TCGA癌症临床数据资源全面性介绍---癌症研究领域的全谱!

2021-11-02 02:16 来源:萍乡妇科医院

2006年,胃肝癌DNA上图谱(The Cancer Genome Atlas, TCGA)计划书以多形开放性外膜伤寒变(GBM)、呼吸系统结节巨噬细胞肝癌(LUSC)和卵巢浆液开放性囊腺肝癌(OV)开始月初3年的实验区重大项目,2009年~2015年全面展开。到重大项目截止,TCGA局域网研究社会活动教育社会活动者已描绘出了33种胃肝癌子类10,000余由此可知伤寒症的分子可特开放性,并假定了很多分子可非典型。TCGA包涵的则有科极其重要特开放性代请注意到比如说的资料查阅。为适当正确常用这些极富DNA特开放性的巨量则有科资料,不太可能TCGA完成一批重大成果,发请注意到在CellPress间公司的医学期刊。

本文对4月底5日发请注意到Cell上的一文开展重写。文章阐述以OS(总穴居期)、PFI(无特别间隔)、DFI(无伤寒间隔)和DSS(结核伤寒相关能活)为四个主要则有科结果往南的TCGA泛胃肝癌则有科资料资源(TCGA-CDR)新标准化资料库,并得出了每种胃肝癌子类的往南常用要求。TCGA则有科资料可从DNA资料共享三维空间(GDC)网易下载,所有的分子可资料在下载。则有科资料和分子可资料常用同样的条形码结构,便于伤寒症的则有科资料和采样分子可资料统合。

TCGA泛肝癌资料库表头特开放性

上图1A为则有科资料统合和统计学分析分析方法及4个主要则有科往南则有和分析报告的流程上图,对33份初始申领和97份全面性资料文件,共33种胃肝癌子类111,60由此可知胃肝癌伤寒症的资料开展了处理过程。请注意到1为每个TCGA表头的基本特开放性。按原发采样根据分子可特开放性选入每个表头,黏膜前列腺癌(SKCM)的原发和转到灶两种子类都有,其它极较少数的原发与转到子类也有研究社会活动。

上图1. 则有科资料统合和统计学分析分析方法及4个主要则有科往南则有和分析报告流程上图

请注意到1. TCGA 泛肝癌表头特开放性

则有科结果往南OS、PFI、DFI和DSS

总穴居期(OS)很最主要,优点是假定OS重大事件时模糊开放性最高于。但常用OS先为往南可能会削弱则有科研究社会活动,因为非肝癌活着因不一定能体现出动物科学、蹂躏开放性或对化疗缓和。常用OS或须越来越长的随访小时;很多则有科试验中的,通常采用尤其随访小时较短的DFI或PFI。针对现有TCGA则有科资料,要认识到连续开放性则有科随访间隔在蹂躏开放性胃肝癌子类结果的最主要开放性,因为可能会几年内就辨别到则有科重大事件,在活着亡同一时间已用到伤寒情开刀或特别。对蹂躏开放性较弱的胃肝癌子类,伤寒症在数十乃至几十年后开刀,随访期间可能会未有辨别所需重大事件以大力支握简单结果供人辨别。该统计学分析的目的是体检TCGA泛肝癌则有科验证的尤其优势和不足以,教导今后的统计学分析和能避免随访间隔小时不足以等缺陷。

统计学分析全部TCGA则有科资料后,得出结论如下:在资料可拿到时,OS、PFI及DFI尤其精确,但大多前提只能估算DSS。上图1B为33种完全相同胃肝癌子类的OS K-M双曲线。尽管穴居统计学分析不是TCGA主要目标,大多胃肝癌子类穴居双曲线与即使如此分析报告完全相同穴居往南的脱离研究社会活动基本完全相同,GBM、OV(2008, 2011)和高于级别外膜糙(LGG)(2015)的TCGA结果就是比较好由此可知证。PFI、DFI和DSS的K-M双曲线见上图1C–1E。

上图1 B-E则有科资料统计学分析

基于每种胃肝癌子类4个往南的辨别小时近似取值平均随访小时及重大事件或体检的中的位小时(请注意到2)。所有的中的位随访小时为22.1个月底,但完全相同子类胃肝癌该小时区别极大;GBM和急开放性髓系白血伤寒(LAML)最短约12个月底,而肾嫌色巨噬细胞肝癌(KICH)最长约48个月底。

请注意到2 总体中的位随访小时及4个往南的重大事件与辨别中的位小时

延揽常用的则有科结果往南

则有科结果往南选择取决于研究社会活动目标、重大事件数量、表头体积和结果资料质量。将这些分析方法和开发的其它分析方法先为为对单个结核伤寒资料库的检测和补足体检,得出在每种结核伤寒子类中的常用每个结果往南的要求及理由(请注意到3)。每种胃肝癌子类的穴居往南须要将近通过一个主要检测和补足体检才被拒绝接受。33种肝癌中的的13种常用全部4个往南:膀胱尿路上皮肝癌(BLCA)、宫颈结节巨噬细胞肝癌(CESC)、结肠肝癌(COAD)、食管肝癌(ESCA)、头颈部结节巨噬细胞肝癌(HNSC)、肾状巨噬细胞肝癌(KIRP)、呼吸系统腺肝癌(LUAD)、LUSC、OV、胰腺肝癌(PAAD)、肉糙(SARC)、胃腺肝癌(STAD)和子宫内膜肝癌(UCEC)。相反,未有一个往南的有嗜铬巨噬细胞糙和副骨骼肌糙(PCPG)。淋巴弥漫大B巨噬细胞淋巴糙(DLBC)、LAML和腹部腺糙(THYM)仅仅一个往南;剩余胃肝癌子类2或3个往南,但其中的一些握保留意见。最简单的是PFI,可无保留地延揽给除LAML(无资料)、DLBC和KICH(严厉常用)和PCPG(不延揽)则有的4种。

请注意到3 往南OS,PFI,DFI及DSS的分析报告与延揽常用

有效开放性TCGA-CDR及案由此可知应用

在乳腺肝癌研究社会活动中的,皮质醇ER阴开放性伤寒症则有科穴居期肾功能比ER+伤寒症差。分别用OS、PFI、DFI和DSS尤其这两类伤寒症的穴居期(上图3A–3D;双曲线截止于10年随访小时,但常用整个资料库开展统计学分析)。单主因统计学分析显示,常用PFI(p= 0.005)和DFI(p = 0.001)先为为则有科往南,TCGA中的ER+乳腺肝癌伤寒症比ER-伤寒症有越来越好的穴居期,但常用OS时两类伤寒症间不不存在区别(p = 0.097) 。此则有,两类伤寒症的DSS(p = 0.009)有值得注意到区别,请注意到明DSS的潜在价取值。以上见到断定了PFI和DFI是特定子类乳腺肝癌分子可研究社会活动的合适往南。

上图3 有效开放性和应用实由此可知

此则有还有效开放性了蹂躏开放性GBM穴居结果往南。TCGA中的GBM中的位OS为12.6个月底,介于此同一时间媒体报道的新标准化疗的12.1个月底和新标准化疗重新组建替莫唑胺的14.6个月底彼此之间。中的位PFI是6.1个月底,介于此同一时间媒体报道的新标准化疗5个月底和新标准化疗重新组建替莫唑胺的6.9个月底彼此之间。仅仅,TCGA资料库OS和PFI重大事件小时与文献保握一致。再一便是OS和PFI先为为GBM分子可研究社会活动的则有科往南效度。

用Cox比由此可知可能会会回归数学模型相符高期(III、IV期)尤其高于期(I、II期)胃肝癌伤寒症的可能会会比(HR),有效开放性4个往南的TCGA-CDR资料。由于DFI假定与其它结果的假定不保握一致,对延揽常用OS、PFI和DSS的14种子类胃肝癌尤其logHR(请注意到3)。随后仅仅对保证Cox比由此可知可能会会假定的结核伤寒开展统计学(上图3E–3G)。结果请注意到明,14种子类胃肝癌中的,除间皮糙(MESO)、PAAD和葡萄膜前列腺癌(UVM)则有,高期对比高于期HR在3个延揽往南OS、PFI及DSS上明显偏高。采用一对一采样的Wilcoxon秩和检验,当常用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)计算时,logHR有值得注意到区别,显示结核伤寒特别和穴居往南在HR上不存在系统偏移;OS与DSS彼此之间未有值得注意到区别(p = 0.106)。对2个logHR取值的新标准说是开展当此加权平均相符Pearson绝对值, 由logHR估算的3种结果有极值得注意到正相关:PFI和OS绝对值0.96(95%置信区间[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区间:0.76–0.99),OS和DSS为0.90(95%置信区间:0.61–0.98)。这些相关开放性潜在大力支握则有科早期用PFI,后期用OS和DSS做到往南。

除了统合分子可资料,还设法统计学分析首次化疗后无伤寒伤寒症与非无伤寒伤寒症是否用到完全相同的新重大事件。TCGA-CDR中的29类胃肝癌资讯用做到消除该疑虑,不属于伤寒症从伤寒症到完成首治并降到无伤寒稳定状态将近能活3个月底。以LUSC为由此可知,有289由此可知无伤寒伤寒症和41由此可知依然非无伤寒伤寒症,NTE不下大致完全相同21.8%和68.2%。用Cox比由此可知可能会会回归数学模型,见到在非无伤寒伤寒症中的NTE可能会会值得注意到高于无伤寒伤寒症(HR = 6.68,95% CI = 4.25–10.51,FDR变更q取值<0.05)。在另则有21种胃肝癌子类中的也有类似结果(请注意到4)。余下7种中的未有辨别到这些区别。我们也在分析报告是否每个数学模型都保证比由此可知可能会会假定,其中的有两个不符合,须要研究社会活动小时依赖及多变量数学模型来寻找理由。

请注意到4 非无伤寒与无伤寒伤寒症NTE发展对比

TCGA从世界性数百个市区内查阅伤寒由此可知,为消除则有科资料完全相同市区内间的可比开放性,须回避资料基本开放性、和伤寒症特开放性等。对每种结核伤寒而言,我们对比了同一时间两名包括人伤寒由此可知数最多的的组织来源市区内(TSS)与所有其它TSS的同种结核伤寒及4个结果往南(请注意到5)。

请注意到5 对来自同一时间两位TSS的每个胃肝癌子类研究社会活动结果开展尤其

对于GBM等极极富蹂躏开放性的,同一时间两位TSS(#1和#2)的发伤寒人群与其它TSS远比类似的有OS、PFI和DSS,因重大事件实在较少难以统计学分析不延揽DFI做到往南。BRCA等较较少蹂躏开放性,强力延揽常用PFI和DFI,但要求严厉用OS或DSS分析报告。TSS #1的则有科资料导致不实在好的OS和DSS,但未有辨别到PFI区别;另则有,请注意到面上TSS#1有越来越好的DFI结果,仅仅用到3由此可知 DFI重大事件。这种请注意到里不一的周期性请注意到明该市区内的结果资料须必要性分析报告。另一特别,TSS #2的4个往南结果与其它地方保握一致。

这个简单的结果尤其请注意到明,当从特定结果统计学分析整体TCGA的则有科资料时,须要回避TSS的极富体资讯。由于年龄组、分期/分级及化疗等主因严重影响完全相同TSS患伤寒人群的往南结果,TSS可以先为为这些和不完全则有科脚注等其它未有计算区别的替代。

潜在的比如说主因、相互竞争结果的

可能会会及数学模型假定

对则有科穴居往南统计学分析来说,要求常用所处理过程的全部则有科资料。但远比分子可/DNA资料的统合统计学分析,要注意到两个特别。首先,延揽意见基于孔径穴居数学模型,以分子可非典型先为得出得出结论因子界定采样集,有可能会破坏结果统计学的值得注意到开放性区别。因此,从彼此间关联的TCGA分子可资料或非典型TCGA-CDR结果资料中的得出的得出结论须在脱离的资料库中的必要性断定。

第二,我们要求仅仅常用原发的分子可资料,因为伤寒症初诊时,最主要小时资讯等匹配的则有科资料已查阅尤其基本。黏膜前列腺癌(SKCM)在TCGA子类中的十分特殊,470由此可知中的仅仅103由此可知原发,其余296由此可知为原发局部淋巴结转到,68由此可知后端转到。这与甚较少查阅到转到糙的其它TCGA胃肝癌子类构成自然而然。SKCM转到糙甚较少较强匹配的原发,而其它TCGA胃肝癌子类尽管甚较少有转到糙,但都较强匹配的原发采样。因此,对于SKCM结果的相关开放性,要求只常用有限数量的原发伤寒由此可知,尽管SCKM淋巴结转到的III期伤寒由此可知可先为为脱离总括开展研究社会活动。

在常用新统合的TCGA-CDR资料库时,还须要注意到:潜在搞混主因、相互竞争结果的可能会会及数学模型假定。

比如说主因

比如说主因不存在但被排除在数学模型之则有时,偏移可能会实在高于或高于估确实。如在乳腺肝癌的种族区别研究社会活动中的,黑人与黑人伤寒症彼此之间不存在最主要的基因请注意到达区别,然而根据分子可非典型开展变更后,这种区别值得注意到降高于甚至消失。治果也是潜在的比如说主因,当资讯可获取时应适当回避变更。化疗未有知时,年龄组、诊治医院及伤寒症年份等新标准化疗先为为替代资讯能降高于大部分说是差。对这特别的议程建模,鼓励常用标志物肾功能研究社会活动要求报告(REMARK)。

相互竞争结果的可能会会

测定DSS、DFI和PFI往南时,要对未有历程最主要重大事件且无伤寒的活着亡伤寒症开展审查。在这种前提,如果假定伤寒症未有其它活着因,那她/他再一仍可能会活着于胃肝癌指征。然而,在估算化疗等得出得出结论因子对继发开放性胃肝癌或心血管结核伤寒等非基准胃肝癌活着亡可能会会的得出得出结论能力时,该假定十分比如说。

数学模型假定

应用Cox比由此可知可能会会(PH)数学模型不必体检PH假定。除较少数案由此可知则有,大大多数学模型都保证Cox PH假定,但须必要性探讨这些个案以解开违背假定的理由,从而对HR做到出越来越准确的估算。尽管仍然为清理资料和消除疑虑无论如何了庞大奋斗,但仍不存在最主要的常用上限,次访问TCGA则有科资料都不必了解这些上限。

首先,TCGA主要是为分子可研究社会活动所设计,最初伤寒由此可知选择来自多个机构较强合适库存的组织的未有化疗原发伤寒由此可知,因此这些伤寒由此可知不构成连续开放性。此则有,对于每种完全相同子类/研究社会活动,随访资料未有统一查阅。同时,则有科资料查阅的一些规章在即使如此迫使随着小时的推移而扭曲。TCGA - CDR不包涵胃肝癌化疗史,并非所有伤寒由此可知都被脚注。因此,统计学分析特定子类或非典型的化疗剧中优于统计资料开放性泛肝癌统计学分析。当伤寒症开展极富体化疗时,受益他用DFI和PFI往南有效地统计学分析。

其次,TCGA采样则有科随访根据当地诊所的小时请注意到,可能会为结核伤寒或特定臀部的开刀和伤寒人最主要生命稳定状态的记录下来,因此未有TCGA指定的则有科随访计划书,仅仅得出重大项目主要强调的分子可特开放性。

仍要,近乎所有TCGA拿到的采样和DNA及分子可资料来自新诊伤寒症原发的单个切片,由此导致的DNA和分子可资料必须在三维空间或小时任何特别明确捕获代请注意到另一伤寒症结果变量的异质开放性。该疑虑不是TCGA独有的,任何静态伤寒变研究社会活动都不存在。

新发展

这项社会活动是越来越是第一次全面核心内容处理过程TCGA泛肝癌则有科资料。由此导致的TCGA-CDR的结果往南与脱离非TCGA研究社会活动结果保握一致,明确指出该资源在空同一时间规模的则有科尺度上包括人了动物观测新视角。也要认识到TCGA-CDR的内在常用在实践中及极其最主要教导和延揽意见。仍然十分越来越为最主要,人类结核伤寒未有来大规模的分子可研究社会活动不必核心内容查阅则有科伤寒理、化疗和转给重大事件资料,以执意高达新标准的则有科研究社会活动。尽管有其在实践中,TCGA-CDR包括人了新标准化资料库,以及模糊不清的4个则有科结果往南推,并消除了质量疑虑,从而在泛肝癌和母体水平上开展转化研究社会活动。未有来资料研究社会活动的相结合将大大提高结果彼此之间的可比开放性,越来越好地理解和大力支握以此类推。

参考资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
排卵期有什么病因 这些现象别忽视
成年人有规律是比较举足轻重的一个期中,因为在成年人有规律中备孕和避孕就是一个比较举足轻重的期中,但是很多成年人不知道在暴发有规律的时候...[详细]
2022-05-05
经期吃饭什么好 经期注意事项
妊娠期间能够须知,每个异性恋每个月初总有那么几天,眉酸背痛,杂色也不正常,于是习惯性的朝天朝天眉,捏捏肚子的,本来这个里四面就有一些能够留意的...[详细]
2022-05-04
都安全|这样的白带「异常」,可能是光
作为异性恋,我们终其一生可能才会遇到不少疾病,大到恶性,小到月经不规律性,但有一类缺陷,或许是极其普遍,且让很多奶奶民不聊生,那就是—...[详细]
2022-05-03
腹腔滤泡大脑皮层状细胞肉瘤伴副性天疱疮一例
得病患者,女,30岁,体重50kg,身高155 cm,ASAⅢ级。因口腔粘膜放纵、溃疡18个年末入院。得病患者于18个年末从前(自然环境分娩后20d)再次出现口腔放...[详细]
2022-05-02
央视记者蹲守数全程采访,揭露医院真相,竟然是这样的……
CCTV-美联社蹲守数每隔谈话,为你介绍现实的实习医生医护。仅有段时间,气温变化,流感来犯,各类猝死癌症升高,中国地区诊所的诊所和诊所来得甚...[详细]
2022-05-02
20130313万家灯火视频:郑瑞讲妇女荷尔蒙失调
未婚的内增生非常的关键因素的,它影响未婚容颜,肌肉生活品质等,那么你告诉他你告诉他未婚内增生失调吗?现在我们请来了医学芝加哥大学郑瑞看望...[详细]
2022-04-28
8病征示月经不调
你的元月似乎每次都能够准时报到,你知道元月不调有哪些呕吐吗?你想要知道元月不调怎么胃肠吗?那就赶紧跟着小编去学学吧 异性恋元月不调:元月不...[详细]
2022-04-27
黑眼圈是什么原因 怎样并不需要远离黑眼圈
黑眼圈是什么诱因你们告诉他吗?肯定可能会有人告诉他熬夜熬的呗,虽然这样告诉他没错,但熬夜不是黑眼圈形成的唯一诱因,还有许多你根本并未确...[详细]
2022-04-26
他们在对抗子宫腺肌病的路上走了太多弯路!
妇科主任医师王斌教授说:许多子宫腺肌病患者都有误解。子宫腺肌病最常见的症状是痛经,但在传统观念中,女孩痛经是正常的,长大或结婚后都很好...[详细]
2022-04-25
  • 地区医院
  • 医院联盟