TCGA癌症临床数据资源全面介绍----癌症研究领域的全谱!
2021-12-13 02:34 来源:济源妇科医院
2006年,肝癌症基因序列三幅谱(The Cancer Genome Atlas, TCGA)计划以多形患态胶质母蛋白质肿(GBM)、肠胃点状蛋白质癌症(LUSC)和卵巢粘液患态囊小肠癌症(OV)开始两星期3年的实验区建设项目,2009年~2015年全面一触即发。到建设项目累计,TCGA网路原始数据分析管理工作者已描绘了33种肝癌症类别10,000余亦然患人的小分子相似患态,并下定义了很多小分子非典型。TCGA涵盖的药理学最不可或缺相似患态代同上蓝绿化的原始数据获取。为尽可能亦然确用作这些兼具基因序列相似患态的海量药理学原始数据,早先TCGA启动一批重大成果,发同上短文在CellPress旗下的期刊。本文对4月底5日发同上短文Cell上的一文一触即发编译。短文阐述以OS(总肉食动物期)、PFI(无成果每条)、DFI(无患每条)和DSS(患态疾患相关生存者)为四个主要药理学结果站起的TCGA蓝绿肝癌症药理学原始数据水资源(TCGA-CDR)规范化原始元数据,并给出了每种肝癌症类别的站起用作提议。TCGA药理学原始数据可从基因序列原始数据共享空近(GDC)人民网浏览,所有的小分子原始数据在浏览。药理学原始数据和小分子原始数据用作同样的列印结构,便于患人的药理学档案和抽取小分子原始数据定位。TCGA蓝绿癌症原始元数据配置文件相似患态三幅1A为药理学原始数据定位和原始数据实证及4个主要药理学站起衍生和评核的流程三幅,对33份初始申请人和97份更促使原始数据文件,共33种肝癌症类别111,60亦然肝癌症患人的档案一触即发认识决问题。同上1为每个TCGA配置文件的基本相似患态。按原发抽取根据小分子相似患态选入每个配置文件,皮肤黑色素肿(SKCM)的原发和移到灶两种类别都有,其它极少数的原发与移到类别也有原始数据分析。三幅1. 药理学原始数据定位和原始数据实证及4个主要药理学站起衍生和评核流程三幅同上1. TCGA 蓝绿癌症配置文件相似患态药理学结果站起OS、PFI、DFI和DSS总肉食动物期(OS)很不可或缺,优点是下定义OS事件真相时模糊患态最极低。但用作OS作站起只不过削弱药理学原始数据分析,因为非癌症死因不一定能反映出生物学、洪水泛滥患态或对化疗大大降极低。用作OS或须非常长的随访时近;很多药理学试验里面,通常运用于相对来说随访时近较短的DFI或PFI。针对除此以另有TCGA药理学原始数据,要认识到连续患态药理学随访每条在洪水泛滥患态肝癌症类别结果的不可或缺患态,因为只不过几年内就仔细观察到药理学事件真相,在遇害年前已绝迹患情复发或成果。对洪水泛滥患态较差的肝癌症类别,患人在数十乃至几十年后复发,随访期近只不过无法仔细观察足够事件真相以赞同合理结果供假定。该原始数据分析的用意是核对TCGA蓝绿癌症药理学检测的相对来说压倒性和太少,指导今后的原始数据分析和避免随访时近延迟太少等缺陷。原始数据分析全部TCGA药理学原始数据后,事实如下:在原始数据可获取时,OS、PFI及DFI相对来说可靠,但多数意味着不用预估DSS。三幅1B为33种十分相同肝癌症类别的OS K-M曲率。尽管肉食动物原始数据分析不是TCGA主要目标,多数肝癌症类别肉食动物曲率与过去评核相近肉食动物站起的独立原始数据分析基本相近,GBM、OV(2008, 2011)和极低级别胶质肿(LGG)(2015)的TCGA结果就是最出色无疑。PFI、DFI和DSS的K-M曲率见三幅1C–1E。三幅1 B-E药理学原始数据原始数据分析基于每种肝癌症类别4个站起的仔细观察时近量度高达随访时近及事件真相或核对的里面位时近(同上2)。所有的里面位随访时近为22.1个月底,但十分相同类别肝癌症该时近一比别极大;GBM和急患态髓系白血患(LAML)最短大约12个月底,而大肠嫌色蛋白质癌症(KICH)最长大约48个月底。同上2 总体里面位随访时近及4个站起的事件真相与仔细观察里面位时近延揽用作的药理学结果站起药理学结果站起考虑取决于原始数据分析目标、事件真相总数、配置文件大小和结果原始数据运动速度。将这些方法和开发的其它方法作为对单个患态疾患原始元数据的证明和补充核对,给出在每种患态疾患类别里面用作每个结果站起的提议及状况(同上3)。每种肝癌症类别的肉食动物站起必须有数通过一个主要证明和补充核对才被接受。33种癌症里面的13种用作全部4个站起:小肠尿路上皮癌症(BLCA)、阴道点状蛋白质癌症(CESC)、结肠癌症(COAD)、食管癌症(ESCA)、肩部点状蛋白质癌症(HNSC)、大肠状蛋白质癌症(KIRP)、肠胃小肠癌症(LUAD)、LUSC、OV、胰小肠癌症(PAAD)、肉肿(SARC)、小肠小肠癌症(STAD)和阴道内膜癌症(UCEC)。相反,从尚未一个站起的有嗜铬蛋白质肿和副神经节肿(PCPG)。内膜弥漫大B蛋白质内膜肿(DLBC)、LAML和颊腺肿(THYM)仅仅一个站起;这样一来肝癌症类别2或3个站起,但其里面一些持保留发表意见。最合理的是PFI,可无保留地延揽给除LAML(无原始数据)、DLBC和KICH(谨慎用作)和PCPG(不延揽)另有的4种。同上3 站起OS,PFI,DFI及DSS的评核与延揽用作证明TCGA-CDR及案亦然应用领域在乳小肠癌症原始数据分析里面,雌激素ER阴患态患人药理学肉食动物期患症比ER+患人一比。分别用OS、PFI、DFI和DSS非常这两类患人的肉食动物期(三幅3A–3D;曲率累计于10年随访时近,但用作整个原始元数据一触即发原始数据分析)。单状况原始数据分析推断,用作PFI(p= 0.005)和DFI(p = 0.001)作为药理学站起,TCGA里面ER+乳小肠癌症患人比ER-患人有非常多的肉食动物期,但用作OS时两类患人近不长期存在一比别(p = 0.097) 。此另有,两类患人的DSS(p = 0.009)有突出一比别,暗示DSS的潜在效益。以上推测证实了PFI和DFI是特定类别乳小肠癌症小分子原始数据分析的合适站起。三幅3 证明和应用领域实亦然此另有还证明了洪水泛滥患态GBM肉食动物结果站起。TCGA里面GBM里面位OS为12.6个月底,介于此年前华盛顿邮报的规范化疗的12.1个月底和规范化疗联合替莫唑胺的14.6个月底两者之近。里面位PFI是6.1个月底,介于此年前华盛顿邮报的规范化疗5个月底和规范化疗联合替莫唑胺的6.9个月底两者之近。只不过,TCGA原始元数据OS和PFI事件真相时近与文献原则上。最终印证OS和PFI作为GBM小分子原始数据分析的药理学站起效度。用Cox人口比亦然安全患态回归数学方法确定高期(III、IV期)相对来说极低期(I、II期)肝癌症患人的安全患态比(HR),证明4个站起的TCGA-CDR原始数据。由于DFI下定义与其它结果的下定义不原则上,对延揽用作OS、PFI和DSS的14种类别肝癌症非常logHR(同上3)。随后仅仅对受限制Cox人口比亦然安全患态断言的患态疾患一触即发统计原始数据(三幅3E–3G)。结果暗示,14种类别肝癌症里面,除近皮肿(MESO)、PAAD和葡萄膜黑色素肿(UVM)另有,高期对比极低期HR在3个延揽站起OS、PFI及DSS上突出偏高。运用于配对抽取的Wilcoxon秩和检查,当用作PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)计算时,logHR有突出一比别,推断患态疾患成果和肉食动物站起在HR上长期存在系统偏一比;OS与DSS两者之近从尚未突出一比别(p = 0.106)。对2个logHR值的规范说是一触即发逆加权高达确定Pearson标准一比, 由logHR预估的3种结果有极突出亦然相关:PFI和OS标准一比0.96(95%无风险[CI]:0.77–0.99),PFI和DSS为 0.95(95%无风险:0.76–0.99),OS和DSS为0.90(95%无风险:0.61–0.98)。这些相关患态潜在赞同药理学早期用PFI,末期用OS和DSS做站起。除了定位小分子原始数据,还在此之后原始数据分析首次化疗后无患人与非无患人前提绝迹十分相同的上新事件真相。TCGA-CDR里面29类肝癌症反馈用于应对该疑问,纳入患人从病症到启动首治并降至无患长时间有数生存者3个月底。以LUSC为亦然,有289亦然无患人和41亦然长期非无患人,NTE领军分作21.8%和68.2%。用Cox人口比亦然安全患态回归数学方法,推测在非无患人里面NTE安全患态突出高于无患人(HR = 6.68,95% CI = 4.25–10.51,FDR优化q值<0.05)。在另另有21种肝癌症类别里面也有类似结果(同上4)。全数7种里面从尚未仔细观察到这些一比别。我们也在评核前提每个数学方法都受限制人口比亦然安全患态断言,其里面有两个不符合标准,必须原始数据分析时近依赖患态及多数据类型数学方法来寻觅状况。同上4 非无患与无患人NTE发展对比TCGA从世界数百个条线路获取确诊,为应对药理学原始数据十分相同条线路近的可比患态,须考虑原始数据完整患态、和患人相似患态等。对每种患态疾患而言,我们对比了年前两名发放确诊数最多的一个组织来源条线路(TSS)与所有其它TSS的同种患态疾患及4个结果站起(同上5)。同上5 对来自年前两位TSS的每个肝癌症类别原始数据分析结果一触即发非常对于GBM等极兼具洪水泛滥患态的,年前两位TSS(#1和#2)的肠胃癌群体与其它TSS相对于类似的有OS、PFI和DSS,因事件真相太少难以原始数据分析不延揽DFI做站起。BRCA等较极低洪水泛滥患态,强力延揽用作PFI和DFI,但提议谨慎用OS或DSS评核。TSS #1的药理学原始数据归因于不太好的OS和DSS,但从尚未仔细观察到PFI一比别;另另有,同上面上TSS#1有非常多的DFI结果,仅仅绝迹3亦然 DFI事件真相。这种同上里不一的情形暗示该条线路的结果原始数据须促使评核。另一总体,TSS #2的4个站起结果与其它地方原则上。这个单纯的结果非常暗示,当从特定结果原始数据分析整体TCGA的药理学原始数据时,必须考虑TSS的兼具体反馈。由于高达年龄、分期/分级及化疗等状况影响十分相同TSS患患群体的站起结果,TSS可以作为这些和不完全药理学评注等其它尚未计算一比别的替代。潜在的普遍存在状况、竞争结果的安全患态及数学方法断言对药理学肉食动物站起原始数据分析来说,提议用作所应对问题的全部药理学原始数据。但相对于小分子/基因序列原始数据的定位原始数据分析,要注意到两个总体。首先,延揽发表意见基于基线肉食动物数学方法,以小分子非典型作预期因子划分抽取集,有只不过破坏结果统计原始数据的突出患态一比别。因此,从互相相似性的TCGA小分子原始数据或非典型TCGA-CDR结果原始数据里面得出的事实须在独立的原始元数据里面促使证实。第二,我们提议仅仅用作原发的小分子原始数据,因为患人初诊时,不可或缺时近反馈等反之亦然的药理学原始数据已获取相对来说完整。皮肤黑色素肿(SKCM)在TCGA类别里面非常相同,470亦然里面仅仅103亦然原发,其余296亦然为原发渐进内膜结移到,68亦然可执行移到。这与很少获取到移到肿的其它TCGA肝癌症类别转变成一时期。SKCM移到肿很少不兼具反之亦然的原发,而其它TCGA肝癌症类别尽管很少有移到肿,但都不兼具反之亦然的原发抽取。因此,对于SKCM结果的相关患态,提议只用作有限总数的原发确诊,尽管SCKM内膜结移到的III期确诊可作为独立组群一触即发原始数据分析。在用作上新定位的TCGA-CDR原始元数据时,还必须注意到:潜在混淆状况、竞争结果的安全患态及数学方法断言。普遍存在状况普遍存在状况长期存在但被回避在数学方法之另有时,偏一比只不过高估或极低估单纯。如在乳小肠癌症的种族一比别原始数据分析里面,白人与黑人患人两者之近长期存在不可或缺的基因同上达一比别,然而根据小分子非典型一触即发优化后,这种一比别突出减少甚至绝迹。治果也是潜在的普遍存在状况,当反馈可获取时应适当考虑优化。化疗尚未知时,高达年龄、就诊所医院及病症年份等规范化疗作为替代反馈能减少其余部分说是一比。对这总体的权衡建模,提倡用作;也患症原始数据分析提议通报(REMARK)。竞争结果的安全患态测定DSS、DFI和PFI站起时,要对从尚未经历不可或缺事件真相且无患的遇害患人一触即发审查。在这种意味着,如果断言患人从尚未其它死因,那她/他终究仍只不过死于肝癌症指征。然而,在预估化疗等预期因子对化脓患态肝癌症或心血管患态疾患等非指数肝癌症遇害安全患态的预期能力时,该断言十分可取。数学方法断言应用领域Cox人口比亦然安全患态(PH)数学方法必须核对PH断言。除少数案亦然另有,大多数数学方法都受限制Cox PH断言,但须促使探索这些个案以找出违背断言的状况,从而对HR做出非常准确的预估。尽管仍尚未为清理原始数据和应对疑问付出了巨大决心,但仍长期存在不可或缺的用作限制,回访TCGA药理学原始数据都必须认识这些限制。首先,TCGA主要是为小分子原始数据分析设计,早先确诊考虑来自多个机构不兼具合适库存一个组织的尚未化疗原发确诊,因此这些确诊不构成连续患态。此另有,对于每种十分相同类别/原始数据分析,随访原始数据从尚未标准化获取。同时,药理学原始数据获取的一些规则在过去不得不随着时近的推移而改变。TCGA - CDR不涵盖肝癌症化疗史,并非所有确诊都被评注。因此,原始数据分析特定类别或非典型的化疗背景优于概况患态蓝绿癌症原始数据分析。当患人一触即发兼具体化疗时,受益能用DFI和PFI站起有效原始数据分析。其次,TCGA抽取药理学随访根据当地门诊的时近同上,只不过为患态疾患或特定部位的复发和患人不可或缺生命长时间的记录,因此从尚未TCGA指定的药理学随访计划,仅仅给出建设项目主要合理化的小分子相似患态。最后,几乎所有TCGA获取的抽取和基因序列及小分子原始数据来自上新诊患人原发的单个切片,由此归因于的基因序列和小分子原始数据不能在空近或时近任何总体完全一致逃逸代同上另一患人结果数据类型的举亦然来说。该疑问不是TCGA独创的,任何静态原肠胃癌态原始数据分析都长期存在。展望这项管理工作是有史以来第一次全面系统地应对问题TCGA蓝绿癌症药理学档案。由此归因于的TCGA-CDR的结果站起与独立非TCGA原始数据分析结果原则上,所述该水资源在空年前需求量的药理学尺度上发放了生物目视上新视角。也要认识到TCGA-CDR的内在用作局限患态及最不可或缺患态指导和延揽发表意见。仍尚未非常明晰,有机体患态疾患将会大需求量的小分子原始数据分析必须系统地获取药理学患理、化疗和转归事件真相原始数据,以执意最高规范的药理学原始数据分析。尽管有其局限患态,TCGA-CDR发放了规范化原始元数据,以及清晰的4个药理学结果站起导出,并应对了运动速度疑问,从而在蓝绿癌症和生物体水平上一触即发转变成原始数据分析。将会原始数据原始数据分析的融合将提高结果两者之近的可比患态,非常多地断言和赞同重复。参考档案An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics
TAG:
延伸阅读
-
女人内分泌痉挛八大征兆
情人一旦激素痉挛,就不会招致肌肤、双腿各方面都再次出现问题,那么激素痉挛怎么麦芽糖呢?上头小编教大家一些香辛料,一起去评论之中想到学学吧...[详细]2022-05-05
-
卵巢囊肿会自己不复存在吗 怎么治疗
卵巢肺部是成年人很常用的一种卵巢疾病,很多成年人在发掘出自己患病了卵巢肺部在此之后一般而言才会想到很紧张,不并不知道该怎么办,可是过很...[详细]2022-05-03
-
前女友都没有却“下奶”了,妇科医生查出“真相”
23岁的小嘉身材苗条,近1年受孕一律时,常常2~3个月底才流连一次,经量也寡,不仅如此,最近她的还表皮出乳白色透明液体。小嘉来看门诊。“精神科...[详细]2022-05-02
-
发热、淋巴结肿大——完了完了,白血病?!
“兄弟姐妹高冷老不好,身上还多附近淋巴溃疡,到底怎么了?”一位妈妈冷淡地看着医生,“我网上查过,有没有癌症?还是化学疗法啊?”医生:“...[详细]2022-05-02
-
赵宇昊讲急性盆腔炎的发病理由
赵宇昊教授表示盆腔炎是一种常见于的妇科疾病,虽然没有轻易危及人的心灵,但对化学物质的危害也是比较大的,如果不明了盆腔炎的关键因素成因,...[详细]2022-04-28
-
**堵塞的症状 这部位出现不适要注意
造成了未婚的或许有很多,其中就包括直肠截断,直肠截断分为原发性和继发性两种,而外阴腹膜病变是引来直肠截断的重要或许。当直肠截断时,必须...[详细]2022-04-27
-
月经颜色发黑是怎么回事 警惕是这些疟疾
排卵期是育龄男人短时间的一种生物体情形,一般来说,短时间的排卵期紫色应该是紫色的。如果男人推断出排卵期的紫色水泡,或者紫黄色、白色等,...[详细]2022-04-26
-
第七届中澳亚太微创妇科论坛暨第三届全国第二代宫腔能源应用研讨会暨第二届基层医院妇女盆底修复重建培训班
为促进妇科微创技术的交流和改进,更好地促进妇科微创技术的普及和发展,上海嘉定区妇幼保健医院和中国卫生部内镜和微创培训基地-澳大利亚-亚太...[详细]2022-04-25