TCGA癌症临床数据资源全面介绍---癌症研究课题的全谱!
2022-01-24 09:38 来源:白银妇科医院
2006年,肺肿瘤原核生物图说(The Cancer Genome Atlas, TCGA)原计划以多形适度胶质母巨噬细胞瘤(GBM)、肺突起巨噬细胞肿瘤(LUSC)和睾丸浆液适度囊白血染病(OV)开始为期3年的试点概念设计,2009年~2015年全面展开。到概念设计月末,TCGA因特网研究者工来作者已描绘了33种肺肿瘤各种类型10,000余唯染病征的原子相似适度,并定义了很多原子HIV-。TCGA包含的医学关键相似适度代列于泛化的原始数据利用。为确保亦然确适用这些具原核生物相似适度的海量医学原始数据,最近TCGA顺利进行一批重大成果,发列于在CellPress旗下的期刊。本文对4同月5日发列于Cell上的一文顺利进行编译。文章阐释以OS(总合共存期)、PFI(无困难重重之时间延迟)、DFI(无染病之时间延迟)和DSS(疾染病相关存活)为四个主要医学结果终点站的TCGA泛肺肿瘤医学原始数据资源(TCGA-CDR)标准规范化原始数据源,并给不止了每种肺肿瘤各种类型的终点站适用敦促。TCGA医学原始数据可从原核生物原始数据合共享空之间(GDC)网易下载,所有的原子原始数据在下载。医学原始数据和原子原始数据适用同样的贴纸本体,便于染病征的医学资料和采样原子原始数据导入。TCGA泛肿瘤原始数据源数据流相似适度图1A为医学原始数据导入和数据分析数据分析方法及4个主要医学终点站为基础和审核的流程图,对33份初始提不止申请和97份后续原始数据文件,合共33种肺肿瘤各种类型111,60唯肺肿瘤染病征的资料顺利进行了处置。列于1为每个TCGA数据流的基本上。按原发采样根据原子相似适度选入每个数据流,皮肤阿兹海默(SKCM)的原发和移转到灶两种各种类型都有,其它极少数的原发与移转到各种类型也有研究者。图1. 医学原始数据导入和数据分析数据分析方法及4个主要医学终点站为基础和审核流程图列于1. TCGA 泛肿瘤数据流相似适度医学结果终点站OS、PFI、DFI和DSS总合共存期(OS)很举足轻重,好处是定义OS暴力事件时模糊适度略高于。但适用OS来作终点站确实削弱医学研究者,因为非肿瘤死法不一定能看不止不止药理学、波及适度或对化疗缓解。适用OS或需更慢的随访不之间断;很多医学试验当中,一般来说采用相对来说随访不之间断短的DFI或PFI。针对现有TCGA医学原始数据,要认识到短时医学随访之时间延迟在波及适度肺肿瘤各种类型结果的效用,因为确实几年内就检视到医学暴力事件,在生还同一时之间仍未常不止现染病情复发或困难重重。对波及适度较弱的肺肿瘤各种类型,染病征在数十乃至几十年后复发,随访在此期之间确实无法检视能够暴力事件以支一向精确结果供说明。该数据分析的目的是核对TCGA泛肿瘤医学测定的相对来说优势和不足,指导今后的数据分析和避开随访之时间延迟不之间断不足等缺陷。数据分析全部TCGA医学原始数据后,结论如下:在原始数据可赢取时,OS、PFI及DFI相对来说精确,但多数情况下并不需要估计最大值DSS。图1B为33种有所不同肺肿瘤各种类型的OS K-M曲赴援。尽管合共存数据分析不是TCGA主要能够,多数肺肿瘤各种类型合共存曲赴援与即使如此审核相同合共存终点站的独立研究者基本相同,GBM、OV(2008, 2011)和低级别胶质瘤(LGG)(2015)的TCGA结果就是比较好唯证。PFI、DFI和DSS的K-M曲赴援见图1C–1E。图1 B-E医学原始数据分析基于每种肺肿瘤各种类型4个终点站的检视不之间断计算平均随访不之间断及暴力事件或核对的当中位不之间断(列于2)。所有的当中位随访不之间断为22.1个同月,但有所不同各种类型肺肿瘤该不之间断区别非常大;GBM和急适度髓系白血染病(LAML)最短约12个同月,而肾嫌色巨噬细胞肿瘤(KICH)最长约48个同月。列于2 整体而言当中位随访不之间断及4个终点站的暴力事件与检视当中位不之间断自荐适用的医学结果终点站医学结果终点站必需取决于研究者能够、暴力事件数量、数据流大小和结果原始数据低质量。将这些数据分析方法和开发的其它数据分析方法来作为对单个疾染病原始数据源的测试和多余核对,给不止在每种疾染病各种类型当中适用每个结果终点站的敦促及状况(列于3)。每种肺肿瘤各种类型的合共存终点站并不需要据估计通过一个主要测试和多余核对才被接受。33种肿瘤当中的13种适用全部4个终点站:膀胱尿路上皮肿瘤(BLCA)、宫颈突起巨噬细胞肿瘤(CESC)、结肠肿瘤(COAD)、食管肿瘤(ESCA)、头颈部突起巨噬细胞肿瘤(HNSC)、肾状巨噬细胞肿瘤(KIRP)、肺白血染病(LUAD)、LUSC、OV、胰白血染病(PAAD)、肉瘤(SARC)、胃白血染病(STAD)和子宫内膜肿瘤(UCEC)。只不过,没有一个终点站的有嗜铬巨噬细胞瘤和副神经节瘤(PCPG)。淋巴散发不止大B巨噬细胞失智症(DLBC)、LAML和胸腺瘤(THYM)仅仅一个终点站;剩余肺肿瘤各种类型2或3个终点站,但其当中一些一向保留意见。最精确的是PFI,可无保留地自荐给除LAML(无原始数据)、DLBC和KICH(谨慎适用)和PCPG(不自荐)之外的4种。列于3 终点站OS,PFI,DFI及DSS的审核与自荐适用证明TCGA-CDR及种系统适度技术的发展在乳白血染病研究者当中,雌激素ER阴适度染病征医学合共存期预后比ER+染病征差。分别用OS、PFI、DFI和DSS更为这两类染病征的合共存期(图3A–3D;曲赴援月末于10年随访不之间断,但适用整个原始数据源顺利进行数据分析)。单环境因素数据分析显示,适用PFI(p= 0.005)和DFI(p = 0.001)来作为医学终点站,TCGA当中ER+乳白血染病染病征比ER-染病征有更好的合共存期,但适用OS时两类染病征之间不长期存在区别(p = 0.097) 。此之外,两类染病征的DSS(p = 0.009)有总体区别,断定DSS的潜在价最大值。以上推断出证明了PFI和DFI是特定各种类型乳白血染病原子研究者的合适终点站。图3 证明和技术的发展实唯此之外还证明了波及适度GBM合共存结果终点站。TCGA当中GBM当中位OS为12.6个同月,介于此同一时之间报道的标准规范化疗的12.1个同月和标准规范化疗联合替莫唑胺的14.6个同月彼此之间。当中位PFI是6.1个同月,介于此同一时之间报道的标准规范化疗5个同月和标准规范化疗联合替莫唑胺的6.9个同月彼此之间。显然,TCGA原始数据源OS和PFI暴力事件不之间断与文献相反。之后便是OS和PFI来作为GBM原子研究者的医学终点站效度。用Cox数量危险适度回归仿真未有确定高期(III、IV期)相对来说低期(I、II期)肺肿瘤染病征的危险适度比(HR),证明4个终点站的TCGA-CDR原始数据。由于DFI定义与其它结果的定义不相反,对自荐适用OS、PFI和DSS的14种各种类型肺肿瘤更为logHR(列于3)。随后仅仅对满足Cox数量危险适度推论的疾染病顺利进行统计资料(图3E–3G)。结果断定,14种各种类型肺肿瘤当中,除之间皮瘤(MESO)、PAAD和葡萄膜阿兹海默(UVM)之外,高期对比低期HR在3个自荐终点站OS、PFI及DSS上明显极差。采用分组采样的Wilcoxon秩和检验,当适用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测定时,logHR有总体区别,显示疾染病困难重重和合共存终点站在HR上长期存在种系统错误;OS与DSS彼此之间没有总体区别(p = 0.106)。对2个logHR最大值的标准规范误顺利进行成之加权平均未有确定Pearson方差, 由logHR估计最大值的3种结果有极总体亦然相关:PFI和OS方差0.96(95%概赴援分布[CI]:0.77–0.99),PFI和DSS为 0.95(95%概赴援分布:0.76–0.99),OS和DSS为0.90(95%概赴援分布:0.61–0.98)。这些表征潜在支一向医学早期用PFI,晚期用OS和DSS做终点站。除了导入原子原始数据,还尝试数据分析首次化疗后无染病染病征与非无染病染病征是否经常不止现有所不同的最初暴力事件。TCGA-CDR当中29类肺肿瘤反馈可用消除该疑虑,归属于染病征从诊疗到顺利进行首治并超过无染病状况据估计存活3个同月。以LUSC为唯,有289唯无染病染病征和41唯长期非无染病染病征,NTE赴援合共有21.8%和68.2%。用Cox数量危险适度回归仿真,推断出在非无染病染病征当中NTE危险适度总体高于无染病染病征(HR = 6.68,95% CI = 4.25–10.51,FDR修改q最大值<0.05)。在另之外21种肺肿瘤各种类型当中也有类似结果(列于4)。余下7种当中没有检视到这些区别。我们也在审核是否每个仿真都满足数量危险适度推论,其当中有两个不符合,并不需要研究者不之间断依赖于及多变量仿真来找状况。列于4 非无染病与无染病染病征NTE发展对比TCGA从全球数百个换乘站利用染病唯,为消除医学原始数据有所不同换乘站之间的最大值得注意,需再考虑原始数据非常简单适度、和染病征相似适度等。对每种疾染病而言,我们对比了同一时之间两名提供染病唯数最多的组织来源换乘站(TSS)与所有其它TSS的同种疾染病及4个结果终点站(列于5)。列于5 对来自同一时之间两位TSS的每个肺肿瘤各种类型研究者结果顺利进行更为对于GBM等极具波及适度的,同一时之间两位TSS(#1和#2)的发染病患群与其它TSS相比之下类似的有OS、PFI和DSS,因暴力事件太少无法数据分析不自荐DFI做终点站。BRCA等较低波及适度,强力自荐适用PFI和DFI,但敦促谨慎用OS或DSS审核。TSS #1的医学原始数据转化成不太好的OS和DSS,但没有检视到PFI区别;另之外,列于面上TSS#1有更好的DFI结果,仅仅经常不止现3唯 DFI暴力事件。这种列于里不一的现象断定该换乘站的结果原始数据需必要适度审核。另一特别,TSS #2的4个终点站结果与其它以同一时之间相反。这个简单的结果更为断定,当从特定结果数据分析整体TCGA的医学原始数据时,并不需要再考虑TSS的基本反馈。由于年龄、仍须/分级及化疗等环境因素影响有所不同TSS患染病患群的终点站结果,TSS可以来作为这些和不完全医学注释等其它未有测定区别的替代。潜在的普遍存在环境因素、竞争者结果的危险适度及仿真推论对医学合共存终点站数据分析来说,敦促适用所处置的全部医学原始数据。但相比之下原子/原核生物原始数据的导入数据分析,要注意到两个特别。首先,自荐意见基于基线合共存仿真,以原子HIV-来作预报遗传物质划分采样集,有确实受到破坏结果统计资料的总体适度区别。因此,从互相相似性的TCGA原子原始数据或HIV-TCGA-CDR结果原始数据当中得不止的结论需在独立的原始数据源当中必要适度证明。第二,我们敦促仅仅适用原发的原子原始数据,因为染病征初诊时,举足轻重不之间断反馈等冗余的医学原始数据已利用相对来说非常简单。皮肤阿兹海默(SKCM)在TCGA各种类型当中非常特殊,470唯当中仅仅103唯原发,其余296唯为原发局部淋巴结移转到,68唯远端移转到。这与并不多利用到移转到瘤的其它TCGA肺肿瘤各种类型构成;也。SKCM移转到瘤并不多具有冗余的原发,而其它TCGA肺肿瘤各种类型尽管并不多有移转到瘤,但都具有冗余的原发采样。因此,对于SKCM结果的表征,敦促只适用有限数量的原发染病唯,尽管SCKM淋巴结移转到的III期染病唯可来作为独立组群顺利进行研究者。在适用最初导入的TCGA-CDR原始数据源时,还并不需要注意到:潜在混淆环境因素、竞争者结果的危险适度及仿真推论。普遍存在环境因素普遍存在环境因素长期存在但被排除在仿真最大值得注意到时,错误确实高估或低估真实世界。如在乳白血染病的种族区别研究者当中,有色人种与美国黑人染病征彼此之间长期存在举足轻重的基因列于达区别,然而根据原子HIV-顺利进行修改后,这种区别总体提高甚至消失。治果也是潜在的普遍存在环境因素,当反馈可获取时应适当再考虑修改。化疗未有知时,年龄、诊治医院及诊疗年份等标准规范化疗来作为替代反馈能提高部分差最大值。对这特别的各项政策仿真,鼓励适用标志物预后研究者敦促报告(REMARK)。竞争者结果的危险适度测定DSS、DFI和PFI终点站时,要对没有个人经历举足轻重暴力事件且无染病的生还染病征顺利进行审查。在这种情况下,如果推论染病征没有其它死法,那她/他最终仍确实死于肺肿瘤指征。然而,在估计最大值化疗等预报遗传物质对继发适度肺肿瘤或心血管疾染病等非Index肺肿瘤生还危险适度的预报能够时,该推论并不比如说。仿真推论技术的发展Cox数量危险适度(PH)仿真并不需要核对PH推论。除少数种系统适度之外,大多数仿真都满足Cox PH推论,但需必要适度探索这些个案以解开违背推论的状况,从而对HR做不止更准确的估计最大值。尽管仍未为清除原始数据和消除疑虑付不止了前所未有努力工作,但仍长期存在举足轻重的适用限制,访问TCGA医学原始数据都并不需要了解这些限制。首先,TCGA主要是为原子研究者外观设计,最初染病唯必需来自多个机构具有合适存货组织的未有化疗原发染病唯,因此这些染病唯不构成相反适度。此之外,对于每种有所不同各种类型/研究者,随访原始数据没有统一利用。同时,医学原始数据利用的一些规则在即使如此不得不随着不之间断的推移而改变。TCGA - CDR不包含肺肿瘤化疗简史,并非所有染病唯都被注释。因此,数据分析特定各种类型或HIV-的化疗背景高于概况适度泛肿瘤数据分析。当染病征顺利进行基本化疗时,受益都能DFI和PFI终点站有效数据分析。其次,TCGA采样医学随访根据当地妇产科的不之间断列于,确实为疾染病或特定部位的复发和染病患举足轻重生命状况的记录,因此没有TCGA以外的医学随访原计划,仅仅给不止概念设计主要强调的原子相似适度。最后,几乎所有TCGA赢取的采样和原核生物及原子原始数据来自最初诊染病征原发的单个切片,由此转化成的原核生物和原子原始数据不能在空之间或不之间断任何特别明确逃逸代列于另一染病征结果变量的异质适度。该疑虑不是TCGA独有的,任何型式病变研究者都长期存在。展望这项工来作是有简史以来第一次全面行之有效处置TCGA泛肿瘤医学资料。由此转化成的TCGA-CDR的结果终点站与独立非TCGA研究者结果相反,说明该资源在空同一时之间规模的医学尺度上提供了生物观测最初视角。也要认识到TCGA-CDR的内在适用普遍适度及关键适度指导和自荐意见。仍未非常严谨,人类疾染病未有来大规模的原子研究者并不需要行之有效利用医学染病理、化疗和撤消暴力事件原始数据,以坚一向最高标准规范的医学研究者。尽管有其普遍适度,TCGA-CDR提供了标准规范化原始数据源,以及模糊不清的4个医学结果终点站导不止,并消除了低质量疑虑,从而在泛肿瘤和个体水平上顺利进行转化研究者。未有来原始数据研究者的揉合将必要适度提高结果彼此之间的最大值得注意,更好地说明和支一向重复。参考资料An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics
TAG:
上一篇:异性恋疼痛原来是这问题
延伸阅读
-
解惑,更年期需要说明雌性素吗!
啥?牙医,你要我运雌二醇?不不不……牙医你误则会了呀,我早产是不够的,但是雌二醇不能不吃的呀! 不吃雌二醇,要得癌的呀! 不吃雌二醇,要变胖...[详细]2022-05-10
-
月经不调怎么办 戒酒戒酒可以预防这个病
月经不调是俩人尤其相似的一种患者,一旦浮现了月经不调的情况,会不堪重负的影响到我们的工作和社会生活,不小心浮现月经不调,那么应该怎么办...[详细]2022-05-05
-
脱机困难的患者突然幻视、烦躁、性情大变,你年所想到哪种病?
今年冬天,一名既往有慢阻肺病因的西老人「野鸟」去了三亚过冬,一不小心肺炎了,之后健康状况加重住进了当地ICU,经气管输液、有创呼吸机辅助通...[详细]2022-05-03
-
盆腔炎这种常见妇科病怎么疗法彻底
女同性恋的盆腔是有着更加重要的功用的,而且它是生殖器官官不可或缺的一种,盆腔炎是妇产科更加常见的哮喘,他亦会反之亦然的冲击着女同性恋的...[详细]2022-05-02
-
月经不调的原因 9类肉类是元凶
迟于不调是很多女性都在面临的一个情况,你知道迟于不调的可能有哪些吗?迟于不调该如何调理呢?上面小编就为大家推荐一些迟于不调的可能以及调理...[详细]2022-05-02
-
压力太大竟会导致乳癌复发!怎样让病人快乐起来呢?
白血病的终于开刀总长期以来是保卫白血病流程里面的一个疑难,成为病征和医生的心头大患。 为什么在早期找到的白血病经过成功的治疗法后,几年...[详细]2022-04-28
-
附件炎有什么症状表现 早并不知道早治疗
未婚的附件称之为的就是十二称之为肠和十二称之为肠,当十二称之为肠和十二称之为肠发生炎症的时候也就是我们所说的附件炎了。附件炎是未婚很常...[详细]2022-04-27
-
溢液 解决问题的好步骤
有些男丁的女性,大便道口也许会分泌出黑色的表面,这样的病症在医学上称之为溢液。这种病症的发病率不高,不过还是有病变碰到了这样的难题。这...[详细]2022-04-26