中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院劉芝華團(tuán)隊(duì)、陳洪巖團(tuán)隊(duì)和溫州醫(yī)科大學(xué)眼科醫(yī)院甌江實(shí)驗(yàn)室蘇建忠團(tuán)隊(duì)合作對(duì)來(lái)自230名非轉(zhuǎn)移性ESCC或癌前病變患者和230名來(lái)自多個(gè)中心的匹配健康對(duì)照(HC)的共460個(gè)cfDNA樣本進(jìn)行了全基因組重亞硫酸鹽測(cè)序(WGBS)。并開發(fā)了一種擴(kuò)展多模式分析(expanded multimodal analysis,EMMA)綜合方法,可以同時(shí)鑒定cfDNA WGBS數(shù)據(jù)中的cfDNA甲基化、拷貝數(shù)變異(CNV)和片段化標(biāo)記。cfDNA甲基化標(biāo)記是最早期和最敏感,可在70%的ESCC和50%的癌前病變中檢測(cè)到,并與分子亞型和腫瘤微環(huán)境相關(guān)。CNV和片段化標(biāo)記表現(xiàn)出高特異性,但與晚期疾病有關(guān)。EMMA方法顯著提高了檢出率,將AUC(area under the curve)從0.90增加到0.99,并在驗(yàn)證隊(duì)列中檢測(cè)到87%的ESCC和62%的癌前病變,特異性>95%。研究通過(guò)多模式分析方法分析了cfDNA-WGBS數(shù)據(jù),揭示了cfDNA甲基化組的多模式分析對(duì)于早期檢測(cè)和監(jiān)測(cè)ESCC分子特征的潛力。相關(guān)研究成果于2024年5月2日以“Multimodal analysis of cfDNA methylomes for early detecting esophageal squamous cell carcinoma and precancerous lesions”為題發(fā)表在《Nature Communications》(IF 16.6/Q1)期刊上。
a. 使用機(jī)器學(xué)習(xí)開發(fā)了EMMA多模式分析方法,以加強(qiáng)血漿樣品cfDNA中ctDNA的檢測(cè)。該方法通過(guò)全面分析cfDNA全基因組亞硫酸鹽測(cè)序(cfWGBS)數(shù)據(jù)中癌癥來(lái)源的差異甲基化區(qū)域(DMR)、拷貝數(shù)變異(CNV)和片段化標(biāo)記。最初從155例食管鱗狀細(xì)胞癌(ESCC)患者的原發(fā)性腫瘤和匹配的相鄰癌旁組織的配對(duì)WGBS數(shù)據(jù)和WGS數(shù)據(jù)中鑒定出癌癥來(lái)源的DMR和CNV。隨后在cfWGBS數(shù)據(jù)中分析了ESCC來(lái)源的DMR和CNV,并進(jìn)一步利用短cfDNA片段大小比例來(lái)訓(xùn)練發(fā)現(xiàn)隊(duì)列中的診斷模型。在外部ESCC隊(duì)列和癌前隊(duì)列中獨(dú)立評(píng)估了每種診斷模型的性能。為了揭示這些最佳DMR的生物學(xué)意義,研究人員將它們與成對(duì)ESCC組織樣品中基于多組學(xué)的分子亞型和轉(zhuǎn)錄組學(xué)譜相關(guān)聯(lián)。
b. 該發(fā)現(xiàn)隊(duì)列包括150名ESCC或高級(jí)別上皮內(nèi)瘤變患者和150名匹配的健康對(duì)照,以使用不同的cfDNA特征構(gòu)建診斷模型。在外部ESCC隊(duì)列和癌前隊(duì)列中獨(dú)立評(píng)估每個(gè)診斷模型的性能。
ESCC:食管鱗狀細(xì)胞癌,IEN:上皮內(nèi)瘤變,WGS:全基因組測(cè)序,WGBS:全基因組亞硫酸鹽測(cè)序,cfWGBS:cfDNA WGBS,RNAseq:RNA測(cè)序,HC:健康對(duì)照,CNV:拷貝數(shù)變異,DMR:差異甲基化區(qū)域,IM:免疫調(diào)節(jié),CCA:細(xì)胞周期通路激活,IS:免疫抑制,NRFA:NRF2致癌激活。
cfDNA甲基化標(biāo)記物的鑒定和性能
圖2:食管鱗狀細(xì)胞癌的游離DNA甲基化標(biāo)志物及其性能檢測(cè)。
a. 在食管鱗狀細(xì)胞癌(ESCC)組織中發(fā)現(xiàn)的差異甲基化區(qū)域(DMRs)中,通過(guò)調(diào)整后的p值<0.05(雙側(cè)Wilcoxon檢驗(yàn))recall了650個(gè)DMRs,這些DMRs在發(fā)現(xiàn)隊(duì)列中的ESCC平均值(n=150)比健康對(duì)照組(n=150)更為顯著。圖中展示了前十個(gè)DMRs的惡性比例和p值。數(shù)據(jù)以最大值和最小值的中值表示。
b. ESCC-cfMeth評(píng)分的診斷性能在發(fā)現(xiàn)隊(duì)列(十倍交叉驗(yàn)證,每種顏色的曲線表示一次交叉驗(yàn)證)、外部驗(yàn)證隊(duì)列和癌前驗(yàn)證隊(duì)列中進(jìn)行了評(píng)估。黑色曲線表示受試者ROC曲線,藍(lán)色區(qū)域表示95%置信區(qū)間(CI)。
c. 使用最佳50個(gè)標(biāo)記的cfDNA惡性比例構(gòu)建最終預(yù)測(cè)模型(ESCC-cfMeth評(píng)分)。與發(fā)現(xiàn)隊(duì)列和驗(yàn)證隊(duì)列中的健康對(duì)照(HCs)相比,ESCC和上皮內(nèi)瘤變(IEN)患者的ESCC-cfMeth評(píng)分顯著更高(雙側(cè)Mann-Whitney U檢驗(yàn),p<0.01)。數(shù)據(jù)以最大值和最小值的中值表示。
d. 與健康對(duì)照組相比,不同階段的ESCC(左側(cè);n=30、9、6和 15,分別為各階段的樣本數(shù))和IENs(右側(cè);n=50、12和 38,分別為各階段的樣本數(shù))的ESCC-cfMeth評(píng)分顯著提高。數(shù)據(jù)以最大值和最小值的中值表示。
e. 在ESCC組織和配對(duì)的相鄰癌旁組織(n=155)之間的基因表達(dá)比較中,發(fā)現(xiàn)50個(gè)最佳DMRs中的功能基因表達(dá)存在差異(使用雙側(cè)Wilcoxon檢驗(yàn)或t檢驗(yàn),ZNF132的p值<2.2×10^-16,LINC00680、FLT1和ID1的p值分別為1.1×10^-8、2.7×10^-14和0.078)。
a. 基于全基因組重亞硫酸鹽測(cè)序(WGBS)方法,從組織和cfDNA中recalling WGBS數(shù)據(jù)中的重復(fù)拷貝數(shù)變異(CNV)。
b. 以ECGEA隊(duì)列中的002號(hào)患者為例,在全基因組測(cè)序數(shù)據(jù)中鑒定出chr.3、chr. 5的擴(kuò)增和chr. 3、4、9、10、11、13、16、18、21的缺失,并在成對(duì)的WGBS數(shù)據(jù)中recall。
c. 150例食管鱗狀細(xì)胞癌(ESCC)患者中,153個(gè)區(qū)域的CNV事件發(fā)生率顯著高于150例健康對(duì)照組(HCs)。擴(kuò)增(紅色)和缺失(藍(lán)色)用ESCC與HCs差異的相應(yīng)調(diào)整p值(錯(cuò)誤發(fā)現(xiàn)率,F(xiàn)DR)顯示(雙側(cè)t檢驗(yàn);ns,灰色;FDR<0.05,黃色;FDR<0.01,橙色;FDR<0.001,深紅色)。
d. ESCC和上皮內(nèi)瘤變(IEN)患者的CNV陽(yáng)性率顯著高于發(fā)現(xiàn)隊(duì)列和驗(yàn)證隊(duì)列中的HCs,并且與分期和分級(jí)呈正相關(guān)。
a. 在發(fā)現(xiàn)隊(duì)列中分析cfDNA片段大小。食管鱗狀細(xì)胞癌(ESCC)患者和健康對(duì)照組的cfDNA peaks均為166 bp。但在ESCC中鑒定出更多的短片段(90–150bp)。
b. 以全基因組重亞硫酸鹽測(cè)序數(shù)據(jù)中的片段大小比(FSR)計(jì)算cfDNA的短片段比例。
c. 人類基因組分為5Mb bins,共產(chǎn)生1082(541個(gè)bins×2)個(gè)FSR。
d. 在發(fā)現(xiàn)隊(duì)列中,ESCC患者和HCs之間所有bins的平均FSR均無(wú)顯著差異。但83個(gè)bins中ESCC患者的FSR顯著高于發(fā)現(xiàn)隊(duì)列中HCs。發(fā)現(xiàn)隊(duì)列和外部驗(yàn)證隊(duì)列中的ESCC患者中83個(gè)選定BIN的平均FSR顯著高于癌前驗(yàn)證隊(duì)列中的上皮內(nèi)瘤變患者(雙側(cè)Mann–Whitney U檢驗(yàn),p < 0.05)。數(shù)據(jù)以具有最大值和最小值的中值表示。
聯(lián)合EMMA模型準(zhǔn)確檢測(cè)ESCC和癌前病變
圖5:三種cfDNA特征的互補(bǔ)性和組合模型的性能。
a. 人類基因組中cfDNA甲基化標(biāo)記、拷貝數(shù)變異和片段化標(biāo)記分布。
b. 在發(fā)現(xiàn)隊(duì)列的食管鱗狀細(xì)胞癌(ESCC)患者中發(fā)現(xiàn)了這三個(gè)標(biāo)記之間的互補(bǔ)性。每個(gè)條形圖表示ESCC患者中每個(gè)標(biāo)記的狀態(tài)。
c. 在外部驗(yàn)證隊(duì)列和癌前驗(yàn)證隊(duì)列中評(píng)估ESCC-cfMeth評(píng)分、DMR加CNV模型、和EMMA模型的診斷性能。
d. ESCC-cfMeth評(píng)分、DMR加CNV模型、和EMMA模型對(duì)上皮內(nèi)瘤變(IEN)I、II和III期ESCC的檢出率。
e. 在外部驗(yàn)證隊(duì)列中,三個(gè)標(biāo)記的互補(bǔ)性提高了組合模型的性能。
f. 根據(jù)不同的實(shí)驗(yàn)間隔,從5年到連續(xù)測(cè)試(理想化),評(píng)估EMMA模型和ESCC-cfMeth模型的潛在生存效益。
g. 不同cfDNA標(biāo)記和組合模型的檢出率以及不同階段的5年生存率示意圖。
cfDNA甲基化標(biāo)記的生物學(xué)意義
圖6:DNA甲基化標(biāo)記在食管鱗狀細(xì)胞癌cfDNA中的生物學(xué)意義
a. 根據(jù)ESCC-cfMeth評(píng)分中50個(gè)最佳DNA甲基化標(biāo)記的平均甲基化水平,將ECGEA隊(duì)列中的155例食管鱗狀細(xì)胞癌(ESCC)患者分為三組。
b. ESCC分子亞型在甲基化顯著組(methylation-dominate)(n=69)、甲基化中度組(methylation-moderate)(n=54)和甲基化缺失組(methylation-poor)(n=32)中的比例。
c. 通過(guò)雙側(cè)t檢驗(yàn)對(duì)甲基化顯著組(n=69)和甲基化中度組/甲基化缺失組(n=86)比較分析腫瘤微環(huán)境中的細(xì)胞組分。(p=6.6×10-3、0.04、0.01、0.04和0.04分別用于上皮細(xì)胞、CD4+T細(xì)胞、CD8+T細(xì)胞、B細(xì)胞和樹突狀細(xì)胞)。
d. 這些通路在甲基化顯著組和甲基化缺失組中富集。
參考文獻(xiàn):
Liu J, Dai L, Wang Q, Li C, Liu Z, Gong T, Xu H, Jia Z, Sun W, Wang X, Lu M, Shang T, Zhao N, Cai J, Li Z, Chen H, Su J, Liu Z. Multimodal analysis of cfDNA methylomes for early detecting esophageal squamous cell carcinoma and precancerous lesions. Nat Commun. 2024 May 2;15(1):3700. pii: 10.1038/s41467-024-47886-1. doi: 10.1038/s41467-024-47886-1. PubMed PMID: 38697989.