文獻賞析

華盈視角:外泌體全轉錄組——發現新型疾病標志物的搖籃

2020/08/14

美國食品和藥品管理局(FDA)將2019年度Breakthrough Device Designation授予了Exosome Diagnostics公司的ExoDx Prostate (IntelliScore) (EPI)檢測產品。EPI是通過檢測尿液外泌體中ERG, PCA3和SPDEF基因的mRNA表達量實現對前列腺癌的提前診斷,診斷效能顯著高于傳統的診斷方1。由此可見,外泌體核酸標志物的研究及臨床轉化潛能,已經開始大放異彩。那么,怎樣系統性開展一項外泌體RNAs標志物研究呢?今天華盈視角就通過復旦大學附屬腫瘤醫院黃勝林教授團隊發表的兩篇高質量的外泌體long RNAs診斷標志物文2,3,為大家揭開這個謎題。




 

案例一 血漿外泌體long RNAs

作為肝癌診斷的標志物

 

外泌體核酸包括諸多種類的long RNAs和以microRNA為代表的small RNAs。由于microRNA在外泌體豐富度和含量都比較4,限制了它的廣泛性應用,而外泌體中含有更為豐富的long RNAs(包括mRNA, lncRNA, circRNA和Pseudogene),將long RNAs作為疾病標志物,相比microRNA可能更具優勢。

黃勝林教授團隊2019年發表于Clinical Chemistry雜志(IF= 7.292)上的研究成果,對159個健康者和104個肝細胞癌(HCC),9個胃癌(GC),12個結直腸癌(CRC),10個乳腺癌(BRCA),15個腎癌患者(KIRC)以及24個良性肝腫瘤,11個肝炎和8個肝硬化患者的血漿外泌體進行了系統的全轉錄組測序2。測序結果顯示,血漿外泌體樣本中普遍能夠鑒定大約10000個以上有注釋的基因,其中含量最多的是mRNA,占比達到了76%(圖1a,b)。因此不難想象,篩選外泌體RNAs標志物時,mRNA成為候選標志物的比例會很高。同樣,外泌體mRNA由于豐度高,其作為標志物也便于后續研究中利用PCR等技術進行驗證,并進行臨床轉化,這也是診斷產品ExoDx Prostate (IntelliScore) (EPI)選擇mRNA作為檢測目標的原因之一。

另外和外周血單個核細胞PBMCs的RNA測序結果比較,結果發現能夠覆蓋mRNA全長的reads在外泌體中占比22.5%,在PBMCs中占比42.9%(圖1c)。這說明外泌體除了有相當數量完整的mRNA外,部分mRNA還會以片段化的形式存在于外泌體中。這也提醒研究人員在后續利用PCR等方法驗證外泌體mRNA時,需要參考轉錄組測序的結果進行引物設計。除了mRNA外,外泌體中circRNA和lncRNA也占有一定比例(圖1a,b)。對于circRNA而言,總共發現circRNAs的reads數是137196(圖1d)。大約90%的circRNA與已知基因重疊,包括各種形式的circRNA(圖1e)。并且和PBMCs相比,circRNA在外泌體中的有相對高的占比(圖1f),這也說明了外泌體會富集大量的circRNA??傊?,外泌體全轉錄組數據揭示了外泌體富含大量的long RNAs及片段。

圖片 6.png

1. 血漿外泌體long RNAs組成

 

外周血中外泌體的母本細胞來源問題一直讓大家很棘手,而外泌體全轉錄組有可能解決這個外泌體溯源的問題。因為不同組織細胞有各自特異的基因表達譜,外泌體攜帶母本細胞的基因,所以外泌體的基因表達譜也會反映出它的組織細胞來源。為此研究人員首先在含有30個人類組織的基因表達數據庫GTEx中篩選出了1783個組織特異表達的基因,然后在健康者的血漿外泌體中進行檢索,大約33.1%(591)的組織特異表達的基因出現在外泌體中(圖2a),說明血漿外泌體富含組織特異性的基因。為了進一步驗證,研究人員發現109個肝臟特異表達的基因中有73個在肝細胞癌患者血漿外泌體中的表達顯著增加(圖2a),說明在血漿外泌體含有的基因呼應了肝臟組織內的表達狀態,由此可見從肝細胞癌患者血漿外泌體全轉錄組中篩選到標志物或許可以更加準確的反映出癌組織細胞的真實狀態。反之,也可以根據外泌體全轉錄組數據反向溯源分析不同母本組織細胞的占比與豐度。研究人員通過比較分析正常人和肝細胞癌患者外泌體全轉錄組數據發現了22種不同的免疫細胞參與了外泌體的分泌,其中16種細胞的含量在肝細胞癌患者中顯著增加(圖2b),例如中性粒細胞,M2巨噬細胞(圖2c)?,F有的各種組織基因表達數據庫聯合外泌體全轉錄組極大方便了研究人員開展標志物組織溯源方面的數據挖掘和分析工作。游離的單個標志物容易受外周因素的影響,不能很準確的反應組織細胞的整體變化,基于外泌體全轉錄組學可以篩選出同時變化的多個基因作為標志物。同時,外泌體這種載體也對標志物分子起到了保護作用,保證了標志物變化的協調一致性,在疾病進展中更能準確反應組織整體變化,從而提高診斷的靈敏度和準確度。

圖片 14.png

圖2. 血漿外泌體全轉錄組數據溯源組織細胞來源
接下來,研究人員調查了外泌體long RNAs是否可以診斷肝細胞癌。研究人員將受試樣本分為訓練集(training),驗證集(validation)和測試集(internal testing)(圖3a),所有樣本都開展血漿外泌體全轉錄組測序。在訓練集階段,研究人員將外泌體全轉錄組數據和TCGA中的肝細胞癌組織基因表達數據比對,結果發現了379個在癌癥患者外泌體中上調的long RNAs也在肝細胞癌組織中上調。之后通過隨機森林算法(RFA)和LASSO方法分析這379個上調的longRNA,確定了8個外泌體long RNA作為診斷肝細胞癌的標志物。然后利用隨機變量機器學習算法(SVM)和ROC分析都驗證了8個外泌體long RNAs聯合診斷肝細胞癌的準確度非常高(圖3b)。在診斷肝細胞癌患者和良性肝腫瘤患者的準確度上,8個外泌體long RNAs聯合要顯著高于傳統的診斷標志物AFP(圖3c)。這些結果說明血漿外泌體long RNAs可以作為癌癥診斷的標志物。

 

圖片 3.png

圖3. 外泌體long RNAs標志物可準確診斷肝細胞癌

案例二 血漿外泌體long RNAs

作為PDAC診斷的標志物

同樣的研究思路,黃勝林教授團隊對胰腺導管腺瘤(PDAC)診斷進行了多中心的外泌體long RNAs標志物研究,相關成果2019年發表于Gut雜志(IF= 19.8193。該研究總共納入了501個受試者,包括284個PDAC患者,100個慢性胰腺炎患者(CP),117個健康者(HC)。研究人員對所有受試樣本開展血漿外泌體全轉錄組測序。測序結果鑒別了大約15000個有注釋的基因。比較所有受試者發現PDAC,CP和HC之間血漿外泌體中檢測到的long RNAs種類的數量基本一致(圖4a)。使用t-SNE生成的三維數據散點圖說明PDAC患者外泌體long RNAs圖譜不同于健康個體和某些CP患者的圖譜(圖4b)。與CP和HC比較,鑒別了399個在PDAC中差異表達的外泌體long RNAs(圖4c)。KEGG分析發現這些差異表達的外泌體long RNAs主要富集于癌癥相關的通路,例如胰腺癌,mTOR和VEGF信號通路等(圖4d)。這些結果說明外泌體long RNAs也可以作為診斷PDAC的潛在標志物。

 

圖片 10.png

圖4. 血漿外泌體long RNA測序

 

在訓練集階段(Training),研究人員整合比對血漿外泌體全轉錄組數據與組織基因表達數據庫,機器學習分析篩選外泌體long RNAs標志物,隨后開展多中心驗證(Validation)(圖5a)。在訓練集階段相對于CP和HC,PDAC患者血漿外泌體中有1502個long RNAs上調,隨后研究人員比較了178個 PDAC癌組織RNA表達數據(TCGA)和171個正常胰腺組織RNA表達數據(GTEx),最后發現了有398個RNA在癌組織和PDAC血漿外泌體中都顯著上調。研究人員通過隨機森林算法和LASSO分析進一步確定了8個外泌體long RNAs可以作為診斷PDAC的候選標志物進行驗證(圖5b)。

圖片 2.png

圖5. 篩選8個外泌體long RNA作為診斷PDAC的標志物

 

隨后,研究人員在訓練集,驗證集的內部隊列和外部隊列利用ROC驗證了8個外泌體long RNAs非常高精確度的診斷PDAC(圖6a-c)。最后合并訓練集和驗證集進行分析,研究人員發現了外泌體long RNAs診斷標志物對早期的PDAC(I期和II期)具有很高的診斷準確度(圖6d)。并且外泌體long RNAs診斷標志物聯合CA199對于區分PDAC患者(CA199陽性)和CP患者的診斷準確度顯著提高(圖6e),并且外泌體long RNAs診斷標志物也可以高準確度的區分診斷CA199陰性PDAC患者和非癌癥者(圖6f)。這些結果說明血漿外泌體long RNAs可以作為PDAC診斷的標志物。

圖片 18.png

圖6. 外泌體long RNAs可準確診斷PDAC

 

通過上述兩個精彩的案例,不難發現基于外泌體全轉錄組篩選到的標志物具有非常高精確度的診斷效能,外泌體全轉錄組可謂是新型疾病標志物發現的搖籃。但這是一項系統性的工作,對各技術環節都有較高的要求,例如外泌體分離、RNA純化、微量建庫、片段化RNAs數據比對與拼接、機器學習建模篩選差異候選標志物等等。很多研究人員看到這里,忽然感覺可遇而不可求。不用著急,華盈生物與國內外知名學者及研發企業合作,經過不斷摸索和創新,建立了一整套的外泌體全轉錄組分析體系。我們能夠穩定地從1mL血漿中分離出高質量的外泌體,并通過高通量測序方法獲得 >10,000條long RNAs的數據。進一步,通過創新的測序數據比對算法進行高質量的片段化RNAs數據拼接,通過機器學習建模,為研究人員挑選出優秀的候選long RNAs標志物(圖7)。

圖片 1.png

圖7. 華盈生物外泌體全轉錄組標志物服務體系


在文章最后,小編特別呼吁一下,外泌體long RNA作為候選標志物大有可為,有臨床問題和臨床樣本資源的研究人員可以抓緊時機,快速行動起來了。華盈生物也會持續努力,幫助研究人員掃除外泌體標志物研究路上的一個個技術攔路虎。

相關文獻

 

1.       James McKiernan, Michael J Donovan, Vince O'Neill et al., A Novel Urine Exosome Gene Expression Assay to Predict High-grade Prostate Cancer at Initial Biopsy. [J]. JAMA Oncol. 2016;2(7):882-889. 

2.       Yuchen Li, Jingjing Zhao, Shulin Yu et al., Extracellular Vesicles Long RNA Sequencing Reveals Abundant mRNA, circRNA, and lncRNA in Human Blood as Potential Biomarkers for Cancer Diagnosis. [J]. Clin Chem.2019;65(6):798-808. 

3.       Shulin Yu, Yuchen Li, Zhuan Liao et al., Plasma extracellular vesicle long RNA profiling identifies a diagnostic signature for the detection of pancreatic ductal adenocarcinoma. [J]. Gut. 2020;69(3):540-550. 

4.       John R Chevillet, Qing Kang, Ingrid K Ruf et al., Quantitative and stoichiometric analysis of the microRNA content of exosomes. [J]. Proc Natl Acad Sci U S A. 2014 ;111(41):14888-14893.

相關閱讀

 

1. 外泌體蛋白組如何幫助小樣本量標志物研究發到高分雜志?

2. 華盈視角:外泌體蛋白質組分析如何助力腫瘤微環境研究

3. 外泌體蛋白質組學服務

4. 外泌體研究:臨床醫生申請國自然的小竅門

5. 國自然申請專題:外泌體研究經典技術路線(一)