文獻賞析

高分文章策略一: 動物模型在蛋白標志物研究中的妙用

2020/11/16

 

標志物研究只能僅限于臨床樣本嗎?
利用臨床樣本開展標志物研究會受到諸多因素的制約,從而較難確定標志物與疾病的直接相關性。同時,受到人群個體差異的影響,臨床標志物研究需要大量樣本產生的數據作為支撐,才具有統計說服力。相比之下,動物模型實驗可人為控制外界影響因素(年齡和腫瘤類型和分級等),動物模型遺傳背景相似,個體差異也更少1。雖然動物實驗的結果還需要回歸到臨床上進行驗證,但通過動物模型找到的標志物可能和疾病的相關性更加確定。特別是在臨床樣本收集困難,經費不富余的情況下,結合動物模型或許可以找到更具價值的標志物。另外,在篩選完標志物后,動物模型還可直接應用到下一階段的機制研究中,有效保持科學研究的連續性。今天華盈視角為大家分享兩篇利用動物模型篩選疾病標志物的研究設計,一起領略動物模型在蛋白標志物研究中的妙用。


 

 

案例一 利用小鼠模型篩選診斷前列腺癌的血清標志物

臨床上應用的很多蛋白標志物都是糖基修飾的蛋白,所以研究者聚焦在篩選血清糖基化蛋白作為前列腺癌的診斷標志物。研究者開展了2個階段的篩選和驗證研究。起始的篩選階段,研究者首先通過糖肽固相萃取和酰肼樹脂方法分別富集小鼠組織和血清中的N-linked糖蛋白,之后通過label free LC-MS/MS進行分析,篩選潛在的血清標志物;驗證階段,研究者通過靶向蛋白組學SRM-MS和ELISA在前列腺癌患者血清中檢測潛在標志物的表達,通過隨機森林算法篩選構建診斷模型(圖1)。相關研究在2011年發表于國際著名學術期刊Proc Natl Acad Sci雜志1。

圖片 7.png

圖1. 標志物研究方案

第一階段,小鼠模型實驗:研究者通過LTQ-FT軟件對質譜結果分析,鑒定了小鼠前列腺組織和血清中總共775個糖蛋白,其中658個蛋白表達在前列腺組織中(圖2A),只有95個蛋白在組織和血清中都可以被鑒別出(圖2A)。對比正常小鼠,總共分別有152個蛋白和21個蛋白惟一地表達在前列腺癌小鼠組織和血清中(圖2A)。之后研究者利用SuperHirn軟件分別對247個組織蛋白和139個血清蛋白,總共352個蛋白(其中34個組織和血清共有)進行定量分析。和正常小鼠相比,組織中有68個差異表達的蛋白,血清中有12個差異蛋白(圖2B),接著研究者對高顯著性的幾個蛋白進行了western blotting和免疫熒光驗證分析(圖2C,D)。最后研究者根據3個原則(前列腺組織特異表達的蛋白、具有顯著性差異的蛋白、在血清中可以檢測到的)從小鼠的這些數據中選取診斷前列腺癌患者的候選標志物。值得注意的是作者在這里并沒有完全僅僅按照顯著性和差異倍數來選取標志物,或許是考慮到物種間的差異性。作者最終選取了126個蛋白作為潛在的標志物,包括30個前列腺組織特異性表達的蛋白,其中的11個組織特異性蛋白的表達在癌癥和正常小鼠中并無差異;總共47個蛋白在小鼠血清中也可以被檢測到;12個蛋白唯一性的表達在癌癥小鼠中,這其中有9個蛋白是在血清中唯一性檢出的蛋白。

圖片 9.png

圖2. 分析小鼠前列腺組織和血清糖蛋白組

第二個階段,臨床驗證實驗:研究者首先檢測是否前列腺癌患者中PTEN失活也與上述的血清標志物相關。研究者收集了77個前列腺癌患者和66個良性前列腺增生患者的血清樣本,同時對其中的59個前列腺癌和40個良性前列腺增生患者進行了組織芯片分析(圖3A)。研究者利用酰肼樹脂方法富集了這些血清樣本中的糖蛋白,根據作者自己優先考慮的某些原則,利用SRM-MS定量檢測了第一階段發現的126個差異蛋白中的49個蛋白,共57個N-glycosites肽段。定量結果顯示在80-105個病人中,始終可以檢測到33個蛋白的37個多肽。作者還利用ELISA驗證了6個蛋白,補充了SRM的檢測結果,最終總共定量分析了39個蛋白,以作為潛在標志物。為了建立最優的預測模型來區分PTEN正常和失活狀態,研究者利用隨機森林算法對這39個蛋白進行了篩選分析。作者選擇了排名最高的20個預測模型,并且對1-5個血清蛋白的組合形式進行logistic回歸分析預測PTEN失活狀態。通過ROC分析,發現THBS1、TIMP-1、CFH、LRP-1這4個蛋白組成的診斷模型可以準確預測PTEN的失活狀態(PTEN正常,n=26; PTEN失活,n=28)(圖3B)。而GALNTL4、FN、AZGP1、BGN、ECM1這5個蛋白組成的診斷模型可以準確預測腫瘤病人的不同分期(Gleason score <7 or ≥7)(圖3C)。最后,研究者還發現HYOU1、ASPN、CTSD、OLFM4這4個蛋白組成診斷模型,可以準確的預測前列腺癌,區分前列腺增生。將這4個蛋白與傳統標志物PSA結合,能夠大幅度提高PSA的診斷效能(圖3D)。綜上,研究通過臨床樣本的驗證,明確了小鼠模型中篩選到的蛋白標志物確實可以成為臨床診斷候選標志物。

圖片 10.png

圖3. SRM-MS和ELISA驗證前列腺癌血清診斷標志物。

A,Venn圖展示納入的病人,可用的血清和組織。B,診斷PTEN失活和正常的前列腺癌。

C,診斷不同腫瘤分級的前列腺癌患者。D,診斷前列腺癌患者和良性前列腺增生患者。

 

案例二 整合小鼠腦組織蛋白組和轉錄組篩選缺血性腦中風標志物

本研究的目的是為了尋找缺血性腦中風潛在的標志物。研究者通過大腦中動脈閉塞構建了小鼠缺血性腦中風模型,繼而對中風小鼠缺血的腦半球(ipsilateral, IP)和非缺血的腦半球(contralateral, CL)開展了label free蛋白組學以及轉錄組學的研究。研究者對篩選出的差異基因和蛋白分別通過數字PCR靶向蛋白組學PRM在小鼠模型中進行驗證和評估潛在的標志物,最后利用ELISA檢測證實,這些潛在的標志物也存在于中風小鼠模型和中風患者的血漿中(圖4)。此項研究于2020年發表于蛋白組學權威期刊Mol Cell Proteomics2.

圖片 1.png

圖4. 研究思路

在discovery階段,研究者通過label free LC-MS/MS結合表達譜基因芯片對腦缺血小鼠模型缺血和非缺血的腦半球組織樣本,以及假手術組(執行手術,但不閉塞大腦中動脈)小鼠兩個腦半球均進行了蛋白表達譜和mRNA表達譜對比分析。發現缺血和非缺血腦組織共有76個差異基因和192個差異蛋白(p-values<0.05)差異變化(圖5A)。特別注意的是差異基因和蛋白之間并沒有重疊性,這種不一致性說明mRNA和蛋白的變化并不在同一調控維度上,也說明將mRNA與蛋白分開檢測具有充分的必要性。另外,分析假手術組小鼠的兩個腦半球組織,研究者只鑒別了2個差異基因和60個差異蛋白。這說明缺血處理相對于手術操作,大腦中動脈供血閉塞是導致小鼠腦組織的基因和蛋白表達變化的主要因素。通過多重協慣量分析(Multiple Co-Inertia Analysis,MCIA)發現這些差異基因和蛋白可以將缺血和非缺血兩種表型分開(圖5B)。

圖片 11.png

圖5. 分析缺血性和非缺血性腦組織間的差異基因和蛋白。
A. 差異基因和蛋白間沒有重疊性。B. 缺血和非缺血組織很明顯的可以分開。
黑色代表非缺血;灰色代表缺血;原點代表基因;箭頭代表蛋白。

在qualification驗證階段,研究者通過Nanostring?nCounter分析和PRM-MS、Western blotting等技術分析了候選的12個基因和5個蛋白標志物在另外一組獨立小鼠模型腦組織中的表達差異。在這組小鼠中,研究者將缺血模型分為了早期(2h)和晚期(6h)兩個階段。研究者發現了Ccl3, Atf3, Fosb, Gadd45g, Rgs2,4933427D14Rik, Cldn20, Cstad這8個基因和BAG5, CTNND2這2個蛋白的差異性表達和discovery階段一樣(圖6),研究者對比了它們在缺血早期和晚期之間的表達,發現了Gadd45g, Rgs2,Cldn20基因和BAG5, CTNND2蛋白在缺血早期和晚期間也具有差異性表達(圖6),繼而研究者通過ELISA檢測了這5個待選標志物在中風小鼠和臨床中風患者血漿中的表達狀況。對比發現RGS2、GADD45G和CTNND2的表達在缺血后都出現了顯著性的改變(圖7A)。研究者對比了這些候選標志物在假手術小鼠中左右腦半球的表達,發現它們并沒有差異,更加確定了它們的表達變化只與腦缺血直接相關。

圖片 3.png

圖6. Nanostring和PRM-MS驗證候選標志物的表達

研究者接著利用ELISA檢測了臨床上中風患者和中風狀況類似患者血漿中RGS2、GADD45G和CTNND2蛋白的表達。對比分析發現RGS2的表達并沒有差異,GADD45G的表達和小鼠模型一致,在中風患者血漿中表達升高(圖7B),但是CTNND2在中風患者血漿中的表達也增加(圖7C),CTNND2的表達趨勢和小鼠模型中的表達相反,這也說明物種之間存在的差異性。研究者將臨床數據與GADD45G和CTNND2蛋白的表達結合起來,顯著提高了對臨床缺血性中風患者的診斷效能(圖7B,C)。

圖片 4 (2).png

圖7. ELISA檢測待選標志物在小鼠和患者血漿中的表達。

由于該研究的組學篩選階段是在小鼠模型上進行,非常方便地獲取了病原灶部位的腦組織mRNA和蛋白表達譜數據。因此,對差異基因和蛋白進行聯合分析還可能發現缺血性腦中風疾病發生和進展的潛在分子機制。研究者通過網絡相關結構分析(rCCA)發現了這些差異基因和蛋白具有高度的相關性。CAMK2A 和SRGAP2兩個分子作為網絡的核心,分別聯系了19個和10個分子(圖8A)。GO分析也表明了這些相關的分子與神經發育,突觸和缺氧途徑相關,而這些通路都已經證明了與腦缺血緊密關聯(圖8B)。除此之外,差異分子還與MAPK通路,AP-1轉錄,G蛋白受體和免疫系統的功能相關,說明這些分子和相關的通路在缺血性中風的病理發生中發揮著重要作用,為進一步的機制研究指明了方向。

圖片 12.png

圖8.分析差異基因和蛋白關系,以及功能分析。
A. 差異基因和蛋白間具有高度網絡相關性。橢圓代表基因;長方形代表蛋白。
上述兩個精彩的案例展示了動物模型怎樣應用在疾病標志物的研究中。同時兩個研究用了非常相似的策略和技術手段進行研究,都是通過label free蛋白組學方法篩選標志物,PRM-MS, SRM-MS或者MRM-MS靶向蛋白組學技術進行標志物驗證。這兩種類型的蛋白組學技術的聯合應用也是標志物研究的經典路線。

82c6a535291919d1df5d21fd683abc7.png

華盈生物致力于蛋白質譜技術的應用的研究,可以提供一系列的蛋白質組學技術服務,包括非標記定量標記定量,以及靶向蛋白組學技術,同時華盈生物還提供后續數據的深度分析包括支持向量機,邏輯回歸,隨機森林算法等機器學習模型構建,為大家在科研道路上保駕護航。

相關文獻

1. Cima I, Schiess R, Wild P,et al., Cancer genetics-guided discovery of serum biomarker signatures for diagnosis and prognosis of prostate cancer. Proc Natl Acad Sci U S A. 2011;108(8):3342-3347. 

2. Simats A, Ramiro L, García-Berrocoso T, et al., A mouse brain-based multi-omics integrative approach reveals potential blood biomarkers for ischemic stroke. Mol Cell Proteomics. 2020;mcp.RA120.002283.

相關閱讀

1. 華盈視角:外泌體蛋白質組分析如何助力腫瘤微環境研究

2.蛋白質組學技術應用于中藥靶點的尋找

3.外泌體蛋白組如何幫助小樣本量 標志物研究發到高分雜志?