文獻賞析

質譜原始數據如何上傳數據庫?

2021/03/01

很多在華盈生物完成質譜檢測服務后的客戶,到了文章發表的階段都會咨詢如何上傳原始數據到公共數據庫這個問題。對于組學研究來說,文章發表時雜志社一般會要求將原始數據上傳到公共數據庫,并在正文中提供相應數據庫編號供同行下載,以重新進行數據分析和核對。隨著蛋白組學的發展,專門供質譜原始數據儲存和分享的數據庫也出現了,功能也日趨完善。今天,小編將為大家介紹一款目前應用體驗度排名靠前的數據庫——ProteomeXchange。

ProteomeXchange(簡稱PX),是應用較為廣泛的蛋白質組學質譜數據存儲平臺(proteomexchange.org),其旗下包括了PRIDE Archive, MassIVE, PeptideAtlas, jPOST等質譜數據存儲平臺,接下來我們將一起體驗如何一步步上傳我們的質譜原始數據到PX上。

一、 ProteomeXchange原始數據的上傳

1. 點擊下面的網址下載標準的提交工具PX Submission tool,軟件基于Java開發環境,請確保電腦已經安裝Java。PX Submission tool無需安裝,解壓文件夾即可直接運行。網址:ebi.ac.uk/pride/help/archive/submission


2. 登錄賬號,若之前未使用的話需要進行注冊。

(注冊網址:ebi.ac.uk/pride/archive/register



3. 選擇提交類型(在實際使用過程中,partial submission為更經常用到的模式)。


4. 提交原始數據對應的相關信息。


5. 點擊Add Files添加項目原始raw文件搜庫文件,Fasta序列數據庫,搜庫結果,項目相關信息等等。若導入的File Type經軟件識別類型有誤時,可點擊對應的文件進行文件類型的修改。


6. 加載進所有文件之后,需要添加Result結果和原始文件之間的相關性。


7. 添加物種,樣本類型,質譜儀器和修飾等相關信息。(帶*號的為必填項)


8. 提供實驗室負責人或者課題組老師的聯系方式等。


9. 如果本次上傳的數據是一個大型研究項目的一部分,或者在數據處理過程中采用了其他發表文獻數據或其他數據集數據則需要提供相關信息。


10. 對已上傳的數據進行核對,若無誤點擊Next進行數據提交。



提交成功后,郵箱會收到一條提醒原始數據提交成功的郵件,待數據通過審核之后ProteomeXchange會再次通過郵件提醒Project accession(也可以通過登錄網站:ebi.ac.uk/pride/login進入個人中心查看)。

二、 上傳數據內容說明

上傳的數據集(dataset)往往包含質譜儀下機的原始文件(Raw data)、搜庫完成后的結果文件以及實驗信息等。其中質譜原始數據,我們稱之為“RAW”,常見為質譜儀直接輸出的raw格式文件,或者經過加工后的XML形式文件(mzXML或者mzML);搜庫結果文件為ProteinGroups和Peptides蛋白肽段鑒定結果,稱之為“RESULTS”。對于微生物等特殊物種,可以選擇上傳搜庫時所比對的DNA測序轉換成的氨基酸序列數據文件(一般為.fasta后綴的格式文件)等等。華盈生物目前報告中常用的質譜搜庫軟件包括Maxquant軟件和Proteome Discoverer軟件(PD)等。上傳數據庫時,一般針對Maxquant軟件搜庫結果,選擇上傳原始下機Raw文件+搜庫結果文件search(可以將table文件夾中所有文件壓縮得到壓縮包直接上傳)。

針對PD軟件搜庫結果,選擇上傳原始下機Raw文件+蛋白鑒定列表+搜庫searchsummary結果。


特色質譜,特色華盈

華盈生物質譜平臺擁有多種不同型號高精度質譜儀,通過深入的質譜技術開發,我們致力于在常規定量蛋白組(iRAQ/TMT/Label free/DIA)技術之外,為科研用戶提供更多的特色質譜技術服務的選擇。經過多年發展,外泌體蛋白組、靶向蛋白組(MRM)和定量藥物小分子組等產品已經成為華盈生物質譜業務的新名片。有了這些技術平臺的支撐,華盈生物的合作者們就可以放心地開展更大范圍、更前沿的科學探索了。



相關閱讀

外泌體蛋白質組學服務                 2020.07.23