亚洲精品无码国产片_国产午夜精品理论片久久_国产精品免费视频观看拍拍_国产精品1区2区3区在线播放

作者:Mike May / 文 李楠 / 譯 來源: 發布時間:2019-9-5 14:52:22
大數據轉化:蛋白質組學的挑戰

 
人體中有大約20000個蛋白質編碼基因,能翻譯相應數量的蛋白質。然而,通過翻譯后修飾會產生更多形態的蛋白質。截至2018年4月4日,人類蛋白質組圖譜包含30057種蛋白質。將眾多的分子與質譜(MS)這樣的分析技術相結合,探索其微妙的聯系,會產生海量的“大數據”。由于獲得的蛋白質組復雜信息數據量過于龐大,通常需要很多科研人員協作才能解讀某一個數據集的信息。
 
雖然這些數據集無論從體量還是復雜度看都是驚人的,但共享在將來仍是可預期的。位于威斯康星大學麥迪遜分校的國立衛生研究院(NIH)國家復雜系統定量生物學中心主任Joshua Coon說:“作者通常主動的或者是根據要求將蛋白質組學研究的原始數據發送到相應數據庫中。但在10年前,情況并非如此,人們的態度已經在改變了。”蛋白質組學界甚至整個學術界都意識到數據透明度提高了研究人員之間的信任程度,即使身處不同領域的人也是如此。
 
數據共享的困難
 
在馬薩諸塞州比勒利卡的布魯克公司蛋白質組學業務開發副總裁Gary Kruppa表示,現在產生蛋白質相關的大數據比以往任何時候都容易,但以最有效的方式分享數據卻很難。研究人員可以在幾天內獲取數以TB計的數據,但數據的轉移和可視化卻很難。甚至儲存一個月積累的數據都很困難。
 
海量數據共享的難點依然在于缺乏有效的方法,而且很難提供足夠的實驗和生物學相關信息。如果研究人員只想分享蛋白質組學實驗的原始數據,以及與數據相關的一些背景和結果,那是非常簡單的,位于英國劍橋的歐洲分子生物學實驗室——歐洲生物信息學研究所(EMBL—EBI)蛋白質組學團隊負責人Juan Antonio Vizcaíno解釋說。
 
越來越多的科研人員參與到數據共享中,隨之而來的挑戰也在不斷增加。例如,僅將信息轉儲到數據庫是不夠的。“必須確保上傳的數據質量足夠高,以便其他同行能夠使用這些數據,”加利福尼亞州圣何塞市賽默飛世爾科技公司蛋白質組學解決方案全球營銷總監Andreas Huhmer說。此外,除非數據采用某種標準格式,否則數據上傳到數據庫以后無法方便地進行檢索。
 
分析數據的方法也會影響從中得出的結論。“目前有太多種分析蛋白質組學數據的方法,因此對數據的解釋存在主觀性,”澳大利亞帕克瓦拉的沃爾特和愛麗莎霍爾醫學研究所的系統生物學和個性化醫學部門負責人Andrew Webb解釋說。
 
其他專家也贊同數據分析仍然是蛋白質組學研究人員面臨的挑戰之一。“我們如何有效地將原始數據轉化為有意義的東西,仍然是要克服的第一個難題,就算是在同一個實驗室里也一樣。”英國曼徹斯特沃特世公司健康科學主任James Langridge指出。
 
即使科研人員們就數據的標準化格式和分析方法達成一致,還是存在很多需要解決的問題。首先,必須根據需要更新數據標準;其次,即使是共享最大的蛋白質組數據集也會出現不足。“為了盡量多的從蛋白質組學數據集中獲得科學知識,而且這些知識應該與其基因組和轉錄組信息進行系統化的整合,”位于馬里蘭州羅克維爾市的美國國家癌癥研究所癌癥臨床蛋白質組學研究辦公室主任Henry Rodriguez說,“通過將蛋白質組學與基因組學、蛋白質基因組學等信息進行整合,這種多組學方法可以獲得更多新的生物學知識,這是單一組學數據分析所不能比擬的。”
 
科學研究的尺度
 
蛋白質組學大數據集共享的價值在于它們可能帶來衛生保健等方面的改善。例如,Rodriguez說:“制藥公司將獲益于更深入地了解疾病,從而開發出更有效的藥物。”
 
同樣,蛋白質組學可以與其他工具結合使用,例如CRISPR等基因編輯技術。“編輯生物系統并觀察其表型確實非常驚人,”Langridge說。用基因編輯工具調整系統,并分析其結果將有助于科研人員揭示特定蛋白質的功能。
 
就目前來說,像EMBL-EBI的PRoteomics IDEntifications(PRIDE)這種專門為數據共享所開發的數據庫可能是最有幫助的。它收錄了來自50多個國家的超過8400個蛋白質組學數據集,代表了近80000個獲取蛋白質組學數據的測試,所有數據總量大約為400TB。
 
洛桑的瑞士生物信息學研究所開發了neXtProt,這是另一個蛋白質知識庫,它記錄了超過20000種蛋白質和近20萬種翻譯后修飾數據。
 
“最著名的蛋白質知識庫是UniProt,當然它不僅僅關注人類蛋白質,”Vizcaíno說。像這樣的數據庫可以收錄各種新的科學知識。“你可以試著找出結合不同實驗室數據集的方法,或尋找更具創新性的方法來分析這些數據,”Vizcaíno說。“通常,對蛋白質組學數據的分析是為了回答一組科學問題,當然也可以用其他方法分析這些數據。”因此,如果有人提出一種探索現有數據的新方法,那么其結果可能會揭示新的生物學知識。
 
除此之外,還有更多關于蛋白質的數據信息有待確定。正如Huhmer所指出的那樣,“大約有15000個已知的蛋白質家族。”同一個家族中的蛋白質都存在結構相似性。根據Huhmer的說法,研究人員已經研究了一些家族蛋白的結構,并用X射線晶體學等技術直接測量了大約4500個家族;通過計算機模擬了另外4500個(其中只有大約1000個具有高可信度);他們還不知道其余6000多個家族蛋白的結構。
 
技術的進步不斷給研究人員提供更多的蛋白質組學數據。例如,Huhmer提到多種無標定量的MS方法可用于每天產生100萬個數據點。此外,結合MS與冷凍電鏡之類的結構生物學技術,可以確定蛋白質的三維形狀,從而用來分析一些現在未被描述的結構。“因此,技術的演化揭示了更多蛋白質結構的信息,并推動了這個領域的更多研究。”
 
值得高興的是,一旦蛋白質家族中某一個成員的結構被解析,隨后就可以通過計算生物學模擬該家族中的其他成員結構。“這樣,蛋白質數據分析結果會呈指數增長,”Huhmer解釋道。事實上,計算生物學在推動蛋白質組學數據分析和共享方面發揮著廣泛的作用。
 
技術開發團隊和科研課題組的密切協作能夠使科研人員更容易共享蛋白質組學數據,并促進項目合作。例如,德國慕尼黑工業大學(TUM)、柏林的JPT Peptide Technologies公司(JPT)、瓦爾多夫的SAP公司和賽默飛世爾科技公司創建了一個聯盟,幫助科學家將蛋白質組學數據進行轉化,并應用到基礎和醫學研究。用戶在這個叫做ProteomeTools的在線數據庫中可免費獲得該聯盟提交的研究數據。
 
找出數據間的聯結
 
ProteomeTools聯盟的例子清楚地表明,科研人員和機構需要開展新形式的合作,并共享大型蛋白質組學數據集。當然,當科研人員們收集了如此多的數據,而實驗和實驗結果之間存在多種可能的聯結,于是他們比以往更加專注于新的計算工具的開發。
 
“我認為人工智能,機器學習和深度學習是能夠激勵研究者們共享大數據的技術領域。這些技術需要大量數據,因此,一定程度上會推動研究界分享大數據,以確保他們的持續發展。”Rodriguez指出。
 
雖然Rodriguez欣喜于這些工具將輔助科研人員發現那些隱藏的聯結,并可能進一步催生出新的科學假設與研究,但他補充說,“我們必須謹記它不僅僅是關于技術本身,也是人們對數據分析方法的進一步解釋,審查,挑戰與質疑的過程。”
 
正如Rodriguez解釋的那樣,“這些計算系統需要更多的合作和開放性科學數據,并以新的方式創造價值。”他列舉了三個這種持續和廣泛合作的例子:國家癌癥研究所(NCI)的臨床蛋白質組學腫瘤分析聯盟(CPTAC)計劃;NCI、國防部和退伍軍人事務部合作的應用蛋白基因組學學習和成果共享組織網絡(APOLLO);國際癌癥蛋白質組聯盟(ICPC),它們都“鼓勵通過數據共享向公眾提供數據”。
 
為了進一步發揮合作的效力,分析平臺應該具備簡化數據采集和共享的技術。在這些方面,沃特世公司開發了一種獨立于數據的串聯MS數據采集方法——SONAR。Langridge說:“整個思路的核心是能夠以穩定一致的方式獲取蛋白質組學數據”。對于每個測試樣品,該系統都將獲取肽段和蛋白質的定量信息。Langridge解釋到,“不僅僅是鑒定這些蛋白質,而是在不同的樣品中收集它們的豐度值。”此外,用戶無需在測試開始之前決定是否要采集數據,因為SONAR會采集所有數據。“靶向實驗的挑戰在于,你需要預先確定你所關注的東西。但是你也不清楚是否存在脫靶效應,或者是否有其他的生化途徑參與其中,”Langridge說。
 
收集如此多的數據,并以研究人員們可共享、可重新訪問的方式存儲,將會提高數據集的可持續價值。“許多已經發表的研究果可能再也沒有被關注過,”Kruppa指出,“如果數據無法輕易共享,則無法驗證數據。”因此,創建數據共享工具可以使得新舊結果互相得到印證。“另外,這些工具讓你可以分析來自其他科研人員的數據,并對你的研究進行更有效更廣泛的比較。”
 
以前獲得的數據集還可以幫助科學家們開發工具。例如,可以在現有數據集上測試新的分析工具,并在需要時進行調整。Kruppa指出,“許多研究人員正致力于開發包含人工智能分析技術的新工具。只要既有的數據可以輕松共享,這些工具就可以在以前的數據集上進行驗證。”
 
數據是否易于共享取決于其格式。為此,布魯克開發了捕獲型離子淌度——飛行時間質譜(timsTOF Pro MS/MS)平臺,以獲得格式通用的數據。Kruppa說:“該儀器將采集大量數據,我們需要使其易于使用。如果沒有這種數據兼容性,即使是最先進的計算工具也會在嘗試數據集比較時遇到障礙。”
 
查看共享內容
 
這一點已經很清晰了:蛋白質組學專家們并不缺乏數據。相反,他們中的大多數人可能會同意Coon的觀點:“我們被數據淹沒了。”
 
Coon指出,最好是從同一個實驗中收集所有原始MS數據并對其進行批量化處理。“大家都希望以同樣的方式收集和分析所有的樣本,”他說。
 
完成這項工作,特別是分析部分,往往需要科研人員們開發自己的工具。例如,Coon聘請了一名數據分析專家,用兩年時間構建了一個可視化工具。他們的研究團隊需要一種方法來分析、組織并結合項目產生的所有蛋白質組學、脂質組學和代謝組學數據集。因此,Coon和他的同事將他們的數據查看器集成到了一個網站中。
 
“我們首先將一個酵母研究項目的相關數據進行了這樣的展示,以方便人們使用這些數據。現在我們為每個項目創建一個這樣的網站。”有了Coon的查看器,他們不再需要給訪問者提供一個8000列的Excel電子表格,其他研究人員也可以快速地對不同樣本來源的數據就行比較。“他們可以非常快速地對數據進行查詢。”Coon解釋。
 
雖然Coon說他還沒有發現很多與他的辦法類似的例子,但他發現這有助于他的團隊和其他同行從數據集中提取有用的生物信息,因為他們可以通過查詢它,而非常快速地比較樣本和數據點。
 
“大多數實驗室需要弄清楚當他們獲得如此多的數據之后,如何從原始MS文件中獲得有用的信息。他們也許有自己的工具去解決這個問題,”Coon指出。“但目前還沒有那么多脫穎而出的選項供大家使用。人們也不像重視硬件那樣重視軟件。”
 
然而,為了共享大型蛋白質組學數據集,必須持續優化硬件和軟件。此外,科研人員必須保持數據質量。Rodriguez表示,雖然“一提起大數據,數據的大小就會跳出來。但從獲取知識的機會來看,從大數據中汲取的信息內容和質量是我理解的大之所在。”■
 
(譯者李楠是中國科學院深圳先進技術研究院的副研究員。)
Mike May 是佛羅里達州的自由撰稿人和編輯。
 鳴謝:“原文由美國科學促進會(www.aaas.org)發布在2018 年6 月14 日《科學》雜志”。官方英文版請見https://www.sciencemag.org/features/2018/06/
translating-big-data-proteomics-challenge。

 
《科學新聞》 (科學新聞2019年8月刊 科學·生命)
發E-mail給:      
| 打印 | 評論 |
亚洲精品无码国产片_国产午夜精品理论片久久_国产精品免费视频观看拍拍_国产精品1区2区3区在线播放
<ul id="8ie0k"></ul>
  • <ul id="8ie0k"><acronym id="8ie0k"></acronym></ul>
  • 欧美精品自拍偷拍动漫精品| 亚洲高清久久久| 久久久久久久高潮| 99v久久综合狠狠综合久久| 国产偷国产偷亚洲高清97cao| 免费欧美在线视频| 欧美一区日本一区韩国一区| 亚洲人午夜精品| 国语自产精品视频在线看抢先版结局 | 国产欧美日韩另类一区| 欧美日韩精品国产| 欧美丰满高潮xxxx喷水动漫| 久久动漫亚洲| 欧美一区二区三区另类| 亚洲——在线| 亚洲最新合集| 一本色道久久综合一区| 亚洲精品综合精品自拍| 亚洲每日在线| 夜夜夜精品看看| 99这里只有精品| 一区二区冒白浆视频| 99精品99久久久久久宅男| 亚洲日本欧美在线| 99xxxx成人网| 亚洲一区二区精品视频| 亚洲一区二区四区| 午夜天堂精品久久久久| 欧美一区午夜视频在线观看| 久久xxxx| 欧美99在线视频观看| 免费观看亚洲视频大全| 欧美激情va永久在线播放| 欧美精品一区二区三区四区| 欧美国产国产综合| 欧美日本国产| 国产精品高潮呻吟久久av黑人| 欧美天堂亚洲电影院在线播放| 国产精品护士白丝一区av| 国产精品在线看| 在线播放中文字幕一区| 国产精品日韩| 国产精品无码永久免费888| 国产婷婷色一区二区三区| 国产一区二区精品久久| 亚洲高清不卡av| 91久久精品一区| 亚洲五月六月| 久久一区二区三区av| 欧美成黄导航| 国产精品久久久久久久午夜 | 国产欧美精品xxxx另类| 一区二区在线视频播放| 日韩西西人体444www| 欧美亚洲视频| 美女网站久久| 国产嫩草一区二区三区在线观看| 在线精品福利| 亚洲欧美日韩国产综合精品二区 | 黄色在线成人| 亚洲视频成人| 欧美va天堂va视频va在线| 国产精品久久中文| 亚洲日本成人| 久久www成人_看片免费不卡| 欧美精品综合| 在线观看欧美激情| 亚洲性人人天天夜夜摸| 欧美高清视频在线| 国产一区99| 午夜精品久久久久久久99黑人| 免费成人av资源网| 国产视频亚洲| 亚洲一品av免费观看| 欧美va天堂在线| 激情欧美日韩一区| 久久爱另类一区二区小说| 欧美日韩一卡| 99视频有精品| 欧美国产日韩精品免费观看| 国产日韩欧美高清免费| 亚洲最新在线| 欧美国产日韩亚洲一区| 亚洲成人在线网站| 久久免费国产| 伊人精品久久久久7777| 久久精品人人爽| 国产一区二区三区成人欧美日韩在线观看| 99在线精品免费视频九九视| 欧美精品色综合| 亚洲精品视频一区| 欧美国产日韩视频| 亚洲精品国精品久久99热一| 欧美va天堂在线| 亚洲国产成人久久综合| 欧美在线视频一区二区| 国产精品永久免费视频| 午夜视频一区| 好吊成人免视频| 久久免费午夜影院| 一区二区在线视频播放| 久久久噜噜噜久久中文字幕色伊伊 | 国产精品第一区| 在线一区二区三区做爰视频网站| 欧美精品v日韩精品v国产精品| 一区在线电影| 欧美国产视频一区二区| 亚洲国产精品激情在线观看| 欧美精品亚洲| 亚洲午夜一级| 国产一区二区三区在线观看网站| 欧美在线播放一区| 在线观看亚洲精品| 欧美日韩成人一区二区| 午夜精品久久久久久99热软件| 狠狠噜噜久久| 欧美日韩一区二区在线观看| 亚洲欧美影院| 亚洲第一偷拍| 国产精品高潮久久| 久久久久国产精品人| 一区在线影院| 欧美日韩精品中文字幕| 欧美中文在线免费| 亚洲精品久久久久久久久久久久久| 欧美三区美女| 久久这里有精品15一区二区三区 | 美女999久久久精品视频| 亚洲三级电影在线观看| 国产欧美日韩精品a在线观看| 久久夜精品va视频免费观看| 中文日韩电影网站| 亚洲国产精品美女| 国产伦精品一区二区三| 欧美激情1区2区3区| 欧美在线视频在线播放完整版免费观看| 在线成人免费视频| 国产精品入口| 欧美了一区在线观看| 日韩午夜在线| 亚洲国产精品欧美一二99| 国产情人节一区| 欧美午夜片在线免费观看| 免费不卡中文字幕视频| 欧美在线视频观看免费网站| 一区二区三区欧美在线观看| 亚洲国产精品va在看黑人| 国产日韩在线看片| 国产精品户外野外| 欧美日韩免费视频| 欧美风情在线观看| 久久亚洲高清| 久久精品国产欧美亚洲人人爽| 亚洲网友自拍| 一区二区精品在线观看| 亚洲精品欧美日韩专区| 在线免费高清一区二区三区| 国产日韩av一区二区| 欧美午夜激情视频| 欧美日韩色一区| 欧美日韩精品欧美日韩精品| 欧美激情在线观看| 欧美夫妇交换俱乐部在线观看| 麻豆精品一区二区综合av| 久久久久久久久久码影片| 性做久久久久久| 午夜精品一区二区三区电影天堂| 亚洲字幕一区二区| 亚洲综合日韩在线| 香蕉久久夜色| 久久福利精品| 老司机午夜精品视频在线观看| 免费成人性网站| 欧美国产日本在线| 欧美日本一区二区三区| 欧美三级欧美一级| 国产精品亚洲一区| 狠狠色综合色区| 亚洲欧洲精品一区二区三区波多野1战4| 亚洲人成网站在线播| 99视频一区二区| 欧美一进一出视频| 久久人人97超碰精品888| 欧美成人嫩草网站| 欧美日韩亚洲免费| 国产精品jvid在线观看蜜臀| 欧美日韩综合精品| 国产精品视频免费一区| 韩国av一区二区三区| 亚洲日韩视频| 亚洲欧美日韩国产精品| 久久天堂成人| 欧美视频亚洲视频| 国产日韩综合| 亚洲精品国产精品国自产在线| 亚洲天堂成人在线视频| 久久爱www| 欧美日韩一区二区视频在线观看 | 亚洲欧美另类国产| 久久亚洲国产精品日日av夜夜|