面向大數(shù)據(jù)的生物信息云
云計算是一種通過Internet以服務的方式提供動態(tài)可伸縮的虛擬化的資源的計算模式。現(xiàn)今,隨著高通量測序技術的迅猛發(fā)展,生物信息學進入到大數(shù)據(jù)時代,所引發(fā)的多組學海量生物數(shù)據(jù)的存儲和分析等問題亟待需要利用云的方式來解決。
近期,中國科學院北京基因組研究所基因組科學與信息重點實驗室的“百人計劃”章張研究員,與沙特阿卜杜拉國王科技大學(King Abdullah University of Science and Technology)、北京理工大學、IBM中國系統(tǒng)與科技中心開展合作研究,在Biology Direct雜志上發(fā)表了題為Bioinformatics clouds for big data manipulation的學術論文。文中分析了現(xiàn)有生物信息學領域的云計算服務(簡稱:生物信息云),根據(jù)其服務特點提出分類方法:數(shù)據(jù)即服務(DaaS,Data as a Service)、軟件即服務(SaaS,Software as a Service)、平臺即服務(PaaS,Platform as a Service)以及基礎設施即服務(IaaS,Infrastructure as a Service)。
生物信息云從四個方面提供了海量生物數(shù)據(jù)的儲存、獲取、分析等相關需求的服務。同時,文中對云計算在生物信息學的應用進行了展望和討論,提出并分析了以下幾個亟需解決問題,即生物信息云應實現(xiàn)數(shù)據(jù)和軟件的云儲存,結合的高速傳輸、P2P、數(shù)據(jù)壓縮等大數(shù)據(jù)的傳輸,開發(fā)基于云的輕量型編程環(huán)境,以及建立開放的生物信息學云平臺。