您好, 歡迎來到環(huán)保在線! 登錄| 免費(fèi)注冊| 產(chǎn)品展廳| 收藏商鋪|
摘要 : 2016年10月14日,學(xué)術(shù)期刊《BioInformatics》在線發(fā)表了*北京基因組研究所生命與健康大數(shù)據(jù)中心章張研究員的一篇研究論文,研究報(bào)道了*基于Spark的大數(shù)據(jù)系統(tǒng)發(fā)育建樹工具CloudPhylo。
2016年10月14日,學(xué)術(shù)期刊《BioInformatics》在線發(fā)表了*北京基因組研究所生命與健康大數(shù)據(jù)中心章張研究員的一篇研究論文,研究報(bào)道了*基于Spark的大數(shù)據(jù)系統(tǒng)發(fā)育建樹工具CloudPhylo。博士研究生徐行健為論文*作者,章張研究員為論文通訊作者。
構(gòu)建系統(tǒng)發(fā)育樹是分子進(jìn)化研究中分析物種間進(jìn)化關(guān)系的基礎(chǔ)步驟與重要環(huán)節(jié)。隨著生物大數(shù)據(jù)時(shí)代的到來,傳統(tǒng)的建樹工具在使用大數(shù)據(jù)集構(gòu)建系統(tǒng)發(fā)育樹時(shí)需要消耗更多的計(jì)算資源且運(yùn)行時(shí)間超長,使得科研工作者無法快速地進(jìn)行分子進(jìn)化分析。為此,生命與健康大數(shù)據(jù)中心(BIG Data Center;http://bigd.big.ac.cn)利用Spark云計(jì)算技術(shù),于近期開發(fā)了一款適用于大數(shù)據(jù)集的系統(tǒng)發(fā)育樹構(gòu)建工具——CloudPhylo。Spark是一種新的分布式云計(jì)算框架,它實(shí)現(xiàn)了MapReduce分布式并行算法?;赟park框架的程序在運(yùn)算過程中可地將中間輸出結(jié)果保存在內(nèi)存中,大大降低了因?yàn)轭l繁讀寫文件造成的損耗。因此,與傳統(tǒng)的Hadoop框架相比,Spark能更好地應(yīng)用于需要反復(fù)迭代的大數(shù)據(jù)分析任務(wù)。
CloudPhylo是目前上針對大數(shù)據(jù)集開發(fā)的系統(tǒng)發(fā)育建樹工具,同時(shí)也是國內(nèi)*使用Spark云計(jì)算技術(shù)開發(fā)的生物信息學(xué)分析軟件。在應(yīng)用于模擬和真實(shí)的大數(shù)據(jù)集構(gòu)建系統(tǒng)發(fā)育樹時(shí),CloudPhylo均表現(xiàn)出了比傳統(tǒng)建樹軟件更高的運(yùn)行效率和更大的并行加速比(圖1)。
工具已經(jīng)部署在BIGD云平臺Qomo(https://cloud.big.ac.cn/users/bigd/tools/Clouldphylo)上,無須本地安裝,用戶可在線提交數(shù)據(jù)并進(jìn)行分析。
<img alt="BioInformatics:北京基因組所章張研究組開發(fā)基于Spark的大數(shù)據(jù)系統(tǒng)發(fā)育建樹工具" "="" data-cke-saved-src="http://www.bio1000。。com/uploads/allimg/161102/0956493591-0.jpg" src="http://www.bio1000。。com/uploads/allimg/161102/0956493591-0.jpg" style="vertical-align: middle; border: 0px; width: 400px; height: 214px;">
圖1 CloudPhylo在不同條件下的并行加速比
請輸入賬號
請輸入密碼
請輸驗(yàn)證碼
以上信息由企業(yè)自行提供,信息內(nèi)容的真實(shí)性、準(zhǔn)確性和合法性由相關(guān)企業(yè)負(fù)責(zé),環(huán)保在線對此不承擔(dān)任何保證責(zé)任。
溫馨提示:為規(guī)避購買風(fēng)險(xiǎn),建議您在購買產(chǎn)品前務(wù)必確認(rèn)供應(yīng)商資質(zhì)及產(chǎn)品質(zhì)量。