2019-10-28
從IT到DT,中科曙光支撐生命
北京2019年12月2日 /美通社/ -- 生命科學(xué)是通過(guò)分子遺傳學(xué)為主,研究生命活動(dòng)規(guī)律,從而達(dá)到治療診斷遺傳病、提高農(nóng)作物產(chǎn)量、保護(hù)環(huán)境等目的。生命科學(xué)的數(shù)據(jù)來(lái)源和形式多樣,包括基因測(cè)序、分子通道、不同的人群等。技術(shù)的提升引領(lǐng)了IT到DT(數(shù)據(jù)時(shí)代)的變革,基于基因組數(shù)據(jù)量越來(lái)越多的情況下,生命科學(xué)大數(shù)據(jù)的發(fā)展前景將更加廣闊。利用信息技術(shù)將數(shù)據(jù)轉(zhuǎn)換成更好理解的基礎(chǔ)生命科學(xué)機(jī)制,其分析結(jié)果將給人類(lèi)帶來(lái)更多福音。
計(jì)算和存儲(chǔ)是大數(shù)據(jù)研究中不可或缺的重要技術(shù)和支撐,生命科學(xué)大數(shù)據(jù)的研究也不例外。中國(guó)科學(xué)院上海生命科學(xué)研究院(以下簡(jiǎn)稱(chēng):生科院),是國(guó)家級(jí)生命科學(xué)研究平臺(tái),整體實(shí)力和技術(shù)水平處于國(guó)內(nèi)領(lǐng)先。它的領(lǐng)先除了生物技術(shù)之外,信息技術(shù)也扮演者重要的角色。在本次項(xiàng)目中,由曙光為生科院建設(shè)生物醫(yī)學(xué)大數(shù)據(jù)信息系統(tǒng)基礎(chǔ)平臺(tái)(以下簡(jiǎn)稱(chēng):生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái))。平臺(tái)建成后將面向生命科學(xué)研究、生物醫(yī)藥研發(fā)、臨床醫(yī)學(xué)研究與應(yīng)用,推動(dòng)生物醫(yī)藥技術(shù)企業(yè)創(chuàng)新發(fā)展,支撐數(shù)據(jù)密集型科學(xué)研究和生物信息共享。
安全穩(wěn)定存儲(chǔ)系統(tǒng),滿(mǎn)足生物醫(yī)學(xué)用戶(hù)需求:
生物醫(yī)學(xué)數(shù)據(jù)的主要類(lèi)型為文本文件、圖像文件、二進(jìn)制文件等非結(jié)構(gòu)化數(shù)據(jù),對(duì)存儲(chǔ)的要求主要在存儲(chǔ)容量的大小和大文件讀寫(xiě)通量的高低,此外少量的關(guān)鍵數(shù)據(jù)庫(kù)、索引等結(jié)構(gòu)化數(shù)據(jù),則對(duì)存儲(chǔ)的IOPS和穩(wěn)定讀寫(xiě)能力要求較高。
未來(lái),生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)將成為面向生物醫(yī)學(xué)大數(shù)據(jù)開(kāi)放研究平臺(tái),面向世界的國(guó)際數(shù)據(jù)交流接口和合作研究基地,海量生物醫(yī)學(xué)大數(shù)據(jù)資源的匯聚、管理和共享,數(shù)據(jù)的安全性至關(guān)重要。
兩地三中心架構(gòu),打造高可用生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái):
生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)基礎(chǔ)設(shè)施由三個(gè)中心組成,分別為張江中心、岳陽(yáng)路中心和貴州中心,每個(gè)中心都需要承載相關(guān)的業(yè)務(wù)系統(tǒng)。三個(gè)中心通過(guò)科技網(wǎng)鏈路相互連通,通過(guò)同城雙活、異地容災(zāi)的兩地三中心架構(gòu),滿(mǎn)足生物醫(yī)學(xué)大數(shù)據(jù)平臺(tái)業(yè)務(wù)高可用和高穩(wěn)定性。