陳尚義百度新存儲系統(tǒng)應(yīng)對大數(shù)據(jù)挑戰(zhàn)

陳尚義演講
近日,百度技術(shù)委員會理事長陳尚義應(yīng)邀與電子學(xué)會名譽理事長、原信息產(chǎn)業(yè)部部長吳基傳,中國電子學(xué)會副理事長劉汝林以及北京航空航天大學(xué)計算機學(xué)院院長呂衛(wèi)峰等產(chǎn)業(yè)界高端專家、學(xué)者共同出席第四屆中國云計算大會的“云計算與大數(shù)據(jù)專題論壇”。
論壇上,陳尚義作了題為“百度大數(shù)據(jù)挑戰(zhàn)及應(yīng)對”的主題演講,從百度的數(shù)據(jù)特點及對存儲系統(tǒng)的要求出發(fā),介紹了百度存儲系統(tǒng)的先進性。
在介紹百度的數(shù)據(jù)特點時,陳尚義用了“海量”和“復(fù)雜”來形容百度數(shù)據(jù)特點。他說:“百度儲存和處理的數(shù)據(jù)主要包括:網(wǎng)頁和超鏈接的數(shù)據(jù)量、日志、數(shù)據(jù)倉庫、廣告數(shù)據(jù)以及UGC(用戶創(chuàng)造的數(shù)據(jù))等。百度擁有上百PB(1PB= 1048576GB)的數(shù)據(jù)總量,日處理量達幾十PB,且呈現(xiàn)高速增長的態(tài)勢。這些數(shù)據(jù)都具有結(jié)構(gòu)化與非結(jié)構(gòu)化并存、系統(tǒng)數(shù)據(jù)對數(shù)據(jù)一致性要求強弱程度不同、用戶對數(shù)據(jù)的訪問行為存在不確定性,即在毫無征兆的情況下,對某些信息進行突發(fā)式訪問等特點,這些特點使得百度要應(yīng)對復(fù)雜的存儲要求。
那么如何應(yīng)對這樣的挑戰(zhàn)呢?陳尚義通過解析百度的云儲存架構(gòu)及優(yōu)勢,為與會嘉賓解開了心中的疑惑。他特別指出,百度對存儲系統(tǒng)做了全局優(yōu)化,包括針對訪問模式的優(yōu)化、硬件特性的優(yōu)化、依訪問模式定制硬件、提升單機性能、與CDN系統(tǒng)實現(xiàn)更優(yōu)結(jié)合等?!氨热?,在硬件特性優(yōu)化方面,百度對單機的硬件(CPU、內(nèi)存、硬盤、SSD等)進行了合理配比,以實現(xiàn)單機資源的充分利用?!标惿辛x解釋說,“又如,在與CDN系統(tǒng)實現(xiàn)更優(yōu)結(jié)合方面,百度將最常被訪問的數(shù)據(jù)自動緩存到距離用戶最近的數(shù)據(jù)中心?!?BR> 此外,在談到百度儲存優(yōu)勢時,陳尚義還介紹了李彥宏發(fā)明的超鏈分析技術(shù)。他說:“這一技術(shù)早在1999年就被授予了專利,比Google創(chuàng)始人佩奇申請的Pagerank專利還早,是搜索引擎產(chǎn)業(yè)發(fā)展的基石。原中國計算機學(xué)會理事長、中國工程院院士李國杰先生曾稱贊‘李彥宏在推動計算技術(shù)和產(chǎn)業(yè)的發(fā)展中作出了可載入史冊的歷史性貢獻’?!?/FONT>
責編/劉榮 高玉梅
手機體驗

微信公眾號

微信小程序

手機版
-
微分享
