Apache HBase
来自维基百科,自由的百科全书
HBase是一個開源的非關係型分布式數據庫(NoSQL),它參考了谷歌的BigTable建模,實現的編程語言為 Java。它是Apache軟件基金會的Hadoop項目的一部分,運行於HDFS文件系統之上,為 Hadoop 提供類似於BigTable 規模的服務。因此,它可以對稀疏文件提供極高的容錯率。
HBase在列上實現了BigTable論文提到的壓縮算法、內存操作和布隆過濾器。HBase的表能夠作為MapReduce任務的輸入和輸出,可以通過Java API (頁面存檔備份,存於網際網路檔案館)來存取數據,也可以通過REST、Avro或者Thrift的API來訪問。
雖然最近性能有了顯著的提升,HBase 還不能直接取代SQL數據庫。如今,它已經應用於多個數據驅動型網站[1][2],包括 Facebook的消息平台[3][4]。
在 Eric Brewer的CAP理論中,HBase屬於CP類型的系統。
歷史
Apache HBase最初是Powerset公司為了處理自然語言搜索產生的海量數據而開展的項目。不過現在它已經是Apache基金會的頂級項目,並且引起了廣泛的關注[5]。
Facebook在2010年11月選用了HBase來實現它新的消息平台[3]。
參考資料
參考書目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.