Hadoop + Hbase 叢集環境

這是配合著CentOS 5.5 + Hadoop 0.20以及CentOS 5.5 + Hbase 0.94.8建立的叢集系統,為了方便記錄,所以我分開介紹囉。但記錄畢竟有點久了,有些步驟還需要再架一次才會更正確。

因為Hadoop本身的優勢將文件的儲存和任務處理分散化,Hadoop分散式架構中有兩種負責不同功能的服務器Master服務器和Slave服務器,安裝時假設要為2台服務器安裝Hadoop架構。

本篇環境介紹

  1. 安裝了Java 1.6.x,或以後的版本

  2. 兩台服務器名稱為master和slave

  3. 兩台服務器操作系統均為centos5.*且版本大於等於5.4

  4. master將作為master主服務器使用,slave將作為slave服務器使用:

  5. master和slave的wget命令均可正常使用

  6. master和slave均正常運行且可正確聯繫

  7. master和slave空間足夠

  8. master和slave均已獲取root權限

  9. master的ip位址為192.168.1.28,slave的ip位址為192.168.1.29

設置環境變數

設置hosts在Master和slave的/etc/hosts下共同增加

$ vim /etc/hosts
192.168.1.28 master
192.168.1.29 slave

修改master的hostname文件

修改slave的hostname文件

免密碼登入遠端電腦

請參考SSH免密碼登入遠端電腦

重新配置Hadoop

配置core-site.xml,在節點下添加

配置mapred-site.xml,在節點下添加

修改master文件

修改slaves

修改内容,注意不是添加是更改

重新配置Hbase

配置hbase-env.sh

配置hbase-site.xml,在節點下添加

將hadoop的設定放到hbase內

替换其中内容,如果有加在slave則會變成Datanode

這樣就算一台Hbase的叢集環境了

安裝第二台電腦:slave

複製第一台電腦的所有設定到此台機器內,因此於第二台電腦下指令

在第一台電腦master電腦啟動Hbase叢集

若沒有出現錯誤訊息,代表成功,完整的程序可用jps來看。在第一台電腦上執行jps可以看到

參考教學:

https://sites.google.com/site/waue0920/Home/hbase/hbase-cong-ji-an-zhuang

Jun 17th, 2013 2:32:00pm

Last updated

Was this helpful?