Running Spark on CDH4
Purpose
기존에 쓰고 있는 CDH4 구성에서 Spark를 쓰고자 하는 경우
Installation
Common
-
spark-1.5.1-bin-cdh4를 내려받아 Master/Slave에 모두 설치한다.
Configuration
먼저 Master에서 Slave로 페스워드 없이 SSH 접속하게 설정한다.
Master
-
$SPARK_HOME/conf/slave에 slave 노드의 IP(또는 hostname)을 적어준다. -
$SPARK_HOME/conf/spark-env.sh에HADOOP_HOME을 지정한다.
Slave
없음
Run
-
Master노드에서$SPARK_HOME/sbin/start-master.sh실행 -
Master노드에서$SPARK_HOME/sbin/start-slaves.sh실행 -
http://<master_node_ip>:8080으로 상태 확인
References
[Install Spark/Shark on CDH 4 @sskaje](https://sskaje.me/2014/02/install-spark-shark-cdh-4/)