본문 바로가기

Dev/Data

Hadoop Single Node 설치 (linux) 1. 기본 설정 # JAVA 설치 - OS에 맞춰 설치(다운로드) 후 JAVA_HOME 환경변수 설정 # Hadoop 실행 계정 생성 및 SSH Key 등록 - 노드에서 다른 노드로 접속(ssh) 시 패스워드 없이 접속을 위해 키 생성 및 등록 - ssh localhost 명령에서 패스워드가 없이 접속이 되어야 성공 $ useradd hadoop$ su - hadoop$ ssh-.. 더보기
Spark 테스트 (Windows, Scala, Self-Contained Applications) # Scala 를 이용한 Spark Self-Contained Applications 테스트 # 설치 - Scala 다운로드 : http://www.scala-lang.org/download/all.html (2.10.6 버전)- SBT(Scala Build Tool) 다운로드 : http://www.scala-sbt.org/download.html- 두개의 프로그램 모두 공백이 없는 경.. 더보기
Apache Tajo 테스트 (Windows) # Apache Tajo - Apache Tajo™: A big data warehouse system on Hadoop- http://tajo.apache.org/# Apache Tajo 설치 - Download : http://tajo.apache.org/downloads.html- 최신 바이너리(Latest Release 0.11.0) 를 받아서 압축을 풀기 - conf/tajo-e.. 더보기
Apache Hadoop 2.7.1 (Windows) ** Apache Hadoop을 Windows 10에 설치 및 테스트 # Apache Hadoop for Windows - 깃헙에서 소스를 받아 빌드 작업을 해야 하지만, 친철하게 Windows용 64비트 비공식 빌드가 있어 해당 바이너리를 다운로드 - karthikj1/Hadoop-2.7.1-Windows-64-binaries https://github.com/karthikj1/Hado.. 더보기
Spark 테스트 (Windows, Python 환경) # Spark 어플리케이션 실행 방법- Spark 어플리케이션을 실행 하기 위해서 3가지 방법을 제공- http://spark.apache.org/docs/latest/quick-start.html 1. Spark Shell 을 이용한 인터랙티브한 환경에서 실행 (scala : bin/spark-shell, python: bin/pyspark)>> bin\pyspark Python 3.5.0 (v3.5.0:37.. 더보기
Spark 설치 (Standalone) # Apache Spark - http://spark.apache.org/- Apache Spark™ is a fast and general engine for large-scale data processing.- Spark 의 핵심은 무엇인가? RDD! : http://www.slideshare.net/yongho/rdd-paper-review- Spark programming guid.. 더보기