본문 바로가기

BigData/Spark

Learning Spark Chapter. 1 스파크를 이용한 데이터 분석

by Tomining 2015. 7. 3.

What is Apache Spark?
- 빠르다
- General Purpose
  아래 내용들을 하나의 단일 machine 에서 수행가능
  - 배치작업
  - 복잡한 알고리즘(ex. Machine Learning)
  - interactive queries
  - streaming
- Python/Java/Scala/SQL API 지원
- local filesystem, hdfs, Amazon S3, cassandra, hive, hbase 등 파일 접근 지원
Spark Stack
- Spark core
  - RDDs
- Spark SQL
  - Hive Table, Parquet, JSON 지원
- Spark streaming
  - 실시간 분석
- MLlib
- GraphX
- Cluster Manager
  - Hadoop Yarn
  - Apache mesos
  - Standalone Scheduler
    Spark 를 단일 장비에서 수행할 때 기본적으로 설치되는 Scheduler

저작자표시 비영리 (새창열림)

'BigData > Spark' 카테고리의 다른 글

Learning Spark Chapter. 3 RDD 프로그래밍 (0)	2015.07.03
Learning Spark Chapter. 2 스파크 설치 및 무작정 시작하기 (2)	2015.07.03
Spark App 수행시 memory 이슈 (0)	2015.05.22
Spark로 WordCount 구현하기. #2 (0)	2015.05.21
Spark로 WordCount 구현하기. #1 (0)	2015.05.21

티스토리툴바