- What is Apache Spark?
- 빠르다
- General Purpose
아래 내용들을 하나의 단일 machine 에서 수행가능- 배치작업
- 복잡한 알고리즘(ex. Machine Learning)
- interactive queries
- streaming
- Python/Java/Scala/SQL API 지원
- local filesystem, hdfs, Amazon S3, cassandra, hive, hbase 등 파일 접근 지원
- Spark Stack
- Spark core
- RDDs
- Spark SQL
- Hive Table, Parquet, JSON 지원
- Spark streaming
- 실시간 분석
- MLlib
- GraphX
- Cluster Manager
- Hadoop Yarn
- Apache mesos
- Standalone Scheduler
Spark 를 단일 장비에서 수행할 때 기본적으로 설치되는 Scheduler
- Spark core
'BigData > Spark' 카테고리의 다른 글
Learning Spark Chapter. 3 RDD 프로그래밍 (0) | 2015.07.03 |
---|---|
Learning Spark Chapter. 2 스파크 설치 및 무작정 시작하기 (2) | 2015.07.03 |
Spark App 수행시 memory 이슈 (0) | 2015.05.22 |
Spark로 WordCount 구현하기. #2 (0) | 2015.05.21 |
Spark로 WordCount 구현하기. #1 (0) | 2015.05.21 |