티스토리 뷰

  1. What is Apache Spark?
    • 빠르다
    • General Purpose
      아래 내용들을 하나의 단일 machine 에서 수행가능
      • 배치작업
      • 복잡한 알고리즘(ex. Machine Learning)
      • interactive queries
      • streaming
    • Python/Java/Scala/SQL  API 지원
    • local filesystem, hdfs, Amazon S3, cassandra, hive, hbase 등 파일 접근 지원
  2. Spark Stack

    • Spark core
      • RDDs
    • Spark SQL
      • Hive Table, Parquet, JSON 지원
    • Spark streaming
      • 실시간 분석
    • MLlib
    • GraphX
    • Cluster Manager
      • Hadoop Yarn
      • Apache mesos
      • Standalone Scheduler
        Spark 를 단일 장비에서 수행할 때 기본적으로 설치되는 Scheduler

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함