의견.png

아파치 스파크

위키원
ko7890 (토론 | 기여)님의 2019년 7월 24일 (수) 10:39 판
이동: 둘러보기, 검색

스파크(Spark)는 무료 오픈소스 기반의 클러스터 컴퓨팅 프레임워크이다. 정식 이름은 아파치 스파크(Apache Spark)이다. 영어로 spark는 불꽃이 튀기는 것을 말하는데, 대용량 데이터를 마치 불꽃이 튀기는 것처럼 순식간에 처리한다는 것을 강조하기 위해 붙인 이름이다. 스파크는 디스크에 저장되어 있는 데이터메모리로 읽어와서 처리하기 때문에 디스크 기반으로 작동하는 하둡(Hadoop)에 비해 데이터 처리 속도가 최소 10배에서 100배 정도 빠르다. 대용량 데이터를 분산 처리하기 위해 여러 개의 메모리를 묶어서 마치 하나의 메모리인 것처럼 사용할 수 있다. 머신러닝을 위한 빅데이터 처리에 주로 사용된다. SK㈜ C&C는 한국의 '스파크 사용자 모임'을 후원하고 있다.

역사

2009년 : 미국 캘리포니아 대학교 버클리 캠퍼스(UC Berkey)의 대학원생인 마테이 자하리아(Matei Zaharia)가 개발 2010년 : BSD 라이선스로 공개 2012년 : 처음 배포 2013년 : 스파크의 핵심 코드를아파치재단에 넘겨서 아파치 라이선스(Apache License)로 변경 2014년 : 아파치 최상위 프로젝트 선정 2016년 : Stable release 2.0.1

구조

같이 보기


  의견.png 이 아파치 스파크 문서는 프로그래밍에 관한 토막글입니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 이 문서의 내용을 채워주세요.