검수요청.png검수요청.png

"더그 커팅"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
3번째 줄: 3번째 줄:
 
[[파일:스탠포드 대학.jpg|썸네일|300픽셀|[[스탠포드 대학]] (Stanford University)]]
 
[[파일:스탠포드 대학.jpg|썸네일|300픽셀|[[스탠포드 대학]] (Stanford University)]]
  
'''더그 커팅'''(Douglass Read Cutting)은 소프트웨어 디자이너이자 오픈 소스 검색 기술의 옹호자이자 창안자이다. [[루씬]](Lucene)을 설립하고, [[마이크 카파렐라]](Mike Cafarella)와 같이 [[아파치 너치]](Nutch)등 오픈 소스 검색 기술 프로젝트를 모두 설립했으며, 현재는 [[아파치]] 소프트웨어 재단(Apache Software Foundation)을 통해 관리되고 있다. 더그 커팅과 마이크 카파렐라는 [[아파치 하둡]](Apache Hadoop)의 공동 창립자이다.<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref>
+
'''더그 커팅'''(Douglass Read Cutting)은 소프트웨어 디자이너이자 오픈 소스 검색 기술의 옹호자이자 창안자이다. [[루씬]](Lucene)을 설립하고, [[마이크 카파렐라]](Mike Cafarella)와 같이 [[아파치 너치]](Nutch) 등 오픈 소스 검색 기술 프로젝트를 모두 설립했으며, 현재는 [[아파치]] 소프트웨어 재단(Apache Software Foundation)을 통해 관리되고 있다. 더그 커팅과 마이크 카파렐라는 [[아파치 하둡]](Apache Hadoop)의 공동 창립자이다.<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref>
  
 
==생애==
 
==생애==
더그 커팅은 1981년에 [[스탠포드 대학]](Stanford University)에 입학했고, 1985년에 언어학 학사 학위를 받았다. 루씬(Lucene)을 개발하기 전에 더그 커팅은 팰로앨토 연구소(Xerox PARC)에서 검색 기술 직책을 맡아 수집 / 분석 알고리즘(Scatter/Gather algorithm) 및 계산 양식(computational stylistics) 대해 연구했다. 더그 커팅은 [[익사이트]](Excite), [[비트윈]](V-Twin)에서 검색 엔진의 수석 디자이너로 일했었고, 텍스트 검색 프레임워크의 주요 저자였던 [[애플]](Apple Inc.)에서도 일했다.<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref> 현재 하둡의 상용 버전을 판매하고 지원하는 크라우데라의 아키텍츠로 재작중이며, 오픈 소스 소프트웨어 연구센터(CROSS)의 조언자, 웰컴 트러스트의 조언자, 카머스 에너지의 조언자로 재직중이다. <ref name="ITWORLD">〈[https://www.itworld.co.kr/tags/55161/%EB%8D%94%EA%B7%B8%20%EC%BB%A4%ED%8C%85/72624?page=0,1 인터뷰 | 하둡 창안자 더크 커팅 “폭발적인 관심 지속될 것”]〉, 《ITWORLD》, 2011-11-09</ref>
+
더그 커팅은 1981년에 [[스탠포드 대학]](Stanford University)에 입학했고, 1985년에 언어학 학사 학위를 받았다. 루씬(Lucene)을 개발하기 전에 더그 커팅은 팰로앨토 연구소(Xerox PARC)에서 검색 기술 직책을 맡아 수집 / 분석 알고리즘(Scatter/Gather algorithm) 및 계산 양식(computational stylistics) 대해 연구했다. 더그 커팅은 [[익사이트]](Excite), [[비트윈]](V-Twin)에서 검색 엔진의 수석 디자이너로 일했었고, 텍스트 검색 프레임워크의 주요 저자였던 [[애플]](Apple Inc.)에서도 일했다.<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref> 현재 하둡의 상용 버전을 판매하고 지원하는 크라우데라의 아키텍츠로 재작중이며, 오픈 소스 소프트웨어 연구센터(CROSS)의 조언자, 웰컴 트러스트의 조언자, 카머스 에너지의 조언자로 재직 중이다. <ref name="ITWORLD">〈[https://www.itworld.co.kr/tags/55161/%EB%8D%94%EA%B7%B8%20%EC%BB%A4%ED%8C%85/72624?page=0,1 인터뷰 | 하둡 창안자 더크 커팅 “폭발적인 관심 지속될 것”]〉, 《ITWORLD》, 2011-11-09</ref>
  
 
===경력===
 
===경력===
15번째 줄: 15번째 줄:
 
* 1992년 - 애플(Apple Inc.)에서 첨단 기술 그룹 수석 기술자
 
* 1992년 - 애플(Apple Inc.)에서 첨단 기술 그룹 수석 기술자
 
* 1996년 - 익사이트(Excite)에서 수석 엔지니어
 
* 1996년 - 익사이트(Excite)에서 수석 엔지니어
* 2000년 - 인프라서치(InfraSearch)에서 수석 엔지니어
+
* 2000년 - 인프라 서치(InfraSearch)에서 수석 엔지니어
 
* 2001년 - 그랜드 센트럴에서 수석 엔지니어
 
* 2001년 - 그랜드 센트럴에서 수석 엔지니어
 
* 2001년 - 아파치 소프트웨어 재단 커미터(Committer)
 
* 2001년 - 아파치 소프트웨어 재단 커미터(Committer)
* 2005년 - 인터넷 아카이브에서 검색부분 이사를 담당
+
* 2005년 - 인터넷 아카이브에서 검색 부분의 이사를 담당
 
* 2006년 - 야후의 기술 담당
 
* 2006년 - 야후의 기술 담당
 
* 2009년 - 아파치 소프트웨어 재단의 디렉터(Director), 이사회에 선출<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref>
 
* 2009년 - 아파치 소프트웨어 재단의 디렉터(Director), 이사회에 선출<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref>
32번째 줄: 32번째 줄:
 
==주요 활동==
 
==주요 활동==
 
===오픈 소스 프로젝트===
 
===오픈 소스 프로젝트===
검색 인덱서인 루씬(Lucene)과 스파이더 또는 크롤러인 아파치 너치(Nutch)는 오픈 소스 일반 검색 플랫폼의 두 가지 핵심 구성 요소로, 먼저 웹에서 콘텐츠를 탐색한 다음 검색 기능을 한 인덱스로 구조화한다. 이러한 두 프로젝트는 리눅스, MySQL등 일반적인 오픈 소스 소프트웨어 프로젝트의 리더가 되어  이러한 오픈 소스 소프트웨어 프로젝트의 개념과 기능을 검색의 영역까지 수직으로 확장시켰다.<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref>
+
검색 인덱서인 루씬(Lucene)과 스파이더 또는 크롤러인 아파치 너치(Nutch)는 오픈 소스 일반 검색 플랫폼의 두 가지 핵심 구성 요소로, 먼저 웹에서 콘텐츠를 탐색한 다음 검색 기능을 한 인덱스로 구조화한다. 이러한 두 프로젝트는 리눅스, MySQL 등 일반적인 오픈 소스 소프트웨어 프로젝트의 리더가 되어  이러한 오픈 소스 소프트웨어 프로젝트의 개념과 기능을 검색의 영역까지 수직으로 확장시켰다.<ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref>
 +
 
 +
사이버 보안을 수행하는 오픈 소스 빅 데이터 스타일인 아파치 스폿 (Apache Spot) 프로젝트를 통해 클라우델라을 돕고 있다. 이 프로젝트는 이전에 공격적인 측면으로 누군가 수동 코딩한 특정 유형의 동작을 스캔하는 필터를 사용하여 검열하는 기존의 접근 방식이 아니다. 이러한 새로운 공격을 포착하는 것은 어렵지만 일반적인 동작을 정의하는 모델의 구축하여 다른 이상 동작을 할 때 포착이 가능하도록 시스템을 구축했다. <ref name="Brian McKenna"> Brian McKenna, 〈[https://www.computerweekly.com/news/450420002/Doug-Cutting-father-of-Hadoop-talks-about-big-data-tech-evolution Doug Cutting, ‘father’ of Hadoop, talks about big data tech evolution]〉, 《ComputerWeekly.com》, 2017-06-02</ref> 이러한 아파치 스폿은 확장이 가능한 오픈 소스 프로젝트로 모든 IT 원격 측정 데이터에 고급 분석을 제공하기 위하여 구축된 커뮤니티 기반 사이버 보안 프로젝트이다. 스폿은 머신 러닝을 통해 위협을 감지하고 조사 및 치료를 신속하게 처리한다. 모든 엔터프라이즈 보안 데이터를 개방형 데이터 모델을 기반으로 하는 포괄적인 IT 측정 허브로 통합하고 관리한다. 이러한 스폿의 확장성 및 기계 학습 기능은 하나로 공유되고 또한 이러한 경험으로 모인 풍부한 데이터 세트는 동시에 실행될 수 있는 ML 기반 애플리케이션 에코 시스템을 지원하여 최대의 분석 유연성을 제공한다.<ref name="Apache Spot"> 〈[https://spot.apache.org/ Apache Spot (Incubating)]〉, 《Apache Spot》</ref>
  
 
===맵리듀스 패러다임 사용===
 
===맵리듀스 패러다임 사용===
2004년 12월, [[구글 리서치]](Google Research)는 대규모 서버 클러스터에서 대규모 계산을 사소하게 병렬화 할 수 있는 [[맵리듀스]](MapReduce)알고리즘에 대한 논문을 발표했다. <ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref> 이러한 [[맵리듀스]]는 더욱 효율적인 분산 처리가 가능하다. 이 때 더그 커팅과 마이크 카파렐라는 이러한 구글에서 논문으로 발표한 맵리듀스 기반으로 분산 파일 시스템으로 NDFS(Nutch Distributed File System)를 본격적으로 작업하기 시작한다. 2005년 12월에 NDFS는 더그 커팅이 자신의 아들이 가지고 놀던 코끼리 인형의 이름에서 따와 [[하둡]](Hadoop)프레임워크라고 이름을 붙인다. 하둡은 20개의 노드에서 안정적으로 실행되는 모습을 보인다. 이때 [[야후!]](Yahoo!)도 구글과 같은 분산 파일 시스템을 고민하던 중이였고, 자연스럽게 하둡에 관심을 두게 되었고 본격적으로 2006년 더그 커팅을 하둡 프로젝트에 합류시킨다. 2007년에 [[페이스북]](Facebook), [[트위터]](Twitter), [[링크드인]](Linkedin)과 같은 소셜네트워크서비스, [[SNS]]에서 하둡을 적용하면서 새로운 시대인 빅데이터 시대를 대표하는 오픈 소스로 자리매김 하게 되었다.<ref name="루나"> 루나, 〈[https://brunch.co.kr/@hvnpoet/98 빅데이터 시대를 열다, 하둡을 창시한 더그 커팅]〉, 《브런치》, 2020-04-16</ref>
+
2004년 12월, [[구글 리서치]](Google Research)는 대규모 서버 클러스터에서 대규모 계산을 사소하게 병렬화할 수 있는 [[맵리듀스]](MapReduce) 알고리즘에 대한 논문을 발표했다. <ref name="Wikipedia">〈[https://en.wikipedia.org/wiki/Doug_Cutting Doug Cutting]〉, 《Wikipedia》</ref> 이러한 [[맵리듀스]]는 더욱 효율적인 분산 처리가 가능하다. 이때 더그 커팅과 마이크 카파렐라는 이러한 구글에서 논문으로 발표한 맵리듀스 기반으로 분산 파일 시스템으로 NDFS(Nutch Distributed File System)를 본격적으로 작업하기 시작한다. 2005년 12월에 NDFS는 더그 커팅이 자신의 아들이 가지고 놀던 코끼리 인형의 이름에서 따와 [[하둡]](Hadoop) 프레임워크라고 이름을 붙인다. 하둡은 20개의 노드에서 안정적으로 실행되는 모습을 보인다. 이때 [[야후!]](Yahoo!)도 구글과 같은 분산 파일 시스템을 고민하던 중이었고, 자연스럽게 하둡에 관심을 두게 되었고 본격적으로 2006년 더그 커팅을 하둡 프로젝트에 합류시킨다. 2007년에 [[페이스북]](Facebook), [[트위터]](Twitter), [[링크드인]](Linkedin)과 같은 소셜네트워크서비스, [[SNS]]에서 하둡을 적용하면서 새로운 시대인 빅데이터 시대를 대표하는 오픈 소스로 자리매김하게 되었다.<ref name="루나"> 루나, 〈[https://brunch.co.kr/@hvnpoet/98 빅데이터 시대를 열다, 하둡을 창시한 더그 커팅]〉, 《브런치》, 2020-04-16</ref>
  
 
{{각주}}
 
{{각주}}
43번째 줄: 45번째 줄:
 
* ITWORLD, 〈[https://www.itworld.co.kr/tags/55161/%EB%8D%94%EA%B7%B8%20%EC%BB%A4%ED%8C%85/72624?page=0,1 인터뷰 | 하둡 창안자 더크 커팅 “폭발적인 관심 지속될 것”]〉, 《ITWORLD》, 2011-11-09
 
* ITWORLD, 〈[https://www.itworld.co.kr/tags/55161/%EB%8D%94%EA%B7%B8%20%EC%BB%A4%ED%8C%85/72624?page=0,1 인터뷰 | 하둡 창안자 더크 커팅 “폭발적인 관심 지속될 것”]〉, 《ITWORLD》, 2011-11-09
 
* linkedin, 〈[https://www.linkedin.com/in/cutting/ Doug Cutting]〉, 《linkedin》
 
* linkedin, 〈[https://www.linkedin.com/in/cutting/ Doug Cutting]〉, 《linkedin》
 +
* Brian McKenna, 〈[https://www.computerweekly.com/news/450420002/Doug-Cutting-father-of-Hadoop-talks-about-big-data-tech-evolution Doug Cutting, ‘father’ of Hadoop, talks about big data tech evolution]〉, 《ComputerWeekly.com》, 2017-06-02
 +
* Apache Spot, 〈[https://spot.apache.org/ Apache Spot (Incubating)]〉, 《Apache Spot》
 
* 루나, 〈[https://brunch.co.kr/@hvnpoet/98 빅데이터 시대를 열다, 하둡을 창시한 더그 커팅]〉, 《브런치》, 2020-04-16
 
* 루나, 〈[https://brunch.co.kr/@hvnpoet/98 빅데이터 시대를 열다, 하둡을 창시한 더그 커팅]〉, 《브런치》, 2020-04-16
  

2021년 1월 29일 (금) 14:24 판

더그 커팅 (Douglass Read Cutting)
아파치 소프트웨어 재단 (Apache Software Foundation)
스탠포드 대학 (Stanford University)

더그 커팅(Douglass Read Cutting)은 소프트웨어 디자이너이자 오픈 소스 검색 기술의 옹호자이자 창안자이다. 루씬(Lucene)을 설립하고, 마이크 카파렐라(Mike Cafarella)와 같이 아파치 너치(Nutch) 등 오픈 소스 검색 기술 프로젝트를 모두 설립했으며, 현재는 아파치 소프트웨어 재단(Apache Software Foundation)을 통해 관리되고 있다. 더그 커팅과 마이크 카파렐라는 아파치 하둡(Apache Hadoop)의 공동 창립자이다.[1]

생애

더그 커팅은 1981년에 스탠포드 대학(Stanford University)에 입학했고, 1985년에 언어학 학사 학위를 받았다. 루씬(Lucene)을 개발하기 전에 더그 커팅은 팰로앨토 연구소(Xerox PARC)에서 검색 기술 직책을 맡아 수집 / 분석 알고리즘(Scatter/Gather algorithm) 및 계산 양식(computational stylistics) 대해 연구했다. 더그 커팅은 익사이트(Excite), 비트윈(V-Twin)에서 검색 엔진의 수석 디자이너로 일했었고, 텍스트 검색 프레임워크의 주요 저자였던 애플(Apple Inc.)에서도 일했다.[1] 현재 하둡의 상용 버전을 판매하고 지원하는 크라우데라의 아키텍츠로 재작중이며, 오픈 소스 소프트웨어 연구센터(CROSS)의 조언자, 웰컴 트러스트의 조언자, 카머스 에너지의 조언자로 재직 중이다. [2]

경력

  • 1981년 - 스탠포드 대학교 입학
  • 1985년 - 언어학 학사 학위 취득
  • 1986년 - 스코틀랜드 에든버러의 음성 기술 연구 센서에서 연구 조교
  • 1987년 - 팰로앨토 연구소(Xerox PARC)에서 연구원 취직
  • 1992년 - 애플(Apple Inc.)에서 첨단 기술 그룹 수석 기술자
  • 1996년 - 익사이트(Excite)에서 수석 엔지니어
  • 2000년 - 인프라 서치(InfraSearch)에서 수석 엔지니어
  • 2001년 - 그랜드 센트럴에서 수석 엔지니어
  • 2001년 - 아파치 소프트웨어 재단 커미터(Committer)
  • 2005년 - 인터넷 아카이브에서 검색 부분의 이사를 담당
  • 2006년 - 야후의 기술 담당
  • 2009년 - 아파치 소프트웨어 재단의 디렉터(Director), 이사회에 선출[1]
  • 2009년 - 클라우데라(Cloudera) 수석 설계사
  • 2016년 - 오픈 소스 소프트웨어 연구 센터(CROSS)의 조언자
  • 2010년 - 아파치 소프트웨어 재단의 회장으로 선출
  • 2019년 - 웰컴 트러스트(Wellcome Data Labs)의 조언자, 자문 그룹 회원
  • 2020년 - 카머스 에너지의 오픈 소스 전략에 대한 자문에 대한 조언자 [3]

수상 및 영예

  • 2015년 - 구글 오'리얼리 오픈 소스 어워드(Google O'Reilly Open Source Award) 상을 받았다.[1]

주요 활동

오픈 소스 프로젝트

검색 인덱서인 루씬(Lucene)과 스파이더 또는 크롤러인 아파치 너치(Nutch)는 오픈 소스 일반 검색 플랫폼의 두 가지 핵심 구성 요소로, 먼저 웹에서 콘텐츠를 탐색한 다음 검색 기능을 한 인덱스로 구조화한다. 이러한 두 프로젝트는 리눅스, MySQL 등 일반적인 오픈 소스 소프트웨어 프로젝트의 리더가 되어 이러한 오픈 소스 소프트웨어 프로젝트의 개념과 기능을 검색의 영역까지 수직으로 확장시켰다.[1]

사이버 보안을 수행하는 오픈 소스 빅 데이터 스타일인 아파치 스폿 (Apache Spot) 프로젝트를 통해 클라우델라을 돕고 있다. 이 프로젝트는 이전에 공격적인 측면으로 누군가 수동 코딩한 특정 유형의 동작을 스캔하는 필터를 사용하여 검열하는 기존의 접근 방식이 아니다. 이러한 새로운 공격을 포착하는 것은 어렵지만 일반적인 동작을 정의하는 모델의 구축하여 다른 이상 동작을 할 때 포착이 가능하도록 시스템을 구축했다. [4] 이러한 아파치 스폿은 확장이 가능한 오픈 소스 프로젝트로 모든 IT 원격 측정 데이터에 고급 분석을 제공하기 위하여 구축된 커뮤니티 기반 사이버 보안 프로젝트이다. 스폿은 머신 러닝을 통해 위협을 감지하고 조사 및 치료를 신속하게 처리한다. 모든 엔터프라이즈 보안 데이터를 개방형 데이터 모델을 기반으로 하는 포괄적인 IT 측정 허브로 통합하고 관리한다. 이러한 스폿의 확장성 및 기계 학습 기능은 하나로 공유되고 또한 이러한 경험으로 모인 풍부한 데이터 세트는 동시에 실행될 수 있는 ML 기반 애플리케이션 에코 시스템을 지원하여 최대의 분석 유연성을 제공한다.[5]

맵리듀스 패러다임 사용

2004년 12월, 구글 리서치(Google Research)는 대규모 서버 클러스터에서 대규모 계산을 사소하게 병렬화할 수 있는 맵리듀스(MapReduce) 알고리즘에 대한 논문을 발표했다. [1] 이러한 맵리듀스는 더욱 효율적인 분산 처리가 가능하다. 이때 더그 커팅과 마이크 카파렐라는 이러한 구글에서 논문으로 발표한 맵리듀스 기반으로 분산 파일 시스템으로 NDFS(Nutch Distributed File System)를 본격적으로 작업하기 시작한다. 2005년 12월에 NDFS는 더그 커팅이 자신의 아들이 가지고 놀던 코끼리 인형의 이름에서 따와 하둡(Hadoop) 프레임워크라고 이름을 붙인다. 하둡은 20개의 노드에서 안정적으로 실행되는 모습을 보인다. 이때 야후!(Yahoo!)도 구글과 같은 분산 파일 시스템을 고민하던 중이었고, 자연스럽게 하둡에 관심을 두게 되었고 본격적으로 2006년 더그 커팅을 하둡 프로젝트에 합류시킨다. 2007년에 페이스북(Facebook), 트위터(Twitter), 링크드인(Linkedin)과 같은 소셜네트워크서비스, SNS에서 하둡을 적용하면서 새로운 시대인 빅데이터 시대를 대표하는 오픈 소스로 자리매김하게 되었다.[6]

각주

  1. 1.0 1.1 1.2 1.3 1.4 1.5 Doug Cutting〉, 《Wikipedia》
  2. 인터뷰 | 하둡 창안자 더크 커팅 “폭발적인 관심 지속될 것”〉, 《ITWORLD》, 2011-11-09
  3. Doug Cutting〉, 《linkedin》
  4. Brian McKenna, 〈Doug Cutting, ‘father’ of Hadoop, talks about big data tech evolution〉, 《ComputerWeekly.com》, 2017-06-02
  5. Apache Spot (Incubating)〉, 《Apache Spot》
  6. 루나, 〈빅데이터 시대를 열다, 하둡을 창시한 더그 커팅〉, 《브런치》, 2020-04-16

참고자료

같이 보기


  검수요청.png검수요청.png 이 더그 커팅 문서는 컴퓨터에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.