"데이터마이닝"의 두 판 사이의 차이
9번째 줄: | 9번째 줄: | ||
=== 데이터 관련기술의 발전 과정 === | === 데이터 관련기술의 발전 과정 === | ||
*데이터 수집 : 데이터 수집에 중점, 파일 처리 방식, 테이프, 디스크 | *데이터 수집 : 데이터 수집에 중점, 파일 처리 방식, 테이프, 디스크 | ||
− | *데이터 접근 : 데이터 접근에 중점, SQL<ref>〈[https://terms.naver.com/entry.nhn?docId=3431178&cid=58430&categoryId=58430 SQL]〉, 《네이버 지식백과》</ref>(Structured Query | + | *데이터 접근 : 데이터 접근에 중점, SQL<ref>〈[https://terms.naver.com/entry.nhn?docId=3431178&cid=58430&categoryId=58430 SQL(Structured Query Language)]〉, 《네이버 지식백과》</ref>(Structured Query Language), 관계데이터 관리시스템 |
*데이터 웨어하우스 : 과거의 데이터를 여러가지 관점에서 동적으로 접근하여 분산된 데이터 정보 통합, OLAP<ref>〈[https://terms.naver.com/entry.nhn?docId=2807097&cid=40942&categoryId=32840 OLAP(ON-line Analytical Processing)]〉, 《네이버 지식백과》</ref>(ON-line Analytical Processing) | *데이터 웨어하우스 : 과거의 데이터를 여러가지 관점에서 동적으로 접근하여 분산된 데이터 정보 통합, OLAP<ref>〈[https://terms.naver.com/entry.nhn?docId=2807097&cid=40942&categoryId=32840 OLAP(ON-line Analytical Processing)]〉, 《네이버 지식백과》</ref>(ON-line Analytical Processing) | ||
*데이터 마이닝 : 예측중심의 데이터 분석 및 정보전달, 대용량 데이터베이스 | *데이터 마이닝 : 예측중심의 데이터 분석 및 정보전달, 대용량 데이터베이스 | ||
15번째 줄: | 15번째 줄: | ||
== 특징 == | == 특징 == | ||
+ | === 데이터마이닝 특징 === | ||
+ | ====대용량의관측 자료 취급==== | ||
+ | 실험 자료는 가설검정 등의 구체적인 문제에 답하기 위하여 여러 요인들이 통제되고 조작된 가운데 만들어진다. 그러나 관측자료는 시간의 흐름에 따라서 비계획적으로 축적되며, 일반적으로 자료분석을 염두에 두고 수집되지 않는다. | ||
+ | ====경험적 방법에 근거==== | ||
+ | 많은 데이터마이닝 기법들은 이론적원리에 기초하여 개발되었다기보다는 경험에 기초하여 개발되었다. 이러한 기법들은 그 특성이 수리적으로 밝혀지지 않은 것들이 많다. | ||
+ | ===일반화에 초점==== | ||
+ | 일반화는 예측모델이 새로운 자료에 얼마나 잘 적용되도록 하는 것으로, 일반화를 통해 데이터마이닝 기법의 비정형성을 해결하고 보완하여 주는데 도움을 준다. | ||
== 활용 == | == 활용 == | ||
==전망 == | ==전망 == | ||
25번째 줄: | 32번째 줄: | ||
* 〈[https://ko.wikipedia.org/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0_%EB%A7%88%EC%9D%B4%EB%8B%9D 데이터마이닝]〉 , 《위키백과》 | * 〈[https://ko.wikipedia.org/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0_%EB%A7%88%EC%9D%B4%EB%8B%9D 데이터마이닝]〉 , 《위키백과》 | ||
* Dandy Vae, 〈[https://m.blog.naver.com/PostView.nhn?blogId=vae3085&logNo=220705560819&proxyReferer=https%3A%2F%2Fwww.google.com%2F]〉 ,《네이버 블로그 》, 2016-05-10 | * Dandy Vae, 〈[https://m.blog.naver.com/PostView.nhn?blogId=vae3085&logNo=220705560819&proxyReferer=https%3A%2F%2Fwww.google.com%2F]〉 ,《네이버 블로그 》, 2016-05-10 | ||
− | *〈[https://terms.naver.com/entry.nhn?docId=3431178&cid=58430&categoryId=58430 SQL]〉, 《네이버 지식백과》 | + | *〈[https://terms.naver.com/entry.nhn?docId=3431178&cid=58430&categoryId=58430 SQL(Structured Query Language)]〉, 《네이버 지식백과》 |
*〈[https://terms.naver.com/entry.nhn?docId=2807097&cid=40942&categoryId=32840 OLAP(ON-line Analytical Processing)]〉, 《네이버 지식백과》 | *〈[https://terms.naver.com/entry.nhn?docId=2807097&cid=40942&categoryId=32840 OLAP(ON-line Analytical Processing)]〉, 《네이버 지식백과》 | ||
== 같이 보기 == | == 같이 보기 == |
2019년 9월 9일 (월) 10:05 판
데이터마이닝(data mining)은 대용량의 데이터 속에서 유용한 정보를 발견하는 과정이며, 기대했던 정보뿐만 아니라 기대하지 못했던 정보를 찾을 수 있는 기술을 의미한다.
목차
개요
데이터마이닝은 데이터 베이스 내에서 어떠한 방법(순차 패턴, 유사성 등)에 의해 관심 있는 지식을 찾아내는 과정으로, 데이터 정보의 연관성을 파악함으로써 가치있는 정보를 만들어 의사 결정에 적용함으로써 이익을 극대화시킬 수 있다. 데이터를 기반으로 감춰진 지식, 기대하지 못했던 경향 또는 새로운 규칙 등을 발견하고, 이를 실제 비즈니스 의사 결정 등을 위한 정보로 활용하는 것이다. 데이터 속에서 유도된 새로운 데이터 모델을 발견하여 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용한다.
등장배경
데이터마이닝 등장 이전의 환경
1980년대 대부분의 기업이 고객과 경쟁사 및 제품에 대한 데이터를 담고있는 데이터베이스 정보 인프라를 인식하고 구축하게 되었으며 SQL이나 질의도구로는 찾아내기 어려운 정보를 포함하는 방대한 규모의 데이터베이스를 형성하게 되었다. 네트워크 사용의 증가로 다수의 데이터 베이스에 대한 접근이 용이해짐에 따라, 고객의 소비행위를 파악함으로써 이제까지 알 수 없었던 새로운 지식을 얻을 수 있게 되었다.
데이터 관련기술의 발전 과정
- 데이터 수집 : 데이터 수집에 중점, 파일 처리 방식, 테이프, 디스크
- 데이터 접근 : 데이터 접근에 중점, SQL[1](Structured Query Language), 관계데이터 관리시스템
- 데이터 웨어하우스 : 과거의 데이터를 여러가지 관점에서 동적으로 접근하여 분산된 데이터 정보 통합, OLAP[2](ON-line Analytical Processing)
- 데이터 마이닝 : 예측중심의 데이터 분석 및 정보전달, 대용량 데이터베이스
특징
데이터마이닝 특징
대용량의관측 자료 취급
실험 자료는 가설검정 등의 구체적인 문제에 답하기 위하여 여러 요인들이 통제되고 조작된 가운데 만들어진다. 그러나 관측자료는 시간의 흐름에 따라서 비계획적으로 축적되며, 일반적으로 자료분석을 염두에 두고 수집되지 않는다.
경험적 방법에 근거
많은 데이터마이닝 기법들은 이론적원리에 기초하여 개발되었다기보다는 경험에 기초하여 개발되었다. 이러한 기법들은 그 특성이 수리적으로 밝혀지지 않은 것들이 많다.
일반화에 초점=
일반화는 예측모델이 새로운 자료에 얼마나 잘 적용되도록 하는 것으로, 일반화를 통해 데이터마이닝 기법의 비정형성을 해결하고 보완하여 주는데 도움을 준다.
활용
전망
각주
- ↑ 〈SQL(Structured Query Language)〉, 《네이버 지식백과》
- ↑ 〈OLAP(ON-line Analytical Processing)〉, 《네이버 지식백과》
참고자료
- 〈데이터마이닝 : 컴퓨터인터넷IT용어대사전〉 , 《네이버 지식백과》
- 〈데이터마이닝(data mining)〉 , 《두산백과》
- 〈데이터마이닝〉 , 《위키백과》
- Dandy Vae, 〈[1]〉 ,《네이버 블로그 》, 2016-05-10
- 〈SQL(Structured Query Language)〉, 《네이버 지식백과》
- 〈OLAP(ON-line Analytical Processing)〉, 《네이버 지식백과》
같이 보기
|