검수요청.png검수요청.png

데이터베이스업

위키원
이동: 둘러보기, 검색
데이터베이스업 또는 데이터베이스산업

데이터베이스업 또는 데이터베이스산업은 데이터베이스로 다양한 기업 활동을 영위하는 사업의 집합으로, 흔히 데이터베이스에 저장되는 '정보'와 밀접한 연관을 지닌다. 조금 더 구체적으로 말하자면 데이터베이스를 직접 제작 및 유통하는 사업을 영위하거나 그에 필요한 용역을 제공하고, 또는 관련 소프트웨어를 개발하는 일련의 사업 집합을 의미한다고 할 수 있다.

개요[편집]

데이터베이스는 여러 사람에 의해 공유되어 사용될 목적으로 통합하여 관리되는 데이터의 집합을 말한다. 자료항목의 중복을 없애고 자료를 구조화하여 저장함으로써 자료 검색과 갱신의 효율을 높인다. 현대적인 의미의 데이터베이스 개념을 확립한 사람은 당시 제너럴일렉트릭사(社)에 있던 C.바크만으로 그는 1963년 IDS(Integrated Data Store)라는 데이터베이스 관리시스템을 만들었다.

논리적으로 연관된 하나 이상의 자료의 모음으로 그 내용을 고도로 구조함으로써 검색과 갱신의 효율화를 꾀한 것이다. 즉, 몇 개의 자료 파일을 조직적으로 통합하여 자료 항목의 중복을 없애고 자료를 구조화하여 기억시켜 놓은 자료의 집합체라고 할 수 있다.

이 용어가 처음 사용된 것은 1963년 6월 미국 SDC(System Development Corporation)가 산타모니카에서 개최한 '컴퓨터 중심의 데이터베이스 개발과 관리'라는 심포지엄 제목에서 공식으로 사용되었다.

이 심포지엄에서 발표된 많은 논문들은 대부분 자료 파일에서 정보를 쉽게 검색하는 작업에 관련된 것들이었으며, 데이터베이스란 단순히 자기(磁氣) 테이프와 같은 보조기억장치에 저장된 자료 파일의 의미로 쓰였다.

현대적인 의미의 데이터베이스 개념을 확립한 사람은 당시 제너럴일렉트릭사(社)에 있던 C.바크만으로 그는 1963년 IDS(Integrated Data Store)라는 데이터베이스 관리시스템을 만들었다.

데이터베이스가 가지는 몇 가지 특성을 살펴봄으로써 그 뜻을 보다 명확히 할 수 있다. 첫째 똑같은 자료를 중복하여 저장하지 않는 통합된 자료이며, 둘째 컴퓨터가 액세스하여 처리할 수 있는 저장장치에 수록된 자료이며, 셋째 어떤 조직의 기능을 수행하는 데 없어서는 안 되며 존재 목적이 뚜렷하고 유용성 있는 운영 자료이기 때문에 임시로 필요해서 모아 놓은 데이터나 단순한 입출력 자료가 아니라는 점이며, 넷째 한 조직에서 가지는 데이터베이스는 그 조직 내의 모든 사람들이 소유하고 유지하며 이용하는 공동 자료로서 각 사용자는 같은 데이터라 할지라도 각자의 응용 목적에 따라 다르게 사용할 수 있다는 점이다.

DB산업의 구조와 분류[편집]

일반적으로 데이터베이스 산업은 정보 생성, 가공, 전달, 이용의 4단계 핵심 활동으로 이뤄져 있다. 여기에 이러한 핵심 활동을 지원하는 기반(enabler)으로 기술 개발과 컨설팅, 교육, 유지 보수 등이 뒤따르는 것이다.

정보 생성 단계에서는 정보 및 콘텐츠의 수집과 원천정보의 확보, 데이터 정제, 데이터베이스 구축이 이뤄진다. 이어서 정보 가공 단계에서는 콘텐츠에 가치를 부가하고 융합하는 작업을 통해 고도의 정보 서비스 형태로 바꾸고, 세 번째의 정보 전달 단계에서는 인터넷과 위성, 이동통신 등의 다양한 네트워크를 통해 정보를 이동시키게 된다. 마지막으로 정보 이용 단계에서는 유료, 혹은 무료로 정보를 이용하고 그와 관련된 지식을 얻게 된다.

데이터베이스 산업의 분류[편집]

데이터베이스 산업 분류.jpg

한국데이터베이스진흥센터가 제시한 기준에 따라 데이터베이스 산업을 분류하면 오른쪽 표와 같이 정리된다. 표에서 보는 것처럼 데이터베이스 산업은 제작과 유통, 그리고 지원 부문으로 구분됨을 알 수 있다. 먼저 제작 부문은 신규 데이터베이스를 구축하거나 구축된 데이터베이스를 분석 및 활용하기 위한 재화(SW 등)와 인력 서비스를 제공하는 사업 부문이고, 유통 부문은 정보 유통을 목적으로 데이터베이스를 구축하고 구축된 데이터베이스 내의 정보나 데이터베이스 자체의 유통을 통해 수익을 창출하는 분야를 의미한다. 마지막으로 지원 부문은 기관이나 기업에서 데이터베이스를 기반으로 한 개발이나 각종 활용 사업을 효과적으로 수행하도록 지원하는 사업 부문으로 컨설팅과 기획, 교육, 유지 보수 등이 이에 해당된다.

데이터베이스의 역사가 어느덧 수십 년을 헤아리는 만큼 현재는 정보의 생성이나 가공보다는 정보의 전달과 이용 측면에 많은 기업과 기관들의 관심이 쏠려 있다. 따라서 데이터베이스 산업에서의 산업적 부가가치가 점차 데이터베이스 제작을 벗어나 그 유통과 지원 쪽으로 이동하는 모습이 뚜렷하게 감지되고 있다.

관계형 데이터베이스 관리시스템(RDBMS)[편집]

스토리지에 저장되는 데이터를 관리하는 시스템을 데이터베이스 관리시스템(DBMS) 라고 지칭한다.

DBMS는 데이터베이스를 관리하기 위해 필요한 수행과정인 데이터의 추가, 변경, 삭제, 검색 등의 기능을 집대성한 소프트웨어 패키지를 말한다.

DBMS는 계층형과 네트워크형, 그리고 관계형으로 나눠지며 현재 관계형 데이터베이스 관리시스템(RDBMS)가 주류를 이루고 있다. - 특징 : 수학적 논리 관계를 테이블의 형태로 구성한 구조로서 테이블 내의 컬럼 중 일부를 다른 테이블과 중복해 각 테이블간의 상관관계를 정의한 구조이다.

- 장점 : 업무 변화에 대한 적응력이 높아 업무에 쉽게 활용하며 유지보수가 편리하면 생산성이 향상된다.

- 단점 : 다른 DBMS 보다 더 많은 자원이 활용되어 시스템 부하가 높을 수 있다.

- 제품 : 데이터베이스 제품으로는 Oracle, MS-SQL Server, MySQL, Maria DB, DB2, Sybase 가 있다.

데이터베이스의 종류와 장단점[편집]

MySQL[편집]

  • 썬 마이크로시스템즈에서 개발하여 2009년에 Oracle에서 인수가 된 데이터베이스 시스템 입니다. (2009년 Oracle이 SUN을 인수함)
  • 유닉스나 리눅스, 윈도우 운영 체제 등에서 사용할 수 있으며 무엇보다 오픈소스의 장점으로 많은 기업에서 홈 페이지나 쇼핑몰 등 일반적인 웹 개발에 널리 이용되고 있다.
  • 아직 오픈소스를 유지하고 있지만, 오라클에 비해 사용자 편의를 위한 기능, 사용자 실수 또는 재해에 대비한 기능, 성능향상등, 기능적인 한계를 보이고 있다.
  • 현재 오픈소스이기 때문에 현재 많은 기업이 사용하고 있다.
  • 무료로 이용하거나 다른 데이터베이스에 비해 저가로 이용 가능하다.
  • 국내 쇼핑몰과 소규모 웹사이트에서 거의 절대적인 사용율을 보이고 있다.
  • Cafe24의 호스팅을 이용하는 경우 무료로 설치없이 이용가능하며(기능제한 있음), 그누보드4, 워드프레서등을 이용한 쇼핑몰 및 웹사이트 구축시 무료로 플렛폼을 제공 받을 수 있다.

Oracle[편집]

  • 전세계적으로 가장 많이 활용되는 관계형 데이터베이스 시스템(RDBMS) 이다.
  • 오라클사에서 서비스하고 있으며 Unix, Linux, Windows등의 대부분의 OS를 지원하고 있다.
  • 자원의 확장성과 장애에 대한 대처가 유현하며 안정적인 서비스를 지원가능하다.
  • MySQL에 비해 고가의 요금을 지불하고 사용하여야 하므로 소규모 웹사이트및 쇼핑몰등에는 적합하지 않다.
  • 주로 중견기업이나 대기업등 대형화된 엔터프라이즈급 시스템을 관리하는 플렛폼에 활용되고 있다.

MS-SQL Server[편집]

  • 마이크로로소프트사의 대표적인 관계형 데이터베이스 시스템이다.
  • MS제품군이라는 한계에 의행 Windows 서버에서만 구동이 되는 단점이 있다. (Linux, Unix에 설치불가함)
  • 마이크로로소프트사의 .NET Framework을 기반으로 한 IT시스템 구축시 연동측면과 사용측면, 개발편의성에 있어서 높은 효율이 예상된다.
  • 역시 MySQL에 비해 고가의 제품이므로 소규모 웹사이트 및 쇼핑몰에는 무리가 있어 보인다.
  • Oracle과 마찬가지로 주로 중견기업이나 대기업등 대형화된 엔터프라이즈급 시스템을 관리하는 플렛폼에 활용되고 있다.

MongoDB[편집]

  • 최근 4차산업혁명 인공지능빅데이터와 관련하여 가장 핫한 데이터베이스이다.
  • 머신러닝, 딥러닝 등의 인공지능등을 수행하거나 사물인터넷의 정형/비정형 데이터의 빅데이터를 수집하여 처리하는 기술로 NoSQL을 사용하게 되었고 그 중심에 MongoDB가 있으며 활용도가 점차 증가하고 있다.
  • MongoDB(몽고디비) 는 관계형 데이터베이스가 아닌 NoSQL (on Relational Operation Database SQL) 데이터베이스이다.
  • 관계형 데이터베이스는 데이터 중복을 제거하고 무결성을 보장하기 위해서 정규화를 하게 되는데 이러한 정규화가 과도한 JOIN으로 인해 성능 저하가 있을 수 있으나 NoSQL은 중첩데이터 형태를 불필요한 JOIN을 최소화한다.
  • 장점 : 불필요한 JOIN 최소화, 유연성 있는 서버구조제공, 비정형 뎅터 구조로 설계비용 감소, Read/Write가 빠르며 빅데이터 처리에 용이, 저렴한 비용으로 분산처리 및 병렬처리 가능
  • 한마디로 빅데이터 처리에 최근 핫하게 이용률이 올라오고 있는 데이터베이스이다. 빅데이터 이슈가 있는 인공지능과 사물인터넷의 데이터베이스로 적합하다.

데이터베이스 점유율[편집]

아래 사진은 2020년 9월 기준 DB-Engines Ranking 이다.

데이터베이스 점유율.png

기업용으로 가장 많이 사용되는 Oracle이 1위를 차지했다. 과거에도 현재에서 역시 Oracle이 가장 높은 점유율을 보이고 있다. 그다음이 MySQL, MS-SQL 이 뒤를 잇고 있다. 그리고 5위를 차지한 MongoDB는 4차산업혁명의 빅데이터 이슈를 타고 점유율이 상승하고 있는 중인 것 같다.

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 데이터베이스업 문서는 산업에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.