LOD
LOD(Linked Open Data)란 자유롭게 사용이 가능하며, 저작권 표시 및 변경 허락 조건하에 재배포가 가능한 링크 기반 개방형 데이터이다.
목차
개요[편집]
LOD(Linked Open Data)는 사람의 이해와 활용을 전제한 문서 중심의 웹(web of documents)을 기계도 또한 사람처럼 이해하고 자동으로 처리할 수 있는 데이터 중심의 웹(web of data)으로 구축하는 것이다. 누구나 활용할 수 있도록 하기 위해서는 웹에 개방되는 데이터들이 표준화된 형식을 준수해야 하고, 어떤 분야에 어떻게 활용될 수 있는지 명확하게 정의되어야 한다. 이런 데이터 중심의 웹이 구현되면 열린 데이터의 조합을 기반으로 누구나 다양하고 새로운 서비스를 개발할 수 있다. 이런 의미해서 LOD는 기존의 정보 개방 혹은 데이터 개방과 다르게 새로운 서비스 실현을 가능하게 하기 때문에 가장 적극적인 형태의 개방 형태라고 볼 수 있다. [1] LOD의 개념을 살펴보기 전에 간략하게나마 꼭 살펴보아야하는 개념들이 몇 가지 있다. LOD는 링크드데이터(Linked Data)와 오픈데이터(Open Data)의 합성어로 각각의 의미를 이해하면 명확히 이해할 수 있다.[1]
Open Data[편집]
오픈 데이터는 누구나 자유롭게 사용하고 재사용하고 재배포할 수 있는 데이터를 의미하지만 조건을 만족시킬 수 있어야한다. 우선 전체 데이터가 이용가능해야 하며, 합리적인 재생산 비용으로 가능하면 인터넷에서 다운로드되어야 한다. 데이터는 편리하고 수정 가능한 형태로 제공되어야 하는 이용성과 접근이 용이해야한다. 그리고 데이터는 서로 다른 데이터와 결합되는 것을 포함하여 재사용과 재배포를 허용하는 조건으로 제공되어야 한다. 마지막으로 누구나 데이터를 사용, 재사용 및 재배포할 수 있어야 한다. 활동 분야, 특정한 사람 혹은 그룹에 대한 차별 없이 보편적으로 참여해야 한다. 하지만 특정한 목적에 한정된 사용조건은 허용되지 않는다. [2]
Linked Data[편집]
링크드 데이터는 이미 거대한 정보생태계를 갖추고 있는 웹에 구조화된 데이터를 연결하고 발행(publishing)하기 위한 방법으로서 이렇게 발행된 데이터들은 상호 연결되어 보다 유용하게 사용될 수 있다.[1] 웹 상에 존재하는 데이터를 개별 URI(Uniform Resource Identifier)로 식별하고, 각 URI에 링크 정보를 부여함으로써 상호 연결된 웹을 지향하는 모형이다. 링크 기능이 강조된 시맨틱웹의 모형에 속한다고 볼 수 있으며 팀 버너스 리의 W3C를 중심으로 발전하고 있다. 링크드 데이터는 4가지 원칙을 만족하는 데이터 모형으로 구축 원칙이 존재한다. URI의 사용으로 링크드 데이터는 웹문서의 위치를 나타내는 URL 중심의 식별체계를 지향한다. 즉, 개별 문서에 존재하는 개별 객체에 각각 URI를 부여하는 것이다. 그리고 URI 중에서도 HTTP 프로토콜을 통해 접근할 수 있는 URI를 제안하고 있다. 이는 링크드 데이터에 대한 접근성을 강화하려는 목적이다. 세번째로는 RDF의 사용이다. 링크드 데이터는 RDF와 같이 트리플 모형으로 구조화된 데이터를 사용해야 한다. 웹의 데이터를 정형화된 구조로 나타내고, 연계하기 위해서이다. 하지만 이 위의 세가지 원칙을 지켰다고 해도, 풍부한 링크정보가 없다면 웹에 존재하는 데이터를 연결하기는 어렵다. 기존의 시맨틱웹에서도 링크 정보를 부여할 수 는 있었으나, 그 보다는 구조화된 표현을 주로 강조했었다. 링크드 데이터에서는 보다 발전된 시맨틱웹을 위해 링크정보를 부여하는 것이 매우 중요하다. [3]
특징[편집]
LOD의 특징은 오픈 데이터의 특징과 동일하다.
- 사용성 및 접근 : LOD는 언제든지 전체 데이터를 이용/다운로드가 가능하며, 편리하고 수정 가능한 형태로 제공되기 때문에 사용성 및 접근이 용이하다.
- 재사용 재배포 : 사용 및 재사용, 저작권 표시와 변경 허락 조건하에 변경 후 재배포가 가능하다.
- 보편적 참여 : 누구든지 데이터를 이용하고 재배포할 수 있다. 활동분야나 특정 사람 혹은 그룹을 차별하지 않고 보편적으로 참여가 가능하다.
- 상호운용성 : 서로 다른 데이터셋 사이 혼합/참조가 가능하며 데이터 간 연결이 가능한 구조로 상호 운용성이 뛰어나다.[4]
오픈데이터 개방도[편집]
오픈데이터의 5단계에 대한 상세 내용은 아래와 같다.
단계 | 유형 | 설명 | ★ | - OL(On-Line)
- 이미지, PDF |
- 웹 상 개방형 라이선스
- 포맷 무관 공개 상태 |
★★ | - OL + RE(REadable)
- Excel 파일 등 |
- 기계 가독성, 구조화
- 특정 소프트웨어 종속 |
★★★ | - OL + RE + OF(Open Format)
- CSV 파일 등 |
- 소프트웨어 독립적
- 웹 자체 포함 형태 아님 |
★★★★ | - OL + RE + OF + URI
- RDF 등 |
- URI로 개체 식별
- 데이터 개방 형태 |
★★★★★ | - OL + RE + OF + URI + LD(Linked Data) | - 연결 데이터 원칙 준수
- 타 데이터 상호운용 가능 |
---|
기술 요소[편집]
RDF[편집]
리소스(Resource), 데스크립션(Description), 프레임워크(Framework)의 첫 알파벳을 딴 이름으로 웹 상에서 특정 정보자원을 상세히 표현하는 특이자 표현 방식이다. 정보 자원을 주어, 술어, 목적어로 표현하는 트리플을 기본으로 한다.[4]
URI[편집]
웹상의 정보, 데이터의 장소를 표시하는 기술 방식이다. 정보, 데이터를 URI로 표시하여 외부 데이터와 연계가 가능하다.
RDF 표현 방식[편집]
RDF 형식을 토대로 트리플 특정 문법에 따라 시리얼화 한다. 대표적인 시리얼화는 RDF/XML, RDFa, Turtle, N-Triples, RDF/JSON 등이 있다.
기타[편집]
기타 기술로는 RDF 스토어, SPARQL, SPARQL 엔드포인트, OWL(Web Ontology Language)가 있다.[4]
활용[편집]
LOD가 구현 및 활용되는 플랫폼은 웹이다. 자연스럽게 LOD를 만들기 위한 핵심적인 기술요소들은 이미 웹에서 일반적으로 활용되고 있는 기술과 핵심 개념을 그대로 활용한다. 또한 LOD의 기준과 원칙을 준수하여 구축, 발행되는 데이터는 웹에 발행되어 있고 이를 활용하기 위해서는 역시 웹과 지속적인 연결성을 가져야 한다. 현재의 웹을 만들고 유지하고 있는 핵심 개념과 기술은 Hypertext, HTML, HTTP, URI 로 LOD에서는 잘 정리된 문서형의 정보(document)를 웹에 발행하고 활용하는 대신 특정 개념(예:사랑)이나 개체에 대한 구조화된 정보를 발행합니다. 그리고 이 개념과 관련된 다른 개념(예:사랑과 관련된 모성애, 우정 등) 과 연결하여 데이터를 좀 더 명확하고 풍부하게 한다.
각주[편집]
- ↑ 1.0 1.1 1.2 이병하, 김택훈, 박진호, 오원석, 이명진, 〈알기 쉬운 Linked Open Data〉, 《한국정보화진흥원 지식자원활용부》
- ↑ Open Data Handbook, 〈열린 데이터란 무엇인가?〉, 《OpenDataHandbook.org》
- ↑ 위키백과, 〈링크드 데이터〉, 《위키피디아》
- ↑ 4.0 4.1 4.2 4.3 도리의 디지털라이프, 〈LOD(Linked Open Data)〉, 《도리의 디지털라이프》, 2019-01-24
참고자료[편집]
- 이병하, 김택훈, 박진호, 오원석, 이명진, 〈알기 쉬운 Linked Open Data〉, 《한국정보화진흥원 지식자원활용부》
- Open Data Handbook, 〈열린 데이터란 무엇인가?〉, 《OpenDataHandbook.org》
- 위키백과, 〈링크드 데이터〉, 《위키피디아》
- 도리의 디지털라이프, 〈[00</ref>http://blog.skby.net/lod-linked-open-data/ LOD(Linked Open Data)]〉, 《도리의 디지털라이프》, 2019-01-24
같이 보기[편집]