2016년 2월 18일 목요일

시멘틱 웹(semantic web)

네이트가 이용한 (시맨틱) 기술은 전산학에서 꽤 오래된 분야로서 텍스트 분석, 자연어 처리, 기계 학습과 같은 분야는 인공 지능 분야에서 시맨틱 기술

시맨틱 웹은 웹을 데이터 단위로 구조화 시켜상호 관계성을 파악하려는 시도 즉, 웹을 데이터베이스화 혹은 지식 기반으로 만들고 이를 기반으로 추론을 목표로 한다

LinkedData라고 불리는 이름으로 RDF 기반으로 데이터 웹을 구조화 시키거나 RDFa나 마이크로포맷 같은 방식으로 HTML 의미 마크업을 시도하고 있는 것이다. 




온톨로지란 특정 도메인(domain) 내에서 공유되는 데이터를 개념화한 형식적이고 명백한 규정이다. 이는 특정 분야에서 사용되는 표준 어휘들의 모음이라고 할 수 있으며, RDF와 OWL은 이런 온톨로지를 표현하는 언어다. 따라서 온톨로지 언어가 시맨틱 웹의 중심이 된다고는 할 수 있으나, 이를 웹과 접목시키는 일이 더 중요

온톨리지
웹에 있는 자원에 관한 메타 정보를 표현하기 위한 언어. RW3C의 가장 기본적 시맨틱 웹 언어로서 웹 자원을 표현하는데 기본이 되는 제목, 저자, 최종 수정일, 저작권과 같은 웹 문서에 관한 메타 데이터를 XML을 기반으로 매우 간단하게 표현한다. 기본적으로 주어, 동사, 목적어에 해당하는 것을 URI를 써서 대상들을 문장으로 구성하거나 노드와 화살표를 써서 도식적으로 표현하기도 한다.

RDF

웹에 있는 자원에 관한 메타 정보를 표현하기 위한 언어. RW3C의 가장 기본적 시맨틱 웹 언어로서 웹 자원을 표현하는데 기본이 되는 제목, 저자, 최종 수정일, 저작권과 같은 웹 문서에 관한 메타 데이터를 XML을 기반으로 매우 간단하게 표현한다. 기본적으로 주어, 동사, 목적어에 해당하는 것을 URI를 써서 대상들을 문장으로 구성하거나 노드와 화살표를 써서 도식적으로 표현하기도 한다.


한 사이트, domain을 테이블 정도로 생각하고 거대한 웹을 데이터 베이스로 생각하는
각 사이트 안에 태그 등 정보를 메타데이터화 시키는 것

검색엔진에서 페이지들을 분석할때 검색어에 맞는 단어 매칭과 같은 단순한 string search만이 아닌 데이터베이스 처럼 활용 가능하게 한 것.

다음은 SPARQL의 사용 예다.

 SELECT DISTINCT ?name ?home ?orgRole ?orgName ?orgHome
FROM <http://www.w3.org/People/Ivan/>
FROM <http://www.w3.org/Member/Mail/>
WHERE {
?foafPerson  foaf:mbox ?mail;
             foaf:homepage ?home.
}


시맨틱 웹의 본질은 시맨틱 처리
시맨틱 웹의 본질적인 변화는 없다. 다만, 지금까지 시맨틱 웹에 대해 대다수의 사람들이 인식하고 있는 것은 온톨로지였으며, 이와 관련한 기술 개발이 중심이 된 것은 사실이다. 하지만 더 중요한 것은 웹에서의 시맨틱 처리가 가능해야만 본질적인 시맨틱 웹이 가능해질 수 있다는 것이다. 이를 위한 노력이 W3C에서 진행 중이며, 실생활에서도 이와 같은 시맨틱 웹이 이용될 수 있다.
결론적으로, 국제적으로는 XHTML이 단순한 문서를 위한 웹페이지로서 이용되는 것이 아니라, 기계적 처리가 가능한 데이터 집합소로서의 역할도 수행하며, 데이터 통합의 주요 수단으로 이용될 수 있다. 또한 웹페이지에서 쉽고 편리한 방법으로 데이터를 교환하고 재사용할 수 있는 방법에 대한 연구도 진행되고 있음로, 국내 기술 개발도 이런 부분을 간과해서는 안될 것이다.



http://m.blog.naver.com/jeonghj66/140038064614


댓글 없음:

댓글 쓰기