DataBase

[DataBase] 메타 데이터

로니콜먼 2020. 8. 31. 09:28

메타데이터의 개념

  • 데이터에 관한 데이터이며, 속성정보라고도 한다.
  • 정보자원을 설명하는 요소 집합
  • 데이터 그 자체가 아닌 정보자원의 속성을 기술하는 데이터를 의미
  • DB의 생애주기 전반에 걸쳐 유용성을 개선하기 위한 정보이다.
  • 논리, 물리 모델 작성의 기준이 됨

메타데이터의 목적

메타데이터의 목적은 크게 두가지로 나누어진다.

 

데이터를 표현하기 위한 목적

메타데이터의 가장 좋은 예는 HTML 태그이다.

데이터에 관한 구조화가 명확하게 되어있기 때문이다.

 

위의 사진과 같이 데이터가 상위에서 하위로 tree 형태의 구조를 이루고 있다.

이러한 구조가 데이터에 관한 구조화가 잘 되어있는 대표적인 메타데이터이다.

 

데이터의 빠른 검색 목적

컴퓨터에서 정보의 인덱스 구실을 한다. 우리가 많이 사용하는 데이터베이스도

메타데이터가 잘 구성되어 있기 때문에 데이터를 빠르게 찾을 수 있는 것이다.

그렇기 때문에 데이터베이스 구축 시 메타데이터를 잘 구성하는 것이 중요하다.

 

메타데이터의 필요성

데이터의 소유자 측면 관리의 용이성

데이터의 양이 늘어날수록 전사적 데이터 통합 관리가 중요해지며, 이를 체계적으로

관리할 수 있는 메타데이터 관리 기반이 구축되어야 한다

데이터의 사용자 측면 검색의 용이성

메타데이터를 사용하면 일관성 있는 정보의 의미 관리가 이루어지기 때문에 쉽고

빠르게 의미 교환이 가능하고, 원하는 데이터를 빠르게 찾아낼 수 있다.

 

메타데이터의 활용

메타데이터는 논리, 물리모델의 작성 기준이 되기도 하지만,

메타데이터 간 연관성을 활용해 추천기법 구현에 쓰이기도 한다.

예시) 영화추천 기법

영화라는 데이터의 메타데이터로 감독, 출연배우, 장르, 줄거리 등의 요소들이

있으며 묘사된 상세 내용을 기반으로 영화간의 연관성을 도출하고 사용자에게

선호도를 입력받아 선호도에 따른 연관 데이터들을 추천해준다.

 

메타데이터 주요구성

- 정보자원의 내용에 관한 사항

- 정보자원의 속성에 관한 사항

- 정보자원의 물리적 형식 및 생성일자 등 정보자원을 식별할 수 있는 데이터 요소

 

메타데이터 예시)

* 문화관광부 문화예술정보 메타데이터 표준

메타데이터를 활용한 논리, 물리모델 작성

미리 정의된 메타데이터를 활용하여 데이터 모델을 작성한다. 기업의 구성원들간 명확한

의사소통을 가능하도록 작성하는 것이 중요하다. 논리, 물리모델의 작성에서 이용되는

메타데이터는 단어, 도메인, 코드, 용어사전이 해당한다.

 

   <논리, 물리모델에 이용되는 메타데이터 종류>

   ◽ 단어

      전사 관점에서 단어 사전 관리, 금칙어 사전 정의 및 관리

   ◽ 도메인

      속성에 대한 데이터 타입, 길이, 소수점 이하 길이 등을 사전에 정의한 도메인 관리

   ◽ 표준 코드

      수집된 코드로부터 코드 통합 과정을 거쳐 전사 표준 코드를 도출한 후 관리

      소스 코드 값을 표준 코드로 변환 시키는 매핑 처리에 대한 관리

   ◽ 용어 사전

      기본 단어의 조합으로 업무 용어 생성, 업무적으로 정의된 표준 용어에 대한 관리

 

- 논리 모델 작성

메타데이터 단어, 도메인, 코드, 용어사전에 기반해서 논리 모델을 작성한다.

예시 ) 명확한 표준용어 : 담당자 => 담당자명, 담당자사원번호

 

- 물리 모델 작성

논리 모델에서 도출된 속성명에 대하여 명확한 컬럼명을 작성한다.

예시 ) 논리모델 속성명 : 고객번호 

물리모델 컬럼명 : CUST_NUM VARCHAR2(12)