메타데이터
[image]
xkcd 688화 "Self Description"
Metadata
데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터.
메타(Meta)는 일반적으로 "~에 관한"(about)이라는 의미로 사용된다. 따라서 메타언어는 다른 데이터를 기술하기 위해 사용되는 언어이며, 메타데이터는 다른 데이터를 기술하기 위해 사용하는 데이터라고 할 수 있다. 인쇄 출판물을 포함한 모든 유형의 정보자원을 기술하는 용어이기 때문에 문헌정보학을 전공하는 학생이라면 머리 아프게 외워야 하는 학문.
1990년대 초반까지 이 용어는 과학 및 사회과학, 지형공간의 데이터세트에 관련하여 컴퓨터 파일이 인간에게 도움이 되도록 하기 위해 필요한 정보라는 의미로 사용되었다.
이용자는 메타데이터로 자기가 원하는 특정 데이터를 검색엔진 등으로 쉽게 찾아낼 수 있다. 이에 대한 예시로, 월드컵을 녹화한 비디오에서 골인 장면만을 뽑아낼 수 있고, 메타데이터는 이 자료를 이용하여 뽑아낼 수 있다.
그러나 메타데이터는 데이터를 사용하는 사람에게는 보이지 않으며, 컴퓨터가 이러한 메타데이터의 내용을 이해하고 이를 이용한다.
정보자원의 검색을 목적으로 한 메타데이터. 기술용 메타데이터의 목적은 어떤 자원을 어떻게 찾아내는지의 발견(discovery), 어떤 자원을 다른 유사한 자원과 어떻게 구분하는지에 대한 식별, 어떤 자원이 특정 자원을 만족시킨다는 사실을 어떻게 결정하는 지의 목적을 충족시키는 선정 등이 있다. 전통적인 도서관 편목에서의 메타데이터는 기본적으로 기술적인 것들이다.
자원의 관리를 어떻게든 용이하게 하기 위한 메타데이터. 어떤 객체가 언제 어떻게 작성되었나, 주 내용에 대한 접근을 관리하는 등의 책임은 누가 가지며, 접근이나 이용에 대한 어떤 제약이 적용될 수 있는지를 포함한다. 그러나 일반적으로 기술용과 관리용 사이의 경계는 애매모호하며 그 기준은 메타데이터 이용자의 시각에 따라 결정되는 경우가 많다.
복합적인 디지털 객체들을 함께 묶어주기 위한 메타데이터. 물리적인 파일과 페이지, 페이지의 장, 장과 전체로서의 책 사이의 관계를 기록하기 위해 필요하다. 구조용 메타데이터는 수치 데이터세트와 통계 데이터세트의 데이터 요소의 순서와 포맷을 문서화하며, 그 목적이 어떤 엔티티의 이용이 가능하도록 하는 것이다.
현재는 파일이 일종의 "컨테이너"로서 파일 형식에 따른 전용 메타데이터 구조/형식을 갖지만, 과거 메타데이터 개념이 없었을 당시 만들어지고 널리 사용된 파일형식은 시간이 지나 필요에 의해 별도 이름/형식의 메타데이터가 붙게 되었다.
xkcd 688화 "Self Description"
1. 개요
Metadata
데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터.
메타(Meta)는 일반적으로 "~에 관한"(about)이라는 의미로 사용된다. 따라서 메타언어는 다른 데이터를 기술하기 위해 사용되는 언어이며, 메타데이터는 다른 데이터를 기술하기 위해 사용하는 데이터라고 할 수 있다. 인쇄 출판물을 포함한 모든 유형의 정보자원을 기술하는 용어이기 때문에 문헌정보학을 전공하는 학생이라면 머리 아프게 외워야 하는 학문.
1990년대 초반까지 이 용어는 과학 및 사회과학, 지형공간의 데이터세트에 관련하여 컴퓨터 파일이 인간에게 도움이 되도록 하기 위해 필요한 정보라는 의미로 사용되었다.
이용자는 메타데이터로 자기가 원하는 특정 데이터를 검색엔진 등으로 쉽게 찾아낼 수 있다. 이에 대한 예시로, 월드컵을 녹화한 비디오에서 골인 장면만을 뽑아낼 수 있고, 메타데이터는 이 자료를 이용하여 뽑아낼 수 있다.
그러나 메타데이터는 데이터를 사용하는 사람에게는 보이지 않으며, 컴퓨터가 이러한 메타데이터의 내용을 이해하고 이를 이용한다.
2. 메타데이터의 종류
2.1. 기술용 메타데이터
정보자원의 검색을 목적으로 한 메타데이터. 기술용 메타데이터의 목적은 어떤 자원을 어떻게 찾아내는지의 발견(discovery), 어떤 자원을 다른 유사한 자원과 어떻게 구분하는지에 대한 식별, 어떤 자원이 특정 자원을 만족시킨다는 사실을 어떻게 결정하는 지의 목적을 충족시키는 선정 등이 있다. 전통적인 도서관 편목에서의 메타데이터는 기본적으로 기술적인 것들이다.
2.2. 관리용 메타데이터
자원의 관리를 어떻게든 용이하게 하기 위한 메타데이터. 어떤 객체가 언제 어떻게 작성되었나, 주 내용에 대한 접근을 관리하는 등의 책임은 누가 가지며, 접근이나 이용에 대한 어떤 제약이 적용될 수 있는지를 포함한다. 그러나 일반적으로 기술용과 관리용 사이의 경계는 애매모호하며 그 기준은 메타데이터 이용자의 시각에 따라 결정되는 경우가 많다.
2.3. 구조용 메타데이터
복합적인 디지털 객체들을 함께 묶어주기 위한 메타데이터. 물리적인 파일과 페이지, 페이지의 장, 장과 전체로서의 책 사이의 관계를 기록하기 위해 필요하다. 구조용 메타데이터는 수치 데이터세트와 통계 데이터세트의 데이터 요소의 순서와 포맷을 문서화하며, 그 목적이 어떤 엔티티의 이용이 가능하도록 하는 것이다.
3. 메타데이터 포맷 종류
현재는 파일이 일종의 "컨테이너"로서 파일 형식에 따른 전용 메타데이터 구조/형식을 갖지만, 과거 메타데이터 개념이 없었을 당시 만들어지고 널리 사용된 파일형식은 시간이 지나 필요에 의해 별도 이름/형식의 메타데이터가 붙게 되었다.
- 이미지
- 음악
- ID3: MP3의 메타데이터. ID3v1(파일 끝에 기록), ID3v2(파일 시작부에 기록) 버전이 있으며, ID3v2.4(UTF-8), v2.3(ISO-8859-1, 로마자용), v2.3(UTF-16, 한국어 포함 국제용, 윈도우7에서 지원) 버전이 있다. AAC, DSF같이 메타데이터를 넣을 것을 계획하지 않았던 음악 파일들도 이 방식의 메타데이터를 끌어다 쓰기도 한다.
- APE: MP3의 메타데이터. APEv1, APEv2 버전이 있다.
- Vorbis comment: FLAC, Ogg, Opus(오디오 코덱) 등의 Xiph.Org를 비롯한 자유 소프트웨어 단체들이 지원하는 메타데이터.
- m4a의 경우 mp4 컨테이너 표준을 따른다. ISO나 Quicktime이나 iTunes Metadata로 불리기도 한다.
- WMA의 경우 WMV 컨테이너 표준을 따른다.
- MKA의 경우 MKV 컨테이너 표준을 따른다. Matroska Tags로 불린다.
- 자막[1]
- 영상