MPEG-7 Tool의 형태

Download Report

Transcript MPEG-7 Tool의 형태

웹 멀티미디어 컨텐츠 검색 방법
0278193 신은정
개요
1.
2.
3.
4.
5.
멀티미디어 정보검색
메타데이터
MPEG-7
XML
내용기반 정보검색
1. 멀티미디어 정보검색
특징 : 검색 어려움, 검색시간 많이 소요됨
 내용기반 정보검색
(Content-based Information Retrieval)
 MPEG-7
 멀티미디어 정보를 일반 사용자들이 검색해서
유용하게 활용할 수 있으려면?





자연스러운 사용법
사용자의 의도가 잘 반영될 수 있어야.
짧은 검색시간
검색결과 중 필요한 정보를 쉽게 판별 가능해야.
2. 메타데이터
1) 뜻
- 데이터에 대한 데이터
- 컨텐츠에 관한 설명 데이터
2) 장점 : 검색ㆍ관리 용이
3) 포맷과 저장
- 포맷 : XML
- 저장 : 맵핑 정보 테이블
(메타데이터와 해당 웹 컨텐츠의 위치 정보를
맵핑 정보테이블에 저장함)
MappingID
MetaDataID
ContentType
ContentID
맵핑ID
메타데이터ID
컨텐츠타입
컨텐츠ID
3. MPEG-7






메타데이터의 표기 방식 중의 하나.
데이터 그 자체가 아닌 멀티미디어 데이터 내용을
표현하는 방법에 관한 표준
멀티미디어 정보검색이나 활용을 위해 멀티미디어
의 ‘내용‘인 컨텐츠와 관련 정보를 메타데이터로
표현함
XML언어를 이용한 텍스트 방식으로 표기
장점: 별도의 도구 없이도 컨텐츠의 내용파악 용이
단점: 방대한 내용과 저장용량 : 유지관리 비용 多
3. MPEG-7

표준화의 대상
① 기술자(D : Descriptor(element))
② 기술 구조
(DS : Description Schemes(structure))
③ 기술정의언어 : XML
(DDL : Description Definition Language)
④ 부호화 방식 : binary
(Coded Representation)
4. XML
메타데이터의 표현 포맷
 MPEG-7에서 사용하는 언어
 웹 상에서 구조화된 문서를 효율적으로 처리하도
록 설계된 데이터 형식
 XML의 핵심 : 사용자가 새로운 태그를 정의할 수
있는 기능
 인터넷에서 기존에 사용하던 HTML의 한계를 극
복하고 복잡함을 해결하는 방안
cf. HTML

5. 내용기반 정보검색
(Content-based Information Retrieval)

미디어의 내용에 근거하여 미디어 정보를 추
출하는 방법
: 주어진 멀티미디어 데이터에서 색,질감,모양과 같은
속성(feature)들을 자동으로 추출하고
이를 기반으로 검색하는 방법.

필요성 : 멀티미디어 데이터의 특성



다양한 형태의 데이터들로 구성됨
방대한 데이터의 크기
주안점 : 효과적ㆍ효율적 정보검색
: ‘원하는 데이터를
얼마나 정확하고ㆍ빠르게 찾을 수 있는가’

내용 기반 질의



멀티미디어 데이터로부터 내용에 해당되는 속성을 자
동으로 추출 하는 시스템의 기능을 이용하기 때문에
사람이 일일이 주석을 할 필요가 없으므로 주석 기반
검색의 문제점을 해결할 수 있다.
논리적으로 정확하게 표현될 수 없으므로, 속성 측면
에서 정의된 정보 필터를 이용하여 질의를 하고,유사
성에 기반을 둔 탐색을 한다.
유사한 모든 것이 반드시 찾고자 하는 자료는 아니기
때문에 질의 결과 중 사용자가 원하지 않는 결과들을
수동적으로 제거할 수 있고 사용자와 검색 시스템 간
에 상호 대화를 지원해 줄 수 있는 인터페이스가 필
요하다.
접근 방법 및 해법
검색대상
상위 레벨 내용 하위 레벨 내용
내용
의미 정보들
장점
좀더 자연스런
질의 가능
키워드, 형태, 색,
크기, 위치, 방향성,
멜로디 등
시스템이 자동으로
검색 가능
단점
사용자의 개입
필요
사용자 질의가 부자
연스러움
멀티미디어 데이터의 구분

① 오디오 데이터
(음성ㆍ음향정보를 포함)
 ② 정지 영상 데이터
(사진ㆍ그래픽들을 포함)
 ③ 동영상 데이터 (비디오를 포함)
>> 내용 기반 검색 기법을 이러한 세 가지
데이터와 연관시켜 분류하고자 한다.
3-1) 오디오 데이터에 대한 내용기반 검색




① 브라우징을 통한 검색 방법
② 인덱스를 통한 검색방법
㉠ 오디오의 음향이나 음악 등을 분석
하여 특징벡터로 인덱스를 만든 후 사용
자가 멜로디나 음향 효과로 질의를 하여
원하는 곡을 찾는 방법
㉡ 오디오내의 음성을 인식하여 키워드
기반의 인덱스를 만든 후 사용자가 질의
를 음성이나 텍스트로 해주는 방법
3-2) 정지 영상 데이터에 대한 내용기반 검색




영상의 색, 질감, 형태 등의 특징 사용
① 자동추출된 영상의 특징들이 영상화 함께
인덱싱되어 DB에 저장됨
② 사용자의 내용 기반 질의 : 사용자는 질의
로 원하는 색이나 질감 등을 포함하는 영상을
요청하거나 원하는 영상의 모양을 스케치하는
방식으로 내용 기반 질의를 할 수 있다.
③ 질의 결과 : 정확한 영상이 반환되기보다는
요청한 영상과 비슷한 이미지들의 집합이 반환
된다
3-3) 동영상 데이터에 대한 내용기반 검색

필요한 기술




비디오 파싱기법
사용자 인터페이스
비디오 데이터 압축 및 저장 방법
동영상에서 내용검색을 하기 위해 사용할 수
있는 정보들에 따라 내용기반 검색 기법들을
분류



영상정보
문자정보
오디오 정보
1.
2.
3.
4.
영상의 정보만을 사용한 내용기반 검색
문자정보 또는 영상과 문자정보를 함께
사용한 내용기반 검색
오디오 정보 또는 영상과 오디오 정보
를 함께 사용한 내용기반 검색
영상, 문자, 오디오정보를 사용한 내용
기반 검색
ex) IBM “Marvle”

관련기사 : 멀티미디어 검색「꿈이 아니다」
(2004.10.2. ZDNet Korea)
 현재 인터넷 상에서

간단하게 찾을 수 없는 비
디오·오디오 데이터를 검색하기 위한 기술
기존 검색엔진 : 수작업 주석 필요
: 시간ㆍ노동력 소모多, 분류할 정보량의 폭발적 증가


텍스트나 수작업의 주석부 없이도 컨텐츠 검색
가능케
내용을 나타내는 수식 어구를 사용해 동영상을
자동적으로 분류가능케

ex)'옥외','옥내','거리의 풍경','엔진의 노이즈' 등
ex) 네이트닷컴 “Tong”

관련기사 : 네이트닷컴 검색,‘DB차별화’선언


네이트닷컴, 통 검색 오픈..검색戰 합류



(2005.5.3. 연합뉴스 보도자료)
(2005.5.3. 머니투데이)
이미지 사운드 동영상을 별도의 카테고리에서
검색할 수 있어 통 내 뮤직비디오 드라마 음악
등 각종 자료에 쉽게 접근 가능
통 검색과 싸이월드 검색의 연계로 사진 이미
지를 비롯해 음악 동영상 등 멀티미디어 검색
기능이 한층 강화됨
ex) 구글의 이미지검색

관련기사 : 검색엔진의 기린아 ‘구글’



(2005.5.16.ZDNet Korea)
결과에 대하여 미리 보기를 구현하는 최
초의 검색 엔진 중 하나
크기, 색깔, 파일 형태와 도메인에 의해
이미지를 구별하는 능력에서 앞선다.
ex) 온라인 음악 검색

관련기사 : 검색 전쟁 "이젠 온라인 음악이다
"(2005.5.16. 아이뉴스24)





야후 : 방송사업자들과 상세한 메타 데이터 정보 접
근을 위한 계약 체결
MSN : MSN 뮤직 스토어
음반회사들 : 음반 출시 때부터 각종 메타 데이터를
충실하게 정리중
메타데이터가 많을 수록 검색 정확도를 높일 수 있다
온라인 음악 관련 메타 정보 표준화 시급
ex) 동영상 검색

관련기사 : 구글-MS-야후, '이젠 동영상
검색이다‘(2004.11.30. 아이뉴스)



구글 : 인터넷상에 있는 오디오 파일의 원고
처리 작업 / 자막처리
MS : 메타태그
“동영상 검색시대"…야후-블링스 등 서
비스 개시

(2004.12.16. 아이뉴스24)