2001과제결과발표

Download Report

Transcript 2001과제결과발표

ETRI
최종 연구 보고서
복합미디어 워터마킹을 위한
미디어 분석 기술 연구
2002. 2. 19
전북대학교
오일석
0. 서론
 연구 배경과 필요성


정보 패러다임의 변화
 아날로그에서 디지털로 전환하며 불법 복사 용이
 폐쇄성에서 개방성으로 전환하며 디지털 컨텐츠의 폭발적 증가
 저작권 보호의 중요성
• DRM (Digital Rights Management)
• 디지털 컨텐츠 사업의 성공 좌우하는 주요 요소
• 불법 복제 인식 약한 국내에서는 더욱 중요
 워터마킹에 대한 연구 활발
워터마킹 응용 넓음
 DRM (Digital Rights Management)
 Authentication
 Multimedia retrieval (contents encoding by watermarking)
2
0. 서론
 보고서 구성

1 부: 복합 미디어 특성과 워터마킹 기술 분석
 1 장: 복합 미디어 특성과 워터마킹
 2 장: 워터마킹 기술 분석
 3 장: 워터마킹 활용 현황과 전망

2 부: 텍스트 문서 영상 워터마킹 소프트웨어 개발
 4 장: 텍스트 문서 영상 워터마킹 소프트웨어 개발
 5 장: 텍스트 문서 영상을 위한 특징 수준 워터마킹 알고리즘
 6 장: 결론
3
1. 복합 미디어 특성과 워터마킹
4
1. 복합 미디어 특성과 워터마킹
 복합미디어의 6개 영역 구분
1.
2.
3.
4.
5.
6.
텍스트 문서 영상 (text document image)
정지 영상 (still image)
동영상 (motion image)
소리 (sound)
그래픽 영상 (graphic image)
증명서 (authentication papers)
5
1. 복합 미디어 특성과 워터마킹
 텍스트 문서 영상 (text document image) (1)

미디어 특성

문서 영상의 특성
•
•
•
•

문자, 단어, 라인, 블록의 계층적 구성
배경과 전경의 구분 (배경 비율 80% 이상)
전경: 문자와 표로 구성
문자: 긴 획의 규칙적 배열
문서의 표현
• PDL (page description language)
-
•
•
PostScript
PDF
비트맵 영상
DjVu
6
1. 복합 미디어 특성과 워터마킹
 텍스트 문서 영상 (text document image) (2)

워터마킹 기법

변환-영역 (transform-domain) vs. 공간-영역 (spatial-domain)
•

문서 영상 특성상 대부분 공간 영역 방식 사용
문서 영상을 위한 워터마킹 기법
• 화소 수준 (pixel-level)
-
•
특징 수준 (feature-level)
-
•
화소 값의 변경
획의 모양 변경
문자 수준 (character-level)
-
문자, 단어, 또는 줄의 이동
7
1. 복합 미디어 특성과 워터마킹
 텍스트 문서 영상 (text document image) (3)

워터마팅 알고리즘 구현은 문서 영상 처리 기술에 많이 의존
표 1. 워터마킹 기법에 따른 문서 영상 처리 기술 필요 정도.
문서 영상 처리 연산
화소 수준
특징 수준
블록 분할
○
줄 분할
문자 수준
줄 이동
단어 이동
문자 이동
○
○
○
○
Ⅹ
○
○
○
○
단어 분할
Ⅹ
○
Ⅹ
○
○
문자 분할
Ⅹ
○
Ⅹ
Ⅹ
○
획 분할
Ⅹ
○
Ⅹ
Ⅹ
Ⅹ
(○: 필요함, Ⅹ: 필요 없음)
8
1. 복합 미디어 특성과 워터마킹
 텍스트 문서 영상 (text document image) (4)

공격 종류

Retyping (or OCR)

기하 변환 (geometric transformation)
•




이동 (translation), 크기(scaling), 회전(rotation) 등
행 또는 열 삭제
포맷 변환
프린트/스캔
영상 처리
• 잡음 넣기, smoothing 등
9
1. 복합 미디어 특성과 워터마킹
 정지 영상 (still image)

특성
문서 영상에 비해 높은 복잡도
 워터마킹 신호 숨길 공간 많음
 현재 가장 활발한 연구 대상
워터마킹 기법
 변환-영역 (transform-domain) vs. 공간-영역 (spatial-domain) 방식



내용-기반 방식[Bas02]

다양한 기법에 대한 벤치마킹 활발
•
예: StirMark
10
1. 복합 미디어 특성과 워터마킹
 동영상 (motion image)

특성
정지영상에 비해 워터마킹 신호 숨길 공간 많음
 상대적으로 비인지성의 중요성 감소
워터마킹 기법
 실시간 처리가 중요한 요구 사항  압축 공간에서의 처리 요구
 독특한 공격 발생
• 프레임 평균, 프레임 삭제, 프레임 교환 등
 DVD에서 워터마킹의 본격적인 활용 예상됨
• Video compression standard MPEG-4 (ISO/IEC 14496)
• Digital copyright agreement for video (IBM, NEC, Hitachi, and
Pioneer)
 본격적 연구 위해 테스트베드 시스템 구축 중요
• 환경부나 문화 관광부의 비디오 클립 등이 좋은 대상


11
1. 복합 미디어 특성과 워터마킹
 소리 (sound)

특성
1-차원 파형
 적은 샘플들로 표현
워터마킹 기법
 신호 삽입의 공간 부족
 신호 삽입의 어려움
• 인간의 청각 시스템이 시각 시스템에 비해 훨씬 민감
 표준화 노력
• ASCAP Society의 digital music watermarking 프로젝트
• DVD audio copyright specs (1998년 10월)
• SDMI (Secure Digital Music Initiative): 오디오 저작권 보호기구
 본격적 연구 위해 테스트베드 시스템 구축 중요
• “한국의 아름다운 소리 100선” (환경부) 등이 좋은 대상


12
1. 복합 미디어 특성과 워터마킹
 그래픽 영상 (graphic image)

특성

컴퓨터 그래픽스에서 다루는 각종 자료 포함
• Range senser로 획득한 3차원 영상 (voxel 표현)
• 3-D modeling된 물체 표현 (polygonal 표현)
• 2차원 선 도면
 획득 또는 제작에 많은 비용 소요
• 불법 복제에 대한 유혹 큼
• 견고한 보호 장치의 필요
워터마킹 기법
 신호 삽입 공간 비교적 큼
 voxel 표현
• voxel 값 변경
 polygonal 표현
• 꼭지점 좌표 또는 면의 법선 벡터 분포 조작
 2차원 선 도면
• 꼭지점 좌표 변경

13
1. 복합 미디어 특성과 워터마킹
 증명서 (authentication papers)

특성
유효성 입증 목적
 전자상거래로 인해 필요성 급증
워터마킹 기법
 fragility 요구
 조작 여부, 위조 위치 판단 기능 요구
 다중 워터마킹 기법 요구됨
• fragile 워터마크 (위조 판단 목적)
• robust 워터마크 (소유권 목적)


14
2. 워터마킹 기술 분석
15
2. 워터마킹 기술 분석
 개요 (1)

Schyndel-Tirkel-Osborne, “A digital watermark,” ICIP, 1994.
 최초의 디지털 워터마킹 논문


기술 개발 급속도로 진행 중
응용 분야의 폭발적 증가
 전자책 (e-book)
 전자 도서관 (digital library)
 전자 정부 (e-government)
 디지털 방송
 전자상거래
 DVD
16
2. 워터마킹 기술 분석
 개요 (2)

현재 워터마킹 전문 회사의 국내외적 설립과 시범적인 상품 출시
아직 응용 분야의 요구 조건에 미흡한 측면 있음
 정지 영상과 비디오 영상에 치우침
워터마킹 조건
 비인지성 (imperceptibility)
 강인성 (robustness)
 적재량 (payload)
 비밀키에 의한 관리와 접근
 실시간 처리
 원본 영상 없는 탐지
 임의의 정보 삽입


17
2. 워터마킹 기술 분석
 문헌

Special issues




Proceedings of the IEEE, Vol.78, No.7, July 1999. (9개의 논문)
CACM, Vol.41, No.7, July 1998. (5개의 논문)
Signal Processing, Vol.66, No.3, May 1998. (7개의 논문)
IEEE의 연도별 통계 (‘watermarking’ 키워드로 IEEEXplorer DL 검색)
 1994년도 1편
 1995년도 2편
 1996년도 14편
 1997년도 33편
 1998년도 80편
 1999년도 134편
 2000년도 204편
 2001년도 179편
 2002년도 1편
18
2. 워터마킹 기술 분석
 벤치마킹


공정한 벤치마킹의 어려움
 요구사항의 다양성
 조건의 다양성 (강인성, 비인지성, 적재량 등)
 비인지성은 인간의 지각과 관련되어 수령화 어려움
공격* (attack)

종류
•
•
•

JPEG compression
Geometric transformation
Enhancement techniques
StirMark 구현
•
http://www.cl.cam.ac.uk/~fapp2/watermarking/benchmark
* 영국 cambridge 대학의 연구 [kutter & Petitcolac99]
19
2. 워터마킹 기술 분석
 벤치마킹 사례 * (1)

비인지성 측정
 화소 기반 측정
• Difference distortion metrics
• Correlation distortion metrics
• Others
 인지에 기반한 품질 측정
• 표 2. 인지에 기반한 품질 측정 등급화.
등급
손상 정도
품질
5
인지 불가능
아주 좋음
4
인지 가능하나 거슬리지 않음
좋음
3
약간 거슬림
보통
2
거슬림
나쁨
1
매우 거슬림
아주 나쁨
* 영국 cambridge 대학의 연구 [kutter & Petitcolac99]
20
2. 워터마킹 기술 분석
 벤치마킹 사례 (2)


네가지 성능 그래프 제시 (벤치마킹 기준 간의 관계 고려)
 bit-error vs. attack strength
 bit-error vs. visual quality
 attack vs. visual quality
 ROC (Receiver Operating Characteristics) curve: TPF vs. FPF
표준 데이터베이스의 중요성 강조
 USC-SIPI Image Database
 영국 Cambridge 대학교 데이터베이스
21
2. 워터마킹 기술 분석
 국내외 상업화 사례 (1)

국외 업체 [Bas02]













SureSign Digital Watermarking, Signum Tech (Great Britain)
Ice Audio Electronic Watermarking (Great Britain)
Thomson-CSF (France)
Philips (Netherlands)
Eikona mark, Alpha Tec Ltd (Greece)
Aris Technology (US)
Giovanni Media Security, Blue Spike Inc (US)
Digimark Corp (US)
Dice Company (Japan)
MediaSec Technologies LLC (US)
JK-PGS Signal Processing Lab (Switzerland)
Digital Copyright Technologies (Switzerland)
Tigermark, NEC (Japan)
22
2. 워터마킹 기술 분석
 국내외 상업화 사례 (2)

국내 업체




㈜컨텐츠코리아 (http://www.contents.co.kr)
㈜디지트리얼 테크놀로지 (http://www.digitreal.com)
㈜실트로닉 테크놀로지 (http://sealtronic.com)
㈜마크애니 (http://www.markany.com)
23
3. 워터마킹 활용 현황과 전망
24
3. 워터마킹 활용 현황과 전망
 전자 도서관 (1)


미국의 전자 도서관 사업 진행 중
국내 국가 전자 도서관 구축
 24억 원 이상의 비용으로 1997-1998년에 걸쳐 1차 사업 완료
 컨텐츠 측면에서는 단지 scan-and-archive에 치중 (tiff 포맷)
 평가
• 입력된 문서의 양은 극히 일부분에 불과
• 일반 영상 포맷 tiff 사용 (비효율적인 저장 구조)
• 전문 검색은 불가능
• 현재 저작권 보호 측면 미흡
• 문서 영상에 적합한 DjVu와 같은 포맷 연구 시급
25
3. 워터마킹 활용 현황과 전망
 전자 도서관 (2)

표 3. 국가 전자 도서관에 저장되어 있는 문서 (2000년 조사).
26
3. 워터마킹 활용 현황과 전망
 E-book




현재 국내 e-book 제작 판매 회사 15개 이상
회사별로 고유 포맷과 브라우져 사용
컨텐츠의 불법 복제나 유통에 대한 해결책 미흡
 단순한 사용자의 아이디와 패스워드를 통한 인증
 네트워크 보안 방법 등으로 저작권 문제 해결
• 컨텐츠의 열어본 횟수 제어
• 컨텐츠 접근 가능 시간 제어
워터마크 활용 사례 발견 못했음
27
3. 워터마킹 활용 현황과 전망
 텍스트 문서에 대한 워터마킹 활용 사례 (1)

*
IEEE SEPTEMBER 서비스





IEEE 발간 잡지들을 웹을 통해 배포
1995년 10월 JSAC에 대해 시범 서비스 시작
워터마크 이용하여 문서 영상에 대한 저작권 보호의 첫 시도
목적
• 독자가 느끼는 논문 가치의 상승 효과
• 불법 재배포의 의욕 상실
기법
• PostScript 포맷 사용
• 줄 이동 (line shifting) 워터마킹 기법 사용
* Bell Labs, Lucent Technology 연구 [Brassil99]
28
3. 워터마킹 활용 현황과 전망
 텍스트 문서에 대한 워터마킹 활용 사례 (2)

AT&T Bell Lab. 내부 문서 배포 서비스




내부 수령자마다 고유한 표시 (fingerprinting)
문서 유출시 고유한 표시로 추적
실험적 시스템 구축
• DMTS (Document marking and identification system)을 사용하
여 고유한 워터마크 삽입
• 워터마크 삽입된 문서는 PostScript 형태
• 수령자들에게 배포 후 DMTS에 배포 정보 기록
복사와 팩스 전송에 대해 높은 강인성 보임
29
3. 워터마킹 활용 현황과 전망
 복합 미디어에 대한 활용 전망 (1)

워터마킹에 대한 필요성과 상업적 요구 증가
 워터마킹 전문 국제 학술 대회
 유수 학술지에서의 워터마킹 특집호 발간
 꾸준히 증가하는 논문의 양
 관련 기업체의 증가
 국제적인 컨소시움
 DVD player의 급속한 보급으로 인한 워터마킹의 본격적 활용 기대
30
3. 워터마킹 활용 현황과 전망
 복합 미디어에 대한 활용 전망 (2)


국가적으로 디지털 컨텐츠에 대한 중요성 인정
 컨텐츠 진흥원 설립

컨텐츠 진흥법 제정

컨텐츠 유료화 추세

국내 DRM 워킹 그룹 2001년 조직
테스트베드 구축의 중요성
 논문 위주에서 벗어나 실제 환경에서 워터마킹 관찰이 중요
• 워터마킹은 잘 정의된 단일 문제라기보다는, end-user의 요구
사항, 컨텐츠 제공자의 정책, 시스템 환경등에 큰 영향을 받는
문제임
 워터마킹의 본질적인 역할과 한계 파악 가능
 향후 투자 계획과 정책 수립에 도움
 불법복제의 의욕 상실 효과 측정에 도움
31
3. 워터마킹 활용 현황과 전망
 미래 연구 방향 제시 (1)

테스트베드 시스템 구축

향후 연구의 중요한 길잡이

웹을 통한 정보 제공 방식

초기 소규모 설계 바람직

국내 정부 컨텐츠 사업과 연계
•
•
•
비디오: 환경부나 문화 관광부의 비디오 클립 제공 서비스
오디오: 환경부의 “한국의 아름다운 소리 100선” 서비스
문서 영상: 학술지 전자 도서관 서비스
32
3. 워터마킹 활용 현황과 전망
 미래 연구 방향 제시 (2)

벤치마킹 연구

Cambridge 대학교의 StirMark 참조

벤치마킹을 위한 데이터베이스 중요
•
•
다른 연구 분야에서 이미 구축한 데이터베이스 활용이 바람직
예) 텍스트 문서 영상을 위한 데이터베이스
-
NIST
-
Univ. of Washington의 데이터베이스
33
3. 워터마킹 활용 현황과 전망
 미래 연구 방향 제시 (3)

문서 영상에 적합한 포맷과 연계

DjVu에 주목할 필요

DjVu 포맷의 한글 처리 구현 연구

NDL 사업과 연계하여 세가지 시너지 효과 기대
•
•
•
문서 영상에 효율적인 포맷
-
효율적인 파일 크기
-
빠른 브라우징
전문 검색 기능 제공
워터마킹을 이용한 저작권 보호 장치 제공
34
3. 워터마킹 활용 현황과 전망
 미래 연구 방향 제시 (4)

문서 영상 처리 연구와 밀접한 연계

워터마킹을 위한 문서 영상 구조 분석과 분할 필요
•
•

개발되어있는 영상 처리 프로그램 활용
워터마킹 알고리즘에 적합하게 튜닝 작업 필요
관련 연구 그룹
•
•
문서 구조 분석
-
전남대학교 김수형 교수
-
연세대학교 조성배 교수
-
고려대학교 이성환 교수
분할, 단어와 문자 속성 추출
-
•
전남대 김수형 교수
글자 획 추출, 골격선 추출
-
전북대 오일석 교수
35
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹
소프트웨어와 성능 평가
36
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (1)

알고리즘 개요 [Wu00]
 문서 영상을 블록으로 나누고, 각 블록에 신호 인코딩
 인코딩을 위한 다양한 조건 함수
• 나머지 함수 R(m,2i) = m%2i
-
•
정보 인코딩
= 0 이면 00
= 1 이면 01
= 2 이면 10
= 3 이면 11
홀수-짝수 함수 R(m, 21)
-
•
i bits의
R(m, k)
R(m, k)
R(m, k)
R(m, k)
1 bit 정보 인코딩
나머지 구간 함수 T(m,2i) = (m%2i)<2i/2
-
i에 무관하게 1 bit 정보 인코딩
T(m, 23)=TRUE 이면 0, T(m, 23)=FALSE 이면 1
37
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (2)

워터마크 삽입 예 (홀수-짝수 함수 사용)
1
워터마크
0
1
0
m: 5
n:
5
5
4
원 영상
4
5
삽입 영상
3
38
2
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (3)

반전 가능도
 조건 함수 값에 맞추기 위해 반전 (0-1 또는 1-0) 필요
 반전 가능도 높은 부분
• 획이 굽는 부분 또는 획의 끝 부분에서 외곽선 지역
• b가 a보다 반전 가능도 높음
a
b
39
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (4)

실험
 120 Ⅹ 40 이진 영상
 “cvlab616” 신호 삽입 (8bits/문자 * 8문자=64bits삽입)
 홀수-짝수 함수
• 워터마크 삽입 예 (1)
워터마크 신호 삽입 전
워터마크 신호 삽입 후
40
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (5)
•
워터마크 삽입 예 (2)
(a) 워터마크 신호 삽입 전
(b) 워터마크 신호 삽입 후
41
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (6)
•
워터마크 삽입 예 (3)
(a) 워터마크 신호 삽입 전
(b) 워터마크 신호 삽입 후
42
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (7)
•
워터마크 삽입 예 (4)
(a) 워터마크 신호 삽입 전
(b) 워터마크 신호 삽입 후
43
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (8)
•
워터마크 삽입 예 (5)
(a) 워터마크 신호 삽입 전
(b) 워터마크 신호 삽입 후
44
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 화소 반전 알고리즘 (5)

알고리즘 특성
 주로 외곽선 부분에서 반전 일어나서 비인지성 만족
 Fragile함
 Authentication과 retrieval 응용에 적합
• 위조와 워터마크 검출 예
원 영상
워터마크
워터마크 삽입 영상
워터마크 검출
위조된 영상
45
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 히스토그램 영역 알고리즘 (1)

알고리즘 개요
 문서 영상을 블록으로 나누고, 각 블록의 히스토그램을 조작함으로써
신호 인코딩
 문서 영상의 특성을 이용한 인코딩 방법
• 전체 영상의 히스토그램과 블록 영상의 히스토그램 유사
• 어미 히스토그램 ( mother histogram )
-
•
자식 히스토그램 ( child histogram )
-
•
전체 영상 또는 조작을 가하지 않은 부분 영상의 히스토그램
블록 영상의 히스토그램
인코딩 기법 예
-
자식 히스토그램이 어미와 같으면 0, 다르면 1
Similarity measurement 필요
46
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 히스토그램 영역 알고리즘 (2)

문서 영상의 히스토그램 특성
전체 영상 히스토그램
47
블록 영상 히스토그램
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 히스토그램 영역 알고리즘 (3)


히스토그램의 기본 조작
 어미 히스토그램과 다른 모양을 갖도록 하는 조작 필요
 조작과 탐지 쉬워야 하며 강인성과 비인지성 만족해야 함
봉우리 조작
 봉우리와 계곡 사이에 작은 봉우리 생성
48
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 히스토그램 영역 알고리즘 (4)

실험
 200 Ⅹ 200 문서 영상을 네 개의 100 Ⅹ 100 블록으로 나눔
 워터마크 신호 0110 삽입
• 워터마크 삽입 예 (1) (봉우리 구간 [20, 30])
1
2
3
4
(a) 원 영상
1
(b) 신호 삽입 영상
2
3
(c) 워터마크가 삽입된 영상의 자식 히스토그램
49
4
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 히스토그램 영역 알고리즘 (5)

비인지성 평가



사람의 주관적 판단 이용
장님 검사 (blind test) 수행
워터마크 삽입 예 (2) (봉우리 구간 [20, 30])
(a) 원 영상
(b) 신호 삽입 영상
50
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 히스토그램 영역 알고리즘 (6)

다양한 공격과 워터마크
공격을 가하지 않은 상태 (워터마크 0110)
임의의 10개의 열 삭제
51
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
공격을 가하지 않은 상태 (워터마크 0110)
2 픽셀 오른쪽 이동
10 픽셀 오른쪽 이동
20 픽셀 오른쪽 이동
52
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
공격을 가하지 않은 상태 (워터마크 0110)
5º 회전
10º 회전
15º 회전
53
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
공격을 가하지 않은 상태 (워터마크 0110)
임의의 잡음 10% 추가 ( MSE = 11.62 )
Photoshop의 noise filter 사용 1% 추가 ( MSE = 0.52 )
Photoshop의 noise filter 사용 5% 추가 ( MSE = 1.98 )
54
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 구현 (1)

텍스트 문서 영상은 배경을 많이 가짐
 배경이 보통 80% 이상
 배경만 갖는 블록의 문제점
• 화소 반전 알고리즘에서 비인지성 파괴
• 두 개의 봉우리를 갖지 않는 히스토그램 발생

섞음 (shuffling) 연산 방법 [Wu00]
 [0,mn-1]사이의 임의수에 의한 정수 열 생성
• S=<r0, r1, ..., rmn-1>
• 앞에서부터 두개씩 쌍으로 ri와 ri+1번째 화소의 위치를 바꿈
 임의수의 씨앗 값을 비밀 키로 활용
 워터마크 신호 매우 fragile
55
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 구현 (2)

문서 영상 구조 분석 방법
 페이지 영상에 대해 구조 분석을 수행하여 삽입 가능 영역 탐지
 문서 영상 구조 분석기
• 텍스트, 표, 그래픽 영역 중의 하나로 분류
• 텍스트 영역에 워터마크 신호 삽입
56
4. 텍스트 문서 영상을 위한 화소 수준 워터마킹 소
프트웨어와 성능 평가
 활용 방안



화소 반전 알고리즘
 쉽게 부서지는 특성
 디지털 문서의 위조 검출 활용
히스토그램 알고리즘
 강인한 특성
 전자 도서관 등의 응용에 활용
다중 목적 (multi-purpose) 워터마킹 활용
 히스토그램 알고리즘으로 저작권 소유 주장
 화소 반전 알고리즘으로 조작 여부 판정
57
5. 텍스트 문서 영상을 위한 특징 수준 워터마킹
알고리즘
58
5. 텍스트 문서 영상을 위한 특징 수준 워터마킹 알고리즘
 문서 영상 구조 분석과 분할 (1)




전처리
 문서 영상의 기울어짐 추정과 교정
구조 분석
 블록 분할
 분할된 영역을 텍스트, 선, 표, 그림으로 분류
단어 분할
 텍스트 블록을 줄과 단어 단위로 분할
단어 속성 추출
 분할된 개별 단어들에 대한 속성 정보 추출
 언어 (한글, 영문), 스타일 (볼드, 이탤릭, 보통, 밑줄), 문자 크기 (10,
12, 14 포인트), 문자 개수, 서체 (명조, 고딕)
59
5. 텍스트 문서 영상을 위한 특징 수준 워터마킹 알고리즘
 문서 영상 구조 분석과 분할 (2)

문서 영상의 분할 예
60
5. 텍스트 문서 영상을 위한 특징 수준 워터마킹 알고리즘
 획 추출


문자 패턴에 대해 볼록 헐 정보를 이용하여 모양 분해
워터마크 신호를 위해 획 조작을 가할 수 있는 상태로 분해되어 있음
 골격선 정보에서 수직, 수평, 대각선 획 판별
 부품 영역 정보 이용하여 획 두께, serif 정보 판별하고 조작
(a) 모양 분해를 통한 near-convex한 획 추출
(b) 골격선 추출
61
6. 결론 및 향후 연구
62
6. 결론 및 향후 연구
 결론




복합 미디어에 대한 워터마킹 기술의 현황 분석과 전망 제시
벤치마킹과 테스트베드 시스템 중요성 강조
텍스트 문서 영상의 워터마킹 기술과 NDL 사업 연계 중요성 강조
텍스트 문서 영상을 위한 워터마킹 알고리즘 제안 및 실험 결과 제시
63
6. 결론 및 향후 연구
 향후 연구



문서 영상 워터마킹 알고리즘 개선
 획 기반 알고리즘
 화소 기반 알고리즘
테스트베드 구축
 이미 서비스 하고 있는 소규모 DL 대상
문서 영상 벤치 마킹
 데이터베이스 구축
• 언어별, 품질별, 문서 종류별 구분
• 가능한 한 기존 자료 활용
 공격 소프트웨어
 평가 소프트웨어
64