음성인식을 통한 하드웨어 제어 프로그램

Download Report

Transcript 음성인식을 통한 하드웨어 제어 프로그램

Voice Commander
-음성인식을 통한 하드웨어 제어 프로그램 –
<With H.T.K>
<부산대학교> 정보컴퓨터 공학부
3학년 박중규
[email protected]
Contents
1
음성인식 기술
2
Intro. Voice Commander
3
Exp. Software Architecture
4
Program Demonstration
5
Q&A
음성언어번역 핵심기술
언어처리
음성합성
음성데이터
음성언어번역
음성인식
시스템통합
국가별 음성인식 연구
 미국은 국방성 주도아래 대학-연구기관의 오랜
연구로 세계 최고 기술 보유
- 연구 기반 인프라 구축- 공용 DB
- 정기적인 평가로 경쟁적 형태의 연구 조성
- 세계 각국의 기업, 기관의 Reference가 됨
 유럽의 경우 주요국가의 산학 프로젝트를 통해
미국과 대등한 발전을 이루고 있음
- 영국의 Cambridge 대학(HTK개발)은 미국 CMU와 함께
연구분야 최상위를 유지
- L&H는 미,유럽, 아시아권까지 진출
 일본은 기술수준은 아직 미흡
- Sony의 ‘아이보’와 같이 상용화 측면에서 상당한 가능성
음성인식 시장 흐름
 유럽 ‘파이오니아’
- GPS에 음성인식 도입 (06’ 10월)
 MicroSoft
- Window Vista에 음성인식/명령 기능 탑재
 RSA 시큐리티
- 사용자 인증 패키지에 음성 측정기능 추가
(미국 07’ 1분기 폰뱅킹에 실제 적용 예정)
* 일상생활에 밀접한 여러 분야에 걸쳐서 음성인식이 사용되고
있으며 그 시장 규모는 점점 커지고 있다.
Intro. Voice Commander
개발동기
 최근 홈-네트워크가 각광을 받고 있음.
 가정 내의 각종 기기의 다양화와 복잡화.
 제어를 위한 컨트롤러의 복잡화.
 음성 명령을 사용하여 손쉬운 제어 가능.
Intro. Voice Commander
동작 메커니즘
 사용자의 음성을 입력
 인식 된 내용에 따른 명령 해석
 명령에 따른 하드웨어 식별
 RF 통신으로 명령을 전송
음성 DB Training
 사람의 음성 녹음 Data
 단어 사전 작성 및 단어 네트워크 구성
 HTK를 이용하여 MFCC변환
 HTK를 이용하여 Training
** 실제 음성 DB를 개인이 구축하기에는 비효율적.
개인이 DB 생성시에는 고비용 부담이 불가피.
Why Used H.T.K ?
- H.T.K: ( HMM Tool Kit )
 Hidden Markov Model을 사용
 음소단위 Dictionary
 Acoustic analysis
 Viterbi-beam Searching
Exp. System Architecture
전체 시스템 구조와 동작
Exp. S/W Architecture
 세부적인 동작 단계
Program Pre-View
1
7
10
2
3
4
5
6
8
11
12
9
Program Pre-View
1.Manual Controller: H/W를 수동으로 동작하는 기능의 묶음 하드웨어
컨트롤을 할 때 Remote Controller 형태의 기능을 수행한다.
2.Remote Controller: Manual Controller가 활성화 된 상태에서 내부
버튼을 누르게 되면 TV 채널이 바뀌듯이 H/W의 해당되는 기능이
수행되게 된다.
3과 4.는 활성화/비활성화 버튼..
5.Current Status: 현재 Manual Controller의 On/Off 상태를 보여준다.
6.Current Command: 현재 눌러진 버튼이 무엇이고 어떤 명령을
전송하는지 보여준다.
7.Voice Command Controller: 음성인식으로 H/W를 컨트롤하기 위한
명령의 묶음.
8.Start: 클릭 시에 음성인식 엔진이 생성되고 생성과 동시에 인식을 시작.
9.Stop: 음성인식 엔진을 임시 정지 시키며 엔진의 동작을 멈춘다.
10.Current Status: 현재 Voice Command Controller 의 On/Off 상태
11.Current Command: 현재 인식된 음성명령이 무엇인지 출력한다.
12.Progress Bar: 엔진의 동작 상태를 살피기 위한 것으로 엔진이 동작
중에는 Progress Bar가 계속해서 함께 동작한다.
Demonstration
프로그램 시연
- S/W -> “음성인식”
음성명령: 전진, 후진, 좌로가, 우로가, 멈춰
- H/W
하드웨어 제어 정보가 담긴 Packet을 분석
해당 명령에 따라 동작.
Voice Commander 장/단점
Voice Commander
-장점-
-단점-
1.
별도의 이동이 불필요
1.
DB 구축 비용이 높음
2.
단어 단위의 명령사용.
2.
환경적 의존도가 높음
3.
신체적 제약이 없음.
3.
DB 용량이 큼
(메모리 사용량 증가)
향후 보완 점
음성 DB의 추가적 확보와 훈련
-인식률 향상을 위해 필요함.
RF 통신 시에 Packet 암호화
-오동작 방지를 위해 Key설정 필요.
Controller의 휴대성을 개선
-사용자의 Mobility를 높이기 위함.
부산대학교 정보컴퓨터 공학부 - 박중규