02-VoiceXML - 이상정

Download Report

Transcript 02-VoiceXML - 이상정

VoiceXML
순천향대학교 정보기술공학부
이상정
2002-2 컴퓨터공학응용
VoiceXML이란?
 음성 사용자 인터페이스를 위한 XML
 대화형 음성 인터페이스 구현에 용이
 VoiceXML 포럼에서 관리
 현재 VoiceXML 2.0
 http://www.voicexml.org
순천향대학교 정보기술공학부 이 상 정
2
2002-2 컴퓨터공학응용
Hello World 예
<?xml version="1.0"?>
<vxml version="2.0">
<form>
<block>Hello World!</block>
</form>
</vxml>
 <vxml version=“2.0”> dialogs </vxml>
 Dialog
• <form> : 정보를 표현하고 데이터 수집
• <menu> : 여러 가지 중 하나를 선택하는 다이얼로그
순천향대학교 정보기술공학부 이 상 정
3
2002-2 컴퓨터공학응용
음료선택 예
<?xml version="1.0"?>
<vxml version="2.0">
<form>
<field name="drink">
<prompt>Would you like coffee,tea, milk, or nothing?</prompt>
<grammar src="drink.grxml" type="application/grammar+xml"/>
</field>
<block>
<submit next="http://www.drink.example.com/drink2.asp"/>
</block>
</form>
</vxml>
순천향대학교 정보기술공학부 이 상 정
4
2002-2 컴퓨터공학응용
음료선택 예
 <field> : form 내의 입력 필드를 표시
 <grammar> : 음성인식,DTMF 입력을 위한 문법기술
 <block> : 실행코드 명시
C (computer): Would you like coffee, tea, milk, or nothing?
H (human): Orange juice.
C: I did not understand what you said.
(a platform-specific default message.)
C: Would you like coffee, tea, milk, or nothing?
H: Tea
C: (continues in document drink2.asp)
순천향대학교 정보기술공학부 이 상 정
5
2002-2 컴퓨터공학응용
VoiceXML 아키텍처 모델
순천향대학교 정보기술공학부 이 상 정
6
2002-2 컴퓨터공학응용
VoiceXML 아키텍처 모델
 Document Server
• 클라이언트의 요청받아서 VoiceXML 문서를 응답
• 웹서버 등
 VoiceXML Interpreter
• 사용자 입력을 모니터링하고 요청 생성
• VoiceXML 태그 및 문서처리
• Dialog 및 Implementation Platform 제어
 VoiceXML Interpreter Context
• VoiceXML Interpreter의 제어 및 관리
 Implementation Platform
• VoIP 및 외부 통신망 환경 인터페이스
순천향대학교 정보기술공학부 이 상 정
7
2002-2 컴퓨터공학응용
VoiceXML 아키텍처 구성 예
순천향대학교 정보기술공학부 이 상 정
8
2002-2 컴퓨터공학응용
VoiceXML 시스템 컴포넌트
TTS
HTTP API
SR API
Main
LOOP
REC API
XML
Parser
순천향대학교 정보기술공학부 이 상 정
DTMF API
9
2002-2 컴퓨터공학응용
VoiceXML 시스템 컴포넌트
 TTS(Text-to-Speech)
• 문자 정보 또는 기호를 인간의 음성으로변환
 음성인식(SR,Speech Recognition)
• 인간의 음성을 컴퓨터가 분석해 이를 인식,이해
 DTMF(Dual Tone Multi-Frequency)
• 일반 전화기의 버튼을 눌렀을 때 발생되어 전화국으로 보내어
지는 신호
• 사용자가 누르는 전화기의 각 키는 특정한 주파수를 가지는
두 가지 음 생성 => 음성과 구분
• 한 음은 높은 주파수에 속해있는 음, 다른 한 음은 낮은 주파
수에 속해있는 음을 생성
 오디오 녹음
순천향대학교 정보기술공학부 이 상 정
10
2002-2 컴퓨터공학응용
응용분야
 전자상거래
• 상품 홍보와 판촉,소비자 상담 및 카탈로그 소개
• 주문 접수 처리,결제 처리 등의 고급화
• 은행 거래
 실시간 정보 안내
• 날씨,뉴스,증권,교통 정보 등의 실시간 정보 제공
 UMS (Unified Messaging Service)
• 통합 메시징 서비스
• 음성 메일, 음성 게시판, 음성 사서함
• 자동응답시스템(IVR)
순천향대학교 정보기술공학부 이 상 정
11
2002-2 컴퓨터공학응용
날씨 정보 응용 예
SIP CALL
(INVITE)
End User
SIP-PSTN Gateway
Application Server
(VoiceXML Server)
End User
• A는 원격지에서 전화기로 날씨 정보 서비스를 받고 싶다
• VoiceXML 게이트웨이에 연결
• 안내문 발송
(ex> 안녕하십니까 날씨정보 서비스 입니다.
원하시는 지역번호를 입력하세요
1번은 서울/경기 2번은 충남….)
• DTMF, 음성으로 명령
Web Server
(Service Logic)
• 해당 지역의 날씨 정보 서비스 제공
순천향대학교 정보기술공학부 이 상 정
12
RTSP Server
2002-2 컴퓨터공학응용
음성메일 응용 예
SIP CALL
(INVITE)
End User
SIP-PSTN Gateway
Application Server
(VoiceXML Server)
End User
• A는 원격지에서 전화기로 메일 확인 서비스를 받고 싶다
• VoiceXML 게이트웨이에 연결
• 안내문 발송
(ex> 안녕하십니까 E-Mail 서비스 입니다.
ID 번호를 입력하세요)
• DTMF, 음성으로 명령
• 텍스트 기반의 E-Mail을 TTS를 통해 서비스 받거나, Web/Mail Server
(Service Logic)
음성 E-Mail을 청취, 또는 발송
순천향대학교 정보기술공학부 이 상 정
13
RTSP Server
2002-2 컴퓨터공학응용
정보가전 응용 예
• A는 원격지에서 전화기나
PDA로 집안을 Control 하고 싶다
•VoiceXML 게이트웨이에 연결
• 안내문 발송
(ex> 안녕하십니까 A의 집입니다
1번은 보일러 2번은 PC….)
• DTMF, 음성으로 명령
VoiceXML
게이트웨이
디지털캠코더
1394
End User
웹캠
보일러
PC
End User
순천향대학교 정보기술공학부 이 상 정
14