Diapositiva 1

Download Report

Transcript Diapositiva 1

Perspectivas profesionales
en el desarrollo
de las Tecnologías del Habla:
una visión desde la Lingüística
Juan María Garrido Almiñana
Grup de Lingüística Computacional (GLiCom)
Universitat Pompeu Fabra
VIII Seminario TIC-ETL
Madrid, 4 de diciembre de 2014
Las Tecnologías del Habla, un negocio en auge
• Las Tecnologías del Habla han alcanzado un grado
de madurez suficiente como para permitir el
desarrollo de aplicaciones que sean atractivas para el
gran público, y por tanto rentables desde el punto de
vista comercial.
• Están empezando a ser un negocio que genera
empleo, no solo para ingenieros, sino también para
lingüistas.
Las Tecnologías del Habla, un negocio en auge
• Usos de las tecnologías del habla:
• Público en general:
• Comunicación persona-máquina
• Ayuda a la discapacidad
• Comunicación multilingüe
• Empresas:
• Análisis de mercado, posicionamiento de marca
• Comunicación con los clientes
•Profesionales de la lengua:
• Enseñanza de lenguas
• Apoyo al estudio
• Terapia del habla
Productos comerciales con Tecnologías del Habla
•Interfaces persona-máquina:
• Permiten la interacción oral entre un
dispositivo y un usuario
• Se emplean en diferentes tipos de
dispositivos:
• Dispositivos móviles
• Navegadores de a bordo en coches
• Páginas web
• Ejemplos:
• Siri, de Apple
• SYNC, de Ford
• Asistente virtual Renfe
Productos comerciales con Tecnologías del Habla
• Lectores de pantalla:
• Sistemas que permiten interactuar
con un dispositivo electrónico a
personas sin visión o con visión
reducida
• Existen aplicaciones para diferentes
tipos de dispositivos
• ordenadores de sobremesa
• dispositivos móviles
• páginas web
• Ejemplos
• JAWS, de Freedom Scientific
• Mobile Accesibility, de Code
Factory
• Página web de la UOC
Productos comerciales con Tecnologías del Habla
•Traductores voz-voz:
• Sistemas de traducción
automática que incorporan entrada
y salida vocal
• Permiten la comunicación oral
entre dos personas que hablan
diferentes lenguas
• Ejemplos:
• Google Translate for Mobile
• Vocre, de MyLanguage
Productos comerciales con Tecnologías del Habla
• Sistemas
IVR (Interactive
Voice Response):
• Sistemas que permiten la
interacción mediante el habla
entre un cliente y un sistema
automático a través del teléfono
• Muy empleados en la
automatización de call centers
• Ejemplos:
• Emoción Voz (Movistar)
• Spoken
Productos comerciales con Tecnologías del Habla
• Speech
analytics:
• Aplicaciones para el análisis del
contenido de las llamadas a un
servicio de atención telefónica
• Permiten detectar
automáticamente situaciones de
conflicto o temas de interés para los
clientes
• Ejemplos:
• Eureka, de CallMiner
• Interaction Analytics, de Nice
Productos comerciales con Tecnologías del Habla
• Sistemas
de evaluación
automática de la pronunciación:
• Permiten ejercitar la
pronunciación a las personas quue
están aprendiendo una lengua
• Se ofrecen como poductos
aislados o integrados en otros
productos (cursos de idiomas
multimedia)
• Ejemplos:
• TellMeMore Spanish Language
Learning Software, de Rosetta
Stone
• Talk to Me, de Auralog
Productos comerciales con Tecnologías del Habla
• Programas
para el aprendizaje
de lectura y escritura y apoyo al
estudio (literacy software):
• Programas de soporte al estudio
con ayuda del ordenador
• Pensados tanto para estudiantes
con dificultades como sin ella
• Ejemplos:
• Kurzweil 3000/Firefly, de
Kurzweil Educational Systems
• Ditres, de Rehasoft
Tecnologías del Habla comerciales
• Las tecnologías del habla que se emplean en estas aplicaciones
son básicamente tres:
• Conversión texto-habla
• Text-to-speech, o TTS, en inglés
• tecnología que permite leer de forma automática en voz alta un texto
escrito en una lengua determinada
• Reconocimiento de habla
• Tecnología que convierte en una cadena de texto una onda sonora de
habla de entrada
• Gestión de diálogo
• Tecnología encargada de controlar automáticamente las interacciones
orales entre personas y máquinas
• Son una mezcla de conocimiento lingüístico/fonético y métodos
estadísticos
Tecnologías del Habla comerciales
• Conversión texto-habla
Tecnologías del Habla comerciales
• Conversión texto-habla
• Tareas en la incorporación de un idioma a un sistema
comercial:
• Construcción del módulo de procesado lingüístico
• Preprocesado
• Análisis del texto
• Predicción del acento
• Análisis prosódico
• Transcripción fonética
• Construcción de la voz sintética
• Selección del corpus
• Selección del locutor
• Grabación del corpus
• Procesado del corpus
• Construcción de la voz
• Base de datos de sonidos
• Modelos prosódicos
• Evaluación y mejoras
Tecnologías del Habla comerciales
• Reconocimiento de habla
Tecnologías del Habla comerciales
• Reconocimiento de habla
• Tareas en la incorporación de un idioma a un
sistema comercial
• Creación de los modelos acústicos
• Diseño del corpus
• Selección de los locutores
• Recogida del corpus
• Construcción de los modelos
• Creación de los modelos de lenguaje
• Recogida del texto
• Limpieza del texto
• Construcción de los modelos
• Evaluación
Tecnologías del Habla comerciales
• Gestión de diálogo
Tecnologías del Habla comerciales
• Gestión de diálogo
• Tareas en el desarrollo de un servicio basado en
gestión de diálogo:
• Diseño
• Definición de las carácterísticas funcionales
• Tecnología implicada
• Desarrollo
• Diseño del flujo
• Ajuste del conversor texto-habla
• Ajuste del reconocedor
• Evaluación y pruebas
Tecnologías del Habla comerciales
• Desarrolladores de tecnología:
• Grandes empresas:
• Google
• Microsoft
• Apple
• AT&T
• Nuance
• Pequeñas y medianas empresas
• Acapela
• Cereproc
• Neospeech
• Verbio
• Fundaciones
• SRI International
• Desarrolladores
de servicios:
• Ydilo
• Fonetic
• Prosodie
• VoxWeb
• Artificial solutions
• Asistentes Virtuales
Las Tecnologías del Habla en un futuro inmediato
• Nuevas
líneas de aplicación:
•Robótica
•Asistentes personales
•Juguetes: AIBO, de Sony
•Domótica
•Control de electrodomésticos,
calefacción, luz, etc. de una casa
mediante la voz:
• INVOX, de Vócali
• Samsung Smart TV
•Teleasistencia
•Sistemas de ayuda a personas
mayores y enfermos en casa
•Denise
Las Tecnologías del Habla en un futuro inmediato
• Nuevos
retos tecnológicos:
• Mejora de la tecnología actual
• Sistemas de conversión texto-habla con un mayor grado
de naturalidad y capaces de expresar emociones
• Mejora de los modelos prosódicos
• Sistemas de reconocimiento de habla mucho más
robustos, capaces de trabajar en entornos ruidosos o con
habla informal y emotiva
• Mejora del reconocimiento acústico
• Mejora de los léxicos y modelos de lenguaje
• Sistemas de diálogo mucho más flexibles y adaptados
también a entornos informales
• Mejora de las técnicas de control del diálogo
• Tecnología de reconocimiento de locutor más fiable, que
permita su incorporación a sistemas comerciales
Las Tecnologías del Habla en un futuro inmediato
• Nuevos retos tecnológicos:
• Desarrollo de nuevas tecnologías ahora emergentes
• Identificación de idioma
•Identificación en la onda sonora del idioma en que se ha
emitido
• Reconocimiento automático de emociones
•Técnicas para identificar en las ondas sonoras del habla las
emociones del hablante
• Speaker diarization
• Identificación en la grabación de un diálogo de los
segmentos pronunciados por los distintos participantes
Perspectivas profesionales de los lingüistas en las
Tecnologías del habla
• Sin duda, los linguistas tienen (y tendrán) un papel en el
desarrollo de tecnología del habla comercial:
•El desarrollo de estas tecnologías y servicios lo llevan a cabo
grupos interdisciplinares, en los que también participan
lingüistas
• Campos en los que se requieren conocimientos lingüísticos:
• Desarrollo de módulos de procesado lingüístico para
conversión texto-habla
• Desarrollo de diccionarios de pronunciación para
reconocimiento
• Diseño, recogida y anotación de corpus para la síntesis y el
reconicimiento
• Desarrollo y ajuste de servicios basados en sistemas de diálogo
• Evaluación y mejoras
Perspectivas profesionales de los lingüistas en
las Tecnologías del habla
• La aportación de la Lingüística a la investigación en Tecnología del
Habla es más incierta, y dependerá de diversos factores:
• Paradigma empleado en el desarrollo de la tecnología:
• Las aproximaciones estadísticas, de momento, son el paradigma
dominante
• Campos en los que el conocimiento fonético sigue teniendo su papel:
• Aproximaciones paramétricas a la síntesis
• Síntesis de emociones
• Procesado lingüístico para la síntesis y el reconocimiento
• Diccionarios fonéticos para el reconocimiento
• Conocimiento teórico aportado por la Fonética:
• Descripción del habla expresiva
• Modelos prosódicos
• Caracterización segmental
• Descripción del habla en diversas situaciones
• Diálogos orientados a objetivo
• Descripción de la variación interlocutor e intralocutor:
• Habla de niños, habla de personas ancianas
Perspectivas profesionales de los lingüistas en
las Tecnologías del habla
• Hacia un nuevo perfil de fonetista ‘computacional’
• Con mayor dominio de las herramientas tecnológicas de
procesado, no solo en lo que se refiere a su manejo sino
incluso a su desarrollo (con Praat, por ejemplo)
• Capacitado tanto para el trabajo en investigación básica
como para el desarrollo de tecnología del habla, en el mundo
académico o de la empresa.
• Requiere una nueva formación multidisciplinar