Alineacion_de_textos_paralelos

Download Report

Transcript Alineacion_de_textos_paralelos

Alineación de textos paralelos
Informática aplicada a la traducción
1.



Crear una memoria de traducción
1.1 A partir de la alineación de textos
Una memoria de traducción se alimenta de
textos originales alineados con sus respectivas
traducciones.
Puede crearse a medida que se traduce o con
traducciones anteriores
En esta clase y la siguiente veremos:


Distintas herramientas de alineación
Procedimientos para alinear documentos
1.2 En qué consiste la alineación
• El proceso de alineación consiste en comparar el texto
de origen y su traducción, haciendo coincidir los
segmentos correspondientes y uniéndolos como
unidades de traducción de una MT.
• Este corpus paralelo es la base de las memorias de
traducción
Los segmentos están asociados a su
traducción (similar a un corpus paralelo)
2. Herramientas de alineación
 Procedimiento manual: hoja de cálculo (ej.Microsoft
Excel)
 Herramientas incluidas en paquetes de MT:
 WinAlign (incluido en el paquete de Trados)
http://blog.quillslanguage.com/2008/11/trados-winalign/
 DejaVu de Atril incluye también su propio alineador
 Sistemas de código abierto
 Microsoft Bilingual Sentence Aligner
 LF Aligner http://sourceforge.net/projects/aligner/
 Bitext2tmx http://bitext2tmx.sourceforge.net
 Más en: http://www.cse.unt.edu/~rada/wa/#softwareSA
2.1 Ejemplo: WinAlign de Trados
2.1 Ejemplo: Alineador de DéjàVu
Segmentado en los dos puntos
Herramientas para modificar
segmentos
2.2 Cómo mejorar el resultado de la
alineación

Detectar con antelación los posibles errores de
alineación:



Incoherencia de formatos entre ambos textos
(figuras, tablas, logos, etc.)
Falta de correspondencias: división de un segmento
de la TO en dos segmentos en TT o viceversa…
Revisar la alineación propuesta por el programa:

Problemas de división de segmentos (puntos de
abreviaturas, dos puntos…)
3. Procedimiento general
1.
2.
3.
4.
5.
6.
7.
Comprobar que los textos en LO y LT son adecuados y
tienen el mismo formato de archivo.
Especificar el formato de entrada (doc, html, txt…)
Especificar las lenguas de origen y llegada
Seleccionar los archivos correspondientes (puede
trabajarse en uno o más archivos simultáneamente)
Seguir las instrucciones de la herramienta de
alineación elegida (WinAlign, DejaVu, Bitext2TMX…)
Exportar el resultado en un formato compatible con el
programa de memoria que se vaya a utilizar
No todos los textos son adecuados para alimentar una
MT
4. Conceptos generales




eContent: Información digital con una vida útil electrónica, es decir,
material creado, distribuido, utilizado y finalmente descartado en forma
exclusivamente electrónica. También puede ser creado electrónicamente,
aunque su distribución o uso sea en forma impresa.
TMX: Formato estándar para memorias de traducción desarrollado por la
LISA con el objetivo de facilitar el intercambio de memorias de traducción
entre los distintos programas de software y/o entre los proveedores de
servicios de localización. Para mayores detalles véase la página principal
TMX.
Segmento: Una unidad de texto predefinida que puede ser alineada con
su traducción correspondiente. Normalmente la unidad básica de
segmentación es una frase, aunque otras unidades también se pueden
definir como segmentos, por ejemplo titulares, elementos de una lista,
celdas de una tabla o párrafos. (Bowker 2002, 152)
Alineación: El proceso de alineación consiste en comparar el texto de origen
y su traducción, haciendo coincidir los segmentos correspondientes y
uniéndolos como unidades de traducción de una MT.
Referencias






Abiatura, Joseba (2001), “Memorias de traducción en TMX
compartidas por Internet”, Tradumática
Bowker, Lynne (2002). Computer-Aided Translation Technology: A
Practical Introduction. Ottawa: University of Ottawa Press.
Bowker, Lynne (2003). "Terminology tools for translators". In:
Somers, Harold (ed.) (2003), pages 49-65.
Esselink, Bert (2000). A Practical Guide to Localization.
Amsterdam/Philadelphia: John Benjamins.
Esselink, Bert (2003). "Localisation and translation". In: Somers,
Harold (ed.) (2003), pages 67-86.
Somers, Harold (ed.) (2003). Computers and Translation: A
Translator's guide. Amsterdam/Philadelphia: John Benjamins.