Diferencia entre revisiones de «Bitextor»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Rαge (discusión · contribs.)
m Revertidos los cambios de 200.92.92.62 (disc.) a la última edición de Der Kreole
Línea 6: Línea 6:


== Véase también ==
== Véase también ==
En esta pagina podras ber otros jugadores, que tambien forman parte de tu equipo,i los que te acompañan, o puedes ingresar a esta pagia para resibir piedras demoniacas gratis y un porsentage de oro resibiras¡¡¡


http://s31.bitefight.es/c.php?uid=41721
*[[Traducción automática]]
*[[Traducción automática]]
*[[Procesamiento del lenguaje natural]]
*[[Procesamiento del lenguaje natural]]

Revisión del 18:50 13 nov 2009

Bitextor es una aplicación libre de código abierto que tiene como objetivo la generación de memorias de traducción a partir de sitios web multilingües, que son utilizados como corpus base. Bitextor está publicado bajo licencia GNU GPL v2.

La aplicación descarga todos los ficheros HTML del sitio web indicado por el usuario. Entonces, realiza un preproceso para convertirlos a un formato coherente y adecuado para los siguientes pasos. Seguidamente, se aplica un conjunto de heurísticas (principalmente basadas en la estructura de etiquetas HTML y la longitud de las cadenas de texto) para hacer parejas de ficheros que seran considerados como candidatos a contener el mismo texto en diferentes idiomas. A partir de estos candidatos, se generan las memorias de traducción en formato TMX mediante la librería LibTagAligner, que utilitza las etiquetas HTML y la longitud de los bloques de texto (también) para realizar el alineamiento.

El objetivo de esta herramienta es el de facilitar la obtención de corpus multilingüe a partir de Internet. Bitextor fue desarrollado, en un principio, para facilitar el proceso de entrenamiento de aplicaciones de traducción automática y, concretamente, la de la plataforma Apertium.

Véase también

Enlaces externos