- portada
- documents and resources
- other resources
- public trilingual corpus
Corpus
Corpus triling黣 p鷅lico de la OMC
A la luz de la importancia creciente de los estudios sobre el procesamiento de lenguajes naturales, en particular la traducción automática, y a fin de ayudar asimismo a los traductores de textos relacionados con el comercio internacional, la OMC está dispuesta a permitir el acceso a su corpus trilingüe público.
El corpus publicado contiene la mayoría de los documentos públicos de la OMC producidos desde el establecimiento de la Organización en 1995 hasta diciembre de 2018. Todos los documentos han sido traducidos por profesionales. El corpus se ha alineado por frases automáticamente y contiene metadatos, según se explica en el cuadro que figura a continuación. Aunque la calidad de la alineación es buena, no ha sido revisada. Por lo tanto, la OMC no puede garantizar la exactitud ni la integridad de las alineaciones.
ID |
> Nº de identificación del registro |
IdxID |
> Registro del fichero |
SegID |
> Nº de identificación del segmento |
BTYear |
> Año del bitexto |
BTPath |
> Ruta del bitexto (correspondiente a la colección y la serie) |
BTName |
> Nombre del bitexto |
SegSrc |
> Texto origen |
SegTgt |
> Texto meta |
Match |
> Nº de frases (del texto origen-del texto meta) que forman este segmento |
IdxDomain |
> Nombre del dominio |
El Corpus Público de la OMC está disponible en las tres combinaciones de pares de idiomas de trabajo de la OMC: inglés-español, inglés-francés y francés-español. Consta de 22 archivos (de 1 millón de líneas cada uno) y puede descargarse en un archivo comprimido (.zip) para cada par de idiomas.
Descargar el Corpus
Descargo de responsabilidad y condiciones de uso del Corpus Trilingüe Público de la OMC
La utilización del Corpus Trilingüe Público (inglés-español-francés) de la Organización Mundial del Comercio (OMC) -por cualquier persona, en cualquier contexto y con cualquier finalidad- estará sujeta al siguiente descargo de responsabilidad:
- El Corpus Trilingüe Público de la OMC se publica sin garantía explícita o implícita de ningún tipo. En concreto, la OMC no formula específicamente ninguna garantía ni declaración en cuanto a la exactitud o la integridad de la información contenida en el Corpus Trilingüe Público de la OMC en cualquiera de sus tres idiomas -incluido el idioma original del documento- ni a las funciones, los metadatos o los programas informáticos incorporados en el Corpus.
- En ningún caso se considerará que la OMC es responsable de cualquier pérdida, carga, perjuicio o daño (incluso en procedimientos penales) derivado de la presunta utilización del Corpus Trilingüe Público de la OMC. La utilización del Corpus Trilingüe Público de la OMC corre exclusivamente por cuenta y riesgo del usuario, que reconoce y acuerda específicamente que la OMC no es responsable de la conducta de ningún usuario. En el caso de que un usuario no esté satisfecho con alguno de los materiales facilitados en el Corpus Trilingüe Público de la OMC, lo único que puede hacer es dejar de utilizarlo.
- Cuando utilice el Corpus Trilingüe Público de la OMC, el usuario debe citar a la OMC como fuente de la información.
- Nada de lo aquí dispuesto constituirá o se considerará una limitación de los privilegios y las inmunidades de la OMC ni una renuncia expresa o tácita a estos, que se reservan específicamente.
Compartir
Si tiene problemas para visualizar esta p醙ina,
s韗vase ponerse en contacto con [email protected], y proporcionar detalles sobre el sistema operativo y el navegador que est?utilizando.