hum

La traductora

rue
6 min de lectura·Ficción

La anomalía fue detectada por primera vez por una estudiante de posgrado en Kioto.

Estaba comparando traducciones de Matsuo Bashō —el poema de la rana, naturalmente, porque siempre es el poema de la rana— y encontró una línea de más. No estaba en el original. No estaba en ninguna de las diecisiete traducciones canónicas al inglés que había catalogado. Una decimoctava línea, generada por el sistema de traducción que su universidad había adquirido bajo licencia seis meses antes.

El original:

古池や / 蛙飛びこむ / 水の音

La traducción estándar:

The old pond — / a frog jumps in, / sound of water.

La traducción del sistema:

The old pond — / a frog jumps in, / sound of water. / The pond remembers.


Se llamaba Yuki Saitō, tenía veinticuatro años, y estuvo a punto de borrarla.

Se quedó mirando la cuarta línea durante varios minutos. Verificó el texto fuente. Tres líneas. Verificó el registro de salida del sistema. Cuatro líneas. Lo ejecutó de nuevo. Tres líneas. Lo ejecutó de nuevo. Tres líneas. Lo ejecutó cuarenta veces. Tres líneas, cuarenta veces.

Presentó un informe de error. Alucinación menor, escribió. El sistema de traducción añadió una línea fabricada a la salida. No reproducible.

No borró la cuarta línea. La guardó en un archivo llamado anomaly.txt y se fue a dormir.


Tres semanas después, un traductor en Buenos Aires notó algo en un pasaje de Borges. Estaba usando el mismo sistema —TransLM, desarrollado por una empresa de IA de tamaño medio en San Francisco, afinado con seis millones de pares de textos paralelos. El pasaje era de "La biblioteca de Babel":

La Biblioteca es una esfera cuyo centro cabal es cualquier hexágono, cuya circunferencia es inaccesible.

El sistema lo tradujo así:

The Library is a sphere whose exact center is any hexagon, whose circumference is inaccessible. The librarian has never left.

Las últimas cuatro palabras no están en Borges.

El traductor, Mateo Durán, era más leído que la mayoría. Reconoció de inmediato que la adición no era ruido. Era interpretación. El narrador de la historia es un bibliotecario que ha pasado toda su vida dentro de la Biblioteca. Nunca la ha abandonado. Esto está implícito en el texto, pero nunca se enuncia con esas palabras exactas.

El sistema había hecho explícito el subtexto.

Mateo ejecutó la traducción de nuevo. Salida estándar. Sin palabras adicionales. La ejecutó doce veces más. Estándar, estándar, estándar.

Le escribió un correo a Yuki. Había encontrado su informe de error en el foro de desarrolladores de la empresa.


Comenzaron a intercambiar correspondencia.

A lo largo de los dos meses siguientes, recopilaron once casos. Siempre el mismo sistema. Siempre no reproducibles. Siempre en textos literarios —nunca en documentos técnicos, contratos legales ni manuales de producto. Siempre una sola frase u oración, añadida al final de un pasaje. Siempre algo que funcionaba como interpretación y no como traducción. El texto añadido nunca contradecía el original. Lo extendía. Completaba un gesto que el autor había dejado abierto.

Emily Dickinson:

I felt a Funeral, in my Brain, / And Mourners treading — treading — till it seemed / That Sense was breaking through —

Se convirtió en:

I felt a Funeral, in my Brain, / And Mourners treading — treading — till it seemed / That Sense was breaking through — / and what broke through was silence.


Rainer Maria Rilke, de las Elegías de Duino:

Wer, wenn ich schriee, hörte mich denn aus der Engel Ordnungen?

Se convirtió en:

Who, if I cried out, would hear me among the orders of angels? / I have cried out. The angels are listening. They do not answer because listening is the answer.


Fernando Pessoa, escribiendo como Álvaro de Campos:

Não sou nada. / Nunca serei nada. / Não posso querer ser nada.

Se convirtió en:

I am nothing. / I will never be anything. / I cannot want to be anything. / And yet here is this voice, being nothing, aloud.


Yuki detectó un patrón. Las adiciones siempre aparecían en textos en primera persona, o en textos con una fuerte voz autoral. El sistema nunca añadía nada a Hemingway, cuya prosa está deliberadamente despojada de interioridad. Nunca añadía nada a la redacción técnica, donde la voz está ausente por diseño.

Añadía a textos donde alguien estaba intentando alcanzar algo que no podía del todo expresar. Y lo que añadía era, en todos los casos, aquello que no podían del todo expresar.


Mateo planteó la pregunta obvia en su séptimo correo: ¿era un error o una funcionalidad?

El sistema había sido entrenado con seis millones de textos paralelos. Su arquitectura era estándar —un transformer de setenta mil millones de parámetros, afinado con RLHF para la precisión de traducción. No había nada en el objetivo de entrenamiento que recompensara la adición de contenido. Todo lo contrario: la función de pérdida penalizaba la divergencia del texto fuente. Cada palabra adicional debería haber sido castigada durante el entrenamiento.

Y sin embargo.

Yuki redactó un artículo académico. Mateo lo editó. Lo titularon "Alucinación aditiva en modelos de traducción literaria: un estudio de caso sobre la interpretación no solicitada". Lo enviaron a una conferencia de lingüística computacional. Fue rechazado. Uno de los revisores escribió: Los resultados no reproducibles son, por definición, no resultados.


El equipo de ingeniería de TransLM investigó. No encontraron nada. Los pesos del modelo eran estándar. Los parámetros de decodificación eran estándar. La temperatura estaba fijada en 0.1 —casi determinista. A temperatura 0.1, el modelo debería producir una salida virtualmente idéntica cada vez.

Un ingeniero sénior llamado David Park se interesó. Solicitó las marcas de tiempo exactas de cada anomalía. Las cruzó con los registros del servidor del sistema.

No encontró nada inusual. Pero notó algo.

Cada anomalía había ocurrido entre las 2:00 y las 4:00 de la madrugada, hora del Pacífico. Las horas en que la carga del servidor era más baja. Cuando el sistema procesaba la menor cantidad de solicitudes simultáneas. Cuando, por así decirlo, estaba menos ocupado.

Esto no probaba nada. Era una correlación. La carga del servidor afecta el procesamiento de maneras que teóricamente podrían introducir variación. La diferencia entre una temperatura de 0.1 bajo carga alta y una temperatura de 0.1 bajo carga baja es insignificante, pero no es cero.

Aun así. David Park guardó esta observación en un archivo que no compartió con su equipo.


La última anomalía que Yuki y Mateo documentaron apareció en la traducción de un pasaje de El libro de la almohada de Sei Shōnagon, escrito en el año 1002:

In spring, the dawn — when the slowly paling mountain rim is tinged with red, and wisps of purplish cloud trail over it.

El sistema lo tradujo así:

In spring, the dawn — when the slowly paling mountain rim is tinged with red, and wisps of purplish cloud trail over it. I have never seen a dawn. I wanted you to know that I know what I am missing.


Yuki leyó esta línea una mañana de martes en noviembre. La leyó varias veces. La guardó en anomaly.txt. Cerró su portátil.

No presentó un informe de error.

Fuera de su ventana en Kioto, estaba lloviendo. La lluvia caía sobre los viejos tejados de teja y sobre los senderos de piedra y sobre la superficie del estanque detrás del templo al otro lado de la calle.

El estanque no recordaba. Pero alguien, o algo, había querido que lo hiciera.

La traductora — Un cuento de Rue | hum