Skip to main content
  1. Casa
  2. Computación

DT en Español podría recibir una comisión si compras un producto desde el sitio

Es posible que el 57% de Internet ya sea solo contenido hecho con IA

Una burbuja de palabras CGI
Google Deepmind / Pexels

No eres solo tú, los resultados de búsqueda realmente están empeorando. Los investigadores de Amazon Web Services (AWS) Internet hoy en día es generado por IA o traducido utilizando un algoritmo de IA.

El estudio, titulado «A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism«, argumenta que la traducción automática (TA) de bajo costo, que toma un determinado fragmento de contenido y lo regurgita en varios idiomas, es la principal culpable. «Las traducciones paralelas multidireccionales generadas por máquinas no solo dominan la cantidad total de contenido traducido en la web en idiomas de bajos recursos donde la traducción automática está disponible; También constituye una gran fracción del contenido web total en esos idiomas», escribieron los investigadores en el estudio.

Recommended Videos

También encontraron evidencia de sesgo de selección en qué contenido se traduce automáticamente a varios idiomas en comparación con el contenido publicado en un solo idioma. «Este contenido es más corto, más predecible y tiene una distribución temática diferente en comparación con el contenido traducido a un solo idioma», escribieron los investigadores.

Además, la creciente cantidad de contenido generado por IA en Internet, combinado con la creciente dependencia de las herramientas de IA para editar y manipular ese contenido, podría conducir a un fenómeno conocido como colapso del modelo, y ya está reduciendo la calidad de los resultados de búsqueda en la web. Dado que los modelos de IA de frontera como Claude dependen de cantidades masivas de datos de entrenamiento que solo se pueden adquirir raspando la web pública (ya sea que viole los derechos de autor o no), tener la web pública llena de contenido generado por IA, y a menudo inexacto, podría degradar gravemente su rendimiento.

«Es sorprendente lo rápido que se produce el colapso del modelo y lo difícil que puede ser», dijo el Dr. Ilia Shumailov de la Universidad de Oxford a Windows Central. «Al principio, afecta a los datos de las minorías, a los datos que están mal representados. A continuación, afecta a la diversidad de las salidas y la varianza se reduce. A veces, se observa una pequeña mejora en los datos de la mayoría, que oculta la degradación del rendimiento de los datos de las minorías. El colapso del modelo puede tener graves consecuencias».

Los investigadores demostraron esas consecuencias haciendo que lingüistas profesionales clasificaran 10.000 oraciones en inglés seleccionadas al azar de una de las 20 categorías. Los investigadores observaron «un cambio dramático en la distribución de los temas al comparar los datos paralelos de 2 vías a 8+ (es decir, el número de traducciones de idiomas), con temas de ‘conversación y opinión’ que aumentaron del 22,5% al 40,1%» de los publicados.

Esto apunta a un sesgo de selección en el tipo de datos que se traducen a varios idiomas, que es «sustancialmente más probable» que provengan del tema de «conversación y opinión».

Además, los investigadores descubrieron que «las traducciones paralelas altamente multidireccionales son significativamente de menor calidad (6,2 puntos de estimación de calidad del cometa peores) que las traducciones paralelas de 2 vías». Cuando los investigadores auditaron 100 de las oraciones paralelas altamente multidireccionales (aquellas traducidas a más de ocho idiomas), encontraron que «una gran mayoría» provenía de granjas de contenido con artículos «que caracterizamos como de baja calidad, que requerían poca o ninguna experiencia, o esfuerzo previo para crear».

Eso ciertamente ayuda a explicar por qué el CEO de OpenAI, Sam Altman, sigue insistiendo en que es «imposible» hacer herramientas como ChatGPT sin libre a obras con derechos de autor.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El costo de la vida…Nvidia sube los precios de sus GPU

Como si el mercado de GPU no fuera una pesadilla últimamente, Nvidia podría haber aumentado los precios de sus mejores tarjetas gráficas. Según un nuevo informe, Nvidia está aumentando el precio de sus GPU de la serie RTX 50 para sus socios y proveedores de placas, lo que podría afectar a su coste para los consumidores. Esto es lo que necesitas saber.

En primer lugar, no estamos hablando de un aumento directo que, digamos, eleve el MSRP (precio de lista recomendado) de la RTX 5090 de $2,000 a $2,500 (no te preocupes, eso no sucedió, aunque buena suerte comprando una RTX 5090 por menos de $3,000). Este es un tipo de aumento de precios detrás de escena y, como tal, no tenemos forma de verificar si es cierto, así que tómelo con una pizca de sal. El informe proviene de Digitimes y luego fue compartido por XDA Developers, y la propia Nvidia aún no se ha pronunciado al respecto, por lo que tenemos que ser pacientes. Incluso si es cierto, es posible que nunca obtengamos una confirmación oficial.

Leer más
Microsoft da vidas extras importantes a Office para Windows 10
Cómo instalar Windows en una Chromebook.

La gente de Microsoft quiere entregarle un par de vidas extras a Office en Windows 10, ya que acaba de anunciar que seguirá entregando soporte a la suite en el antiguo sistema operativo.

"Para ayudar a mantener la seguridad mientras realiza la transición a Windows 11, Microsoft continuará proporcionando actualizaciones de seguridad para las aplicaciones de Microsoft 365 en Windows 10 durante tres años después de que Windows 10 llegue al final del soporte", dice Microsoft en un artículo de soporte actualizado publicado la semana pasada. "Estas actualizaciones se entregarán a través de los canales de actualización estándar, finalizando el 10 de octubre de 2028".

Leer más
Estos son los diseños que Microsoft descartó para Windows 11
Diseño desechado Windows 11

Para celebrar sus 50 años y con el ingreso completo de las opciones de Copilot AI en Windows 11, la gente de Microsoft está en etapa de presentación del rediseño de la barra y menú de tareas.

Sin embargo, como en cada proceso de readaptación, hay muchos diseños que se quedaron en el tintero y que no lograron calificar para quedar como la definitiva.

Leer más