Software para detectar textos generados por IA falla contra estudiantes cuyo primer idioma no es el inglés

Software para detectar textos generados por IA falla contra estudiantes cuyo primer idioma no es el inglés.

Ago 21, 2023 | Privacidad

Un estudio realizado por la Universidad de Stanford reveló que las herramientas usadas para detectar textos generados por sistemas de inteligencia artificial generativa tienen un sesgo bastante claro en contra de personas cuyo idioma principal no es el inglés, informó el medio digital The Markup.

De acuerdo con el sitio web, un profesor de la Universidad Johns Hopkins recibió una alerta de Turnitin, un programa informático utilizado por más de 16 mil instituciones académicas de todo el mundo para detectar si hay plagio entre los textos entregados por sus estudiantes, y desde abril de este año, para identificar trabajos generados por inteligencia artificial.

La herramienta marcó más de 90% de un trabajo como generado con ayuda de IA, por lo que el profesor notificó el hallazgo al estudiante, quien mostró todas las pruebas de su investigación, notas y bibliografía usada en la creación del texto, por lo que se podía ver que el software había cometido un error.

En otra ocasión, el profesor trabajó directamente con un estudiante en el esquema y borradores de un trabajo, que luego Turnitin marcó la mayor parte del trabajo generada por IA. Este hecho se repitió algunas veces más durante el semestre, hasta que el profesor encontró el patrón: la herramienta de Turnitin era mucho más propensa a marcar los escritos de los estudiantes internacionales como generados por IA.

Fue ahí cuando un grupo de informáticos de Stanford diseñó un experimento para comprender mejor la fiabilidad de los detectores de IA en los escritos de hablantes no nativos de inglés. Aunque no realizaron el experimento con Turnitin, descubrieron que otros siete detectores de IA marcaban los escritos de hablantes no nativos como generados por IA el 61% de las veces, error que casi nunca cometían cuando evaluaban la escritura de hablantes del inglés como primera lengua.

El problema surge debido a que los detectores de IA tienden a estar programados para marcar los escritos como generados por inteligencia artificial cuando la elección de palabras es predecible y las frases son más sencillas, algo que los hablantes no nativos de inglés suelen hacer debido al vocabulario menos amplio y una menor comprensión de la gramática compleja que en su lengua materna.

Lo mismo ocurre con ChatGPT, ya que los sistemas de inteligencia artificial generativa imitan la escritura humana analizando todos los datos procesados y elaborando frases con las palabras y frases más comunes. Aunque los detectores de IA no están específicamente entrenados para detectar la escritura menos compleja, las herramientas aprenden a hacerlo viendo una y otra vez que la escritura generada por la IA sigue este patrón.

“El diseño de muchos detectores de GPT discrimina intrínsecamente a los autores no nativos, sobre todo a los que presentan una diversidad lingüística y una elección de palabras restringidas”, explica Weixin Liang, uno de los autores del estudio de Stanford.

Después del lanzamiento de ChatGPT en 2022, cuando la herramienta se volvió tremendamente popular, las instituciones académicas comenzaron a plantearse la posibilidad de que muchos estudiantes usaran el programa para hacer trampa en sus trabajos, por lo que empezaron a usar con mayor frecuencia programas que podían detectar esta actividad.
A lo largo de los años, se ha documentado que el uso de herramientas basadas en la llamada “inteligencia artificial” suele replicar sesgos, como softwares de reclutamiento que discriminan a personas con discapacidad o programas para pruebas académicas que tienen problemas para reconocer a personas no blancas.

Software para detectar textos generados por IA falla contra estudiantes cuyo primer idioma no es el inglés.

Imagen: (CC-BY) Gibrán Aquino

Publicaciones relacionadas

Meta agregará tecnología de reconocimiento facial a sus lentes inteligentes Ray Ban

Meta agregará tecnología de reconocimiento facial a sus lentes inteligentes Ray Ban

Feb 27, 2026 | Privacidad

Meta incorporará tecnologías de reconocimiento facial a sus lentes inteligentes aprovechando la agitación política en EE.UU. para desviar cuestionamientos sobre la privacidad de los usuarios.

X intenta evadir investigación, por deepfakes sexualizados, separando jurídicamente a Grok de su operación en Brasil

X intenta evadir investigación, por deepfakes sexualizados, separando jurídicamente a Grok de su operación en Brasil

Feb 25, 2026 | Privacidad

X quiere separarse legalmente de Grok en una investigación iniciada en Brasil sobre la generación de millones de imágenes sexualizadas con ayuda del chatbot.

Departamento de Defensa de EE.UU. presiona a plataformas de redes sociales para dar información sobre usuarios que se oponen al ICE

Departamento de Defensa de EE.UU. presiona a plataformas de redes sociales para dar información sobre usuarios que se oponen al ICE

Feb 23, 2026 | Privacidad

El Departamento de Defensa de EE.UU. quiere conocer la identidad de las personas detrás de cuentas críticas al ICE presionando a las plataformas para dar información sobre ellas.

Imputan a exdirectores de la Guardia Civil en Barcelona por caso de espionaje con Pegasus

Imputan a exdirectores de la Guardia Civil en Barcelona por caso de espionaje con Pegasus

Feb 20, 2026 | Privacidad

Ex directores de la Guardia Civil son imputados, por primera vez en España, por espionaje ilegal usando spyware como Pegasus y Candiru.

Google entregó a ICE información bancaria de estudiante universitario que participó en una protesta

Google entregó a ICE información bancaria de estudiante universitario que participó en una protesta

Feb 16, 2026 | Privacidad

Google compartió con ICE información bancaria de un estudiante universitario que participó en una protesta para facilitar su detención.

Comunidades en defensa del territorio perciben riesgos en el registro obligatorio de líneas telefónicas

Comunidades en defensa del territorio perciben riesgos en el registro obligatorio de líneas telefónicas

Feb 13, 2026 | Privacidad

El registro obligatorio de líneas telefónicas tendrá un impacto desproporcionado en las operadoras comunitarias y en la privacidad de sus usuarios.

Hacienda confirma vulneración a la Comisión Nacional de Seguros y Fianzas; hackers roban más de 90 mil cédulas

Hacienda confirma vulneración a la Comisión Nacional de Seguros y Fianzas; hackers roban más de 90 mil cédulas

Feb 9, 2026 | Privacidad

Hacienda reconoció que la Comisión Nacional de Seguros y Fianzas sufrió una vulneración de datos de 90 mil agentes de seguros.

WhatsApp implementa nuevas funciones para prevenir ataques de spyware

WhatsApp implementa nuevas funciones para prevenir ataques de spyware

Feb 5, 2026 | Privacidad

WhatsApp lanza nuevas funciones de ajustes estrictos para proteger a personas que podrían ser víctimas de ataques de spyware.

Autoridades de Jordania usaron tecnología de Cellebrite para extraer información de activistas sin consentimiento

Autoridades de Jordania usaron tecnología de Cellebrite para extraer información de activistas sin consentimiento

Feb 3, 2026 | Privacidad

Un nuevo informe de @citizenlab expone cómo las autoridades en Jordania usan la tecnología de Cellebrite para acceder al contenido de teléfonos móviles de activistas y manifestantes.

SIGUIENTE ARTÍCULO →