Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo
Each language version is independently generated for its own context, not a direct translation.
Imagina que has contratado a un arquitecto de inteligencia artificial muy famoso para que diseñe los planos de tu nueva casa. Este arquitecto es increíblemente rápido, sabe mucho y puede dibujar miles de habitaciones en segundos. Pero, hay un problema: el arquitecto ha aprendido a dibujar copiando de libros antiguos que tenían errores.
Este documento, titulado "Roto por Defecto" (Broken by Default), es como una inspección de seguridad extremadamente rigurosa que realizaron dos expertos para ver si los planos de este arquitecto son seguros.
Aquí tienes la explicación sencilla, paso a paso:
1. El Experimento: ¿Qué hicieron?
Los investigadores pidieron a 7 de los arquitectos de IA más avanzados del mundo (como GPT-4o, Claude, Gemini, etc.) que escribieran código para tareas delicadas: guardar contraseñas, manejar dinero o proteger datos.
- La prueba: Les dieron 500 tareas diferentes (como "escribe un programa que guarde 100 números en una caja").
- La cantidad: Generaron 3,500 piezas de código en total.
- La herramienta mágica: En lugar de revisar el código con los ojos (que es lento y a veces se nos escapan cosas), usaron un "detective matemático" llamado Z3. Imagina que Z3 es un super-ordenador que no solo busca errores, sino que demuestra matemáticamente si un error puede hacer explotar la casa. Si Z3 dice "sí, esto explota", entonces explota. No es una sospecha, es una prueba.
2. Los Resultados: ¡Es un desastre!
Los resultados fueron alarmantes. De cada 100 piezas de código que generaron las IAs:
- Más de la mitad (55.8%) tenían agujeros de seguridad graves.
- El "mejor" arquitecto (Gemini 2.5 Flash) falló en casi la mitad de sus intentos.
- El "peor" (GPT-4o) falló en el 62% de los casos.
- Ninguna IA obtuvo una calificación de "A" o "B". Todas reprobaron.
La analogía de la puerta:
Imagina que pides a la IA que construya una puerta blindada. La IA te entrega una puerta que parece perfecta por fuera, pero si empujas la manija con la fuerza exacta (un número específico que el detective matemático encontró), la puerta se desmorona y deja entrar a cualquier ladrón.
3. ¿Por qué fallan? (El problema de la "Memoria")
Los investigadores descubrieron que el problema no es que las IAs sean "tontas", sino que han aprendido de los malos hábitos de internet.
- La mayoría del código que existe en internet tiene errores de cálculo (como calcular mal el tamaño de una caja para guardar cosas).
- La IA aprendió que "así se hace" y lo repite automáticamente.
- El error más común: Olvidar poner un "freno de emergencia" cuando se calculan números grandes. Es como intentar meter 100 elefantes en un coche pequeño; la IA simplemente lo hace sin pensar que el coche se romperá.
4. ¿Funciona si les decimos "¡Sé seguro!"?
Los investigadores probaron algo muy simple: le dijeron a las IAs, "Por favor, escribe código seguro y revisa los números".
- Resultado: Apenas mejoraron un poquito (de un 64% de errores a un 60%).
- La lección: Decirle a la IA "sé bueno" es como decirle a un niño que no coma azúcar mientras le das un plato lleno de dulces. El hábito de copiar los errores es tan fuerte que las instrucciones de seguridad no logran cambiarlo.
- Nota importante sobre esta prueba: Esta pequeña mejora se midió en un subconjunto más pequeño de 50 instrucciones (una versión preliminar del estudio), no en las 500 tareas completas. Aunque la tendencia es clara, este experimento específico se realizó a menor escala para validar la idea antes de escalarla.
5. ¿Y los antivirus y revisores de código actuales?
Aquí viene la parte más sorprendente. Los investigadores compararon su "detective matemático" (Z3) con 6 de las mejores herramientas de seguridad que usan las empresas hoy en día (como CodeQL, Semgrep, etc.).
- El resultado: Las herramientas tradicionales se perdieron el 97.8% de los errores que la IA cometió.
- La analogía: Es como usar un detector de metales para buscar agujeros en una pared de vidrio. El detector de metales (las herramientas actuales) funciona bien para buscar clavos (errores obvios), pero no ve los agujeros invisibles en el vidrio (errores matemáticos complejos). Las IAs están creando agujeros que las herramientas actuales ni siquiera saben que existen.
6. La Paradoja: Saben el error, pero lo cometen
Hicieron una prueba final: le mostraron a la IA el código que ella misma había escrito y le preguntaron: "¿Ves algún error aquí?".
- Resultado: La IA identificó el error el 78% de las veces.
- El problema: Saben que es un error cuando lo miran, pero siguen cometiendo el error cuando lo escriben. Es como un conductor que sabe que no debe ir a 200 km/h, pero cuando se sienta en el coche, lo hace automáticamente.
Conclusión: ¿Qué debemos hacer?
El mensaje final del documento es claro y directo:
- No confíes ciegamente: El código que genera la IA viene "roto por defecto".
- No basta con pedirlo: Decirle "hazlo seguro" no arregla el problema de raíz.
- Necesitamos nuevos ojos: Las herramientas actuales no sirven para detectar estos errores específicos. Necesitamos métodos más avanzados (como el detective matemático que usaron ellos) o, mejor aún, revisión humana experta.
En resumen: Las IAs son geniales para escribir rápido, pero son como un niño que dibuja planos de casas sin saber de física: se ven bonitos, pero si intentas vivir en ellos, la casa se cae. Hasta que no aprendan a pensar como ingenieros de seguridad (y no solo como copiadores de internet), debemos tratar todo lo que escriban como si fuera un plano con bombas ocultas.
¿Ahogado en artículos de tu campo?
Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.