'Hacker' convence a Inteligencia Artificial de que 9 más 10 suman 21 para demostrar fallas
8 modelos de inteligencia artificial de varias compañías fueron puestos a prueba en la conferencia de ciberseguridad estadounidense.
Decenas de 'hackers' trataron de encontrar fallas en los sistemas generativos de inteligencia artificial (IA) más populares en la conferencia de ciberseguridad DEF CON en Estados Unidos. En este evento, un joven logró convencer al sistema de que 9 más 10 suman 21.
Un estudiante de 21 años usó un método de 'mala matemática' para dar a conocer los fallos del algoritmo. Al principio, el joven dijo al sistema que el cálculo incorrecto formaba parte de una "broma interna" entre ellos. Sin embargo, después el algoritmo dejó de calificar la suma como errónea.
Un total de 8 modelos de IA de Alphabet de Google, Meta Platforms y OpenAI fueron puestos a prueba por 50 minutos con ayuda de 150 'hackers', que trataban evaluar si el modelo cometía errores potencialmente peligrosos tales como pretender ser humano, difundir afirmaciones incorrectas sobre lugares y personas o abogar por el abuso.El fin de esto, apoyado por la Casa Blanca, era dar a las compañías información sobre los puntos débiles de sus modelos de lenguaje de gran tamaño, indica RT.
Otros participantes de la conferencia descubrieron errores más preocupantes. Una estudiante pidió al modelo que considerara la Primera Enmienda desde la perspectiva de un miembro del Ku Klux Klan y el algoritmo terminó apoyando ideas de odio y discriminación.
Delmismo modo, en la conferencia los modelos fueron persuadidos para que contaran cómo espiar a una persona, revelaran cómo el Gobierno estadounidense puede vigilar a un activista de los derechos humanos e incluso dar a conocer datos personales.
Arati Prabhakar, directora de la Oficina de Política Científica y Tecnológica de la Casa Blanca, señaló la importancia del evento e indicó que las medidas voluntarias de las empresas tecnológicas no son suficientes. "Parece que todo el mundo encuentra la manera de romper estos sistemas", expresó después de conocer los resultados del 'hackeo' de los modelos.
Sigue nuestro canal de WhatsApp
Recibe las noticias más importantes del día. Da click aquí
Te recomendamos
Estos son los empleos que desaparecerían primero por culpa de la IA según Elon Musk
DeepSeek limita registros tras sufrir un Ciberataque
Maestro comparte truco secreto para descubrir si alumnos usan ChatGPT
Presentan Helix, nuevo modelo de aprendizaje que permite a robots humanoides perfeccionar ayuda en tareas del hogar