{"id":72927,"date":"2024-06-06T19:13:09","date_gmt":"2024-06-07T01:13:09","guid":{"rendered":"https:\/\/mickyandoniehn.com\/radio\/2024\/06\/06\/openai-acaba-de-emprender-un-camino-tan-ambicioso-como-desafiante-entender-como-funciona-la-caja-negra-de-la-ia\/"},"modified":"2024-06-06T19:13:09","modified_gmt":"2024-06-07T01:13:09","slug":"openai-acaba-de-emprender-un-camino-tan-ambicioso-como-desafiante-entender-como-funciona-la-caja-negra-de-la-ia","status":"publish","type":"post","link":"https:\/\/mickyandoniehn.com\/radio\/2024\/06\/06\/openai-acaba-de-emprender-un-camino-tan-ambicioso-como-desafiante-entender-como-funciona-la-caja-negra-de-la-ia\/","title":{"rendered":"OpenAI acaba de emprender un camino tan ambicioso como desafiante: entender c\u00f3mo funciona la \u2018caja negra\u2019 de la IA"},"content":{"rendered":"<\/p>\n<p>La inteligencia artificial (IA) ha demostrado ser un valioso recurso para un amplio abanico de aplicaciones. En la actualidad impulsa sistemas de asistencia al conductor como el\u00a0<a href=\"https:\/\/www.xataka.com\/vehiculos\/los-tesla-ya-disponen-de-piloto-automatico-y-los-primeros-videos-muestran-que-no-estamos-preparados\">Piloto autom\u00e1tico de Tesla<\/a>\u00a0o permite el funcionamiento de chatbots conversacionales como\u00a0<a href=\"https:\/\/www.xataka.com\/basics\/chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial\">ChatGPT<\/a>. Sin embargo, aunque resulte sorprendente, no sabemos exactamente\u00a0<strong>c\u00f3mo funciona<\/strong>. Y esto se presenta como un obst\u00e1culo a la hora de mejorar la seguridad de los modelos que utilizamos a diario.<\/p>\n<p><a href=\"https:\/\/x.com\/OpenAI\/status\/1798762092528586945\">OpenAI ha anunciado<\/a>\u00a0nuevos m\u00e9todos para desenredar el funcionamiento de\u00a0<a href=\"https:\/\/www.xataka.com\/nuevo\/gpt-4-que-cuando-sale-como-funciona-toda-informacion\">GPT-4<\/a>. Para ello, la compa\u00f1\u00eda liderada por\u00a0<a href=\"https:\/\/www.xataka.com\/empresas-y-economia\/quien-sam-altman-mente-empresarial-openai-chatgpt-dall-e-hombre-negocios-precoz-ia\">Sam Altman<\/a>\u00a0est\u00e1 utilizando lo que se conoce como \u201ccodificadores dispersos\u201d o \u00abSparse Autoencoders\u00bb en ingl\u00e9s para identificar caracter\u00edsticas y descubrir patrones que puedan ayudar a entender el modelo. Hasta el momento se han encontrado 16 millones de caracter\u00edsticas, pero se trata de un n\u00famero que deber\u00eda crecer con el tiempo.<\/p>\n<h2>Tratando de entender \u2018la caja negra\u2019 de la IA<\/h2>\n<p>En el mundo de la IA no todo es una inc\u00f3gnita. Tenemos conceptos muy claros y definidos. Utilizamos enormes conjuntos de datos (datasets) para entrenar las redes neuronales que forman parte de los\u00a0<strong>grandes modelos de lenguaje<\/strong> (LLM). Cuando estos son demasiado grandes y complejos como para funcionar en la infraestructura de c\u00f3mputo actual recurrimos a t\u00e9cnicas como Mixture of experts (MoE) para dividir la capacidad del modelo en diferentes especialidades.<\/p>\n<p>Tambi\u00e9n somos capaces de crear modelos multimodales como\u00a0<a href=\"https:\/\/www.xataka.com\/basics\/gemini-1-5-1-5-pro-1-5-flash-que-caracteristicas-como-puedes-probarlos\">Gemini 1.5<\/a>\u00a0o\u00a0<a href=\"https:\/\/www.xataka.com\/basics\/gpt-4o-que-que-se-diferencia-gpt-4\">GPT-4o<\/a>\u00a0que pueden procesar entradas de texto, audio e im\u00e1genes. Ahora bien, lo que sucede dentro de cualquiera de estos ejemplos es un aut\u00e9ntico misterio. Podemos pedirle a una IA que haga un resumen de un cap\u00edtulo de un libro. Conoceremos la entrada, que es el cap\u00edtulo en cuesti\u00f3n, y la salida, el resumen, pero no lo que sucedi\u00f3 dentro de la llamada \u201ccaja negra\u201d del modelo.<\/p>\n<div class=\"article-asset-image article-asset-normal article-asset-center\">\n<div class=\"asset-content\">\n<div class=\"caption-img \">Codificadores dispersos<\/div>\n<\/div>\n<\/div>\n<p>Podr\u00edamos decir que no solo se trata de una caja negra, sino tambi\u00e9n de una especie de caja cerrada donde es complicado indagar lo que sucede ah\u00ed dentro. La raz\u00f3n de esto es que no creamos las redes neuronales artificiales que forman parte del modelo, sino que nos encargamos de\u00a0<strong>entrenarlas a trav\u00e9s de algoritmos<\/strong>. S\u00ed, lo sabemos, se trata de una tecnolog\u00eda alucinante que no comprendemos completamente y que, en muchos casos, acaba sorprendiendo a los propios expertos.<\/p>\n<div class=\"article-asset-image article-asset-normal article-asset-center\">\n<div class=\"asset-content\"><\/div>\n<\/div>\n<p><a href=\"https:\/\/openai.com\/index\/extracting-concepts-from-gpt-4\/\">Como explica OpenAI<\/a>, las activaciones neuronales de los modelos tienen patrones impredecibles que dificultan su estudio. Los codificadores dispersos llegan para brindar un poco de luz. Estos son capaces de recuperar decenas de millones de caracter\u00edsticas de los modelos para entenderlos mejor. Si bien muchas de estas caracter\u00edsticas ser\u00e1n abstractas o insignificantes, muchas otras tendr\u00e1n el potencial de mejorar la seguridad y, por consecuencia, la calidad del modelo.<\/p>\n<p>Es preciso se\u00f1alar que todav\u00eda queda mucho trabajo por hacer, y que la aplicaci\u00f3n de los Sparse Autoencoders se encuentra en sus primeras etapas. Por lo pronto, OpenAI espera que los primeros resultados de esta soluci\u00f3n se conviertan en recursos para\u00a0<strong>monitorizar y ajustar<\/strong>\u00a0el comportamiento de sus \u201cmodelos de vanguardia\u201d. Cabe se\u00f1alar que los creadores de ChatGPT no son los \u00fanicos trabajando en esto,\u00a0<a href=\"https:\/\/transformer-circuits.pub\/2024\/scaling-monosemanticity\/index.html\">Anthropic tambi\u00e9n est\u00e1 enfocada<\/a>\u00a0en impulsar los codificadores dispersos.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La inteligencia artificial (IA) ha demostrado ser un valioso recurso para un amplio abanico de aplicaciones. En la actualidad impulsa sistemas de asistencia al conductor como el\u00a0Piloto autom\u00e1tico de Tesla\u00a0o permite el funcionamiento de chatbots conversacionales como\u00a0ChatGPT. Sin embargo, aunque resulte sorprendente, no sabemos exactamente\u00a0c\u00f3mo funciona. Y esto se presenta como un obst\u00e1culo a la &hellip;<\/p>\n","protected":false},"author":0,"featured_media":72928,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[5],"tags":[],"class_list":["post-72927","post","type-post","status-publish","format-standard","has-post-thumbnail","","category-noticias"],"jetpack_sharing_enabled":true,"jetpack_featured_media_url":"https:\/\/mickyandoniehn.com\/radio\/wp-content\/uploads\/2024\/06\/500_333-7yZUah.jpeg","_links":{"self":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/posts\/72927","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/comments?post=72927"}],"version-history":[{"count":0,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/posts\/72927\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/media\/72928"}],"wp:attachment":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/media?parent=72927"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/categories?post=72927"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/tags?post=72927"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}