{"id":72799,"date":"2024-06-03T18:12:33","date_gmt":"2024-06-04T00:12:33","guid":{"rendered":"https:\/\/mickyandoniehn.com\/radio\/2024\/06\/03\/cohere-es-la-openai-canadiense-dedicada-al-mundo-empresarial-y-lo-hace-todo-al-reves-que-sam-altman\/"},"modified":"2024-06-03T18:12:33","modified_gmt":"2024-06-04T00:12:33","slug":"cohere-es-la-openai-canadiense-dedicada-al-mundo-empresarial-y-lo-hace-todo-al-reves-que-sam-altman","status":"publish","type":"post","link":"https:\/\/mickyandoniehn.com\/radio\/2024\/06\/03\/cohere-es-la-openai-canadiense-dedicada-al-mundo-empresarial-y-lo-hace-todo-al-reves-que-sam-altman\/","title":{"rendered":"Cohere es la OpenAI canadiense dedicada al mundo empresarial. Y lo hace todo al rev\u00e9s que Sam Altman"},"content":{"rendered":"<\/p>\n<p>En 2017 Aidan Gomez (en la imagen, en el centro) era el m\u00e1s joven de un grupo de ocho investigadores muy especial. Todos ellos formaban parte de Google Brain, la divisi\u00f3n que acab\u00f3\u00a0<a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/ahora-google-brain-deepmind-trabajaban-manera-separada-ahora-unica-enorme-division-enfocada-ia\">fusion\u00e1ndose con DeepMind<\/a>. Y todos ellos publicaron en aquel momento el estudio m\u00e1s relevante del campo de la inteligencia artificial en a\u00f1os.<\/p>\n<p>Aquella publicaci\u00f3n, titulada \u2018<a href=\"https:\/\/arxiv.org\/abs\/1706.03762\">Attention is all you need<\/a>\u2018, introdujo el concepto de Transformer. Ese fue el detonante de la aparici\u00f3n de los modelos de IA generativa y de chatbots como ChatGPT.<\/p>\n<p>Gomez acabar\u00eda trabajando\u00a0<a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/padrino-ia-ha-decidido-dejar-google-advierte-sus-aterradores-riesgos-a-humanidad\">con Geoffrey Hinton<\/a>\u00a0en su laboratorio de Toronto, pero no durar\u00eda mucho all\u00ed. En 2019\u00a0<strong>decidi\u00f3 fundar Cohere<\/strong> junto a Nick Frosst (en la imagen, a la derecha) y a Ivan Zhang (a la izquierda).<\/p>\n<p>Todos ellos hab\u00edan estudiado en la Universidad de Toronto, y aquello ha acabado haciendo que se unan para crear una startup de IA que comienza a hacer ruido y que podr\u00eda plantar cara a las grandes.<\/p>\n<h2>As\u00ed se diferencia Cohere de las gigantes de IA<\/h2>\n<p>Cohere es una empresa canadiense con unos 300 empleados que se ha convertido en una interesante alternativa en este segmento. Y lo es porque tiene un enfoque muy distinto a sus rivales, y en especial al de OpenAI, con el que se la compara a menudo. \u00a0\u00bfPor qu\u00e9? Tres razones.<\/p>\n<p><strong>Modelo SaaS<\/strong>. Empresas como OpenAI ofrecen acceso a sus modelos de IA a trav\u00e9s de una API y cobran por cada token que generan sus LLMs. Adem\u00e1s esas empresas ejecutan esas consultas en infraestructura que tienen montada en infraestructuras en la nube como las de Microsoft, Google o Amazon. Cohere plantea un modelo SaaS (Software-as-a-Service) en el que el cliente ya tiene su propia infraestructura, y usa modelos de Cohere, que cobra una comisi\u00f3n por ello. Como\u00a0<a href=\"https:\/\/fortune.com\/2024\/04\/25\/cohere-ceo-openai-rival-aidan-gomez-enterprise-ai-revenues-set-to-soar\/\">explicaba<\/a>\u00a0Gomez, \u00abeso nos permite tener m\u00e1rgenes mucho m\u00e1s altos, porque no estamos pagando por la computaci\u00f3n\u00bb.<br \/>\n<strong>El chatbot no importa (tanto)<\/strong>. Las grandes de la IA presumen de chatbots, pero Cohere no tiene un producto de ese tipo. Estos asistentes, que aprovechan el modelo freemium, requieren una enorme infraestructura de computaci\u00f3n y ciertamente permiten convencer a muchos usuarios de pasarse a sus planes de pago, pero en Cohere prefieren ahorrarse mucho en costes de inferencia (generar respuestas). \u00abEstamos comenzando a llegar al punto de inflexi\u00f3n en el que el casto en computaci\u00f3n para inferencia es m\u00e1s alto que el del entrenamiento [de los modelos], lo que indica la madurez del mercado\u00bb, destacaba Gomez.<br \/>\n<strong>Modelos ad hoc para empresas<\/strong>. El otro gran punto diferencial de Cohere es que no est\u00e1 orientado a usuarios finales sino a empresas. Y es a estas empresas a las que ofrece modelos muy afinados para prop\u00f3sitos espec\u00edficos. Nick Frosst explicaba\u00a0<a href=\"https:\/\/www.businessinsider.com\/openai-rival-says-model-cheaper-more-accurate-than-gpt-4-2024-5\">en Business Insider<\/a>\u00a0c\u00f3mo \u00abhemos descubierto que ajustar peque\u00f1os modelos con conjuntos de datos [especializados] permite obtener grandes resultados\u00bb.<\/p>\n<h2>Modelos peque\u00f1os, precisos y baratos<\/h2>\n<p>Esa estrategia parece ir ganando fuerza. En marzo de 2024 la empresa\u00a0<a href=\"https:\/\/cohere.com\/blog\/command-r\">lanz\u00f3<\/a>\u00a0un modelo generativo escalable espec\u00edficamente orientado a empresas al que llam\u00f3 Command R. Un mes despu\u00e9s lanzaba\u00a0<strong>Command R+<\/strong>, una versi\u00f3n supervitaminada del anterior que tambi\u00e9n ofrece una ventana de contexto de 128k\u00a0<a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/que-token-cuando-hablamos-ia-que-importante-que-gemini-admita-millon\">tokens<\/a>.<\/p>\n<div class=\"article-asset-image article-asset-large article-asset-center\">\n<div class=\"asset-content\">\n<div class=\"caption-img \">La interfaz de Coral en Cohere, que permite evaluar modelos como Command R.<\/div>\n<\/div>\n<\/div>\n<p>Ambos se pueden usar (con l\u00edmites y consiguiendo una\u00a0<a href=\"https:\/\/docs.cohere.com\/docs\/rate-limits\">API gratuita<\/a>\u00a0de prueba) en plataformas como\u00a0<a href=\"https:\/\/openrouter.ai\/models\/cohere\/command-r-plus\">OpenRouter<\/a>\u00a0o\u00a0<a href=\"https:\/\/huggingface.co\/collections\/CohereForAI\/c4ai-command-r-plus-660ec4c34f7a69c50ce7f7b9\">Hugging Face<\/a>, pero tambi\u00e9n desde la propia plataforma de Cohere a trav\u00e9s de\u00a0<a href=\"https:\/\/coral.cohere.com\/\">Coral<\/a>, su interfaz de usuario para evaluar sus modelos.<\/p>\n<p>En ambos casos Cohere promete algo importante: hace uso de un sistema de generaci\u00f3n por recuperaci\u00f3n aumentada (RAG, Retrieval Augmented Generation), que seg\u00fan ellos reduce las habituales \u00abalucinaciones\u00bb de los modelos de IA. Para ello incluye citas y referencias \u2014al estilo de lo que hace por ejemplo Perplexity.ai\u2014 y sobre todo trata de adaptarse a las necesidades espec\u00edficas de cada empresa y a cada escenario en el que se usan esos modelos.<\/p>\n<p>Eso permite ventajas importantes seg\u00fan los responsables de Cohere. En pruebas internas indicaban c\u00f3mo al analizar informaci\u00f3n cient\u00edfica y financiera, las versiones afinadas de Command R eran m\u00e1s precisas que sus rivales.<\/p>\n<p>As\u00ed, al\u00a0<a href=\"https:\/\/cohere.com\/summarize\">resumir reuniones<\/a> la precisi\u00f3n de Command R fue del 80,2%, mientras que GPT-4 fue del 78,8% y en Claude Opus del 77,9%. En el an\u00e1lisis de datos financieros el modelo de Cohere fue un 6,2% m\u00e1s preciso que el de OpenAI y un 5,3% que el de Anthropic, aunque insistimos, seg\u00fan pruebas internas.<\/p>\n<p>M\u00e1s importante e interesante a\u00fan es el coste: ejecutar estos modelos afinados de Cohere, lo que se denominan costes de inferencia,\u00a0<strong>es notablemente m\u00e1s barato<\/strong>\u00a0que usar los de OpenAI: generar un mill\u00f3n de tokens\u00a0<a href=\"https:\/\/cohere.com\/pricing\">cuesta<\/a>\u00a0entre 2 y 4 d\u00f3lares con Cohere, pero\u00a0<a href=\"https:\/\/openai.com\/api\/pricing\/\">cuesta<\/a>\u00a0entre 30 y 60 d\u00f3lares con GPT-4.<\/p>\n<p>No son las \u00fanicas propuestas de Cohere, que hace tan solo unos d\u00edas\u00a0<a href=\"https:\/\/cohere.com\/blog\/aya23\">presentaba<\/a>\u00a0sus modelos Aya 23 8B y 35B, que plantean una apuesta cercana a Llama 3, con modelos de pesos abiertos, comportamiento\u00a0<a href=\"https:\/\/arxiv.org\/abs\/2405.15032?ref=cohere-ai.ghost.io\">aparentemente notable<\/a>\u00a0\u00a0y adem\u00e1s disponibles en 23 idiomas distintos.<\/p>\n<h2>Pero tambi\u00e9n hay incertidumbre<\/h2>\n<p>En junio de 2023 Cohere\u00a0<a href=\"https:\/\/cohere.com\/blog\/announcement\">anunciaba<\/a> una ronda de financiaci\u00f3n de 270 millones de d\u00f3lares protagonizada por la firma de inversi\u00f3n Inovia Capital, pero en la que tambi\u00e9n participaban gigantes como NVIDIA, Oracle o Salesforce.<\/p>\n<p>Eso hac\u00eda que la valoraci\u00f3n de la firma ascendiese a los 2.100 millones de euros, una cifra destacable. A\u00fan as\u00ed, esa inversi\u00f3n queda lejos de las que se hab\u00edan hecho hasta entonces en firmas como OpenAI (11.300 millones de d\u00f3lares\u00a0<a href=\"https:\/\/techcrunch.com\/2023\/06\/08\/ai-startup-cohere-now-valued-at-over-2-1b-raises-270m\/\">seg\u00fan TechCrunch<\/a>), o Anthropic (450 millones de d\u00f3lares).<\/p>\n<p>En las \u00faltimas semanas se habla de que se est\u00e1 preparando una nueva ronda de inversi\u00f3n de otros 500 millones de d\u00f3lares que har\u00eda que su valoraci\u00f3n de mercado ascendiese a los 5.000 millones de d\u00f3lares. Eso proporcionar\u00eda a\u00fan m\u00e1s margen de crecimiento para la empresa y consolidar\u00eda su apuesta por un modelo diferente al de otras empresas de este \u00e1mbito, pero tambi\u00e9n hay incertidumbre sobre su futuro.<\/p>\n<p>Sobre todo, por los\u00a0<strong>ingresos, a\u00fan muy modestos<\/strong>.\u00a0<a href=\"https:\/\/www.theinformation.com\/articles\/tepid-revenue-at-cohere-shows-openai-competitors-face-uphill-battle?rc=wbkwki\">Seg\u00fan The Information<\/a>, Cohere solo hab\u00eda metido en caja 13 millones de d\u00f3lares en todo 2023, aunque la cosa mejor\u00f3 a principios de a\u00f1o: al terminar el primer trimestre del a\u00f1o esa cifra hab\u00eda aumentado a 35 millones.<\/p>\n<p>Esos datos se quedan muy atr\u00e1s si observamos los te\u00f3ricos ingresos de Anthropic y de OpenAI. Una vez m\u00e1s seg\u00fan The Information, Anthropic\u00a0<a href=\"https:\/\/www.theinformation.com\/articles\/anthropic-projects-at-least-850-million-in-annualized-revenue-rate-next-year?rc=wbkwki\">generar\u00e1<\/a>\u00a0m\u00e1s de 850 millones de d\u00f3lares en este 2024, mientras que OpenAI\u00a0<a href=\"https:\/\/www.theinformation.com\/articles\/anthropic-projects-at-least-850-million-in-annualized-revenue-rate-next-year?rc=wbkwki\">llegar\u00e1<\/a> a los 5.000 millones seg\u00fan las estimaciones.<\/p>\n<p>La competencia adem\u00e1s est\u00e1 acelerando, sobre todo en el caso de las grandes, que est\u00e1n invirtiendo ingentes cantidades de dinero para desarrollar sus modelos y ponerlos a disposici\u00f3n de todos los p\u00fablicos.<\/p>\n<p>El auge de los modelos Open Source \u2014<a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/meta-no-para-presumir-que-ia-llama-open-source-eso-no-todo-cierto\">aunque no sean del todo Open Source<\/a>\u2014 como Llama 3 tambi\u00e9n amenaza la propuesta de Cohere, sobre todo porque facilita esa puesta en marcha de implantaciones a medida si las empresas tienen expertos que puedan entrenar y afinar de forma segura y privada esos modelos.<\/p>\n<p>Cohere tiene sin duda grandes bazas para lograr ser relevante en este mercado cada vez m\u00e1s competitivo, pero ser\u00e1 interesante ver si su enfoque, notablemente diferente al de sus competidores, acaba dando los frutos que esperan.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En 2017 Aidan Gomez (en la imagen, en el centro) era el m\u00e1s joven de un grupo de ocho investigadores muy especial. Todos ellos formaban parte de Google Brain, la divisi\u00f3n que acab\u00f3\u00a0fusion\u00e1ndose con DeepMind. Y todos ellos publicaron en aquel momento el estudio m\u00e1s relevante del campo de la inteligencia artificial en a\u00f1os. Aquella &hellip;<\/p>\n","protected":false},"author":0,"featured_media":72800,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[5],"tags":[],"class_list":["post-72799","post","type-post","status-publish","format-standard","has-post-thumbnail","","category-noticias"],"jetpack_sharing_enabled":true,"jetpack_featured_media_url":"https:\/\/mickyandoniehn.com\/radio\/wp-content\/uploads\/2024\/06\/500_333-Fp6vrM.jpeg","_links":{"self":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/posts\/72799","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/comments?post=72799"}],"version-history":[{"count":0,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/posts\/72799\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/media\/72800"}],"wp:attachment":[{"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/media?parent=72799"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/categories?post=72799"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mickyandoniehn.com\/radio\/wp-json\/wp\/v2\/tags?post=72799"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}