[ad_1]
Demis Hassabis nunca ha rehuido anunciar grandes avances en inteligencia artificial. Se hizo particularmente famoso en 2016 después de que un robot llamado AlphaGo aprendió por sí solo a jugar el complejo y sutil juego de mesa Go con habilidad e ingenio sobrehumanos.
Hoy, Hassabis dice que su equipo en Google ha dado un gran paso adelante, para él, la empresa y, con suerte, para el campo más amplio de la IA. Gemini, el modelo de IA que Google anunció hoy, dice que abre un nuevo camino en la IA que podría conducir a nuevos avances importantes.
«Como neurocientífico e informático, he querido intentar durante años crear algún tipo de nueva generación de modelos de IA inspirados en la forma en que interactuamos y entendemos el mundo utilizando todos nuestros sentidos», dijo Hassabis a WIRED antes del anuncio de hoy. Gemini es “un gran paso hacia ese modelo”, afirma. Google llama a Gemini «multimodal» porque puede procesar información en forma de texto, audio, imágenes y vídeo.
Una primera versión de Gemini estará disponible hoy a través del chatbot Bard de Google. La compañía dice que la versión más potente del modelo, Gemini Ultra, se lanzará el próximo año y superará al GPT-4, el modelo detrás de ChatGPT, en varios puntos de referencia populares. Los vídeos publicados por Google muestran a Gemini resolviendo tareas que requieren un razonamiento complejo, así como ejemplos del modelo, que combina información de texto, imágenes, audio y vídeo.
«Hasta ahora, la mayoría de los modelos se han acercado a la multimodalidad entrenando módulos separados y luego uniéndolos», dice Hassabis, en una referencia aparentemente velada a la tecnología OpenAI. «Para algunas tareas eso está bien, pero en el espacio multimodal no se puede tener ese tipo de pensamiento profundo y complejo».
OpenAI introdujo una actualización de ChatGPT en septiembre, que le dio al chatbot la capacidad de usar imágenes y audio como entrada además de texto. OpenAI no ha revelado detalles técnicos sobre cómo hace esto GPT-4 o cuáles son los fundamentos técnicos de sus capacidades multimodales.
ponerse al día
Google ha desarrollado y llevado Gemini al mercado a un ritmo sorprendente en comparación con los proyectos de IA anteriores de la compañía, impulsado por las recientes preocupaciones sobre la amenaza que los desarrollos de OpenAI y otros podrían representar para el futuro de Google.
A finales de 2022, Google era considerado el líder en inteligencia artificial entre las principales empresas de tecnología, y numerosos investigadores de inteligencia artificial hicieron importantes contribuciones en este campo. El director ejecutivo, Sundar Pichai, había explicado su estrategia para la empresa como «la IA primero», y Google había integrado con éxito la IA en muchos de sus productos, desde la búsqueda hasta los teléfonos inteligentes.
[ad_2]