Inteligencia artificial es la palabra del momento y esto no cambió en la conferencia de desarrolladores Google I/O 2024, dónde el gigante tecnológico habló extensamente de sus iniciativas de IA como su nuevo modelo de lenguaje Gemini y su su integración con otros productos de la compañía como sus celulares Android y sus servicios Gmail, Google Docs y Search. Aquí revivimos algunos momentos cruciales del evento.
Gracias por acompañarnos en este en vivo.
Google I/O termina con Sundar Pichai utilizando IA para determinar cuántas veces se utilizó la palabra inteligencia artificial durante la presentación. La respuesta es 121.
Google también presentó su programa LearnLM, un asistente de aprendizaje que no solo proporciona respuestas, sino da los pasos para aprender diversos temas. Estará disponible en Gemini en los próximos meses.
The new Learning coach Gem uses LearnLM to provide step-by-step study guidance, helping you build understanding instead of just giving you an answer. It will launch in Gemini in the coming months. #GoogleIO pic.twitter.com/cjCQX9oRDO
— Google (@Google) May 14, 2024
Google señala que para evitar el uso de su tecnología de inteligencia artifical para la expansión de desinformación, están extendiendo el uso de SynthID, una marca de agua invisible. Antes solo era usada en imágenes y audios, pero ahora estará presente en textos y videos generados utilizando sus programas.
El ejecutivo de Google Josh Woodward detalló los precios de Gemini 1.5 Pro y Flash. Gemini 1.5 Flash tiene un precio de 35 céntimos por 1 millón de tokens, más barato que la tarifa de competidores como GPT-4o de 5 dólares por 1 millón de tokens. Ambos programas están disponibles en 200 países.
Entre los avances que mostraron estaba un sistema de descripción de imágenes para personas con dificultades de visión e incluso un sistema de protección de posibles engaños que interpreta incluso llamadas y lanza advertencias sobre pedidos sospechosos.
Thanks to Gemini Nano, @Android will warn you in the middle of a call as soon as it detects suspicious activity, like being asked for your social security number and bank info. Stay tuned for more news in the coming months. #GoogleIO pic.twitter.com/wtc3rrk0Gc
— Google (@Google) May 14, 2024
Google planea implemantar funciones de inteligencia artificial directamente sobre el sistema operativo con Gemini Nano, lo cual permitirá utilizar los servicios de IA incluso cuando no se tenga conexión con el internet.
Ahora pasamos a los smartphones, pero todavía se habla de inteligencia artificial. Google habló de la opción Circle to Search, que permite hacer un círculo en imágenes, texto y hasta problemas matemáticos para obtener una respuesta. La opción ya estaba disponible en teléfonos Galaxy, pero ahora estará disponible en más modelos equivaliendo a100 millones de dispositivos.
Google señala que Gemini Advance será el chatbot con mayor capacidad en el mercado, con capacidad de hasta un millón de tokens, equivalente a 1.500 páginas, hasta 30 mil líneas de código o una hora de video. Indicaron que para finales del año esto se duplicará a dos millones de tokens.
This summer, we’re expanding Gemini’s multimodal capabilities — including the ability to have an in-depth two-way conversation using your voice. This new experience is called Live. #GoogleIO pic.twitter.com/eAZbaO5WKz
— Google (@Google) May 14, 2024
En un paso más para hacer realidad la película "Her", Google indicó que este año expandirán las capacidades de Gemini para poder tener complejas conversaciones con el app. La experiencia se llama Gemini Live.
This summer, we’re expanding Gemini’s multimodal capabilities — including the ability to have an in-depth two-way conversation using your voice. This new experience is called Live. #GoogleIO pic.twitter.com/eAZbaO5WKz
— Google (@Google) May 14, 2024
Gemini también llega a Drive y permitirá, entre otras cosas, utilizar las Hojas de cálculo para hacer un recuento de tus gastos mensuales. La idea es que todos los programas de Google estén conectados para darte la mayor cobertura y ayuda basada en tu información.
Google también está integrando la inteligencia artificial a su servicio de correo Gmail, permitiendo realizar resúmenes de largas cadenas de correos e incluso hacer preguntas basándose en información presente en estas comunicaciones. ¿Me permitirá borrar automáticamente el spam? ¡Ojalá!
Las búsquedas de Google pronto ya no tendrán que estar basadas solo en texto. Así lo demostró la ejecutiva de Google Rose Yao, que utilizó un video tomado en el escenario para hacer una búsqueda de por qué su tocadiscos estaba fallando, con el programa identificando el problema y enviándole enlaces a sitios con una posible solución.
Coming soon, we’ll bring new multi-step reasoning capabilities to Google Search. It breaks your bigger question down into parts and figures out which problems to solve and in what order, so research that might've taken you minutes or even hours can be done in seconds. #GoogleIO pic.twitter.com/Op8Iu7K21m
— Google (@Google) May 14, 2024
Durante la conferencia ya habían mencionado las mejoras a Search utilizando inteligencia artificial como AI Overviews, pero ahora están explicando el proceso. Según indicaron, el buscador ahora utiliza un proceso llamado 'multi-step reasoning' (razonamiento en varios pasos) en el que analiza tus preguntas para determinar la prioridad y organizar la información en la manera más conveniente para tí, salvándote de tiempo de investigación.
Coming soon, we’ll bring new multi-step reasoning capabilities to Google Search. It breaks your bigger question down into parts and figures out which problems to solve and in what order, so research that might've taken you minutes or even hours can be done in seconds. #GoogleIO pic.twitter.com/Op8Iu7K21m
— Google (@Google) May 14, 2024
Pichai regresa al escenario para hablar de infraestructura, más relevante ahora gracias a la enorme demanda de poder de procesamiento generada por las iniciativas de inteligencia artificial. Queriendo asegurar qué preparados están, el CEO resalta innovaciones como su nuevo chip Trillium, especializado para centros de datos de nueva generación y con un rendimiento 4.7 veces mejor, así como la inversiones en centros de datos con refrigeración líquida.
También presentarón Veo, un modelo de generación de videos que puede generar cortos de 60 segundos a una calidad de 1080p a partir de instrucciones textuales (prompts) o de otros cuadros de videos.
Introducing Veo: our most capable generative video model.
— Google DeepMind (@GoogleDeepMind) May 14, 2024
It can create high-quality, 1080p clips that can go beyond 60 seconds.
From photorealism to surrealism and animation, it can tackle a range of cinematic styles. #GoogleIO pic.twitter.com/6zEuYRAHpH
Luego su programa de generación de música Music AI Sandbox, el cual permite a creadores en YouTube a crear nuevas melodías mezclando diferentes estilos.
Doug Eck, director de investigación de Google Research, continúa demostrando las iniciativas basadas en la inteligencia artificial de Google. Primero presentaron Imagen 3, la nueva versión de su generador de imágenes que presenta cualidades más fotorrealistas.
Un video de muestra de Project Astra lo ve identificando un parlante, haciendo asociaciones de palabras, identificando código y resolviendo problemas en una pizarra.
We’re sharing Project Astra: our new project focused on building a future AI assistant that can be truly helpful in everyday life.
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Watch it in action, with two parts - each was captured in a single take, in real time. #GoogleIO pic.twitter.com/x40OOVODdv
También presentan a Project Astra, un agente de IA que es útil en la vida diaria.
Ahora presentan un nuevo modelo de Gemini más rápido y eficiente. Llamado Gemini 1.5 Flash, estará disponible en Google AI Studio y Vertex AI por un millón de tokens.
Pinchai reitera que la meta de Google es "hacer que la IA sea útil para todos." En ese aspecto señala que el propósito de sus esfuerzos es "Organizar la información mundial y hacerla universalmente accesible y útil."
Gemini 1.5 Pro también trabajará con Workspace, permitiéndote pedir el resumen de reuniones en Google Meets, así como ordenar la información de tu inbox.
PDF attachments?
— Google (@Google) May 14, 2024
Meeting recordings?
Lots of school emails?
With Gemini 1.5 Pro in Workspace, now available in Labs, you can get help processing all the info in your inbox and save more time. #GoogleIO pic.twitter.com/EGnxSO26E4
Comienzan los primeros ejemplos entre Gemini y el resto de servicios de Google. Sundar Pichai habló de la integración de Gemini con su servicio de fotos con el programa Ask Photos, dónde permite hacer preguntas complejas basadas en tu archivo fotográfico cómo cuál es el número de mi placa o cuándo mi hija aprendió a nadar.
El ejecutivo también habló de la nueva opción de Google Search, su reconocido buscador, empoderada por IA llamada AI Overviews, la cual estará disponible para usuarios de los Estados Unidos a partir de hoy. El resto del mundo tendrá que esperar un poco.
El CEO de Google y Alphabet, Sundar Pichai, comienza la conferencia Google I/O. "Llevamos más de una década invirtiendo en AI. (...) Estamos en los primeros días de la AI, pero vemos muchas oportunidades por delante.", indicó el ejecutivo.
Marc Rebillet termina su intervención revelando que MusicFX DJ está disponible para probar en el url https://labs.google/MusicFX-DJ
Marc Rebillet muestra cómo el programa de Google Music FX DJ puede combinar los sonidos de varios instrumentos para generar una nueva melodía.
Marc Rebillet presenta Music FX DJ, un programa de inteligencia artificial que permite crear música a partir de prompts. "Esto solo es el comienzo. Lo van a escuchar bastante en esta conferencia", asegura el 'youtuber'.
Qué esperamos de la conferencia:
Gemini: Se espera que Google presente un nuevo modelo de su inteligencia artificial Gemini, presentada en diciembre del 2023, así como nueva integración con otros productos de la compañía. También hay rumores de que Gemini será la base para el nuevo asistente virtual de Google, proyecto que llevaría el nombre de Pixie.
Android 15: el nuevo sistema operativo de Android ya se encuentra en versión beta con miras a una salida en la segunda mitad del 2024. Sería curioso si la compañía no reserva un tiempo de su conferencia para hablar sobre sus avances y las novedades del OS.
Se tratará de una conferencia crucial para la compañía detrás del buscador más popular del mundo, ya que la carrera por sobresalir en cuestiones de inteligencia artificial la enfrenta a poderosos rivales como OpenAI, Facebook, X y más.
Aquí la fecha de comienzo en otros países:
Estados Unidos: 10 a.m. (hora del Pacífico), 1 p.m. (hora del este)
México: 11 a.m.
Perú: 12 p.m.
Colombia: 12 p.m.
Chile: 1 p.m.
Argentina: 2 p.m.
España: 7 p.m.
La conferencia Google I/O 2024 será transmitida gratuitamente mediante YouTube en el siguiente enlace. El evento comenzará el 14 de mayo a las 10 a.m. hora del Pacífico, lo que se traduce como las 12 p.m. hora peruana.
Falta menos de una hora para el comienzo de la conferencia Google I/O 2024, donde el gigante tecnológico presentará todas sus novedades del año.
Las búsquedas de Google cambiarán para siempre: ahora serán impulsadas por su IA, Gemini