Google Meet tradueix veus en temps real
La traducció de veu amb Gemini, en beta a anglès i espanyol, s’ampliarà aviat a italià, alemany i portuguès
Google ha aprofitat el Google I/O 2025 per reforçar el seu lideratge en intel·ligència artificial amb una sèrie de novetats que deixen ChatGPT d’OpenAI en una posició més relegada. La primera i més destacada és la traducció de veu en temps real a Google Meet: els usuaris d’AI Pro i Ultra poden activar a la seva sessió una traducció bidireccional gairebé instantània entre anglès i espanyol, amb la promesa d’incorporar més idiomes en les properes setmanes. Aquesta funció, impulsada pel model multimodal de Gemini desenvolupat per DeepMind, manté el timbre i l’expressivitat originals, i redueix dràsticament la latència perquè les converses de grup flueixin amb naturalitat.
A més, Google ha presentat Gemini 2.5 Pro amb el nou mode Deep Think, que destaca per la seva capacitat de raonament avançat. Segons les dades de la companyia, aquest mode ha obtingut un 49,4% en la prova Usamo 2025 i supera amb escreix els resultats de Gemini 2.5 estàndard, de Gemini 2.5 Flash i de les tecnologies d’OpenAI o3 i o4-mini. Els benchmarks de programació (LiveCodeBench v6) i multimodalitat (MMMU) també situen Deep Think per sobre de la resta, amb puntuacions superiors al 80%.
Paral·lelament, Google ha llançat Veo 3 i Image 4, els seus nous models generatius de vídeo i imatge. Veo 3 inclou suport natiu per a efectes de so, diàlegs o sorolls ambientals, un avenç sense precedents en IA de vídeo. Image 4, en canvi, és fins a deu vegades més ràpid que la versió anterior i ofereix més qualitat, resolució 2 K i millor manejament de textos en les imatges. Tots dos models són accessibles a través de l’app de Gemini (en beta per a Veo 3 i general per a Image 4) i s’integraran en Workspace.
El llançament de Flow, una eina que combina Gemini, Veo 3 i Imagen 4, permet generar clips cinematogràfics a partir de simples instruccions i arxius de referència, amb controls professionals de càmera i possibilitat d’estendre vídeos existents. Aquesta aposta de la companyia de Mountain View que lidera Sundar Pichai per l’“IA universal” situa Google en una posició de privilegi en la cursa pels agents i els assistents intel·ligents, amb funcions que ja es desplegaran aquesta tardor per a empreses i usuaris particulars de Google AI Ultra.