Google déploie Gemini 3.5 Live Translate, un modèle audio qui traduit la voix en direct dans plus de 70 langues tout en gardant le ton, le débit et le timbre de la personne qui parle. L'application Google Traduction sur Android et iOS y passe, Google Meet aussi. Pendant ce temps, la traduction en direct des AirPods plafonne à une dizaine de langues.
Votre voix, mais en japonais
Google court après la traduction en temps réel depuis des années, avec des démos régulières sur scène qui exigeaient à chaque fois un téléphone Pixel, des Pixel Buds ou une configuration bien précise. Hier, l'entreprise a présenté Gemini 3.5 Live Translate, un modèle audio entraîné pour détecter automatiquement plus de 70 langues et générer la traduction parlée en continu, sans attendre la fin de la phrase comme le font les systèmes classiques. Le décalage annoncé tient en quelques secondes, et surtout, la voix produite conserve l'intonation, le rythme et la hauteur de celui qui parle. Vous parlez français, votre interlocuteur entend du japonais, mais c'est toujours un peu vous. Les démonstrations sont franchement impressionnantes, même si Google admet les avoir enregistrées dans des conditions contrôlées. À vérifier en conditions réelles, donc.
Et sur votre iPhone ?
Le modèle débarque d'abord chez les développeurs, en préversion publique via la Gemini Live API et AI Studio. Les entreprises clientes de Google Workspace y auront droit dans Google Meet ce mois-ci, avant un déploiement plus large dans l'année, avec plus de 70 langues et au-delà de 2 000 combinaisons possibles dans une même réunion. Mais le plus intéressant pour vous, c'est l'application Google Traduction : la mise à jour arrive sur Android et sur iOS, avec n'importe quels écouteurs. Mieux, plus besoin d'écouteurs du tout. Un mode écoute permet de coller le téléphone à l'oreille, comme pour un appel, et d'entendre la traduction en direct. Ce mode reste réservé à Android pour l'instant. Dommage ! Le singapourien Grab teste déjà le modèle pour faire discuter chauffeurs et passagers, sur plus de 10 millions d'appels par mois.
Un filigrane impossible à retirer
Faire parler une voix synthétique qui ressemble à la vôtre, ça ouvre forcément la porte aux abus. Google a prévu le coup : chaque flux audio généré par Gemini 3.5 Live Translate embarque un filigrane SynthID, tissé directement dans l'onde sonore. Inaudible pour vous, mais détectable par les logiciels, et impossible à retirer pour le moment. Côté Apple, la comparaison fait un peu mal. La traduction en direct des AirPods réclame des AirPods Pro 2, des AirPods 4 à réduction de bruit ou des AirPods Max 2, un iPhone compatible Apple Intelligence, et se contente d'une dizaine de langues. Elle n'est d'ailleurs arrivée en Europe qu'à la fin de l'année dernière.
On en dit quoi ?
La conservation de la voix change vraiment la donne : entendre son propre timbre parler coréen, c'est bluffant et un peu troublant à la fois. On retient aussi que Google sort l'artillerie sur iPhone, gratuitement, là où Apple verrouille sa traduction derrière du matériel récent et dix langues. Cupertino a intérêt à muscler son jeu d'ici iOS 27.