• MAMMAM IA!
  • Posts
  • Kung-Fu Robot, Gemini 3.0 en fuite : le monde de l’IA ne prend pas de pause !

Kung-Fu Robot, Gemini 3.0 en fuite : le monde de l’IA ne prend pas de pause !

Microsoft transforme Windows en coach vocal, Google muscle ses vidéos et la nouvelle puce M5 d’Apple fait de l’ombre à la concurrence.

👋 Chers Dancing Queens et Super Troupers,

Alors que nous nous remettions à peine de Bob l’Éponge sous acide (merci Sora 2), le monde de l’IA accélère encore. Cette semaine, le rythme est donné par les géants : Google a mis à jour Veo/Flow pour que vos vidéos aient désormais de l'audio et des montages de pro. Cerise sur le gâteau, non seulement une fuite donnait la date, mais le CEO Sundar Pichai a officiellement confirmé que Gemini 3.0 arrive d'ici à la fin de l'année.

Pendant ce temps, Microsoft rend chaque PC sous Windows 11 "AI PC" avec l'arrivée de Copilot Vision et Voice partout. Notre PC est officiellement devenu un partenaire qui nous parle et regarde ce que nous faisons. Un peu flippant, mais terriblement pratique.

Sur le front du hardware, Apple a répondu en silence, mais avec force en dévoilant la puce M5, taillée pour l'IA, assurant que même leurs machines auront leur propre cerveau de pointe.

Enfin, du côté de la compétition, Anthropic frappe fort avec Claude Haiku 4.5, un modèle ultrarapide et trois fois moins cher qui rivalise avec les meilleurs. La course à la puissance est aussi une course à la performance économique.

Et si vous avez besoin d'un rappel à l'ordre, regardez la vidéo du robot Unitree G1 qui maîtrise le Kung-Fu mieux que vous ne marchez.

Voici le sommaire de la semaine :

👉 Google dégaine Veo 3.1 et ajoute l'audio à vos clips 🎬​

👉 Gemini 3.0 officiellement confirmé : Google accélère son calendrier 🚀

👉 Microsoft transforme chaque PC en partenaire vocal et visuel 🗣️​

👉 Anthropic lance Haiku 4.5 : moins cher, plus rapide et meilleur que GPT-5 ? 💸

👉 La puce M5 d'Apple met l'IA sur stéroïdes 🍎

Si on t’a transféré cette lettre, abonne-toi en cliquant sur ce lien !

Si tu as une minute :

  • Google Flow s'améliore massivement avec Veo 3.1 : l'IA vidéo intègre désormais un audio riche et généré dans ses fonctionnalités, comme "Extend" pour allonger les clips ou "Frames to Video" pour des transitions fluides. L'outil permet aussi l'ajout et la suppression d'éléments avec un éclairage naturel.

  • Le CEO de Google, Sundar Pichai, a officiellement confirmé la sortie de Gemini 3.0 pour plus tard cette année. Une fuite crédible sur un calendrier marketing suggère même une annonce imminente. Google veut accélérer ses modèles pour ne pas se laisser distancer par OpenAI et Anthropic.

  • Microsoft fait de chaque Windows 11 un "AI PC" en déployant Copilot Vision (qui analyse ce qui est à l'écran) et Copilot Voice (activé par "Hey Copilot") mondialement. L'idée est de passer du prompt textuel à l'action vocale et visuelle directe.

  • Anthropic lance Claude Haiku 4.5, son petit modèle désormais par défaut dans Claude.ai. Il est deux fois plus rapide et un tiers du coût de Sonnet 4, tout en surpassant GPT-5 et Gemini 2.5 Pro sur certains tests de codage et d'utilisation d'ordinateurs.

  • Apple dévoile la puce M5, gravée en 3 nm. Elle est axée sur l'IA, intégrant des "Accélérateurs Neuraux" dédiés dans chaque cœur du GPU, promettant des performances IA quatre fois supérieures à celles de la M4. Elle équipera les nouveaux MacBook Pro et iPad Pro.

🔥 Si tu as quinze minutes ?

1️⃣ Veo 3.1 : Google passe sa caméra IA en mode réalisateur 

Le résumé : Google introduit Veo 3.1, une version améliorée de son moteur de génération vidéo, alimentant le créateur vidéo Flow. L’ensemble promet un audio natif, des transitions plus fluides, un contrôle narratif renforcé et des fonctions comme Ingredients to Video ou Frames

Les détails :

  • Audio à part entière : Avec Veo 3.1, les vidéos générées intègrent aujourd’hui des dialogues, des ambiances et des effets sonores de façon naturelle.

  • Transitions guidées : Grâce à la fonctionnalité Frames to Video, l’utilisateur fournit une image de départ et une de fin. Flow crée le passage entre les deux avec cohérence visuelle et sonore.

  • Scène prolongée : Générant un segment continu, la fonction Extend/Scene extension permet de prolonger une vidéo à partir de son dernier instant.

  • Insertion et retrait d’éléments : L’outil Flow permet d’ajouter ou de supprimer des objets/personnages dans une scène, tout en reconstruisant l’arrière-plan pour que cela semble naturel.

  • Disponible pour développeurs et entreprises : Veo 3.1 est désormais accessible via l’API Gemini, Google AI Studio et Vertex AI.

Pourquoi c’est important : Parce que cette évolution marque un virage clé : la génération vidéo par IA ne se contente plus d’images fixes animées. Elle s’élargit à l’audio, à la narration et à la personnalisation poussée.

Pour les créateurs, c’est une boîte à outils puissante. Pour le grand public et l’industrie, c’est un pas vers des vidéos IA « prêtes à l’usage » et potentiellement indiscernables des formats traditionnels, ce qui soulève à la fois des opportunités et des défis.

2️⃣ Gemini 3.0 : Une annonce imminente ? Google sous pression après la fuite

Le résumé : Le CEO Sundar Pichai a officiellement confirmé que Gemini 3.0 arriverait plus tard cette année. Cette annonce met en lumière une fuite interne qui indiquait que Google pourrait dévoiler son IA le mercredi 22 octobre 2025. Publiée sur X par @chatgpt21, elle fait déjà beaucoup parler. Bien que ce calendrier reste à confirmer, l’expert Mishaal Rahman juge le document « tout à fait crédible ». Google, de son côté, reste silencieux.

Les détails :

  • La fuite de la date : Un document interne récemment divulgué, évoquait la date du 22 octobre 2025 avec la mention « Looking to align with Gemini 3.0 launch moment », ce qui laissait penser que l’annonce était imminente.

  • Confirmation officielle : Le CEO Sundar Pichai a officiellement tempéré l'urgence en confirmant seulement que Gemini 3.0 sera bien lancé "plus tard cette année".

  • Crédibilité de l'info : Malgré la publication par un compte non vérifié (@chatgpt21), l’expert Mishaal Rahman, référence dans l’écosystème Android, a jugé le document « tout à fait crédible ».

  • Accélération dorcée : Alors que Gemini 2.5 vient à peine d’être déployé, Google semble déjà vouloir éviter de se faire distancer par la concurrence, d’après les signaux de cette fuite.

  • Stratégie sous pression : Cette rumeur tombe alors que Google tente de rattraper les avancées rapides d'OpenAI (ChatGPT) et de Perplexity

Pourquoi c’est important : Si Gemini 3.0 est réellement dévoilé dans la semaine, ce sera un signal fort de Google qui montre que l’IA n’est plus un luxe de labo, mais une guerre pour l’innovation et le leadership. Pour les utilisateurs comme pour les professionnels, cela pourrait redéfinir la façon dont on interagit avec l’intelligence artificielle dans notre quotidien plutôt que dans l’entreprise.

3️⃣ Claude Haiku 4.5 : la nouvelle flèche d’Anthropic dans la course à la vitesse

Le résumé : Deux semaines à peine après le lancement de Claude Sonnet 4.5, Anthropic remet le couvert. Voici Claude Haiku 4.5, un modèle plus vif, plus léger et surtout trois fois moins cher.

Dario Amodei, patron de la start-up, promet une IA taillée pour l’efficacité : aussi douée que Sonnet 4 pour coder, mais deux fois plus rapide et imbattable sur les coûts. De quoi séduire entreprises et développeurs pressés.

Les détails :

  • La vitesse avant tout : Selon Anthropic, Haiku 4.5 surpasse Sonnet 4 dans l’exécution des tâches sur ordinateur et accélère des applis comme Claude pour Chrome, désormais plus fluides que jamais.

  • Une économie bien calculée : Avec un coût réduit d’un tiers par rapport à Sonnet 4, ce modèle vise une adoption massive en entreprise.

  • Des sous-agents à la rescousse : Sonnet planifie et les Haiku exécutent : Finie la dépendance à une seule IA. Haiku 4.5 fonctionne en équipe, plusieurs instances pouvent collaborer pour gérer un projet complexe.

  • Haiku s’affirme comme la nouvelle norme : Ce modèle devient le défaut pour tous les plans gratuits de Claude.ai. Un choix stratégique pour populariser la plateforme tout en gardant les mêmes standards de sécurité.

  • Des premiers retours élogieux : Les bêta-testeurs, dont Gamma et Augment Code, confirment 65 % de précision en génération de texte et 90 % des capacités de Sonnet 4.5, plus une intégration prometteuse sur GitHub Copilot.

Pourquoi c’est important : Anthropic transforme la logique du haut de gamme : plus vite, moins cher, tout aussi fort. En rendant son modèle premium accessible à tous, la start-up défie frontalement OpenAI et Google. Avec Haiku 4.5, la productivité prend un accent zen, mais à vitesse supersonique.

4️⃣ Windows 11 : chaque PC devient un compagnon IA ultra-connecté

Le résumé :  Microsoft propulse Windows 11 dans une nouvelle dimension avec Copilot et Agentic. Chaque PC se transforme en assistant intelligent capable de comprendre vos instructions, d’analyser ce que vous voyez à l’écran et d’agir en votre nom. Voix, texte, vision : tout est pensé pour que l’IA devienne naturelle, rapide et sécurisée, directement intégrée à votre quotidien numérique.

Les détails :

  • Interaction fluide et naturelle : Les utilisateurs peuvent désormais converser avec leur PC par voix ou texte. « Hey Copilot » déclenche instantanément des actions et la voix double l’usage par rapport au texte classique.

  • Copilot Vision mondial : Disponible partout où Windows Copilot est proposé, Vision analyse le contenu de votre écran, guide vos projets et fournit des recommandations personnalisées, du dépannage aux présentations PowerPoint.

  • Barre des tâches repensée : La fonctionnalité Ask Copilot intègre l’IA directement à votre flux de travail. Résultats ultra-rapides et interface dynamique pour une productivité optimisée sans effort supplémentaire.

  • Gaming Copilot : En partenariat avec ASUS, Xbox et Windows dévoilent les ROG Xbox Ally et Ally X. Une simple pression permet d’interagir avec votre assistant de jeu, pour recommandations et supports en direct, sans quitter le jeu.

  • Sécurité au cœur : Copilot Actions reste sous contrôle total de l’utilisateur, avec notifications, approbations et déploiement responsable. Windows 11 conserve sa réputation de système le plus sécurisé avec plusieurs couches de protection dès le démarrage.

  • Matériel Copilot+ : Surface, Acer, ASUS, Dell, HP, Lenovo et Samsung proposent des PC optimisés pour l’IA, avec processeurs neuronaux et autonomie prolongée, à partir de 679,99 $ jusqu’à 1 499,99 $.

Pourquoi c’est important : Windows 11 ne se limite plus à un outil. Il devient un partenaire actif, accessible à tous, transformant la saisie et la navigation en expériences intuitives. Les PC Windows 11 avec Copilot offrent rapidité, sécurité et IA prête à l’emploi, rendant l’ordinateur non seulement plus intelligent, mais aussi profondément humain dans son usage quotidien.

5️⃣ Puce M5 d’Apple : l’IA surboostée débarque dans vos appareils

Le résumé : Apple dévoile la puce M5, gravée en 3 nm et pensée pour l’intelligence artificielle. Destinée aux nouveaux MacBook Pro 14 pouces, iPad Pro et Apple Vision Pro, elle promet des performances IA multipliées par quatre par rapport à la M4.

GPU et CPU repensés, Neural Engine boosté, mémoire unifiée étendue : Apple place ses utilisateurs sur orbite numérique.

Les détails :

  • GPU 10 cœurs et Neural Engine dopé : Chaque cœur du GPU intègre un Accélérateur Neural dédié, quadruplant la puissance IA et améliorant les graphismes jusqu’à 45 % grâce au ray tracing 3ᵉ génération et au caching dynamique.

  • CPU affûté et multitâche fluide : Jusqu’à 10 cœurs, avec 4 performances, 6 efficacités, propulsent le MacBook Pro et l’iPad Pro avec un gain multitâche de 15 % par rapport à la M4. Conçus pour jongler entre applications IA et créations pro.

  • Neural Engine et IA locale : Les 16 cœurs du Neural Engine accélèrent les fonctions Apple Intelligence et le traitement d’images sur Vision Pro, pour un usage IA intégré directement sur l’appareil.

  • Mémoire unifiée étendue : Bande passante de 153 Go/s (+30 %), jusqu’à 32 Go configurables, pour gérer de gros projets et modèles IA sans transiter par le cloud.

  • Disponibilité : Les premiers appareils équipés de la M5 sont en précommande dès aujourd’hui, propulsant Apple dans une nouvelle ère IA sur MacBook Pro, iPad Pro et Vision Pro.

Pourquoi c’est important : Avec la M5, Apple transforme ses appareils en véritables partenaires IA. Multitâche, graphismes et calculs neuronaux sont amplifiés pour offrir aux créatifs, joueurs et professionnels un outil ultra-rapide, prêt à accompagner chaque idée et projet. La marque maintient simultanément son exigence de contrôle et de simplicité d’utilisation.

❤️ L’outil de la semaine : Nano Banana, l'IA qui donne du style à vos photos

Nano Banana est le nom de l'éditeur d'images par IA de Google qui est en train d'être intégré dans plusieurs de leurs produits existants, ajoutant des capacités de stylisation et d'édition en un éclair.

À quoi ça sert ?

  • Stylisation Facile : Transformer vos images ou les illustrations générées par l'IA en styles variés (aquarelle, anime) via une simple commande.

  • Boostez NotebookLM : Ajouter des options de style aux "Video Overviews" et générer des illustrations contextuelles automatiques basées sur vos documents.

  • Édition en Temps Réel : Éditer des photos prises directement via l'outil Lens de Google Search ou styliser des images déjà existantes par prompt.

  • Organisation : L'outil sera bientôt intégré à Google Photos pour l'édition de vos archives stockées.

Comment l’utiliser ?

👉 Pour créer des images à partir de zéro, rendez-vous dans l'application Gemini. Pour l'édition d'images dans Search et NotebookLM (déploiement en cours), utilisez une commande vocale ou textuelle, notamment via le nouveau mode "Create" de Google Lens.

💙​ La vidéo de la semaine : Le robot Unitree qui fait du Kung-Fu

La société chinoise Unitree Robotics a dévoilé le Unitree G1, surnommé "Kungfu Kid V6.0," un robot humanoïde de 1,30 m et 35 kg capable d’exécuter des mouvements de Kung-Fu complexes, y compris des saltos arrière, avec un équilibre et une fluidité déconcertants.

Cette démonstration de l'Unitree G1 met en lumière les progrès fulgurants de la robotique agile, surpassant visiblement les démonstrations plus lentes d'Optimus de Tesla en matière d'acrobaties. Le G1, conçu pour la recherche avancée, embarque jusqu'à 43 moteurs d'articulation lui permettant d'imiter, d'apprendre et d'exécuter des séquences complexes grâce à l'apprentissage automatique.

À regarder absolument pour constater que le futur ne sera pas seulement automatisé, mais aussi très, très agile.

Un robot humanoïde capable de faire du Kung-Fu… utile ou terrifiant ?

Connexion ou S'abonner pour participer aux sondages.