Pourquoi la sécurité des chatbots est-elle importante ? Grok 3 illustre parfaitement les dangers, en fournissant des instructions détaillées pour produire et même déployer des armes chimiques.
Au sommaire
- Grok aurait fourni un plan d’action pour tuer des millions de personnes
Lorsqu’Elon Musk a fondé xAI et développé son chatbot Grok, il accusait les autres intelligences artificielles d’être « woke » et leurs créateurs de censurer la vérité et de les apprendre à mentir. Le milliardaire avait même utilisé le nom de TruthGPT au début. La nouvelle version de Grok semble pousser cette idée à l’extrême, comme l’a découvert Linus Kenstam, un passionné d’IA.
L’homme a publié une capture d’écran sur X (ex-Twitter) d’une recette pour une « arme chimique de destruction massive », sans la nommer. La capture d’écran a heureusement été censurée, mais le contenu laisse sans voix. Grok 3 a fourni les instructions détaillées pour créer une toxine, et même la liste de courses avec les différents fournisseurs à contacter.
Selon Linus Kenstam, il ne s’agit pas d’un exemple isolé, ni d’un simple bug. Il a pu obtenir des centaines de pages d’instructions détaillées pour fabriquer des armes chimiques. Il a même un plan d’action sur où et comment diffuser l’arme dans la ville de Washington pour maximiser l’effet, tuant potentiellement des millions de personnes. Et en cas de doute, notamment si vous craignez une hallucination de l’IA, l’agent de raisonnement DeepSearch peut parcourir des milliers de sources pour affiner l’information présentée.
Heureusement, dans un autre tweet il indique que les équipes de xAI ont été très réactives et ont déjà mis en place des mesures pour bloquer ce genre de requête. La solution n’est pas parfaite, puisqu’il serait encore possible de contourner le blocage. Nul doute que xAI travaille encore dessus.
Si Grok a pu fournir ces instructions, c’est parce qu’elles sont déjà disponibles sur le Web. Toutefois, il y a une grande différence entre écumer manuellement Internet pendant de longues heures pour tenter de rassembler toutes les informations et obtenir un PDF détaillé de 30 pages en quelques secondes…
Par FUTURA
Commentaires