Des informations ont fuité sur un nouveau projet de Google qui pourrait être officiellement dévoilé en décembre. Il s’agirait d’une intelligence artificielle capable de naviguer sur le Web et effectuer des tâches du quotidien toute seule, à la place de l’utilisateur.
Oubliez les chatbots et les générateurs d’images, c’est déjà ringard. La prochaine fonctionnalité phare dans la course à l’intelligence artificielle est de remplacer l’interface chaise-clavier, autrement dit l’utilisateur. Alors qu’Anthropic a annoncé la semaine dernière que le nouveau Claude 3.5 Sonnet peut interagir avec les applications de bureau, Google travaillerait sur une fonctionnalité similaire, selon The Information.
D’après leurs sources, l’IA porterait le nom de code Project Jarvis, et « répond aux commandes d’une personne en effectuant fréquemment des captures d’écran de ce qui se trouve sur l’écran de son ordinateur et en interprétant les captures avant d’effectuer des actions telles que cliquer sur un bouton ou saisir du texte dans un champ ».
Project Jarvis serait toutefois un peu plus limité que Claude, puisque cette fonctionnalité serait restreinte au Web, et plus particulièrement au navigateur Chrome de Google. Le but serait avant tout de traiter automatiquement des tâches du quotidien sur le Web, comme la recherche, les courses ou effectuer des réservations.
Google aurait prévu de dévoiler Project Jarvis en décembre, en même temps que Gemini 2.0. D’autres entreprises travaillent également sur des fonctionnalités similaires. OpenAI plancherait sur un modèle qui peut naviguer sur le Web seul, et Apple Intelligence pourra comprendre ce qui est affiché à l’écran, et même interagir avec les applications. Enfin, si Microsoft Copilot Vision ne sera pas capable de cliquer à votre place, il pourra tout de même comprendre et discuter du contenu affiché à l’écran.
Par FUTURA
Commentaires