E-business

Le New York Times, CNN et la chaîne australienne ABC empêchent le robot d’exploration Web GPTBot d’OpenAI d’accéder au contenu.

0

Le Chicago Tribune et les journaux australiens Canberra Times et Newcastle Herald semblent également avoir interdit le robot d’exploration du fabricant de Chat GPT.

Le robot d’exploration Web d’OpenAI – connu sous le nom de GPTBot – a été bloqué par le New York Times, CNN, Reuters et l’Australian Broadcasting Corporation. Photographie : Jonathan Raa/NurPhoto/Shutterstock

Intelligence artificielle (IA)

Le New York Times, CNN et la chaîne australienne ABC empêchent le robot d’exploration Web GPTBot d’OpenAI d’accéder au contenu.

Le Chicago Tribune et les journaux australiens Canberra Times et Newcastle Herald semblent également avoir interdit le robot d’exploration du fabricant de Chat GPT.

Des médias tels que le New York Times, CNN, Reuters et l’ Australian Broadcasting Corporation (ABC) ont bloqué un outil d’OpenAI, limitant ainsi la capacité de l’entreprise à continuer d’accéder à leur contenu.

OpenAI est à l’origine de l’un des chatbots d’intelligence artificielle les plus connus, ChatGPT. Son robot d’exploration Web – connu sous le nom de GPTBot – peut analyser des pages Web pour aider à améliorer ses modèles d’IA.

The Verge a été le premier à signaler que le New York Times avait bloqué GPTBot sur son site Web. Le Guardian a par la suite découvert que d’autres sites d’information majeurs, notamment CNN, Reuters, le Chicago Tribune, ABC et les marques Australian Community Media (ACM) telles que le Canberra Times et le Newcastle Herald, semblent avoir également interdit le robot d’exploration.

Les soi-disant grands modèles de langage tels que ChatGPT nécessitent de grandes quantités d’informations pour former leurs systèmes et leur permettre de répondre aux requêtes des utilisateurs d’une manière qui ressemble à des modèles de langage humain. Mais les entreprises à l’origine de ces projets restent souvent discrètes quant à la présence de matériel protégé par le droit d’auteur dans leurs ensembles de données.

Le blocage sur GPTBot est visible dans les fichiers robots.txt des éditeurs qui indiquent aux robots des moteurs de recherche et d’autres entités quelles pages ils sont autorisés à visiter.

« Autoriser GPTBot à accéder à votre site peut aider les modèles d’IA à devenir plus précis et à améliorer leurs capacités générales et leur sécurité », a déclaré OpenAI dans un article de blog contenant des instructions sur la façon de refuser le robot d’exploration.

Tous les points de vente examinés ont ajouté le bloc en août. Certains ont également interdit CCBot, le robot d’exploration Web pour un référentiel ouvert de données Web connu sous le nom de Common Crawl, qui a également été utilisé pour des projets d’IA.

CNN a confirmé à Guardian Australia qu’elle avait récemment bloqué GPTBot sur ses titres, mais n’a pas précisé si la marque envisageait de prendre des mesures supplémentaires concernant l’utilisation de son contenu dans les systèmes d’IA.

Un porte-parole de Reuters a déclaré qu’il révisait régulièrement son fichier robots.txt et les conditions générales du site. « Parce que la propriété intellectuelle est l’élément vital de notre entreprise, il est impératif que nous protégions les droits d’auteur de notre contenu », a-t-elle déclaré.

Les conditions d’utilisation du New York Times ont été récemment mises à jour pour rendre l’interdiction de « la suppression de notre contenu à des fins de formation et de développement de l’IA… encore plus claire », selon un porte-parole.

Depuis le 3 août, les règles de son site Web interdisent explicitement que le contenu de l’éditeur soit utilisé pour « le développement de tout programme logiciel, y compris, mais sans s’y limiter, la formation d’un système d’apprentissage automatique ou d’intelligence artificielle (IA) » sans consentement.

Les médias du monde entier sont confrontés à des décisions quant à l’opportunité d’utiliser l’IA dans le cadre de la collecte d’informations, et également à la manière de gérer le fait que leur contenu soit potentiellement aspiré dans les pools de formation par les entreprises développant des systèmes d’IA.

L’intelligence artificielle est-elle une menace pour le journalisme ou la technologie va-t-elle se détruire d’elle-même ?

Début août, des médias comme l’Agence France-Presse et Getty Images ont signé une lettre ouverte appelant à une réglementation de l’IA, y compris la transparence sur « la composition de tous les ensembles de formation utilisés pour créer des modèles d’IA » et le consentement pour l’utilisation de matériel protégé par le droit d’auteur.

Google a proposé que les systèmes d’IA puissent supprimer le travail des éditeurs à moins qu’ils ne se désengagent explicitement.

Dans une soumission à l’examen du gouvernement australien sur le cadre réglementaire autour de l’IA, la société a plaidé en faveur de « systèmes de droits d’auteur qui permettent une utilisation appropriée et équitable du contenu protégé par le droit d’auteur pour permettre la formation de modèles d’IA en Australie sur une gamme large et diversifiée de données, tout en soutenir des opt-outs réalisables ».

Une recherche d’OriginalityAI, une société qui vérifie la présence de contenu d’IA, partagée cette semaine, a révélé que de grands sites Web, dont Amazon et Shutterstock, avaient également bloqué GPTBot.

Le fichier robot.txt du Guardian n’interdit pas GPTBot.

L’ABC, l’Australian Community Media, le Chicago Tribune, OpenAI et Common Crawl n’ont pas répondu dans les délais.

… il y a une bonne raison pour ne pas soutenir le Guardian.

Tout le monde n’a pas les moyens de payer pour des informations à l’heure actuelle. C’est pourquoi nous maintenons notre journalisme ouvert à tous, y compris en Tunisie. Si tel est votre cas, continuez à lire gratuitement. 

Mais si vous en êtes capable, alors il y a trois bonnes raisons de nous soutenir aujourd’hui.

  1. Notre journalisme d’investigation de qualité est une force de contrôle à une époque où les riches et les puissants s’en tirent de plus en plus.
  2. Nous sommes indépendants et aucun propriétaire milliardaire ne tire les ficelles. Votre argent alimente donc directement nos rapports.
  3. Cela ne coûte pas cher et prend moins de temps que pour lire ce message

Aidez à dynamiser le journalisme du Guardian pour les années à venir, que ce soit avec une petite somme ou une somme plus importante. 

admin
Soutenez votre média indépendant de management : abonnez-vous à Afrik Management au service des individus et des organisations ! À 15 €/An A compter de février 2024, accédez à des contenus exclusifs sur et naviguez pour 15 € par an seulement ! Notre mission en tant que média de management ? Rendre le savoir accessible au plus grand monde. Nous produisons chaque jour nos propres articles, enquêtes et reportages, le tout à taille humaine. Soutenez-nous dans cette démarche et cette ambition.

Ce géant de l’automobile en difficulté à cause d’une panne informatique

Previous article

RÉCHAUFFEMENT CLIMATIQUE : «L’ÈRE DE L’ÉBULLITION MONDIALE A COMMENCÉ», SELON LE SECRÉTAIRE GÉNÉRAL DE L’ONU

Next article

Commentaires

Leave a reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

You may also like

More in E-business