spot_img

Google a faim de vos données pour améliorer son IA

Google veut tout avaler

Google affiche clairement son intention de se régaler du contenu des sites internet pour faire progresser ses systèmes d’intelligence artificielle. Le moteur de recherche propose que les entreprises soient obligées de se désengager, comme elles le font actuellement pour l’indexation des moteurs de recherche, si elles ne veulent pas que leur contenu soit scrappé.

Les détracteurs de ce modèle d’exclusion affirment que cette politique va à l’encontre des lois sur le droit d’auteur. Elle fait peser la responsabilité sur les entités cherchant à utiliser du matériel protégé par le droit d’auteur plutôt que sur les détenteurs du droit d’auteur eux-mêmes.

Une pratique douteuse

Il s’agit d’une pratique courante pour de nombreuses grandes entreprises technologiques qui s’appuient sur l’IA. Elles développent des algorithmes d’apprentissage automatique pour déterminer les goûts de leurs utilisateurs et leur proposer des contenus et des publicités adaptés.

Cette volonté d’obtenir davantage de données intervient alors que la popularité de l’IA a explosé. Les capacités de systèmes tels que ChatGPT et Google’s Bard reposent sur l’ingestion d’énormes ensembles de données textuelles, d’images et de vidéos. Selon OpenAI, GPT-4 a appris à partir d’une variété de sources de données sous licence, créées et accessibles au public qui peuvent inclure des informations personnelles accessibles au public.

Cependant, certains experts estiment que le web scraping sans autorisation pose des problèmes de droits d’auteur et d’éthique. Des éditeurs comme News Corp. sont déjà en pourparlers avec la société d’intelligence artificielle, cherchant à se faire payer pour l’utilisation de leur contenu.

Problème de droit d’auteur

L’IA générative et les grands modèles de langage sont souvent formés à partir de contenus médiatiques propriétaires pour lesquels les éditeurs et d’autres investissent beaucoup de temps et de ressources. De telles pratiques sapent les modèles économiques fondamentaux de l’industrie des médias qui reposent sur le lectorat, l’audience, les licences et la publicité.

En plus de violer la loi sur le droit d’auteur, l’impact qui en résulte est de réduire considérablement la diversité des médias et de porter un coup à la viabilité financière des entreprises qui investissent dans la couverture médiatique. Avec comme résultat de réduire l’accès du public à des informations de haute qualité et dignes de confiance.

Tension au sein de l’IA

Le débat illustre la tension entre l’avancement de l’IA grâce à un accès illimité aux données et le respect des droits de propriété. D’une part, plus le contenu consommé est important, plus ces systèmes deviennent performants. Mais ces entreprises profitent également du travail des autres sans en partager les bénéfices.

Il ne sera pas facile de trouver un juste équilibre. La proposition de Google dit essentiellement aux éditeurs de confier leur travail à son IA ou de prendre des mesures pour s’en retirer. Pour les petits éditeurs disposant de ressources ou de connaissances limitées, cette option peut s’avérer difficile à mettre en œuvre.

Cathy Norton
Cathy Norton
Je baigne dans les cryptos depuis 2012. C'est un domaine qui me passionne. Et comme tout passionné, j'aime transmettre mon savoir qui grandit jour après jour. Un domaine infini qui se renouvelle sans cesse. C'est ça qui est passionnant.

Autres Articles

spot_img
4,317SuiveursSuivre

Derniers Articles