Des questions aux réponses difficiles : les technologies d’IA et les infrastructures ouvertes communautaires
Alors que l’essor spectaculaire des technologies d’intelligence artificielle a contraint tous les secteurs à relever leurs propres défis, l’édition savante n’a pas été épargnée. En tant qu’infrastructure ouverte axée sur la communauté, Coalition Publica a dû faire face à une série de demandes particulières au cours des derniers mois. Qu’il s’agisse de la forte augmentation de l’accès automatisé à la plateforme Érudit, des utilisateurs d’Open Journal Systems (OJS) de PKP qui peinent à comprendre les fluctuations dans le volume de téléchargements d’articles ou encore des éditeurs qui sollicitent les conseils d’experts en communication savante pour l’adoption de politiques en matière d’IA pour leurs revues, les communautés membres de Coalition Publica ont été amenées à réfléchir à l’impact de cette croissance.
Puisque les données textuelles constituent la matière première utilisée pour la formation des grands modèles linguistiques et l’apprentissage automatique, les principaux développeurs d’IA dans le monde se sont tournés vers la collecte massive de documents textuels. Outre la surcharge des serveurs, la distorsion des statistiques de consultation et de téléchargement est particulièrement préoccupante, car ces données sont des indicateurs essentiels pour les bibliothèques, les éditeurs de revues et les communautés de recherche. On ne connaît pas encore les répercussions que cela aura sur la découverte des contenus savants. Cette situation soulève également des questions éthiques et juridiques concernant la gouvernance des données, la transparence de leur utilisation et les droits d’auteur. La manière dont ces technologies gourmandes en ressources peuvent et doivent être intégrées aux services fournis par des infrastructures ouvertes et gérées par la communauté constitue également une question délicate.
Ce panel rassemble trois points de vue sur les enjeux soulevés par la généralisation croissante des technologies d’intelligence artificielle, en s’appuyant sur les expériences de Coalition Publica et de sa communauté. Les présentations porteront sur les mesures mises en œuvre par Érudit pour lutter contre la collecte massive de données sur la plateforme, sur l’impulsion donnée à l’exploration des fonctionnalités liées à l’IA dans OJS, ainsi que sur le soutien apporté par les bibliothécaires en matière de politiques éditoriales pour les revues. Elles examineront comment les infrastructures ouvertes et publiques composent avec les tensions qui existent entre l’IA, le libre accès et la viabilité des services.