Articles

Imprimer Partager sur Facebook Partager sur Twitter Partager sur LinkedIn

Portrait et entretien de professionnel

"Pour affronter les défis de notre temps, n’avons-nous pas besoin de toutes les intelligences ?"

novembre 2023

Virginie Clayssen, directrice du patrimoine et de la numérisation du groupe Editis, est Présidente de la commission Numérique du SNE et Présidente de l’European Digital Reading Lab. Elle a répondu à nos questions concernant l’intelligence artificielle, ses avancées récentes, et les premières réactions et réflexions que celles-ci suscitent actuellement dans le monde du livre.


BIEF : Virginie Clayssen, l’intelligence artificielle fait aujourd’hui l’objet de nombreux débats. Depuis combien de temps est-elle présente dans le monde de l’édition ?


Virginie Clayssen : "L’emballement médiatique actuel autour de l’intelligence artificielle ne doit pas nous faire oublier que les travaux dans ce domaine ont commencé dès l’apparition des premiers ordinateurs, dans les années 40. C’est seulement en 1956 que le terme d’intelligence artificielle a été adopté pour désigner ce qui devient alors un nouveau champ de recherche autonome. L’intelligence artificielle a donc déjà son histoire, trop longue pour être racontée ici, une histoire agitée, où se sont opposées – et s’opposent encore – des définitions divergentes et concurrentes de l’intelligence, et de la manière dont celle-ci peut être "inculquée" aux ordinateurs. Après la généralisation progressive de l’usage du web, la disponibilité nouvelle d’un très grand nombre de données (le Big Data) et l’accroissement exponentiel de la puissance de calcul des machines, c’est dans les années 2010 et dans le domaine de l’apprentissage artificiel, notamment avec le "deep learning", que se sont produites les avancées les plus spectaculaires. Leur manifestation la plus connue est sans conteste Chat GPT, même s’il existe déjà de nombreux concurrents, dont la liste ne cesse de s’allonger."

 

BIEF : Depuis combien de temps travaillez-vous sur ces questions ?

 

Virginie Clayssen : "Sans attendre la sortie de Chat GPT, l’IA a été un thème de réflexion dans le monde de l’édition, qui a notamment conduit la Commission numérique du SNE à choisir ce sujet comme thématique pour ses Assises du Livre numérique dès leur édition de 2017, puis à nouveau en 2021. Dans l’édition, comme dans bien d’autres secteurs, les outils utilisés par les différents métiers sont nombreux à s’appuyer déjà sur l’intelligence artificielle. Le plus emblématique est certainement l’OCR (Optical Character Recognition, "reconnaissance optique de caractères"). Cette technologie logicielle identifie électroniquement le texte (manuscrit ou imprimé) à l'intérieur d'un fichier image ou d'un document physique, tel qu'un document scanné, et le convertit en une forme de texte lisible par une machine, qui peut être utilisée pour le traitement des données, et a également permis le développement d’une offre de livres numériques. Des outils basés sur l’IA ont notamment été mobilisés par la société FeniXX, pour le projet de numérisation des livres indisponibles du XXe siècle. Elle a fait appel à la société Pythagoria pour automatiser la production de métadonnées (obtention via l’OCR des données de description des livres, notamment leur titre, auteur(s), éditeur, nombre de pages, quatrième de couverture) de dizaines de milliers de livres numérisés durant le projet. On utilise ainsi, sans toujours le savoir, de l’IA en numérisant un livre, mais aussi en utilisant sa messagerie, un moteur de recherche, un traitement de texte, un site de traduction, car toutes ces applications y font appel pour améliorer leurs performances, leurs fonctionnalités et leur efficacité."

 

BIEF : Qu’est-ce qui a été mis en place pour protéger d’un usage abusif de l’IA l’ensemble des métiers de création dans le domaine du livre ?

 

Virginie Clayssen : "Le fait est établi aujourd’hui que les entreprises qui ont développé les grands modèles d’IA les ont entraînés illégalement avec des ensembles de données qui contenaient un grand nombre de livres numériques sous droits. Des éditeurs et des auteurs, dans le monde entier, se mobilisent pour exiger le maximum de transparence sur les données d’entraînement. Lors de la Foire de Francfort, une proclamation conjointe de la Fédération européenne et internationale des libraires (EIBF), la Fédération des éditeurs européens (FEE) et du Conseil des écrivains européens a appelé les législateurs européens à "saisir l'occasion de la loi sur l'IA pour prendre des mesures décisives afin d'assurer la transparence des modèles d’intelligence artificielle générative et de les rendre plus sûrs pour les citoyens européens." Auparavant, un collectif de plus de 70 organismes professionnels des secteurs de la création et des industries culturelles, dont le SNE, avait appelé, dans une tribune au Monde, à l’adoption d’un cadre européen sur l’utilisation des algorithmes qui garantisse le principe d’une transparence sur les œuvres et sur les contenus utilisés pour entraîner les machines."

 

BIEF : Alors qu’il est partout question des investissements massifs des grands acteurs du numérique dans l’IA, peu de travaux ont été consacrés à la manière dont le monde de l’édition s’empare des outils d’IA.

 

Virginie Clayssen : "Les modèles d’IA d’aujourd’hui ont été développés par les grands acteurs du numérique. Microsoft a annoncé, en janvier 2023, un investissement pluriannuel de plusieurs milliards de dollars dans OpenAI et a intégré sa technologie GPT-4 dans son navigateur Bing. Amazon a lourdement investi dans la société Anthropics, qui a développé un modèle d’IA nommé Claude. Meta et Google ont entraîné leurs propres modèles. Apple recrute massivement des spécialistes en IA et pourrait annoncer des produits grand public intégrant l'IA générative dès 2024. Par ailleurs des centaines de sociétés de toutes tailles se sont lancées sur le créneau avec des offres spécialisées, offrant des solutions d’IA génératives s’appuyant sur les modèles déjà cités. L’apparition des grands modèles d’IA conversationnels est récente, et il n’est guère étonnant qu’il n’existe pas encore de travaux sur la manière dont les groupes et maisons d’édition s’en emparent. Le monde de l’édition suit de très près les développements rapides et nombreux qui interviennent dans ce secteur. Des expérimentations sont menées, et la Foire de Francfort proposait cette année nombre de conférences et de présentations sur le sujet. J’y ai entendu cette affirmation que cette édition était celle de l’"année zéro de l’IA dans l’édition"… 

 

BIEF : On lit souvent que l’IA ne peut pas "remplacer le travail" des différents acteurs du livre mais qu’elle peut par exemple "assister ou accompagner" le travail des libraires ou des bibliothécaires ou même le travail éditorial. Comment ?

 

Virginie Clayssen : "Toutes les innovations de rupture, comme le sont les nouveaux modèles d’IA génératives, provoquent des réactions similaires, toujours ambivalentes : la crainte du "ceci va remplacer cela" voisine avec des affirmations rassurantes du type : "mais ce n’est qu’un outil". Il faudra du temps et un peu de recul sur les usages pour que s’impose une représentation plus nuancée. Pour certaines tâches, l’intérêt d’un recours à l’IA ne fait pas débat. Par exemple, personne ne doute de l’intérêt de réussir à automatiser la production de textes alternatifs aux millions d’images (et d’autres objets non textuels comme les schémas, les tableaux…) présents dans nos catalogues de livres numériques, en vue de rendre ceux-ci accessibles aux personnes non voyantes et malvoyantes. L’accessibilité des livres numériques devenant obligatoire à partir de juin 2025, le sujet s’impose à l’ensemble des éditeurs. Une large réflexion est déjà entamée concernant l’intégration – ou non – des systèmes d’IA dans les diverses situations de travail qui interviennent dans la chaîne du livre. Elle implique une connaissance très fine des métiers, et une bonne compréhension des possibilités offertes par les IA. Elle s’accompagne d’expérimentations et d’échanges qui impliquent tous les acteurs, qu’il s’agisse d’indépendants, d’entreprises ou d’organismes interprofessionnels."

 

BIEF : Si l’intelligence artificielle peut faciliter la commercialisation et le marketing par exemple en rédigeant des posts sur les réseaux sociaux, n’est-elle pas dangereuse pour le secteur éditorial ?

 

Virginie Clayssen : "C’est par ses capacités de génération de textes, d’images ou de musiques que les IA de dernière génération ont enflammé les esprits, et donné envie au plus grand nombre de s’y essayer, preuve que les activités de création fascinent toujours autant. Cependant, même s’il existe des exemples de pseudo-livres générés automatiquement, la création artistique ne semble pas être le domaine où les IA peuvent véritablement rivaliser avec les êtres humains. La vocation première des IA est de résoudre des problèmes. Les artistes sont plutôt là pour en poser de nouveaux, pour ouvrir des brèches dans les conventions. C’est prêter aux IA plus d’intelligence qu’elles n’en ont, c’est oublier le mot "artificiel" caché derrière le i de IA que de leur attribuer des pouvoirs de création qu’elles ne possèdent pas. Certains artistes ont déjà et auront encore le souhait d’explorer l’excellence des capacités d’exécution des IA génératives, non pour se dispenser d’un effort, mais pour ajouter aux outils qu’ils utilisaient déjà dans leur parcours de création ce nouvel instrument aux propositions parfois étranges et déconcertantes."

 

BIEF : Quelles sont nos possibilités d’intervention ? Quelles sont les initiatives existantes ? Où en est-on au niveau des contrats ?

 

Virginie Clayssen : "On voit apparaître dans certains contrats des clauses interdisant le recours aux IA dans le cas où les droits sont cédés pour la traduction, ou des clauses interdisant le recours à des voix de synthèse en cas de cession audio. Il existe aussi des clauses types que les éditeurs peuvent insérer dans les Conditions générales d’utilisation de leur site web, indiquant qu’ils s’opposent à ce que les données présentes sur ces sites soient utilisées pour entraîner des IA. Enfin, la directive européenne du 17 avril 2019 a instauré une exception au droit d’auteur pour le TDM (Text and Data Mining, "fouille de textes et de données"), en instaurant la possibilité d’un opt-out dans le cas de fouilles effectuées à des fins autres que celles de la recherche. Via un protocole appelé Text & Data Mining (TDM) Reservation Protocol spécifié au sein du W3C, il est désormais possible d’indiquer aux robots s’ils sont ou non autorisés à utiliser un contenu en ligne pour entraîner un modèle d’IA, et si oui, sous quelles conditions."

 

BIEF : Faut-il craindre une évolution vers un monde tel celui décrit dans 1984 d’Orwell, où l’usage du langage est formaté, prévisible, programmé ? Saurons-nous nous mobiliser pour défendre un rapport à la langue qui résiste à tout ce qui voudrait la calculer ?

 

Virginie Clayssen : "Le calcul est présent dès l’invention de l’écriture : il y a 6000 ans, les tablettes des Sumériens étaient des livres de comptabilité. Les activités de tous s’appuient aujourd’hui sur quantité d’objets et d’applications numériques, largement alimentés par de l’IA. Comme tout ce qui constitue notre environnement, cela a bien sûr un impact sur notre rapport à la langue, mais pas nécessairement dans le sens du formatage et de la prédictibilité. Il peut aussi s’en trouver diversifié et enrichi, faciliter l’arrivée de nouvelles voix, la possibilité d’écritures collectives, l’invention de nouveaux genres, une meilleure mise en visibilité des œuvres. Mobilisons-nous pour la disponibilité de modèles d’IA durables et dignes de confiance : ainsi pourrons-nous parier, pourquoi pas, sur l’apparition d’usages poétiques, joyeux ou subversifs des IA génératives. Pour affronter les défis de notre temps, n’allons-nous pas avoir besoin de toutes les intelligences ?"

 

Propos recueillis par Katja Petrovic