Chez l'agence de presse AP à New York, une partie des contenus est rédigée de manière autonome depuis 2014.

La course est lancée et les projets fusent. Depuis cinq ans, les rédactions de grands journaux américains investissent dans de nouveaux outils liés à l’intelligence artificielle. Les groupes de presse testent notamment des générateurs de texte autonomes, ou des programmes de reconnaissance audio et visuelle. Tout ce qui peut être automatisé est bon à prendre: cela permet de libérer les journalistes des tâches de routine, et surtout de proposer de nouveaux contenus. En 2014, la rédaction du Los Angeles Times lançait par exemple son Quakebot, un programme qui génère un flash info dès qu’une alerte sismique est détectée. Il lui su it d’un flux de données structurées et de consignes définies à l’avance. Depuis plus de trois ans, ce robot rédige des dépêches de manière autonome.

D’autres processus automatisés requièrent des algorithmes capables de prendre des décisions plus complexes. Pour les créer, les groupes de presse se tournent vers les startups spécialisées en apprentissage automatique (machine learning), un domaine de l’intelligence artificielle qui permet d’entraîner une machine jusqu’au point où elle peut prendre des décisions seule. Les applications médias se développent alors sous forme de partenariats. Le nombre d’entreprises qui se lancent dans le traitement de langage naturel (natural language processing), particulièrement, est en train d’exploser, ouvrant la porte à de nombreux projets en rapport avec l’écriture dans l’industrie de la presse.

Toute l’industrie des média cherche à utiliser les technolo- gies d’automatisation pour produire du contenu. L’agence américaine Associated Press s’est lancée bien avant d’autres dans la création automatisée d’articles. Elle est aujourd’hui en mesure de publier sans les relire des dépêches écrites par un algorithme.

Texte: Fanny Giroud (Journaliste «24 heures»)

Enormes enjeux

Les enjeux sont énormes: les médias doivent créer leurs propres contenus pour essayer de se passer des agences, et les agences doivent se rendre indispensables en proposant de nouveaux produits. Pionnière en la matière, The Associated Press (AP) a mis en place plusieurs projets d’automatisation et en teste d’autres actuellement. De son siège à New York, juste devant le mémorial du 9/11, AP gère chaque jour la création de 2000 articles et leur distribution à 15’000 clients autour du globe. Depuis 2014, une partie des contenus est rédigée de manière autonome. Lisa Gibbs, co-directrice pour l’automatisation et l’intelligence artificielle (AI), s’occupe des partenariats avec les startup externes. C’est elle qui a mené les tests d’implémentation d’un algorithme pour la rédacti- on automatique de dépêches sur les bilans des entreprises.

A ce jour, ce robot rédige quatre fois par année près de 4000 articles sur les résultats trimestriels, soit dix fois plus que ce qu’AP produisait qu’auparavant. L’agence suit désormais des centaines de petites entreprises d’intérêt régional. «Couvrir les résultats trimestriels, c’est rédiger des centaines de rapports sur une période très courte de 3 semaines, explique Lisa Gibbs. Avec l’automatisation, nos journalistes n’ont plus besoin de réunir les informations de base et peuvent utiliser leur cerveau trouver des histoires à raconter sur les entreprises. Le rapport de base fait o ice de premier jet et le journaliste peut y ajouter son analyse, tout est déjà là. Nous le faisons pour près de 80 compagnies comme Google, Apple, ou Walmart.»

Automated Corporate Earnings, le nom de ce nouvel outil, a été paramétré pour gérer un certain nombre de scénarios récurrents et créer automatiquement un petit texte selon un ensemble de règles. Il a été conçu à l’aide de Wordsmith, une plateforme de langage naturel qui génère des récits à partir de données. Cet outil a été conçu par la société américaine Automated Insights, dans laquelle AP a investi, et qui a travaillé sur Google Sheets, Amazon Alexa, Microso Excel ou encore Yahoo Sports Fantasy Football.

Il a fallu dix mois de test pour rendre l’outil Earnings performant, en relisant chaque dépêche et en modifiant le programme selon les erreurs détectées. Les textes sont désormais publiés sans relecture mais avec la mention qu’ils ont été générés automatiquement. Cette indication peut être supprimée par le média client qui publie l’information.


Sport, photos, réseaux sociaux

AP utilise Wordsmith pour d’autres tâches automatisées: en sport notamment, pour rédiger des comptes rendus et des présentations de matches de basket, de baseball ou de football américain. D’autres outils sont en phase de test pour la rédaction automatique de résumés d’articles. «En tant qu’agence, nous avons di érents clients qui utilisent différentes versions d’un article, détaille Lisa Gibbs. Lorsqu’un journaliste écrit un article, il écrit une version texte, une version courte pour la télévision, un résumé et deux headlines. Si nous pouvons automatiser la rédaction de résumés, cela va aider le journaliste ou en tout cas lui permettre d’aller plus vite.»

Sur son immense base de données photo et ses archives, AP teste des logiciels de reconnaissance d’images afin d’améliorer le référencement et donc la réutilisation des images. AP a par ailleurs investidans Wibbits, un programme de vidéo qui génère un script à partir d’un texte et d’images. «Nous testons en ce moment quelles applications de story telling pourraient l’utiliser, précise Lisa Gibbs. Pour l’instant, il n’est pas question de générer des vidéos sans les faire éditer par des journalistes, mais cela accélère beaucoup le processus.»

AP travaille finalement avec Google sur AP Verify, un programme pour repérer des posts intéressants sur les réseaux sociaux, vérifier leur crédibilité et les redistribuer à ses clients. Pour développer ce nouvel outil basé sur le machine learning, AP a reçu une bourse de Google News Initiative. «Google s’y intéresse car si AP détermine qu’un post n’est pas vérifié, cela a un impact sur toute la planète», analyse Lisa Gibbs. «Trouver un tweet sur l’attaque de Las Vegas, ou vérifier un post Facebook sur l’incendie à Los Angeles, c’est une manière de réunir des informations pour le journaliste.»

Nouvelles compétences demandées

Ces technologies conduisent-elles à des suppressions d’emploi? Plutôt à des changement d’a ectation, selon Lisa Gibbs. «Chez nous, cela a modifié certains emplois, notamment celui d’éditeur. Ces implémentations dans la rédaction demandent de nouvelles compétences, de nouveaux outils. Il faut faire attention aux erreurs, s’adapter, apprendre, planifier.»

AP doit désormais maintenir une base de données des entreprises et s’assurer que les données sont exactes. AP a aussi engagé un ingénieur en automatisation, un métier qui n’existait pas dans les rédactions il y a cinq ans. «Les rédactions ont besoin de davantage de développeurs, de codeurs, d’ingénieurs. Savoir utiliser le machine learning fait partie de notre stratégie. Nous voulons savoir comment utiliser ces technologies, nous investissons en elles. C’est un plan d’action global pour nous.»

«Nous nous demandons maintenant s’il faut automatiser les tremblements de terre, les prix de l’immobilier, les failli- tes, les nouvelles entrées au registre du commerce, les nouveaux contrats gouvernementaux, les annonces de procès. Quel sera le prochain projet, que veulent les gens, qu’est-ce qui sera utile? Il y a énormément d’expérimentations en cours en ce moment», conclut la co-directrice.

© Tamedia