Un article, publié sur le site de la Cornell University Library, montre comment l’équipe qui travaille sur le projet Google Brain développe une intelligence artificielle capable d’agréger des informations et de les compiler dans un texte.

Les quelques tests réalisés montrent des résultats de plus en plus probants.

Vers une encyclopédie robotisée

Les informations que vous recherchez sur Internet pourraient à l’avenir être écrites par une Intelligence Artificielle. C’est en tout cas ce sur quoi travaille l’équipe de Google Brain, un projet de recherche lancé en 2011 dont la technologie est utilisée pour la reconnaissance vocale Android ou les recommandations YouTube. Les récents essais ont donné naissance à des articles entièrement rédigés par des logiciels.

L’intelligence artificielle procède en plusieurs étapes. Elle lance tout d’abord une recherche sur Google et réunit les informations trouvées dans les dix premiers sites référencés (hormis Wikipedia). Elle les met bout à bout et classe les différents paragraphes. Le texte est ensuite codé et réduit. Il ne reste plus au logiciel qu’à recréer et réduire à nouveau les phrases. Il se sert alors de la syntaxe des paragraphes qu’il avait copiés comme modèle.

L’équipe Google Brain s’est notamment entraînée à condenser des renseignements sur le site d’aviation Wings over Kansas.

A gauche le résumé généré par ordinateur et à droite l’article Wikipedia.

Les contributeurs de Wikipedia n’ont pas (encore) à s’inquiéter

Le texte rédigé par le logiciel ne rivalise pas avec celui de l’encyclopédie en ligne d’un point de vue synthétique et stylistique. L’intelligence artificielle cherche à lister toutes les données et finit par écrire un article trop long. Les phrases s’étendent, les informations s’accumulent et la lecture devient plus fastidieuse, surtout pour un internaute à la recherche d’une définition concise.

Ces quelques erreurs soulignent cependant le souci de dépasser la phrase simple. Le logiciel manque encore de fluidité dans sa rédaction mais ses performances sont de plus en plus abouties. Un autre point sur lequel Google Brain doit travailler est la fiabilité de l’information. S’appuyer seulement sur les dix premiers sites web entraîne le risque de transmettre des renseignements erronés. Tout ce qui est mis sur Internet n’est pas toujours vrai.