Salut Siri, écris-moi un livre: Jeu d'imitation de Turing est la plus haute forme de flatterie d’IA et elle écrit sa propre histoire

Publié le samedi 5 octobre 2019

Auteur : Jacob Berkowitz

Jacob Berkowitz

Écrivain en résidence de l'ISSP, auteur et artiste

Un avenir dans lequel l'IA empêche finalement de savoir si un humain ou un ordinateur a écrit un texte particulier est presque là. Qu'est-ce qui se passe ensuite?

Comme paru dans le Globe and Mail du samedi 5 octobre 2019

Je me souviens clairement du premier mot de mon fils. Les yeux de Max s'ouvrirent et brillèrent d'amusement à mon expression de surprise choquée lorsque, depuis la table à langer, il dit «da-da».

La table à langer était dans une maison centenaire chauffée au poêle à bois dans un village rural de la vallée de l’Ottawa où ma femme et moi avons limité le temps passé devant l’écran de nos enfants et mis l’accent sur le jeu en plein air et imaginatif. En tant que créateurs indépendants - moi écrivain, ma femme peintre -, nous avons encouragé notre fils, puis notre fille Francesca, 18 mois plus tard, à découvrir leur propre chemin d'expression. (Son premier mot était "Non".)

Étant donné cette enfance bucolique et libre, il est d'autant plus surprenant que Max soit maintenant un étudiant en ingénierie spécialisé en intelligence artificielle (IA), appartenant à une génération qui enseigne ardemment les machines à communiquer. Elles créent les algorithmes et les logiciels pour que les ordinateurs apprennent une langue, et avec chaque message Hey Siri et Gmail, nous aidons tous cette progéniture à apprendre à communiquer comme nous.

Cela fait partie d'une révolution des communications qui peut dépasser l'impact de la presse à imprimer: la création de machines intelligentes. Comme avec Internet, cette nouvelle façon de créer et de partager des connaissances aura des effets personnels et sociaux profonds et non voulus.

Celles-ci incluent la possibilité à la fois fascinante et profondément troublante que le garçon à qui j'ai enseigné de parler et de lire aidera à créer une technologie d'intelligence artificielle susceptible de réduire considérablement, voire d'éviter, le besoin d'écrivains comme moi.

En effet, la fabrication d’ordinateurs capables d’écrire comme les humains est au cœur même de l’intelligence artificielle. L’année prochaine, nous célébrerons le 70e anniversaire du document phare de Alan Turing, Computing Machinery and Intelligence, scientifique et spécialiste de l’intelligence artificielle, publié en 1950 dans le journal de philosophie britannique Mind et probablement connu du film Jeu d'imitation.

Turing a fait valoir qu’il n’était pas utile de poser la question «Les ordinateurs peuvent-ils penser?», Mais que le test ultime d’un ordinateur intelligent serait sa capacité à communiquer d’une manière indiscernable de celle d’un humain. Ainsi, il a proposé le jeu d'imitation. Imaginez que vous discutiez en ligne avec deux autres personnes, A et B, l'une étant une autre personne, l'autre un système d'IA. Le système d’intelligence artificielle remporte la partie et est «intelligent» si vous ne pouvez pas distinguer la communication écrite de l’humain de celle de l’intelligence artificielle.

Turing a conçu le jeu d'imitation comme un test en lecture / écriture uniquement, afin que la voix ne soit pas biaisée par l'évaluateur. Aujourd'hui, nous commandons avec joie Siri et Alexa; S'il avait su, Turing n'aurait peut-être pas pensé que cette distinction était nécessaire. Néanmoins, le test de Turing consiste réellement à déterminer si un ordinateur peut écrire de manière convaincante en tant qu’être humain.

À compter de cet été, la réponse est déjà oui - du moins si cela imite un rédacteur publicitaire en ligne - et probablement oui, pour de nombreux textes plus complexes.

En août, JPMorgan Chase, la plus grande banque américaine, a annoncé qu’elle avait utilisé le système d’intelligence artificielle de la société new-yorkaise Persado pour rédiger des annonces générant jusqu’à cinq fois le texte de réponse écrit par des rédacteurs humains. En d'autres termes, le texte de l'IA était plus attrayant et cliquable que celui créé par le talent humain.

La technologie de Persado «est incroyablement prometteuse. Il a réécrit la copie et les titres qu’un spécialiste du marketing, en se basant sur un jugement subjectif et sur son expérience, n’aurait probablement pas. Et ils ont travaillé », a déclaré Kristin Lemkau, directrice du marketing de JPMorgan, dans un communiqué, annonçant que la banque avait signé un contrat de cinq ans avec Persado pour les annonces publicitaires avec IA.

Les banques ne sont pas les premières à recevoir un article fait par IA. Si vous lisez un article en ligne sur l'évaluation des actions d'une entreprise ou une annonce en ligne de voitures d'occasion aux États-Unis, vous avez de bonnes chances de lire un texte rédigé par le logiciel d'IA breveté de Narrative Science, basé à Chicago (dont le slogan est: “Comment le futur s’écrit”).

Écrire «CONCERNANT VOTRE CARTE: 5% de remise en argent vous attend», comme l’a fait l’intelligence artificielle de Persado, n’est pas Shakespeare. Mais cette critique peu fruitée manque le changement sismique ici. Des gens sanglants ont lu les publicités de Persado AI et ont cliqué - une version fonctionnelle du jeu d'imitation a fonctionné, sans poser de questions.

La clé de tout type d’apprentissage automatique est un grand ensemble de données; le plus gros le meilleur.

L’intersection d’Internet et de vastes quantités de données vocales et textuelles en ligne signifie que les développeurs de logiciels de traitement du langage naturel (NLP) développent de plus en plus de contenus - en programmant des ordinateurs pour traiter et analyser de grandes quantités de données linguistiques. La PNL inclut de tout, des incroyables applications de transcription et de traduction basées sur l'IA d'aujourd'hui aux outils vocaux interactifs pratiques.

Le summum des systèmes de PNL sont ceux qui peuvent générer des textes cohérents et créatifs à partir de zéro. Le principal exemple est GPT-2, développé par OpenAI, un organisme à but non lucratif basé à San Francisco, sur un superordinateur formé pendant plusieurs mois sur un ensemble de données de huit millions de pages Web contenant 40 gigaoctets de texte. GPT-2, qui a fait ses débuts en février, était seulement formé pour prédire intelligemment le mot suivant étant donné quels mots étaient utilisés avant. La formation, qui impliquait 1,5 milliard de paramètres ou de règles, a toutefois révélé que le système peut produire des paragraphes entiers de texte narratif cohérent - une avancée considérable en termes de qualité des générateurs d’histoires aléatoires en ligne que certains auraient pu essayer.

GPT-2, par exemple, a été incité à utiliser ces phrases écrites par l'homme lors d'une expérience plus tôt cette année: «Dans une découverte choquante, un scientifique [sic] a découvert un troupeau de licornes vivant dans une vallée reculée, jusque-là inexplorée, dans les Andes. . Encore plus surprenant pour les chercheurs était le fait que les licornes parlaient un anglais parfait. ”

Après 10 essais, le système linguistique de l'IA a continué avec un article de journal : « Le scientifique a nommé la population, d'après son cor distinctif, Ovid’s Unicorn. Ces licornes blanches à quatre cornes étaient auparavant inconnues de la science. Maintenant, après presque deux siècles, le mystère de ce qui a provoqué cet étrange phénomène est enfin résolu. »

Mettant de côté le contenu de Reddit qui rencontre Game of Thrones (note pour l’avenir: ce n’est pas la faute de l’intelligence artificielle), c’est un exploit remarquable. Et, comme l’ont noté ses concepteurs, «le modèle ressemble à un caméléon: il s’adapte au style et au contenu du texte de conditionnement.» Voulez-vous écrire (ou penser) comme Donald Trump ou Aristote? Entraînez le modèle sur les tweets du président américain ou de la poétique du philosophe.

En annonçant sa création, OpenAI a rendu publique une version considérablement réduite de GPT-2, citant «des inquiétudes quant à l'utilisation de ses modèles de langage volumineux pour générer un langage trompeur, biaisé ou abusif à grande échelle». Les créateurs ne souhaitaient pas. Leur bébé IA serait utilisé pour pomper de fausses nouvelles sans fin, mais ils voulaient donner à d'autres passionnés de PNL la possibilité de tester leur système.

En mai, Adam King, ingénieur canadien en apprentissage automatique, s'en est servi pour développer TalktoTransformer, un site en ligne permettant aux utilisateurs de faire l'expérience de cette intelligence artificielle linguistique ultramoderne, mise à jour en août avec la dernière version, plus grande.

Des systèmes de PNL similaires ne font que s'améliorer, des milliards d'entre nous les aidant activement à apprendre. Par exemple, les fonctionnalités Smart Reply et Smart Compose de Gmail, ajoutées en 2018, sont des systèmes d’apprentissage automatique qui, lorsqu'elles sont activées dans le compte d’un utilisateur, apprennent activement à prédire et à imiter sa langue. C’est comme si un enfant en bas âge finissait l’une de vos phrases et que vous les corrigez s’ils suggèrent un mot incorrect. En conséquence, le système d’intelligence artificielle de Gmail devient plus intelligent avec chaque courrier électronique écrit.

En effet, c’est grâce à cette écriture et à cet apprentissage collaboratifs (pensez: logiciel de correction de la grammaire très prisé) que les ingénieurs en PNL se voient eux-mêmes améliorer l’écriture d’une machine - sans parler de la nôtre.

L'année dernière, une équipe de chercheurs en PNL de l'école d'informatique et d'ingénierie informatique Paul G. Allen de l'Université de Washington a présenté son rapport sur le développement et la mise à l'essai d'un nouveau cadre intégré pour améliorer notre écriture créative en formant un système environ 400 millions de mots de 390 romans d’aventure. Il a été mis à l’essai dans le cadre d’une expérience dans laquelle des participants humains ont été chargés d’écrire une histoire de 10 phrases basée sur un dessin animé sans légende et à panneau unique tiré du concours de légende de fin de page du New Yorker. Un groupe de neuf participants a écrit l'histoire par eux-mêmes. Un autre groupe de neuf personnes a écrit avec la machine en attente de l'IA: l'homme a écrit une phrase et la machine a suggéré la suivante, avec la capacité de conserver, de rejeter ou de modifier la phrase générée par l'IA.

La découverte la plus intriguante à mes yeux est que les lecteurs ont demandé d’évaluer la créativité des histoires, sans aucune connaissance des écrivains, et ont jugé les textes écrits en solo et ceux co-écrits par une machine tout aussi créatifs. Ceci, bien que les auteurs eux-mêmes aient jugé les textes réservés aux humains comme plus créatifs.

Cette conclusion fait écho à l’argument du jeu d’imitation de Turing: nous avons tous une idée différente de ce qui constitue l’intelligence et, dans ce cas, une bonne écriture créative (c’est-à-dire que je déteste un livre, vous l’aimez). La vraie question est donc de savoir si un système linguistique d'IA peut produire une communication qui se situe dans le champ de l'expérience humaine.

Comme le dit turing avec adresse, la capacité des ordinateurs à interagir avec nous va au cœur de ce que nous pensons être l’être humain sur le plan philosophique. Nous sommes des animaux fictifs et, pour beaucoup d’entre nous, nous croyons au double sens de nous-mêmes: notre esprit, notre nature narrative sont animés par des propriétés non physiques: une âme, un esprit ou une conscience. Mais, à l'instar des systèmes d'IA, nous sommes câblés pour le langage et l'histoire, et nous devons l'apprendre. Nous regardons, écoutons, essayons, échouons, ajustons et essayons à nouveau. Nous nous améliorons. Nous avons des réseaux de neurones; Les systèmes d'IA, y compris GPT-2, reposent souvent sur des systèmes de calcul appelés réseaux neuronaux. Au fur et à mesure que les machines apprennent à communiquer, nous voyons une plus grande possibilité que des esprits d’histoire comme le nôtre soient créés artificiellement.

Déjà, la ligne de démarcation entre machine et homme est en train de se confondre. En annonçant le contrat avec Persado, JPMorgan a déclaré que «l'apprentissage par la machine est la voie vers plus d'humanité dans le marketing». Mon interprétation généreuse de cette affirmation est que l'utilisation de l'apprentissage par la machine permet aux spécialistes du marketing de mieux comprendre ce que veulent les clients potentiels. Je suis plus enclin à imaginer que cette ligne a été écrite par l’intelligence artificielle de Persado.

Et il existe un puissant élan économique, scientifique et stratégique qui motive le développement rapide des technologies de la PNL. Par exemple, l’expérience d’écriture créative avec un cadre integré a été financée par le programme «Communiquer avec des ordinateurs» de l’Agence de projets de recherche avancée de la Défense des États-Unis - les mêmes personnes qui ont contribué à nous amener à Internet. Nous sommes maintenant dans une phase de commercialisation rapide de la recherche en PNL, en particulier avec une pléthore de robots conversationnels de commerce électronique.

Turing’s était un article théorique dans Mind. Aujourd'hui, le jeu d'imitation a toutes les exigences techniques pour le concrétiser: de la puissance informatique et des algorithmes PNL à d'énormes ensembles de données numériques.

Comme pour marquer le prochain anniversaire du journal Imitation Game, ce mois-ci, des chercheurs de l’Institut Allen pour l’Intelligence Artificielle, basé à Seattle, ont annoncé qu’ils avaient atteint un jalon en compréhension et en logique de la langue de l’IA. Leur système d'intelligence artificielle Aristo, qui «apprend, lit et raisonne sur la science», a répondu correctement à plus de 80% des questions posées dans un véritable examen de sciences à choix multiples de 12e année utilisé par des étudiants new-yorkais. programmes de sciences universitaires.

C’est un motif de pause pour ceux d’entre nous qui ont grandi lorsque vous avez parlé au téléphone plutôt qu’au smartphone: pour une génération de natifs numériques, l’IA n’est pas l’avenir. C’est une course dans le présent.

Aujourd’hui, Max co-dirige QMIND, un groupe indépendant composé de plus de 100 étudiants de l’Université Queen’s à Kingston, qui aide les entreprises et les chercheurs universitaires à développer des solutions basées sur l’IA. Pour ces jeunes développeurs d’IA, le présent n’est pas un avantage radical, mais un début; c’est un nouveau champ de possibilités infinies.

C’est le même sentiment d’expansion que les nouveaux parents, la crainte de voir nos enfants grandir. Mon fils a adoré quand je lui ai lu le livre du Dr. Seuss, The Sneetches. Une fois au lit, avant d’avoir appris à lire, il a commencé à réciter l’histoire à voix haute avec moi. Une fois encore, je le regardai avec surprise. il avait mémorisé le livre en entier. À ce moment-là, j’ai appris que l’acquisition du langage est beaucoup plus complexe que je ne l’avais imaginé. C'est un phénomène émergent, sans frontières binaires entre capable et non capable.

Enraciné dans notre nature humaine fondamentale et notre intelligence, le langage est un outil remarquablement puissant. En tant que citoyens, nous devons prêter attention au développement des technologies de la PNL; de nombreux problèmes éthiques, juridiques et politiques devront être résolus. Faut-il exiger que nous sachions si nous discutons en ligne avec un bot de commerce électronique d’IA, par exemple, plutôt qu’avec une personne? Les mêmes règles devraient-elles s’appliquer s’il s’agit d’une AI médical ou psychologique? À quel moment le fabricant d’un système de traitement non automatique obtient-il des crédits et des redevances pour les textes co-écrits? Comment réagissons-nous lorsqu'un PNL peut produire un essai de 12e année sur Hamlet, peut-être même avec un choix de syntaxe de Terre-Neuve ou de Texan? Quelles sont les conséquences sociales des conteurs d'IA au coucher? Comment nous reverrons-nous dans les textes écrits par les PNL?

Indépendamment du moment où un système de traitement automatique de la langue écrit un devoir en anglais pour le secondaire A +, ou du moment où nous lirons en version illisible - dans deux ou dix ou vingt ans? - Je suis encore frappé par notre expérience d'adulte de la façon dont les enfants apprennent à communiquer. Le passage du commentaire nouveau-né à un commentaire verbal non-stop d’un enfant de trois ans est un processus essentiellement transparent. En tant que jeunes parents, nous sommes pris au dépourvu lorsque, tout à coup, nous nous disputons avec un enfant articulé et têtu. Nous voulons désespérément que nos enfants, qu’ils soient humains ou non, grandissent et réussissent. Pourtant, quand ils le font, nous nous trouvons stupéfaits par un monde de notre propre création auquel nous devons nous adapter.

Haut de page