asd

La pollinisation croisée entre la recherche en neurosciences, en psychologie et en IA donne une compréhension fondamentale de la pensée

Les progrès de l’intelligence artificielle ont permis la création d’IA qui effectuent des tâches que l’on croyait uniquement possibles pour les humains, telles que traduire des langues , conduire des voitures , jouer à des jeux de société au niveau des champions du monde et extraire la structure des protéines . Cependant, chacune de ces IA a été conçue et formée de manière exhaustive pour une seule tâche et a la capacité d’apprendre uniquement ce qui est nécessaire pour cette tâche spécifique.

Les IA récentes qui produisent des textes fluides , y compris lors de conversations avec des humains, et génèrent des œuvres d’art impressionnantes et uniques peuvent donner la fausse impression d’un esprit au travail . Mais même ces systèmes sont spécialisés qui exécutent des tâches étroitement définies et nécessitent des quantités massives de formation.

Il reste toujours un défi de taille de combiner plusieurs IA en une seule capable d’apprendre et d’effectuer de nombreuses tâches différentes, et encore moins de poursuivre l’ensemble des tâches effectuées par les humains ou de tirer parti de la gamme d’expériences disponibles pour les humains qui réduisent la quantité de données autrement nécessaires pour apprendre à effectuer ces tâches. Les meilleures IA actuelles à cet égard, telles que AlphaZero et Gato , peuvent gérer une variété de tâches qui correspondent à un seul moule, comme le jeu. L’intelligence artificielle générale (IAG) capable d’accomplir un large éventail de tâches reste insaisissable.

En fin de compte, les AGI doivent être capables d’ interagir efficacement les uns avec les autres et avec les personnes dans divers environnements physiques et contextes sociaux, intégrer les grandes variétés de compétences et de connaissances nécessaires pour le faire, et apprendre de manière flexible et efficace de ces interactions.

Construire des AGI revient à construire des esprits artificiels, bien que considérablement simplifiés par rapport aux esprits humains. Et pour construire un esprit artificiel, vous devez commencer par un modèle de cognition.

De l’humain à l’Intelligence Générale Artificielle

Les humains ont un ensemble presque illimité de compétences et de connaissances, et apprennent rapidement de nouvelles informations sans avoir besoin d’être repensés pour le faire. Il est concevable qu’un IGA puisse être construit en utilisant une approche fondamentalement différente de l’intelligence humaine. Cependant, en tant que trois chercheurs de longue date en IA et en sciences cognitives , notre approche consiste à puiser notre inspiration et nos connaissances dans la structure de l’esprit humain. Nous travaillons vers IGA en essayant de mieux comprendre l’esprit humain, et mieux comprendre l’esprit humain en travaillant vers IGA.

De la recherche en neurosciences, en sciences cognitives et en psychologie, nous savons que le cerveau humain n’est ni un énorme ensemble homogène de neurones ni un ensemble massif de programmes spécifiques à une tâche qui résolvent chacun un seul problème. Au lieu de cela, il s’agit d’un ensemble de régions aux propriétés différentes qui soutiennent les capacités cognitives de base qui forment ensemble l’esprit humain.

Ces capacités incluent la perception et l’action ; mémoire à court terme pour ce qui est pertinent dans la situation actuelle ; des souvenirs à long terme pour les compétences, l’expérience et les connaissances ; raisonnement et prise de décision; émotion et motivation; et acquérir de nouvelles compétences et connaissances à partir de l’éventail complet de ce qu’une personne perçoit et expérimente.

Au lieu de se concentrer sur des capacités spécifiques de manière isolée, le pionnier de l’IA Allen Newell a suggéré en 1990 de développer des théories unifiées de la cognition qui intègrent tous les aspects de la pensée humaine. Les chercheurs ont pu construire des logiciels appelés architectures cognitives qui incarnent de telles théories, permettant de les tester et de les affiner.

Les architectures cognitives sont ancrées dans de multiples domaines scientifiques avec des perspectives distinctes. Les neurosciences se concentrent sur l’organisation du cerveau humain, la psychologie cognitive sur le comportement humain dans des expériences contrôlées et l’intelligence artificielle sur les capacités utiles.

Le modèle commun de cognition

Nous avons participé au développement de trois architectures cognitives : ACT-R , Soar et Sigma . D’autres chercheurs se sont également occupés d’approches alternatives. Un article a identifié près de 50 architectures cognitives actives . Cette prolifération d’architectures est en partie un reflet direct des multiples perspectives impliquées, et en partie une exploration d’un large éventail de solutions potentielles. Pourtant, quelle qu’en soit la cause, cela soulève des questions délicates à la fois scientifiquement et en ce qui concerne la recherche d’une voie cohérente vers l’IAG.

Heureusement, cette prolifération a amené le domaine à un point d’inflexion majeur. Nous avons tous les trois identifié une convergence frappante entre les architectures, reflétant une combinaison d’études neurales, comportementales et informatiques. En réponse, nous avons lancé un effort à l’échelle de la communauté pour capturer cette convergence d’une manière semblable au modèle standard de la physique des particules qui a émergé dans la seconde moitié du 20e siècle.

Ce modèle commun de cognition divise la pensée humaine en plusieurs modules, avec un module de mémoire à court terme au centre du modèle. Les autres modules – perception, action, compétences et connaissances – interagissent à travers lui.

L’apprentissage, plutôt que de se produire intentionnellement, se produit automatiquement comme un effet secondaire du traitement. En d’autres termes, vous ne décidez pas de ce qui est stocké dans la mémoire à long terme. Au lieu de cela, l’architecture détermine ce qui est appris en fonction de tout ce à quoi vous pensez. Cela peut vous permettre d’apprendre de nouveaux faits auxquels vous êtes exposé ou de nouvelles compétences que vous essayez. Cela peut également apporter des améliorations aux faits et compétences existants.

Les modules eux-mêmes fonctionnent en parallèle ; par exemple, vous permettant de vous souvenir de quelque chose tout en écoutant et en regardant autour de vous. Les calculs de chaque module sont massivement parallèles, ce qui signifie que de nombreuses petites étapes de calcul se produisent en même temps. Par exemple, en récupérant un fait pertinent à partir d’une vaste mine d’expériences antérieures, le module de mémoire à long terme peut déterminer la pertinence de tous les faits connus simultanément, en une seule étape.

Ouvrir la voie à l’Intelligence Générale Artificielle

Le modèle commun est basé sur le consensus actuel dans la recherche sur les architectures cognitives et a le potentiel de guider la recherche sur l’intelligence générale naturelle et artificielle. Lorsqu’il est utilisé pour modéliser les schémas de communication dans le cerveau, le modèle commun donne des résultats plus précis que les principaux modèles des neurosciences. Cela étend sa capacité à modéliser les humains – le seul système prouvé capable d’intelligence générale – au-delà des considérations cognitives pour inclure l’organisation du cerveau lui-même.

Nous commençons à voir des efforts pour relier les architectures cognitives existantes au modèle commun et pour l’utiliser comme référence pour de nouveaux travaux – par exemple, une IA interactive conçue pour guider les gens vers un meilleur comportement de santé. L’un de nous a participé au développement d’une IA basée sur Soar, baptisée Rosie , qui apprend de nouvelles tâches via des instructions en anglais données par des enseignants humains. Il apprend 60 puzzles et jeux différents et peut transférer ce qu’il apprend d’un jeu à l’autre. Il apprend également à contrôler un robot mobile pour des tâches telles que la récupération et la livraison de colis et la patrouille de bâtiments.

Rosie n’est qu’un exemple de la façon de construire une IA qui approche l’AGI via une architecture cognitive bien caractérisée par le modèle commun. Dans ce cas, l’IA acquiert automatiquement de nouvelles compétences et connaissances lors d’un raisonnement général qui combine l’enseignement du langage naturel par des humains et un minimum d’expérience – en d’autres termes, une IA qui fonctionne plus comme un esprit humain que les IA d’aujourd’hui, qui apprennent par brute. puissance de calcul et des quantités massives de données.

Dans une perspective IGA plus large, nous considérons le modèle commun à la fois comme un guide dans le développement de telles architectures et IA, et comme un moyen d’intégrer les idées dérivées de ces tentatives dans un consensus qui mène finalement à l’AGI.

John E. Laird

John L. Tishman Professeur d’ingénierie, Université du Michigan

Articles Similaires

- Advertisement -

A La Une