« Les machines peuvent-elles penser ? », demandait il y a près de 70 ans le célèbre mathématicien, décrypteur et informaticien Alan Turing . Aujourd’hui, certains experts ne doutent pas que l’intelligence artificielle (IA) sera bientôt en mesure de développer le type d’ intelligence générale dont disposent les humains. Mais d’autres soutiennent que les machines ne seront jamais à la hauteur. Bien que l’IA puisse déjà surpasser les humains sur certaines tâches – tout comme les calculatrices – on ne peut pas leur enseigner la créativité humaine.
Après tout, notre ingéniosité, qui est parfois motivée par la passion et l’intuition plutôt que par la logique et les preuves, nous a permis de faire des découvertes spectaculaires – allant des vaccins aux particules fondamentales. Une IA ne pourra sûrement jamais rivaliser ? Eh bien, il s’avère qu’ils pourraient. Un article récemment publié dans Nature rapporte qu’une IA a maintenant réussi à prédire les futures découvertes scientifiques en extrayant simplement des données significatives des publications de recherche.
Le langage a un lien profond avec la pensée, et il a façonné les sociétés humaines, les relations et, finalement, l’intelligence. Par conséquent, il n’est pas surprenant que le Saint Graal de la recherche en IA soit la pleine compréhension du langage humain dans toutes ses nuances. Le traitement du langage naturel (NLP), qui fait partie d’un ensemble beaucoup plus vaste appelé apprentissage automatique, vise à évaluer, extraire et évaluer des informations à partir de données textuelles.
Les enfants apprennent en interagissant avec le monde environnant par essais et erreurs. Apprendre à faire du vélo implique souvent quelques bosses et chutes. En d’autres termes, nous faisons des erreurs et nous en apprenons. C’est précisément ainsi que fonctionne l’apprentissage automatique , parfois avec quelques apports « pédagogiques » supplémentaires (apprentissage automatique supervisé).
Par exemple, une IA peut apprendre à reconnaître des objets dans des images en créant une image d’un objet à partir de nombreux exemples individuels. Ici, un humain doit lui montrer des images contenant ou non l’objet. L’ordinateur fait ensuite une supposition pour savoir si c’est le cas et ajuste son modèle statistique en fonction de la précision de la supposition, telle qu’elle est jugée par l’humain. Cependant, nous pouvons également laisser le programme informatique faire tout l’apprentissage pertinent par lui-même (apprentissage automatique non supervisé). Ici, l’IA commence automatiquement à être capable de détecter des modèles dans les données. Dans les deux cas, un programme informatique doit trouver une solution en évaluant à quel point elle est erronée, puis essayer de l’ajuster pour minimiser cette erreur.
Supposons que nous voulions comprendre certaines propriétés liées à un matériau spécifique. L’étape évidente consiste à rechercher des informations dans des livres, des pages Web et toute autre ressource appropriée. Cependant, cela prend du temps, car cela peut impliquer des heures de recherche sur le Web, de lecture d’articles et de littérature spécialisée. La PNL peut cependant nous aider. Grâce à des méthodes et des techniques sophistiquées, les programmes informatiques peuvent identifier des concepts, des relations mutuelles, des sujets généraux et des propriétés spécifiques à partir de grands ensembles de données textuelles.
Dans la nouvelle étude, une IA a appris à récupérer des informations dans la littérature scientifique via un apprentissage non supervisé. Cela a des implications remarquables. Jusqu’à présent, la plupart des méthodes automatisées existantes basées sur la PNL sont supervisées, nécessitant la contribution de l’homme. Bien qu’il s’agisse d’une amélioration par rapport à une approche purement manuelle, il s’agit toujours d’un travail à forte intensité de main-d’œuvre.
Cependant, dans la nouvelle étude, les chercheurs ont créé un système capable d’identifier et d’extraire avec précision des informations de manière indépendante. Il a utilisé des techniques sophistiquées basées sur les propriétés statistiques et géométriques des données pour identifier les noms chimiques, les concepts et les structures. Ceci était basé sur environ 1,5 million de résumés d’articles scientifiques sur la science des matériaux.
Un programme d’apprentissage automatique a ensuite classé les mots dans les données en fonction de caractéristiques spécifiques telles que les « éléments », les « énergétiques » et les « liants ». Par exemple, la « chaleur » a été classée comme faisant partie de « l’énergie » et le « gaz » comme des « éléments ». Cela a permis de connecter certains composés avec des types de magnétisme et de similitude avec d’autres matériaux, entre autres, donnant un aperçu de la façon dont les mots étaient connectés sans intervention humaine requise.
Découvertes scientifiques
Cette méthode pourrait capturer des relations complexes et identifier différentes couches d’informations, ce qui serait pratiquement impossible à réaliser par des humains. Il a fourni des informations bien à l’avance par rapport à ce que les scientifiques peuvent prédire pour le moment. En fait, l’IA pourrait recommander des matériaux pour des applications fonctionnelles plusieurs années avant leur découverte effective. Il y avait cinq prédictions de ce type, toutes basées sur des articles publiés avant l’année 2009. Par exemple, l’IA a réussi à identifier une substance connue sous le nom de CsAgGa2Se4as en tant que matériau thermoélectrique , que les scientifiques n’ont découvert qu’en 2012. Donc, si l’IA avait existé en 2009 , cela aurait pu accélérer la découverte.
Il a fait la prédiction en reliant le composé à des mots tels que « chalcogénure » (matériau contenant des « éléments chalcogènes » tels que le soufre ou le sélénium), « optoélectronique » (dispositifs électroniques qui génèrent, détectent et contrôlent la lumière) et « applications photovoltaïques ». De nombreux matériaux thermoélectriques partagent de telles propriétés, et l’IA n’a pas tardé à le montrer.
Cela suggère que les connaissances latentes concernant les découvertes futures sont dans une large mesure intégrées dans les publications passées. Les systèmes d’IA deviennent de plus en plus indépendants. Et il n’y a rien à craindre. Ils peuvent nous aider énormément à naviguer dans l’énorme quantité de données et d’informations créées en permanence par les activités humaines. Malgré les préoccupations liées à la vie privée et à la sécurité, l’IA change nos sociétés. Je crois que cela nous amènera à prendre de meilleures décisions, à améliorer notre vie quotidienne et finalement à nous rendre plus intelligents.
Marcello Trovati
Lecteur en informatique, Edge Hill University