Contactez-nous
Aucun résultat trouvé.

Scientifique en IA : automatiser l'avenir de la découverte scientifique

Sıla Ermut
Sıla Ermut
mis à jour le Avr 28, 2026
Consultez notre normes éthiques

Les chercheurs en intelligence artificielle franchissent une étape majeure vers la découverte scientifique entièrement automatisée, avec pour objectif de mener à bien l'intégralité du processus de recherche de manière autonome. Contrairement aux outils traditionnels, ces laboratoires automatisés peuvent accélérer les processus de recherche en générant des hypothèses, en concevant et en réalisant des expériences, en interprétant les résultats et en communiquant les conclusions.

En combinant de grands modèles de langage, l'apprentissage automatique et la robotique, un chercheur en IA peut affiner itérativement sa compréhension par l'expérimentation.

Découvrez les 6 principaux outils et cadres de recherche en IA, ainsi que les processus scientifiques qui leur permettraient de faire le lien entre l'informatique et les sciences naturelles.

Les 6 meilleures entreprises/cadres de recherche en IA

Outil / Cadre
Description
Cas d'utilisation
Catégorie
Laboratoires périodiques
Forme des scientifiques en intelligence artificielle capables de gérer des laboratoires autonomes en physique, chimie et science des matériaux.
Découverte de matériaux, conception de semi-conducteurs, automatisation expérimentale.
Plateforme de sciences physiques pilotée par l'IA
Claude pour les sciences de la vie
Modèles de langage avancés dotés d'outils scientifiques pour soutenir la recherche biomédicale et en sciences de la vie de bout en bout.
Analyse de la littérature, bioinformatique, conception expérimentale, documentation réglementaire et conformité clinique.
système de recherche en sciences de la vie augmenté par l'IA
Pomme de terre
Système d'exploitation scientifique permettant la recherche pilotée par l'IA, de l'hypothèse à l'expérimentation, grâce à l'utilisation d'agents d'IA et à l'automatisation.
Prédiction de la résistance aux médicaments, ingénierie des protéines, expériences de biologie automatisées.
Système de recherche complet en IA
Lila Sciences
Crée des usines scientifiques d'IA combinant robotique et modèles fondamentaux pour les sciences de la vie et la recherche sur les matériaux.
Thérapie protéique, découverte de catalyseurs et de matériaux, systèmes énergétiques.
plateforme de superintelligence scientifique
AstroAgents
Intelligence artificielle multi-agents pour l'analyse des données de spectrométrie de masse en astrobiologie.
Détection des schémas biotiques, formulation d'hypothèses, intégration de la littérature.
Système d'analyse de données multi-agents
Le scientifique en IA
Cadre de travail complet pour les scientifiques en IA automatisant la génération d'hypothèses, les expériences et la rédaction d'articles.
Automatisation complète du cycle de recherche, génération de manuscrits, évaluation comparative des systèmes.
Système complet de scientifiques IA

Laboratoires périodiques

Periodic Labs vise à développer des systèmes capables de mener des recherches indépendantes, d'affiner des idées de manière itérative et de contribuer à la communauté scientifique en générant de nouvelles connaissances. Son objectif à long terme est de permettre une découverte scientifique entièrement automatisée, où des agents d'IA peuvent proposer des hypothèses, concevoir et réaliser des expériences, interpréter les résultats et rédiger des articles scientifiques avec une supervision humaine minimale.

Le concept central est de fusionner l'intelligence artificielle et l'expérimentation en conditions réelles. Au lieu de s'appuyer uniquement sur les données textuelles à grande échelle d'Internet, qui sont limitées et déjà largement utilisées par les modèles de pointe, Periodic Labs privilégie la création de laboratoires autonomes qui génèrent des données expérimentales originales et de haute qualité. Ces laboratoires servent d'environnements de travail pour les chercheurs en IA, leur permettant de tester leurs hypothèses et d'apprendre directement de la nature.

Domaines de recherche des laboratoires périodiques

Periodic Labs privilégie les sciences physiques comme point de départ. Ce domaine a été choisi car les expériences physiques offrent des signaux de haute qualité, des capacités de modélisation fiables et des critères de vérification clairs. Leurs principaux axes de recherche sont les suivants :

  • Science des matériaux : Développement et découverte de supraconducteurs fonctionnant à des températures plus élevées, susceptibles d’améliorer les systèmes de transport et de réduire les pertes d’énergie dans les réseaux électriques.
  • Recherche sur les semi-conducteurs : Collaborer avec des partenaires industriels pour relever des défis tels que la dissipation de chaleur dans les puces en entraînant des agents d’IA à interpréter et à optimiser les données expérimentales.
  • Physique et chimie : Utilisation d’outils de recherche en IA pour concevoir et synthétiser de nouveaux matériaux, automatiser la génération d’hypothèses et améliorer l’exploration basée sur la simulation.

Ces initiatives visent à accélérer la recherche scientifique en intégrant des spécialistes de l'IA dans des domaines où les progrès ont traditionnellement nécessité d'importantes expérimentations manuelles. Ce faisant, Periodic Labs cherche à réduire le délai entre l'émergence d'idées et la publication d'articles de recherche acceptés pour une présentation lors d'une conférence sur l'apprentissage automatique ou pour une publication dans une revue scientifique.

Vision plus large et considérations éthiques

L’ambition plus large de Periodic Labs est de généraliser la découverte scientifique automatisée à travers différentes disciplines de l’informatique, des sciences naturelles et de l’ingénierie. Leur vision comprend :

  • Conception de systèmes qui développent des algorithmes pour le raisonnement autonome et la conception d'expériences.
  • Soutenir les chercheurs dans le développement d'agents capables de relever les grands défis scientifiques.
  • Créer des systèmes complets qui intègrent la collecte, le raisonnement et la publication des données dans un cadre scientifique unifié.

Ils soulignent également l'importance des considérations éthiques dans le déploiement de systèmes d'IA autonomes, en veillant à la transparence, à la responsabilité et à la collaboration avec les scientifiques humains.

Claude pour les sciences de la vie

Claude for Life Sciences est une initiative développée par Anthropic pour accélérer la recherche et l'innovation dans les secteurs biomédicaux et des sciences de la vie.

La plateforme intègre une intelligence artificielle avancée au processus scientifique, prenant en charge des activités allant de la formulation d'hypothèses et de la conception d'expériences à l'analyse des données, la conformité réglementaire et la préparation des publications.

La mission plus large de Anthropic est d'accélérer le progrès scientifique mondial en développant des systèmes d'IA qui collaborent avec des chercheurs humains et qui, au fil du temps, atteignent un certain degré d'autonomie dans la conduite de la découverte scientifique.

Vision et objectifs scientifiques

Alors que les versions précédentes de Claude étaient principalement utilisées pour des tâches ponctuelles telles que l'écriture de code analytique, la synthèse de la littérature scientifique ou la rédaction de rapports, le cadre actuel permet une participation complète à l'ensemble du cycle de vie de la recherche. Cela inclut la découverte précoce, la translation clinique et la commercialisation des résultats scientifiques.

Le système Anthropic positionne Claude comme un collaborateur de recherche intelligent, capable d'interpréter des données scientifiques, d'intégrer des informations provenant de sources multiples et de générer des idées contribuant directement au progrès expérimental. Il est conçu pour aider les laboratoires, les entreprises pharmaceutiques et les établissements d'enseignement supérieur en améliorant l'efficacité, la reproductibilité et la qualité des résultats de recherche.

Fonctionnalités principales et performances du modèle

Les modèles Anthropic démontrent des gains substantiels en matière de raisonnement scientifique, de compréhension et d'interprétation des protocoles, comme en témoignent plusieurs résultats de référence .

Intégration avec les outils scientifiques et d'entreprise

Claude for Life Sciences inclut une suite étendue de connecteurs logiciels qui permettent une interaction directe avec les bases de données scientifiques, les systèmes de gestion de données et les plateformes de recherche collaborative.

Ces intégrations permettent aux chercheurs d'interroger des données, de visualiser les résultats et de relier leurs observations à des sources expérimentales vérifiées.

Les principales intégrations comprennent les suivantes :

  • Benchling : Permet d'accéder aux cahiers de laboratoire, aux données expérimentales et aux systèmes de documentation.
  • BioRender : Permet la création de figures, de diagrammes et de résumés graphiques scientifiquement précis.
  • PubMed et Scholar Gateway de Wiley : offrent un accès à des millions de publications biomédicales évaluées par des pairs pour la citation, le résumé et la synthèse des preuves.
  • Synapse.org : Facilite le partage de données, le contrôle des versions et la collaboration entre les équipes de recherche distribuées.
  • 10x Genomics : Permet l'analyse de données transcriptomiques unicellulaires et spatiales grâce à une interaction en langage naturel.

compétences des agents et automatisation de la recherche

Anthropic a introduit Agent Skills , un cadre permettant à Claude d'effectuer des tâches scientifiques de manière autonome. Chaque compétence est un ensemble structuré contenant des instructions, des scripts et des ressources qui guident le modèle à travers des processus de recherche spécifiques.

Un exemple notable est la compétence single-cell-rna-qc , qui effectue le contrôle qualité et le filtrage des données de séquençage d'ARN de cellules uniques selon les meilleures pratiques de scverse. Les chercheurs peuvent également concevoir des compétences personnalisées qui définissent les procédures de leur laboratoire, permettant ainsi à Claude d'automatiser le traitement des données, l'analyse statistique et les étapes de validation expérimentale.

Applications dans les sciences de la vie

Claude for Life Sciences prend en charge un large éventail de cas d'utilisation dans les domaines de la recherche, de la clinique et de la réglementation.

  • Recherche scientifique et formulation d'hypothèses : Claude est capable de réaliser des revues de littérature exhaustives, d'identifier les études pertinentes, de synthétiser les résultats et de générer des hypothèses vérifiables à partir des données existantes.
  • Création et documentation des protocoles : grâce à son intégration avec Benchling, Claude aide à rédiger les protocoles d’étude, les procédures opérationnelles standard et les formulaires de consentement éclairé qui répondent aux normes réglementaires et éthiques.
  • Bioinformatique et analyse computationnelle : Claude traite et interprète de grands ensembles de données, notamment des données génomiques et protéomiques, et produit des résultats dans des formats adaptés aux rapports techniques, aux présentations de diapositives ou aux carnets de code.
  • Conformité réglementaire et clinique : le modèle aide à rédiger les dossiers réglementaires, à résumer les exigences de conformité et à compiler les documents justificatifs pour les audits ou les examens.
  • Anthropic fournit également une bibliothèque d'invites adaptée à la recherche scientifique, permettant aux utilisateurs d'obtenir des résultats cohérents et optimisés dans une gamme d'applications de recherche.

Regardez la vidéo ci-dessous pour voir comment Claude effectue l'analyse des données et la revue de la littérature, en tire des conclusions et les synthétise dans une présentation comportant une illustration BioRender.

Cette vidéo explique comment Claude permet aux chercheurs et aux cliniciens d'analyser des données génétiques complexes et de produire des hypothèses prêtes à être présentées en quelques heures, un processus qui prend habituellement des semaines.

Pomme de terre

Potato constitue un système complet qui prend en charge l'intégralité du processus de recherche, de la formulation d'hypothèses à l'exécution d'expériences et à l'interprétation des données. En intégrant l'intelligence artificielle, l'automatisation et la biologie computationnelle, Potato permet une découverte scientifique entièrement automatisée dans des domaines tels que les sciences de la vie, l'informatique et la bioinformatique.

La plateforme permet à des agents d'IA de mener des recherches de manière indépendante ou en collaboration avec des chercheurs. Ces agents peuvent effectuer des recherches bibliographiques, générer des idées, concevoir des flux de travail, analyser les résultats et préparer des articles en vue de leur évaluation par les pairs.

En minimisant le besoin d'une supervision manuelle intensive, Potato accélère le développement et la mise à l'épreuve de nouvelles idées de recherche par la communauté scientifique humaine, contribuant ainsi aux progrès vers le développement d'agents capables de mener des découvertes scientifiques significatives de manière autonome.

La technologie derrière la pomme de terre

Potato fonctionne comme un système d'exploitation scientifique pour les sciences de la vie. Il se connecte à des centaines d'outils qui rendent la recherche scientifique plus efficace et reproductible. Son infrastructure est conçue pour permettre aux agents d'IA de développer des idées de manière itérative, de planifier des expériences et d'interpréter les résultats de façon ouverte.

Les principaux composants technologiques comprennent :

  • Environnement spécialisé pour les agents : Potato fournit un environnement de recherche dédié qui équipe les agents d’IA des données, des outils et de la mémoire nécessaires pour effectuer des tâches de recherche telles que la recherche documentaire, la génération d’hypothèses et la réalisation d’expériences.
  • Environnement d'exécution parallèle : le système basé sur le cloud ajuste automatiquement les ressources de calcul et de GPU, permettant à l'IA d'exécuter simultanément des milliers d'expériences. Cette parallélisation prend en charge les tâches de modélisation complexes en apprentissage automatique et en traitement automatique du langage naturel .
  • Parcours de recherche ramifiés : les chercheurs peuvent explorer de multiples variantes expérimentales en un seul clic. Cette fonctionnalité de ramification favorise la découverte scientifique automatique, permettant l’exploration d’hypothèses et de méthodes alternatives.
  • Communication entre les outils : les outils de Potato communiquent directement entre eux, ce qui améliore l'efficacité et permet des flux de travail plus longs et ininterrompus.

Au cœur du système se trouve TATER (Technical AI for Theoretical & Experimental Research) , un co-chercheur IA multi-agents. TATER peut planifier et exécuter des expériences, analyser des données et traduire les intentions de recherche en scripts robotiques. Il constitue un cadre complet pour la découverte scientifique automatisée, combinant des modèles fondamentaux, la modélisation de la diffusion et les réseaux neuronaux afin de faire progresser la recherche en IA.

Cas d'utilisation 1 : Prédiction de la résistance de la protéase principale du SARS-CoV-2

Dans une application, des chercheurs ont utilisé Potato pour effectuer une analyse de séquences axée sur la prédiction des mutations de résistance virale.

  • Défi : Comprendre quelles variantes mononucléotidiques de la protéase principale du SARS-CoV-2 peuvent provoquer une résistance aux médicaments est un processus lent et coûteux qui nécessite généralement des semaines de travail informatique et de laboratoire.
  • Méthode : À l’aide d’une simple invite, les chercheurs ont demandé à TATER de calculer les scores évolutifs de toutes les variantes faux-sens possibles et d’identifier celles proches des sites de liaison des inhibiteurs.
  • Résultat:
    • Plus de 2 000 variantes possibles ont été générées et classées à l'aide de modèles de score évolutifs.
    • Chaque variante a été cartographiée sur plusieurs structures cristallines afin de déterminer sa proximité avec les poches de liaison aux médicaments.
    • Fourniture d'une liste priorisée des mutations susceptibles de modifier la sensibilité aux inhibiteurs.

Impact:

TATER a condensé en une seule session interactive le travail qui nécessitait habituellement une semaine de codage et d'analyse. En combinant données structurelles et modélisation évolutive, il a guidé les développeurs de médicaments vers les mutations prioritaires pour des tests complémentaires, accélérant ainsi la découverte scientifique d'antiviraux grâce à la recherche en intelligence artificielle appliquée à la santé .

Cas d'utilisation 2 : Concevoir une GFP plus lumineuse

Un deuxième exemple illustre comment Potato soutient l'ingénierie des protéines.

  • Défi : La conception de variantes de GFP (protéine fluorescente verte) plus lumineuses nécessite généralement une revue manuelle de la littérature, une planification des mutations et une mise en place expérimentale, autant d'étapes qui prennent beaucoup de temps.
  • Démarche : Les chercheurs ont adressé à TATER une simple demande : « Je veux créer une GFP plus lumineuse. »
    • L'IA a effectué une recherche bibliographique pour identifier les mutations qui améliorent la luminosité.
    • Nous avons généré une structure GFP optimisée et conçu une bibliothèque de variantes fonctionnelles.
    • J'ai mis au point un protocole expérimental complet pour le clonage, l'expression et le criblage par fluorescence.

Figure 1 : Tater, le scientifique en IA de Potato, génère des plans de recherche et des revues de littérature. 1

  • Résultat:
    • J'ai constitué une bibliothèque de variantes comprenant des substitutions connues et nouvelles.
    • Des protocoles détaillés de normalisation et d'analyse des données ont été définis.
    • Fourniture de protocoles de laboratoire prêts à l'emploi avec modèles de documentation.

Impact:

TATER a transformé un processus qui prend habituellement des jours, voire des semaines, en quelques minutes. Il a fourni un flux de travail complet et reproductible, de l'idée à l'exécution expérimentale, illustrant comment les chercheurs en IA peuvent permettre la découverte scientifique automatisée et une créativité abordable.

En intégrant le raisonnement à travers la littérature et les données, Potato fait progresser la recherche scientifique, permettant aux agents d'IA et aux chercheurs de collaborer et de générer de nouvelles connaissances avec un minimum de frictions.

Lila Sciences

Lila Sciences est une société de recherche basée à Cambridge, dans le Massachusetts, qui développe un système de superintelligence scientifique. Sa mission est de créer une plateforme unifiée où chercheurs en intelligence artificielle et chercheurs humains collaborent au sein de laboratoires autonomes afin d'accélérer les découvertes scientifiques dans les domaines des sciences de la vie, de la chimie et des sciences des matériaux.

Leur objectif est de développer une infrastructure complète capable de gérer l'intégralité du processus de recherche : de la formulation d'hypothèses et la conception d'expériences à l'analyse des données et la rédaction d'articles. Lila désigne ces environnements comme des « usines scientifiques d'IA » (AISF) : des laboratoires physiques automatisés où des agents d'IA mènent des milliers d'expériences en parallèle, analysent les résultats et développent des idées de manière itérative avec une supervision manuelle minimale.

La technologie de Lila Sciences

Lila Sciences combine de vastes modèles de langage , des réseaux neuronaux et l'expérimentation robotique au sein de ce qu'elle appelle un système complet de découverte scientifique automatisée. L'architecture de ses « usines scientifiques d'IA » intègre le raisonnement, la simulation et l'expérimentation dans une boucle de rétroaction unifiée.

Les principales caractéristiques technologiques comprennent :

  • Boucles d'expérimentation pilotées par l'IA : les modèles de base de Lila utilisent l'apprentissage par renforcement et la modélisation de la diffusion pour proposer, exécuter et évaluer des expériences des milliers de fois plus rapidement que les approches traditionnelles.
  • Intégration du raisonnement et de la vérification : le système combine les prédictions informatiques avec la validation dans le monde réel, permettant aux procédures d’IA agentielle d’affiner leur compréhension des systèmes physiques et biologiques par l’expérimentation directe.
  • Capacité interdomaines : En reliant les sciences de la vie, les sciences des matériaux et la chimie, les modèles de pointe de Lila éliminent les barrières qui séparent généralement les disciplines, permettant à l’IA de générer des idées et de découvrir des corrélations entre les domaines scientifiques.
  • Apprentissage basé sur les données : chaque expérience génère des enregistrements numériques qui sont réinjectés dans le système afin d’améliorer les prédictions futures. Ce processus itératif réduit le besoin d’une supervision manuelle intensive, permettant ainsi à l’IA de s’améliorer en continu.

Ce cadre représente une première approche globale pour le développement d'algorithmes capables non seulement de prédire des résultats, mais aussi de les valider expérimentalement. Lila conçoit son chercheur en IA comme un partenaire capable de programmer , de contrôler le matériel de laboratoire et d'interpréter les résultats, transformant ainsi la méthode scientifique en un processus informatique évolutif.

Domaines de recherche scientifique de Lila

Lila se concentre sur plusieurs grands domaines de recherche scientifique où la recherche en IA et l'automatisation peuvent accélérer les découvertes :

  • Sciences de la vie : les agents de Lila conçoivent et valident de nouvelles protéines thérapeutiques, des outils d’édition génique et des outils de diagnostic. Dans le cadre de projets de démonstration, l’IA a déjà produit des anticorps pour le traitement de maladies et identifié de nouveaux médicaments potentiels dans des délais considérablement plus courts que les méthodes traditionnelles.
  • Chimie et matériaux : L'entreprise utilise la génération d'hypothèses pilotée par l'IA pour créer de nouveaux catalyseurs pour la production d'hydrogène vert, ainsi que des matériaux avancés pour la capture du carbone, le stockage de l'énergie et la fabrication .
  • Informatique et énergie : les modèles de Lila explorent de nouveaux matériaux pour le matériel informatique et les systèmes énergétiques durables en reliant le raisonnement basé sur la simulation à l'expérimentation physique.

À titre d'exemple, un agent d'IA a mis au point un nouveau catalyseur pour la production d'hydrogène en quatre mois, un processus qui prend généralement des années aux chercheurs. Cette efficacité illustre comment les scientifiques utilisant l'IA peuvent s'attaquer à des problèmes complexes et étendre la démarche scientifique à des domaines exigeant une résolution de problèmes complexes.

Image montrant des plateaux remplis de solutions protéiques transportés à travers le laboratoire sur une plateforme magnétique.

Figure 2 : Image montrant des plateaux remplis de solutions protéiques transportés à travers le laboratoire sur une plateforme magnétique. 2

Le concept de superintelligence scientifique

Le principe fondateur de l'entreprise repose sur l'idée que la science peut être développée à grande échelle, à l'instar de l'apprentissage automatique qui a permis d'accroître l'intelligence. De même que les modèles d'IA de grande taille ont révélé de nouvelles capacités, l'intensification de l'expérimentation et du raisonnement scientifique peut mener à des découvertes.

Lila décrit sa mission comme celle de permettre une révolution de l'intelligence au service de la science :

  • Les agents d'IA agissent comme des agents de développement capables de mener des recherches scientifiques de manière autonome.
  • Chaque usine scientifique d'IA fonctionne comme un « corps » pour un esprit scientifique superintelligent, où l'IA teste et apprend continuellement du monde naturel.
  • La combinaison de l'automatisation, des modèles fondamentaux et du raisonnement informatique permet une découverte scientifique entièrement automatisée dans de multiples domaines.

Considérations éthiques et implications scientifiques

À mesure que Lila progresse vers une superintelligence scientifique, l'entreprise reconnaît la nécessité de prendre en compte les questions éthiques liées à l'autonomie, à l'intégrité des données et au rôle du contrôle humain. La capacité du système à générer des idées, à concevoir des expériences et à produire des articles de recherche soulève des interrogations sur la paternité des publications, la responsabilité et l'intégration des chercheurs en IA au sein de la communauté scientifique.

Lila souligne que la recherche en IA doit enrichir, et non remplacer, le travail des scientifiques humains. Sa vision est de créer un partenariat où les chercheurs en IA amplifient la créativité humaine et contribuent à relever les grands défis en matière de santé , d'énergie et de développement durable .

AstroAgents

AstroAgents est un système d'intelligence artificielle multi-agents conçu pour aider les scientifiques à formuler des hypothèses à partir de données de spectrométrie de masse, notamment en astrobiologie. Développé par des chercheurs du Georgia Institute of Technology et du Centre de vol spatial Goddard de la NASA, ce projet propose un cadre complet pour la découverte scientifique automatisée.

En intégrant l'intelligence artificielle à la chimie analytique et à l'astrobiologie, AstroAgents réduit la dépendance à une supervision manuelle intensive, aidant ainsi les scientifiques à mener des recherches scientifiques et à produire des articles qui font progresser la compréhension en informatique et en astrobiologie.

Figure 3 : Un exemple de consigne de revue de littérature et le résultat d'AstroAgents. 3

Le système se compose de huit éléments spécialisés fonctionnant en collaboration :

  1. Analyste de données : Interprète les données de spectrométrie de masse, identifie les tendances, met en évidence les anomalies et détecte la contamination.
  2. Planificateur : Divise les données en tâches ciblées que plusieurs agents scientifiques devront analyser.
  3. Agents scientifiques : Élaborent des hypothèses liées aux modèles moléculaires attribués, étayées par des données spécifiques.
  4. Accumulateur : Consolide les hypothèses, élimine les redondances et prépare une liste d'hypothèses unifiée.
  5. Agent de revue de la littérature : recherche des études connexes dans Semantic Scholar et résume les principaux résultats.
  6. Critique : Évalue les hypothèses en fonction de leur nouveauté, de leur plausibilité et de leur rigueur scientifique, et fournit des commentaires pour l'itération suivante.

Figure 4 : La figure montre AstroAgents comme un système multi-agents qui analyse de manière collaborative les données de spectrométrie de masse, génère et affine les hypothèses de distribution moléculaire, intègre les revues de la littérature et améliore de manière itérative les résultats grâce à la rétroaction et à la critique basées sur les agents.

Dispositif expérimental et évaluation des AstroAgents

L'étude a utilisé des données de spectrométrie de masse provenant de huit météorites et de dix échantillons de sol terrestre, analysés par GC×GC-HRTOF-MS. L'objectif était de découvrir des profils moléculaires susceptibles d'indiquer l'origine biotique ou abiotique des composés organiques.

Deux versions d'AstroAgents ont été testées :

  • Claude 3.5 Sonnet , qui mettait l'accent sur la collaboration des agents.
  • Gemini 2.0 Flash , qui utilisait une grande fenêtre de contexte (jusqu'à 1 million de jetons) pour intégrer davantage de littérature de fond.

Un expert en astrobiologie a évalué plus de 100 hypothèses produites par ces modèles en utilisant six critères : nouveauté, cohérence avec la littérature, clarté, soutien empirique, généralisabilité et pouvoir prédictif.

Les résultats ont montré que Claude 3.5 Sonnet a atteint une cohérence et une précision globales plus élevées (moyenne de 6,58/10), tandis que Gemini 2.0 Flash a généré des idées de recherche plus originales (score de nouveauté moyen de 4,26).

Principales conclusions

AstroAgents a démontré que la collaboration multi-agents améliore la découverte scientifique par rapport au raisonnement basé sur un modèle unique. La capacité du système à analyser des données expérimentales et à les intégrer à la littérature scientifique permet une découverte scientifique automatisée qui pourrait s'étendre à d'autres domaines tels que la chimie, la biologie et la science des matériaux.

    Le scientifique en IA

    Le Scientifique IA est un système complet conçu pour automatiser l'intégralité du processus de recherche. Son objectif principal est de permettre une découverte scientifique entièrement automatisée, soutenant ainsi la vision d'un scientifique IA capable de mener des recherches de manière indépendante et d'apporter de nouvelles connaissances à la communauté scientifique humaine.

    Le scientifique IA-v1

    La version 1 (v1) est le prototype initial démontrant qu'un modèle de langage de grande taille peut gérer de manière autonome chaque étape du processus scientifique. Elle comprend des modules pour :

    • Génération d'idées et recherche documentaire à l'aide de bases de données scientifiques.
    • Conception et réalisation d'expériences par le biais du codage et de la simulation.
    • Analyse des résultats et rédaction automatique de documents au format LaTeX.

    Cependant, la version 1 était très limitée dans son champ d'application. Elle se concentrait sur des expériences de validation de principe, souvent dans des domaines simplifiés de l'informatique ou de l'apprentissage automatique. Le système nécessitait une supervision manuelle pour garantir la cohérence logique, l'exactitude du code et la validité des données.

    Le scientifique IA-v2

    La version 2 (v2) constitue une mise à jour majeure qui transforme le cadre en un premier système complet de découverte scientifique automatisée, permettant la création de modèles fondamentaux. Elle améliore chaque étape du processus de recherche :

    • Intégration améliorée de la littérature grâce à des sources comme Semantic Scholar.
    • Amélioration de la génération d'hypothèses grâce au raisonnement itératif et au perfectionnement des idées.
    • Automatisation avancée des expériences avec une intervention humaine minimale.
    • Rédaction d'articles et génération de manuscrits complets prêts à être soumis à une conférence de premier plan en apprentissage automatique .

    V2 réduit le besoin d'une supervision manuelle intensive, intègre des boucles de rétroaction similaires à celles utilisées par les scientifiques humains dans leur développement itératif d'idées et introduit un examinateur automatisé qui évalue l'originalité et la validité scientifique des articles générés.

    Figure 5 : Flux de travail AI Scientist-v2, qui automatise la génération d’idées, l’expérimentation, la visualisation, la rédaction et la révision grâce à une recherche arborescente automatisée gérée par un gestionnaire de progression des expériences. Cette approche élimine les modèles codés manuellement et affine itérativement le code et les hypothèses en utilisant les points de contrôle les plus performants. 4

    Évaluation humaine des manuscrits générés par v2

    Configuration d'évaluation

    • Un groupe de chercheurs expérimentés et de rédacteurs en chef a examiné un ensemble d'articles produits.
    • Chaque article a été évalué en fonction de sa clarté, de son originalité, de sa rigueur scientifique et de sa contribution potentielle.
    • Les relecteurs n'étaient pas certains que les manuscrits aient été générés par une IA ou par des humains.

    Résultats

    • Environ 30 à 40 % des articles générés par l'IA ont atteint ou approché le seuil d'acceptation généralement observé lors d'une grande conférence sur l'apprentissage automatique.
    • Les évaluateurs ont souvent trouvé le style d'écriture cohérent et bien structuré, comparable à celui d'articles rédigés par des scientifiques.
    • Cependant, certains manuscrits manquaient d'analyse approfondie ou de validation expérimentale rigoureuse, ce qui indique que si l'IA peut générer des articles de recherche plausibles, elle a encore du mal avec la profondeur conceptuelle et l'interprétation critique.

    Conclusions de l'évaluation

    • Le logiciel AI Scientist-v2 démontre que les modèles de base peuvent apporter des contributions significatives à la recherche scientifique, en générant des idées et des manuscrits complets.
    • Cela marque un progrès vers la découverte scientifique automatisée, mais la supervision humaine reste essentielle pour vérifier les résultats et garantir le respect des considérations éthiques.

    Caractéristiques clés des systèmes scientifiques IA

    Les systèmes d'IA pour scientifiques intègrent de multiples composants afin d'émuler le cycle de raisonnement et d'expérimentation suivi par les scientifiques humains. Ces systèmes combinent des modèles fondamentaux, le contrôle autonome du laboratoire et le raisonnement scientifique pour permettre des mécanismes de découverte scientifique automatisés.

    1. Hypothèses et idéation pilotées par l'IA

    Les chercheurs en intelligence artificielle utilisent de vastes modèles de langage et le raisonnement multi-agents pour générer des hypothèses vérifiables. Grâce à des techniques telles que le débat, la planification par agents et la recherche documentaire dans des bases de données comme Semantic Scholar, ces systèmes identifient des pistes de recherche potentielles qui pourraient passer inaperçues à l'œil nu.

    2. Conception et planification expérimentales

    Une fois l'hypothèse formulée, l'IA conçoit des expériences ou des simulations adaptées pour la tester. Cela comprend la sélection des variables, des contrôles et des critères d'évaluation, tout en optimisant le coût, le temps et le gain d'information. Certains systèmes intègrent des modules spécialisés pour la réalisation d'expériences et l'optimisation des processus scientifiques.

    3. Laboratoires autonomes ou robotisés

    Un chercheur en intelligence artificielle travaille dans des laboratoires automatisés ou semi-automatisés, équipés de systèmes robotisés. Ces derniers permettent de mener des expériences avec une supervision manuelle minimale, garantissant ainsi un fonctionnement continu et une collecte de données de haute qualité. Même les résultats négatifs, souvent négligés par la communauté scientifique humaine, sont enregistrés et utilisés pour une amélioration continue.

    4. Intégration de l'IA et des boucles de rétroaction

    L'une des caractéristiques essentielles de ces systèmes est l'intégration de l'IA aux boucles de rétroaction des laboratoires. Les résultats des expériences affinent les modèles internes de l'IA, lui permettant ainsi de formuler des hypothèses plus précises lors du cycle suivant. Ce processus d'autocorrection est similaire à la manière dont les chercheurs perfectionnent leurs approches en fonction des résultats antérieurs.

    5. Analyse et interprétation des données

    Les systèmes d'IA nettoient, structurent et interprètent les données brutes afin de détecter les corrélations, les anomalies et les relations de cause à effet. En intégrant les réseaux neuronaux, la modélisation de la diffusion et l'analyse statistique, ces systèmes peuvent évaluer efficacement les hypothèses et mettre à jour leurs modèles de raisonnement en temps réel.

    6. Communication et diffusion

    Certains cadres de travail avancés comprennent des modules qui génèrent des articles, des résumés d'articles ou des synthèses techniques. Ces productions peuvent ressembler à des soumissions à des conférences scientifiques, avec un raisonnement structuré, des résultats et des références.

    7. Adaptabilité interdomaines

    L'un des principaux objectifs de la recherche en IA dans ce domaine est la généralisation des résultats à différents domaines scientifiques. Un chercheur en IA idéal devrait pouvoir transférer ses connaissances d'un domaine, comme la découverte de matériaux, à d'autres, comme la biologie ou les systèmes énergétiques, sans nécessiter de nouvel entraînement. Cette adaptabilité distingue les chercheurs en IA des modèles d'apprentissage automatique spécialisés.

    Limites et défis actuels

    Bien que la vision d'un scientifique doté d'une IA autonome soit séduisante, les systèmes actuels sont confrontés à plusieurs défis pratiques et conceptuels qui empêchent la pleine réalisation de la découverte scientifique automatisée.

    Domaine d'application limité

    La plupart des implémentations opèrent dans des domaines scientifiques étroits et bien définis, tels que le repliement des protéines ou la synthèse de matériaux. Leur capacité à généraliser à des domaines scientifiques plus vastes demeure limitée.

    Complexité de l'exécution physique

    Le passage de la conception informatique à l'expérimentation concrète soulève des difficultés liées à la robotique, à la sécurité chimique et à l'instrumentation. De nombreux systèmes peuvent simuler ou planifier des expériences, mais leur réalisation physique reste tributaire de l'intervention humaine.

    confiance et interprétabilité

    Pour qu'un chercheur en intelligence artificielle contribue de manière significative à la recherche scientifique, le raisonnement qui sous-tend ses travaux doit être transparent et interprétable. Les modèles actuels se comportent souvent comme des boîtes noires, ce qui rend difficile pour les chercheurs d'évaluer la validité des conclusions ou des hypothèses sous-jacentes.

    contraintes de ressources

    La réalisation d'expériences consomme du temps, des matériaux et de l'énergie. Les systèmes d'IA doivent optimiser le rapport coût-efficacité et l'acquisition d'informations tout en gérant un débit de laboratoire limité.

    Risque d'optimisation dégénérée

    En l'absence de stratégies d'exploration bien définies, les agents d'IA peuvent répéter des hypothèses triviales ou converger vers des optima locaux.

    Validation scientifique et publication

    Même si un système d'IA produit des résultats plausibles ou si des articles sont générés par des processus automatisés, ils doivent faire l'objet d'une évaluation par les pairs et d'une réplication indépendante avant d'être acceptés par la communauté scientifique. Garantir la reproductibilité demeure essentiel.

    Adaptabilité et généralisation

    Les systèmes actuels nécessitent souvent un réentraînement pour chaque nouveau domaine. L'élaboration de cadres conceptuels complets permettant de généraliser le raisonnement scientifique à différents sujets demeure un défi majeur pour les chercheurs en IA.

    Sıla Ermut
    Sıla Ermut
    Analyste du secteur
    Sıla Ermut est analyste chez AIMultiple, spécialisée dans le marketing par e-mail et les vidéos de vente. Auparavant, elle travaillait comme recruteuse dans des cabinets de conseil et de gestion de projets. Sıla est titulaire d'un master en psychologie sociale et d'une licence en relations internationales.
    Voir le profil complet

    Soyez le premier à commenter

    Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires.

    0/450