Los científicos que trabajan con IA marcan un importante avance hacia el descubrimiento científico totalmente automatizado, con el objetivo de realizar todo el proceso de investigación de forma independiente. A diferencia de las herramientas tradicionales, estos laboratorios automatizados pueden agilizar los procesos de investigación mediante la generación de hipótesis, el diseño y la ejecución de experimentos, la interpretación de resultados y la comunicación de hallazgos.
Al combinar grandes modelos de lenguaje, aprendizaje automático y robótica, un científico de IA puede refinar iterativamente su comprensión mediante la experimentación.
Descubre las 6 mejores herramientas y marcos de trabajo para científicos de IA, y los procesos científicos que les permitirían tender puentes entre la informática y las ciencias naturales.
Las 6 principales empresas/marcos de trabajo para científicos de IA
Herramienta/Marco de trabajo | Descripción | Casos de uso | Categoría |
|---|---|---|---|
AstroAgentes | Inteligencia artificial multiagente para el análisis de datos de espectrometría de masas en astrobiología. | Detección de patrones bióticos, generación de hipótesis, integración de la literatura. | Sistema de análisis de datos multiagente |
Claude para Ciencias de la Vida | Modelos de lenguaje avanzados con herramientas científicas para respaldar la investigación biomédica y de ciencias de la vida de principio a fin. | Análisis bibliográfico, bioinformática, diseño experimental, documentación regulatoria y cumplimiento clínico. | Sistema de investigación en ciencias biológicas aumentado con IA |
Google Cocientífico de IA | El sistema de IA multiagente genera hipótesis novedosas, propuestas de investigación y protocolos experimentales. | Reutilización de fármacos, descubrimiento de dianas terapéuticas, investigación sobre resistencia antimicrobiana, generación de hipótesis biomédicas. | Sistema de co-científicos de IA multiagente |
Ciencias Lila | Crea fábricas de ciencia basadas en IA que combinan robótica y modelos fundamentales para las ciencias de la vida y la investigación de materiales. | Terapias con proteínas, descubrimiento de catalizadores y materiales, sistemas energéticos. | Plataforma de superinteligencia científica |
Laboratorios periódicos | Crea científicos de IA que gestionan laboratorios autónomos de física, química y ciencia de los materiales. | Descubrimiento de materiales, diseño de semiconductores, automatización experimental. | Plataforma de ciencias físicas impulsada por IA |
Papa | Sistema operativo científico que permite la investigación impulsada por IA, desde la hipótesis hasta el experimento, utilizando agentes de IA y automatización. | Predicción de la resistencia a los fármacos, ingeniería de proteínas, experimentos biológicos automatizados. | Sistema integral de investigación de IA |
El científico de IA | Marco de trabajo integral para científicos de IA que automatiza la generación de hipótesis, la realización de experimentos y la redacción de artículos científicos. | Automatización integral del ciclo de investigación, generación de manuscritos y evaluación comparativa del sistema. | Sistema integral de científicos de IA |
AstroAgentes
AstroAgents es un sistema de IA multiagente diseñado para ayudar a los científicos a generar hipótesis a partir de datos de espectrometría de masas, especialmente en el campo de la astrobiología. Desarrollado por investigadores del Instituto Tecnológico de Georgia y del Centro de Vuelos Espaciales Goddard de la NASA, el proyecto introduce un marco integral para el descubrimiento científico automático.
Al integrar la inteligencia artificial con la química analítica y la astrobiología, AstroAgents reduce la dependencia de una supervisión manual exhaustiva, lo que permite a los científicos humanos llevar a cabo investigaciones científicas y producir artículos que contribuyen al avance del conocimiento en informática y astrobiología.
Figura 1: Ejemplo de una consigna para una revisión bibliográfica y el resultado de AstroAgents. 1
El sistema consta de ocho componentes especializados que trabajan en colaboración:
- Analista de datos: Interpreta los datos de espectrometría de masas, identifica patrones, resalta anomalías y detecta contaminación.
- Planificador: Divide los datos en tareas específicas para que varios agentes científicos las analicen.
- Agentes científicos: Generan hipótesis relacionadas con patrones moleculares asignados, respaldadas por datos específicos.
- Acumulador: Consolida las hipótesis, elimina la redundancia y prepara una lista unificada de hipótesis.
- Agente de revisión bibliográfica: Busca estudios relacionados en Semantic Scholar y resume los hallazgos clave.
- Crítico: Evalúa las hipótesis en cuanto a su novedad, plausibilidad y rigor científico, y ofrece comentarios para la siguiente iteración.
Figura 2: La figura muestra a AstroAgents como un sistema multiagente que analiza de forma colaborativa datos de espectrometría de masas, genera y refina hipótesis de distribución molecular, integra revisiones bibliográficas y mejora iterativamente los resultados mediante retroalimentación y crítica basadas en agentes.
Configuración experimental y evaluación de AstroAgents
El estudio utilizó datos de espectrometría de masas de ocho meteoritos y diez muestras de suelo terrestre, que se analizaron mediante GC×GC-HRTOF-MS. El objetivo era descubrir patrones moleculares que pudieran indicar el origen biótico o abiótico de los compuestos orgánicos.
Se probaron dos versiones de AstroAgents:
- Soneto 3.5 de Claude , que enfatizaba la colaboración entre agentes.
- Gemini 2.0 Flash , que utilizó una gran ventana de contexto (hasta 1 millón de tokens) para integrar más literatura de fondo.
Un experto en astrobiología evaluó más de 100 hipótesis generadas por estos modelos utilizando seis criterios: novedad, coherencia con la bibliografía, claridad, respaldo empírico, generalización y poder predictivo.
Los resultados mostraron que el Soneto Claude 3.5 logró una mayor consistencia y precisión general (promedio de 6,58/10), mientras que Gemini 2.0 Flash generó ideas de investigación más novedosas (puntuación de novedad promedio de 4,26).
Principales conclusiones:
AstroAgents demostró que la colaboración entre múltiples agentes mejora el descubrimiento científico en comparación con el razonamiento basado en un solo modelo. La capacidad del sistema para analizar datos experimentales e integrarlos con la literatura científica permite el descubrimiento científico automático, que podría extenderse a otros campos como la química, la biología y la ciencia de los materiales.
Claude para Ciencias de la Vida
Claude for Life Sciences es una iniciativa desarrollada por Anthropic para acelerar la investigación y la innovación dentro de los sectores biomédico y de ciencias de la vida.
La plataforma integra inteligencia artificial avanzada en el proceso científico, dando soporte a actividades que abarcan desde la generación de hipótesis y el diseño de experimentos hasta el análisis de datos, el cumplimiento normativo y la preparación de publicaciones.
La misión más amplia de Anthropic es acelerar el progreso científico mundial mediante el desarrollo de sistemas de IA que colaboren con investigadores humanos y, con el tiempo, logren un grado de autonomía en la realización de descubrimientos científicos.
Visión y objetivos científicos
Si bien las versiones anteriores de Claude se utilizaban principalmente para tareas específicas, como escribir código analítico, resumir literatura académica o preparar informes, el marco actual permite una participación integral en todo el ciclo de vida de la investigación. Esto incluye el descubrimiento inicial, la traslación clínica y la eventual comercialización de los resultados científicos.
Anthropic posiciona a Claude como un colaborador de investigación inteligente, capaz de interpretar datos científicos, integrar información de múltiples fuentes y generar conocimientos que contribuyen directamente al progreso experimental. El sistema está diseñado para ayudar a laboratorios, organizaciones farmacéuticas e instituciones académicas, mejorando la eficiencia, la reproducibilidad y la calidad de los resultados de la investigación.
Capacidades principales y rendimiento del modelo
Los modelos Anthropic demuestran mejoras sustanciales en el razonamiento científico, la comprensión y la interpretación de protocolos, como lo demuestran varios resultados de referencia .
Integración con herramientas científicas y empresariales
Claude for Life Sciences incluye un conjunto ampliado de conectores de software que permiten la interacción directa con bases de datos científicas, sistemas de gestión de datos y plataformas de investigación colaborativa.
Estas integraciones permiten a los investigadores consultar datos, visualizar resultados y vincular los hallazgos con fuentes experimentales verificadas.
Las principales integraciones incluyen las siguientes:
- Benchling: Proporciona acceso a cuadernos de laboratorio, datos experimentales y sistemas de documentación.
- BioRender: Permite la creación de figuras, diagramas y resúmenes gráficos científicamente precisos.
- PubMed y Wiley's Scholar Gateway ofrecen acceso a millones de publicaciones biomédicas revisadas por pares para su citación, resumen y síntesis de evidencia.
- Synapse.org: Facilita el intercambio de datos, el control de versiones y la colaboración entre equipos de investigación distribuidos.
- 10x Genomics: Permite el análisis de datos transcriptómicos espaciales y de células individuales mediante interacción en lenguaje natural.
Habilidades de los agentes y automatización de la investigación
Anthropic ha introducido Agent Skills , un marco que permite a Claude realizar tareas científicas de forma autónoma. Cada habilidad es un paquete estructurado que contiene instrucciones, scripts y recursos que guían al modelo a través de procesos de investigación específicos.
Un ejemplo destacado es la habilidad de control de calidad de ARN de células individuales (single-cell-rna-qc) , que realiza el control de calidad y el filtrado de datos de secuenciación de ARN de células individuales siguiendo las mejores prácticas de scverse. Los investigadores también pueden diseñar habilidades personalizadas que definan los procedimientos de su laboratorio, lo que permite a Claude automatizar el procesamiento de datos, el análisis estadístico y los pasos de validación experimental.
Aplicaciones en el ámbito de las ciencias biológicas
Claude for Life Sciences ofrece soporte para un amplio espectro de casos de uso en los ámbitos de la investigación, la clínica y la regulación.
- Investigación científica y generación de hipótesis: Claude puede realizar revisiones bibliográficas exhaustivas, identificar estudios relevantes, sintetizar hallazgos y generar hipótesis comprobables a partir de datos existentes.
- Creación y documentación de protocolos: Mediante la integración con Benchling, Claude ayuda a redactar protocolos de estudio, procedimientos operativos estándar y formularios de consentimiento informado que cumplen con las normas reglamentarias y éticas.
- Bioinformática y análisis computacional: Claude procesa e interpreta grandes conjuntos de datos, incluidos datos genómicos y proteómicos, y produce resultados en formatos adecuados para informes técnicos, presentaciones de diapositivas o cuadernos de código.
- Cumplimiento normativo y clínico: El modelo ayuda a redactar las solicitudes de aprobación regulatoria, a resumir los requisitos de cumplimiento y a recopilar la documentación de respaldo para auditorías o revisiones.
- Anthropic también proporciona una biblioteca de indicaciones adaptada a la investigación científica, lo que permite a los usuarios obtener resultados consistentes y optimizados en una variedad de aplicaciones de investigación.
Vea el siguiente video para observar cómo Claude realiza el análisis de datos y la revisión bibliográfica, extrae conclusiones y las sintetiza en una presentación que incluye una ilustración de BioRender.
Google Cocientífico de IA
El asistente científico de IA de Google es un sistema multiagente basado en Gemini 2.0 y diseñado como un colaborador científico virtual. El sistema tiene como objetivo descubrir conocimiento genuinamente original, formular nuevas hipótesis de investigación y generar protocolos experimentales detallados.
Cómo funciona el sistema de co-científicos de IA
El co-científico de IA coordina una coalición de seis agentes especializados: Generación, Reflexión, Clasificación, Evolución, Proximidad y Revisión (Meta). Los agentes están modelados según los pasos del método científico.
Un agente supervisor transforma el objetivo asignado en un plan de investigación, asigna tareas a la cola de trabajadores y ajusta dinámicamente los recursos informáticos. Los científicos pueden interactuar durante todo el proceso aportando ideas iniciales o comentarios en lenguaje natural sobre los resultados generados.
El sistema también recurre a herramientas externas, como búsquedas web y modelos de IA especializados, para mejorar la calidad y la fundamentación de las hipótesis.
Una característica arquitectónica clave es la escalabilidad del cálculo en tiempo de prueba: a medida que el sistema invierte más tiempo en razonamiento, ejecuta debates científicos autodirigidos, torneos de clasificación de hipótesis y ciclos de refinamiento iterativos. La calidad de los resultados se monitoriza mediante una métrica de autoevaluación basada en Elo que se correlaciona positivamente con la precisión en preguntas de referencia rigurosas.
Validación experimental en diversos ámbitos biomédicos.
El proyecto Google validó el sistema mediante experimentos de laboratorio reales en tres casos de uso biomédico:
Reutilización de fármacos para la leucemia mieloide aguda (LMA)
El científico colaborador en IA propuso nuevos fármacos candidatos para la reutilización en el tratamiento de la leucemia mieloide aguda (LMA). Las pruebas in vitro posteriores confirmaron que los compuestos sugeridos inhiben la viabilidad tumoral en concentraciones clínicamente relevantes en diversas líneas celulares de LMA.
Descubrimiento de dianas terapéuticas para la fibrosis hepática
El sistema identificó dianas de tratamiento epigenético con una actividad antifibrótica significativa, validada en organoides hepáticos humanos. Se están preparando los resultados detallados para su publicación en colaboración con investigadores de la Universidad de Stanford.
Mecanismo de resistencia antimicrobiana
Los investigadores encargaron al sistema la tarea de explicar cómo se propagan las islas cromosómicas inducibles por fagos formadoras de cápsides (cf-PICI) entre las especies bacterianas. Este era un problema que ya se había resuelto experimentalmente en su laboratorio, pero que aún no se había publicado.
El co-científico de IA llegó de forma independiente a la misma conclusión, proponiendo que los cf-PICI interactúan con diversas colas de fagos para ampliar su rango de huéspedes. Este redescubrimiento independiente demuestra la capacidad del sistema para sintetizar décadas de literatura científica en conocimientos prácticos.
Rendimiento frente a expertos humanos y otros modelos.
Expertos en la materia seleccionaron 15 objetivos de investigación abiertos y evaluaron los resultados de los colaboradores científicos en IA comparándolos con otros sistemas de razonamiento y agentes líderes.
En un subconjunto de 11 objetivos, los revisores humanos calificaron los resultados del co-científico de IA como de mayor potencial de novedad e impacto, y prefirieron sus resultados a los de los modelos de la competencia. Estas preferencias coincidieron con las autoevaluaciones Elo del propio sistema, lo que sugiere que esta métrica es un indicador fiable de la calidad de los resultados.
Figura 3: Gráfico que muestra la clasificación de los co-científicos de IA según la novedad y el impacto de sus investigaciones. 2
Limitaciones de los co-científicos de IA
Google reconoce varios desafíos abiertos, incluida la necesidad de una mayor verificación de los hechos, una cobertura bibliográfica más amplia, mejores métodos de autoevaluación y una evaluación experta a mayor escala en una gama más amplia de objetivos de investigación.
Actualmente, el sistema se está poniendo a disposición de organizaciones de investigación a través de un Programa de Probadores de Confianza, con la intención de evaluar de manera responsable sus fortalezas y limitaciones antes de su implementación a mayor escala.
Ciencias Lila
Lila Sciences es una empresa de investigación con sede en Cambridge, Massachusetts, que desarrolla un sistema de superinteligencia científica. Su misión es crear una plataforma unificada donde científicos de IA y científicos humanos colaboren en laboratorios autónomos para acelerar los descubrimientos científicos en las ciencias biológicas, la química y la ciencia de los materiales.
Su objetivo es desarrollar una infraestructura integral capaz de gestionar todo el proceso de investigación: desde la generación de hipótesis y el diseño de experimentos hasta el análisis de datos y la redacción de artículos. Lila denomina a estos entornos Fábricas de Ciencia con IA (AISF, por sus siglas en inglés) : laboratorios físicos automatizados donde agentes de IA ejecutan miles de experimentos en paralelo, analizan los resultados y desarrollan ideas de forma iterativa con una mínima supervisión manual.
La tecnología de Lila Sciences
Lila Sciences combina grandes modelos de lenguaje , redes neuronales y experimentación robótica en lo que denomina un sistema integral para el descubrimiento científico automático. La arquitectura de sus Fábricas de Ciencia con IA integra razonamiento, simulación y experimentación en un ciclo de retroalimentación unificado.
Las características tecnológicas clave incluyen:
- Ciclos de experimentación impulsados por IA: los modelos fundamentales de Lila utilizan el aprendizaje por refuerzo y el modelado de difusión para proponer, ejecutar y evaluar experimentos miles de veces más rápido que los enfoques tradicionales.
- Integración de razonamiento y verificación: El sistema combina predicciones computacionales con validación en el mundo real, lo que permite que los procedimientos de IA basados en agentes perfeccionen su comprensión de los sistemas físicos y biológicos mediante la experimentación directa.
- Capacidad interdisciplinaria: Al conectar las ciencias biológicas, la ciencia de los materiales y la química, los modelos de vanguardia de Lila eliminan las barreras que normalmente separan las disciplinas, lo que permite a la IA generar ideas y descubrir correlaciones entre diferentes campos científicos.
- Aprendizaje basado en datos: Cada experimento genera registros digitales que se retroalimentan al sistema para mejorar las predicciones futuras. Este ciclo reduce la necesidad de una supervisión manual exhaustiva, lo que permite que la IA mejore continuamente con el tiempo.
Esto representa un primer marco integral para el desarrollo de algoritmos que no solo predicen resultados, sino que también los validan experimentalmente. Lila concibe a su científico de IA como un socio capaz de escribir código , controlar el hardware del laboratorio e interpretar resultados, transformando esencialmente el método científico en un proceso computacional escalable.
Áreas de investigación científica de Lila
Lila se centra en varios ámbitos importantes de la investigación científica donde la investigación y la automatización basadas en IA pueden acelerar los descubrimientos:
- Ciencias de la vida: Los agentes de Lila diseñan y validan nuevas terapias proteicas, editores genéticos y herramientas de diagnóstico. En proyectos piloto, la IA ya ha producido anticuerpos para el tratamiento de enfermedades e identificado posibles fármacos nuevos en plazos significativamente más cortos que los métodos tradicionales.
- Química y materiales: La empresa aplica la generación de hipótesis impulsada por IA para crear nuevos catalizadores para la producción de hidrógeno verde, así como materiales avanzados para la captura de carbono, el almacenamiento de energía y la fabricación .
- Informática y energía: Los modelos de Lila exploran nuevos materiales para hardware informático y sistemas de energía sostenible, combinando el razonamiento basado en simulaciones con la experimentación física.
En un ejemplo, un agente de IA desarrolló un nuevo catalizador para la producción de hidrógeno en cuatro meses, un proceso que normalmente lleva años a los científicos investigadores. Esta eficiencia demuestra cómo los científicos de IA pueden abordar problemas complejos y extender el proceso científico a campos que requieren la resolución de problemas complejos.

Figura 4: Imagen que muestra bandejas llenas de soluciones proteicas siendo transportadas por el laboratorio sobre una plataforma magnética. 3
El concepto de superinteligencia científica
El principio fundamental de la empresa es que la ciencia misma puede escalarse del mismo modo que el aprendizaje automático ha escalado la inteligencia. Así como los modelos de IA más grandes han desbloqueado capacidades emergentes, escalar la experimentación y el razonamiento científico puede propiciar descubrimientos.
Lila describe su misión como la de impulsar una revolución de la inteligencia artificial en el ámbito científico:
- Los agentes de IA actúan como agentes en desarrollo capaces de llevar a cabo investigaciones científicas de forma autónoma.
- Cada Fábrica de Ciencia con IA funciona como un “cuerpo” para una mente científica superinteligente, donde la IA prueba y aprende continuamente del mundo natural.
- La combinación de automatización, modelos fundamentales y razonamiento computacional permite el descubrimiento científico totalmente automático en múltiples ámbitos.
Consideraciones éticas e implicaciones científicas
A medida que Lila avanza hacia la superinteligencia científica, la empresa reconoce la necesidad de considerar aspectos éticos relacionados con la autonomía, la integridad de los datos y el papel de la supervisión humana. La capacidad del sistema para generar ideas, diseñar experimentos y producir artículos de investigación plantea interrogantes sobre la autoría, la responsabilidad y la integración de los investigadores de IA en la comunidad científica humana en general.
Lila subraya que la investigación en IA debe complementar, no reemplazar, a los científicos humanos. Su visión es crear una colaboración donde los científicos de IA potencien la creatividad humana y ayuden a abordar los grandes desafíos en salud , energía y sostenibilidad .
Laboratorios periódicos
Periodic Labs busca desarrollar sistemas capaces de realizar investigación independiente, refinar ideas de forma iterativa y contribuir a la comunidad científica mediante la generación de nuevos conocimientos. Su objetivo a largo plazo es posibilitar el descubrimiento científico totalmente automático, donde los agentes de IA puedan proponer hipótesis, diseñar y ejecutar experimentos, interpretar resultados y redactar artículos científicos con una mínima supervisión manual.
El concepto central consiste en fusionar la inteligencia artificial con la experimentación en el mundo real. En lugar de depender exclusivamente de datos textuales a escala de internet, que son limitados y ya son ampliamente utilizados por los modelos de vanguardia, Periodic Labs se centra en la creación de laboratorios autónomos que generan datos experimentales originales y de alta calidad. Estos laboratorios sirven como entornos donde un científico de IA trabaja, poniendo a prueba sus ideas y aprendiendo directamente de la naturaleza.
Áreas de investigación de los laboratorios periódicos
Periodic Labs se centra principalmente en las ciencias físicas como punto de partida. Esta área fue elegida porque los experimentos físicos ofrecen señales de alta calidad, capacidades de modelado fiables y criterios de verificación claros. Sus principales áreas de investigación incluyen:
- Ciencia de los materiales: Desarrollo y descubrimiento de superconductores que funcionen a temperaturas más elevadas, lo que podría mejorar los sistemas de transporte y reducir la pérdida de energía en las redes eléctricas.
- Investigación en semiconductores: Colaboración con socios de la industria para abordar desafíos como la disipación de calor en los chips mediante el entrenamiento de agentes de IA para interpretar y optimizar datos experimentales.
- Física y química: Utilización de herramientas de investigación basadas en IA para diseñar y sintetizar nuevos materiales, automatizar la generación de hipótesis y mejorar la exploración basada en simulaciones.
Estos esfuerzos buscan acelerar la ciencia integrando a científicos de IA en ámbitos donde el progreso tradicionalmente ha requerido una extensa experimentación manual. De esta manera, Periodic Labs pretende reducir el tiempo entre la generación de ideas y la publicación de artículos de investigación aceptados para su presentación en una conferencia de aprendizaje automático o su publicación en una revista científica.
Visión más amplia y consideraciones éticas
La ambición más amplia de Periodic Labs es escalar el descubrimiento científico automático a través de diversas disciplinas en informática, ciencias naturales e ingeniería. Su visión incluye:
- Desarrollar sistemas que creen algoritmos para el razonamiento autónomo y el diseño de experimentos.
- Apoyar a los científicos investigadores en el desarrollo de agentes capaces de abordar los grandes desafíos de la ciencia.
- Crear sistemas integrales que integren la recopilación de datos, el razonamiento y la publicación bajo un marco científico unificado.
También hacen hincapié en la importancia de las consideraciones éticas en el despliegue de sistemas de IA autónomos, garantizando la transparencia, la rendición de cuentas y la colaboración con científicos humanos.
Papa
Potato funciona como un sistema integral que respalda todo el proceso de investigación, desde la generación de hipótesis hasta la ejecución de experimentos y la interpretación de datos. Al integrar inteligencia artificial, automatización y biología computacional, Potato permite el descubrimiento científico totalmente automático en campos como las ciencias de la vida, la informática y la bioinformática.
La plataforma permite que los agentes de IA realicen investigaciones de forma independiente o en colaboración con investigadores. Estos agentes pueden buscar bibliografía, generar ideas, diseñar flujos de trabajo, analizar resultados y preparar los artículos generados para su revisión.
Al minimizar la necesidad de una supervisión manual exhaustiva, Potato acelera el desarrollo y la prueba de nuevas ideas de investigación por parte de la comunidad científica humana, lo que contribuye al progreso hacia el desarrollo de agentes capaces de realizar descubrimientos científicos significativos de forma autónoma.
La tecnología detrás de la papa
Potato funciona como un sistema operativo científico (SO) para las ciencias de la vida. Se conecta a cientos de herramientas que hacen que la investigación científica sea más eficiente y reproducible. Su infraestructura está diseñada para permitir que los agentes de IA desarrollen ideas de forma iterativa, planifiquen experimentos e interpreten resultados de manera abierta.
Los componentes tecnológicos clave incluyen:
- Entorno especializado para agentes: Potato proporciona un entorno de investigación específico que equipa a los agentes de IA con los datos, las herramientas y la memoria necesarios para realizar tareas de investigación como la búsqueda bibliográfica, la generación de hipótesis y la ejecución de experimentos.
- Entorno de ejecución en paralelo: El sistema basado en la nube escala automáticamente los recursos de computación y GPU, lo que permite a la IA ejecutar miles de experimentos simultáneamente. Esta paralelización admite tareas de modelado complejas en aprendizaje automático y procesamiento del lenguaje natural .
- Cronogramas de investigación ramificados: Los investigadores pueden explorar múltiples variaciones experimentales con un solo clic. Esta función de ramificación fomenta el descubrimiento científico automático, permitiendo la exploración de hipótesis y métodos alternativos.
- Comunicación entre herramientas: Las herramientas dentro de Potato se comunican directamente entre sí, lo que mejora la eficiencia y permite flujos de trabajo más largos e ininterrumpidos.
El núcleo del sistema es TATER (Inteligencia Artificial Técnica para la Investigación Teórica y Experimental) , un sistema de IA multiagente que actúa como co-científico. TATER puede planificar y ejecutar experimentos, analizar datos y traducir la intención de la investigación en secuencias de comandos robóticas. Representa un marco integral para el descubrimiento científico automático, que combina modelos fundamentales, modelos de difusión y redes neuronales para impulsar el estado de la investigación en IA.
Caso de uso 1: Predicción de la resistencia en la proteasa principal del SARS-CoV-2
En una de las aplicaciones, los investigadores utilizaron Potato para realizar análisis de secuencias centrados en la predicción de mutaciones de resistencia viral.
- Reto: Comprender qué variantes de un solo nucleótido de la proteasa principal del SARS-CoV-2 pueden causar resistencia a los medicamentos es un proceso lento y costoso que normalmente requiere semanas de trabajo computacional y de laboratorio.
- Enfoque: Mediante una sencilla instrucción, los investigadores pidieron a TATER que calculara las puntuaciones evolutivas de todas las posibles variantes de cambio de sentido e identificara aquellas cercanas a los sitios de unión de los inhibidores.
- Resultado:
- Se generaron más de 2000 variantes posibles y se clasificaron utilizando modelos de puntuación evolutiva.
- Se comparó cada variante con múltiples estructuras cristalinas para determinar su proximidad a los sitios de unión de fármacos.
- Se entregó una lista priorizada de mutaciones que probablemente alteren la sensibilidad a los inhibidores.
Impacto:
TATER condensó lo que normalmente llevaría una semana de codificación y análisis en una sola sesión interactiva. Al combinar datos estructurales con modelos evolutivos, guió a los desarrolladores de fármacos hacia mutaciones de alta prioridad para su posterior análisis, acelerando así el descubrimiento científico de antivirales mediante la investigación de IA en el ámbito de la salud .
Caso de uso 2: Diseñar una GFP más brillante
Un segundo ejemplo pone de manifiesto cómo la patata contribuye a la ingeniería de proteínas.
- Reto: Diseñar variantes más brillantes de GFP (proteína fluorescente verde) normalmente requiere una revisión manual de la literatura, la planificación de mutaciones y la configuración experimental, todo lo cual consume mucho tiempo.
- Enfoque: Los investigadores plantearon a TATER una única petición: "Quiero crear una proteína verde fluorescente (GFP) más brillante".
- La IA realizó una búsqueda bibliográfica para identificar mutaciones que mejoran el brillo.
- Se generó un andamiaje de GFP optimizado y se diseñó una biblioteca de variantes funcionales.
- Se elaboró un flujo de trabajo experimental completo para la clonación, la expresión y el cribado por fluorescencia.
Figura 5: Tater, el científico de IA de Potato, genera planes de investigación y revisiones bibliográficas. 4
- Resultado:
- Se ha compilado una biblioteca de variantes que incluye sustituciones conocidas y nuevas.
- Se definieron protocolos detallados de normalización y análisis de datos.
- Se entregaron protocolos de laboratorio listos para usar, con plantillas de documentación.
Impacto:
TATER transformó un proceso que normalmente lleva días o semanas en solo minutos. Proporcionó un flujo de trabajo completo y reproducible, desde la idea hasta la ejecución experimental, demostrando cómo los científicos de IA pueden posibilitar el descubrimiento científico automático y la creatividad asequible.
Al integrar el razonamiento a través de la literatura y los datos, Potato impulsa la investigación científica, permitiendo que los agentes de IA y los científicos investigadores colaboren y generen nuevos conocimientos con una mínima fricción.
El científico de IA
El Científico de IA es un sistema integral diseñado para automatizar todo el proceso de investigación. Su objetivo principal es permitir el descubrimiento científico totalmente automático, apoyando la visión de un científico de IA capaz de realizar investigaciones de forma independiente y aportar nuevos conocimientos a la comunidad científica humana.
El científico de IA-v1
La versión 1 (v1) es el prototipo inicial que demuestra que un modelo de lenguaje extenso puede manejar de forma autónoma cada paso del proceso científico. Incluye módulos para:
- Generación de ideas y búsqueda bibliográfica mediante bases de datos científicas.
- Diseño y ejecución de experimentos mediante codificación y simulación.
- Análisis de resultados y redacción automática de artículos en formato LaTeX.
Sin embargo, la versión 1 tenía un alcance muy limitado . Se centraba en experimentos de prueba de concepto, a menudo en ámbitos simplificados de la informática o el aprendizaje automático. El sistema requería supervisión manual para garantizar la coherencia lógica, la corrección del código y la validez de los datos.
El científico de IA-v2
La versión 2 (v2) es una actualización significativa que amplía el marco de trabajo para convertirlo en el primer sistema integral para el descubrimiento científico automático, lo que permite la creación de modelos fundamentales. Mejora cada etapa del proceso de investigación:
- Integración mejorada de la literatura a través de fuentes como Semantic Scholar.
- Mejora en la generación de hipótesis mediante el razonamiento iterativo y el refinamiento de ideas.
- Automatización avanzada de experimentos con mínima intervención humana.
- Generación de borradores de artículos y manuscritos completos listos para su presentación en una importante conferencia sobre aprendizaje automático .
La versión 2 reduce la necesidad de una supervisión manual exhaustiva, integra bucles de retroalimentación similares a los que utilizan los científicos humanos en el desarrollo iterativo de ideas e introduce un revisor automatizado que evalúa los artículos generados en cuanto a originalidad y validez científica.
Figura 6: Flujo de trabajo de AI Scientist-v2, que automatiza la generación de ideas, la experimentación, la visualización, la redacción y la revisión mediante una búsqueda en árbol gestionada por un Gestor de Progreso de Experimentos. Este enfoque elimina las plantillas codificadas por humanos y refina iterativamente el código y las hipótesis utilizando puntos de control de alto rendimiento. 5
Evaluación humana de manuscritos generados por v2
Configuración de evaluación
- Un grupo de científicos investigadores experimentados y editores sénior revisaron un conjunto de artículos generados.
- Cada artículo fue evaluado en función de su claridad, originalidad, rigor científico y contribución potencial.
- Los revisores no estaban seguros de si los manuscritos habían sido generados por inteligencia artificial o por humanos.
Recomendaciones
- Aproximadamente entre el 30% y el 40% de los artículos generados por IA alcanzaron o se acercaron al umbral de aceptación que se suele observar en una conferencia importante sobre aprendizaje automático.
- Los revisores a menudo consideraron que la redacción era coherente y estaba bien estructurada, comparable a la de artículos escritos por científicos especializados en humanidades.
- Sin embargo, algunos manuscritos carecían de una visión profunda o de una validación experimental rigurosa, lo que indica que, si bien la IA puede generar artículos de investigación plausibles, todavía tiene dificultades con la profundidad conceptual y la interpretación crítica.
Conclusiones de la evaluación
- El proyecto AI Scientist-v2 demuestra que los modelos básicos pueden hacer contribuciones significativas a la investigación científica, generando ideas y manuscritos completos.
- Esto supone un avance hacia el descubrimiento científico automático, pero la supervisión humana sigue siendo esencial para verificar los resultados y garantizar las consideraciones éticas.
Características clave de los sistemas de científicos de IA
Los sistemas de inteligencia artificial para científicos integran múltiples componentes para emular el ciclo de razonamiento y experimentación que siguen los científicos humanos. Estos sistemas combinan modelos fundamentales, control autónomo de laboratorio y razonamiento científico para habilitar mecanismos automáticos de descubrimiento científico.
1. Hipótesis e ideación impulsadas por IA
Los científicos de IA utilizan modelos de lenguaje complejos y razonamiento multiagente para generar hipótesis comprobables. Mediante técnicas como el debate, los agentes de planificación y la búsqueda bibliográfica en bases de datos como Semantic Scholar, estos sistemas identifican posibles líneas de investigación que podrían pasar desapercibidas para los humanos.
2. Diseño y planificación experimental
Una vez propuesta una hipótesis, la IA diseña experimentos o simulaciones adecuados para ponerla a prueba. Esto incluye la selección de variables, controles y criterios de evaluación, equilibrando el costo, el tiempo y la información obtenida. Algunos sistemas integran módulos especializados para la ejecución de experimentos y la optimización de procesos científicos.
3. Laboratorios autónomos o robóticos
Un científico de IA trabaja en entornos de laboratorio automatizados o semiautomatizados equipados con sistemas robóticos. Estos permiten que los experimentos se desarrollen con una supervisión manual mínima, garantizando la continuidad operativa y la recopilación de datos de alta calidad. Incluso los resultados negativos, a menudo ignorados por la comunidad científica humana, se almacenan y se utilizan para la mejora continua.
4. Integración de la IA y los bucles de retroalimentación
Una característica distintiva de estos sistemas es la integración de la IA con los ciclos de retroalimentación del laboratorio. Los resultados de los experimentos perfeccionan los modelos internos de la IA, lo que le permite generar hipótesis más precisas en el siguiente ciclo. Este proceso de autocorrección refleja cómo los investigadores perfeccionan sus enfoques basándose en resultados previos.
5. Análisis e interpretación de datos
Los sistemas de IA limpian, estructuran e interpretan datos brutos para detectar correlaciones, anomalías y patrones causales. Mediante la integración de redes neuronales, modelos de difusión y análisis estadístico, estos sistemas pueden evaluar hipótesis de manera eficiente y actualizar sus modelos de razonamiento en tiempo real.
6. Comunicación y difusión
Algunos marcos de trabajo avanzados incluyen módulos que generan artículos, resúmenes de artículos o informes técnicos. Estos resultados pueden asemejarse a ponencias presentadas en congresos científicos, con razonamiento estructurado, resultados y referencias.
7. Adaptabilidad entre dominios
Una aspiración fundamental de la investigación en IA en este campo es la generalización de los hallazgos a través de diversos dominios científicos. Un científico de IA ideal debería ser capaz de transferir conocimientos de un campo, como el descubrimiento de materiales, a otros como la biología o los sistemas energéticos, sin necesidad de reentrenamiento. Esta adaptabilidad distingue a los científicos de IA de los modelos de aprendizaje automático específicos para cada tarea.
Limitaciones y desafíos actuales
Si bien la visión de un científico autónomo con inteligencia artificial es atractiva, los sistemas actuales se enfrentan a varios desafíos prácticos y conceptuales que impiden la plena realización del descubrimiento científico automático.
Alcance de dominio limitado
La mayoría de las implementaciones operan en áreas científicas específicas y bien definidas, como el plegamiento de proteínas o la síntesis de materiales. La capacidad de generalizar a través de dominios científicos más amplios sigue siendo limitada.
Complejidad de la ejecución física
La transición del diseño computacional a la experimentación en el mundo real plantea dificultades relacionadas con la robótica, la seguridad química y la instrumentación. Muchos sistemas pueden simular o planificar experimentos, pero aún dependen de científicos humanos para su ejecución física.
Confianza e interpretabilidad
Para que un científico de IA contribuya de manera significativa a la investigación científica, el razonamiento que sustenta su trabajo debe ser transparente e interpretable. Los modelos actuales suelen comportarse como cajas negras, lo que dificulta a los investigadores evaluar la solidez de las conclusiones o los supuestos subyacentes.
limitaciones de recursos
La realización de experimentos consume tiempo, materiales y energía. Los sistemas de IA deben optimizar la relación coste-eficacia y la obtención de información, al tiempo que gestionan la limitada capacidad de procesamiento del laboratorio.
Riesgo de optimización degenerada
Sin estrategias de exploración bien definidas, los agentes de IA pueden repetir hipótesis triviales o converger en óptimos locales.
Validación científica y publicación
Aunque un sistema de IA genere resultados plausibles o artículos producidos mediante procesos automatizados, estos deben someterse a revisión por pares y replicación independiente antes de ser aceptados por la comunidad científica. Garantizar la reproducibilidad sigue siendo fundamental.
Adaaptabilidad y generalización
Los sistemas actuales suelen requerir un nuevo entrenamiento para cada nuevo dominio. Desarrollar marcos integrales que generalicen el razonamiento científico a través de diferentes temas sigue siendo un gran desafío para los investigadores de IA.
Sé el primero en comentar
Tu dirección de correo electrónico no será publicada. Todos los campos son obligatorios.