Ciencia Generativa: Punto de Vista "Contrarian" sobre la IA
Ciencia Generativa: La "Visión Contraria" de la IA de OBVIOUS
Los grandes modelos científicos proporcionarán soluciones transformadoras en clima, biotecnología y robótica
JAMES JOAQUIN | 05/08/2024
En 2017, ocho investigadores de Google publicaron un revolucionario artículo llamado Attention is All You Need que sentó las bases para la inteligencia artificial basada en transformers, o lo que ahora conocemos como IA generativa. El primer uso de la tecnología fue para generar medios como texto, imágenes y video.
Los medios de comunicación* generativa han sido una revolución. Pero la próxima ola de IA generativa—la ciencia generativa—será mucho más transformadora para la raza humana e inaugurará la próxima ola de empresas de billones de dólares. Mientras que la mayoría de los dólares de capital riesgo están persiguiendo grandes modelos de lenguaje para la productividad empresarial, Obvious está financiando grandes modelos científicos entrenados en química, física y biología, para generar nuevos avances científicos en descarbonización, biotecnología, ciencia de materiales y robótica.
La idea detrás de la ciencia generativa es simple: entrenar a la IA en nuestro conocimiento de las ciencias físicas como la química y la biología, y luego utilizar esa IA para generar avances científicos que descubran nuevos materiales, nuevos medicamentos y nuevas vacunas. No solo la ciencia generativa (o GenSci) ya está permitiendo avances, sino que también está reconfigurando todos los campos de la ciencia, desde la física hasta la química y la biología, con un enorme potencial para el futuro de nuestra especie y nuestro planeta.
Creemos que la ciencia generativa surgirá como la mayor invención de la humanidad, porque es, por primera vez, una invención que puede inventar.
Los medios de comunicación* generativa nos han proporcionado una imprenta que puede escribir sus propias palabras, pero la ciencia generativa nos proporcionará una mesa de laboratorio más trascendental que puede crear sus propias disposiciones novedosas de átomos. Esos nuevos químicos y moléculas ayudarán a resolver los desafíos más difíciles de la humanidad, desde la fusión nuclear hasta la cura del cáncer, y abrirán vías completamente nuevas de exploración que hemos considerado durante mucho tiempo fuera de nuestro alcance, o que nunca hemos considerado en absoluto.
RESOLVIENDO LO IRRESOLUBLE
La ciencia generativa puede asumir misiones más grandes con una velocidad increíble. Uno de los mayores obstáculos del mundo en la próxima década será la creación de enormes nuevos suministros de energía limpia para impulsar los avances en IA, descarbonización y la electrificación de casi todos los sectores. Según algunas estimaciones, necesitamos triplicar o cuadruplicar nuestra potencia base actual.
La fusión nuclear es nuestra mejor oportunidad para obtener energía limpia ilimitada, pero ha permanecido fuera de nuestro alcance durante décadas. La ciencia generativa ya está permitiendo un progreso importante mucho más rápido de lo que los investigadores humanos posiblemente podrían. Utilizando sistemas de aprendizaje potenciados por IA, los investigadores en Suiza han descubierto cómo controlar el plasma de hidrógeno extremadamente caliente que colisiona en poderosas reacciones de fusión, un paso crucial que nos acerca más que nunca a un avance científico que cambie el mundo.
Por otro lado, la energía geotérmica, durante mucho tiempo una fuente de energía costosa y difícil de alcanzar, también está recibiendo un gran impulso de la ciencia generativa. La compañía geotérmica con sede en Utah, Zanskar, ha demostrado que puede superar a los mejores geólogos humanos en la exploración de sitios aplicando IA para analizar datos geológicos e identificar nuevas fuentes de energía y formas novedosas de alcanzarlas.
Con ricos nuevos suministros de energía, la ciencia generativa también nos ayudará a almacenarla en baterías novedosas. En un mundo con escasez de litio, los modelos de IA ya están descubriendo nuevas químicas de baterías. El año pasado, una herramienta de IA de Microsoft encargada de encontrar nuevas consistencias de baterías para almacenar y distribuir energía tardó menos de tres días en reducir 32 millones de materiales a 18 y aterrizó en un candidato que redujo el uso de litio en un 70 por ciento.
En todos los frentes de nuestra búsqueda de un mundo más limpio, la ciencia asistida por IA está en las primeras etapas de iluminar nuevas tecnologías, métodos mejorados y materiales novedosos. Con cada avance, la ciencia generativa incorpora sus hallazgos y los construye sobre ellos.
UN NUEVO MÉTODO CIENTÍFICO
La ciencia tradicional siempre ha trabajado con el antiguo método científico. Comienza con una hipótesis sobre dónde comenzar, seguida de experimentos, análisis y una conclusión positiva o negativa. Este método nos ha traído siglos de avances, desde vacunas hasta anestesia. Pero está limitado por los límites de la cognición humana y el lento ritmo del análisis humano.
Con la ciencia generativa, este antiguo método se está extinguiendo. Como empezamos a ver en 2018, los modelos actuales aportan capacidades sin precedentes en la generación de hipótesis, la experimentación y el análisis de datos. Las futuras iteraciones generarán de forma autónoma grandes cantidades de datos, simularán fenómenos complejos y explorarán posibilidades generalizadas en espacios de búsqueda masivos.
Estos sistemas detectarán patrones, anomalías y correlaciones en los datos que los investigadores humanos podrían no descubrir nunca.
La biotecnología y la atención sanitaria son los espacios más ricos para presenciar el nuevo método científico en acción. Ya vimos una gran revolución en biotecnología en 2020 cuando los científicos utilizaron el ARNm para desarrollar vacunas Covid en tiempo récord. La tecnología detrás de las vacunas COVID que instruye a las células para producir proteínas específicas puede teóricamente abordar casi cualquier enfermedad, incluyendo el cáncer, la tuberculosis, el VIH/SIDA, las enfermedades del corazón y la diabetes.
Los científicos no pueden encontrar todos estos caminos curativos por sí mismos. Hay un número imposiblemente grande de posibles secuencias de ARNm, incluso una proteína relativamente simple como la proteína spike en las vacunas Covid puede ser codificada en tantas como 2.4 x 10632 posibles disposiciones de ARNm, un número exponencialmente mayor que los 1082 átomos en el universo conocido. Pero los modelos de ciencia generativa bien entrenados pueden buscar en espacios de datos multidimensionales y superficiar caminos relevantes con una velocidad sin precedentes.
La compañía de bio-software Inceptive está liderando la revolución del ARN. Inceptive fue fundada en 2021 por Jakob Uszkoreit, uno de los ocho investigadores de Google que fueron pioneros en la IA basada en transformers. La tecnología generativa de Inceptive está diseñada para descubrir nuevas combinaciones de ARNm para desarrollar vacunas novedosas.
La innovación similar ya está en juego en otros campos. Los investigadores han comenzado a usar la IA para predecir estructuras de proteínas, regular el plasma dentro de un reactor de fusión nuclear y sondear el tamaño y la estructura del universo entero basándose en la composición de una galaxia. Y Google DeepMind acaba de lanzar una versión más potente de AlphaFold, una IA que puede predecir el comportamiento de mecanismos microscópicos, incluyendo ADN y ARN, con la esperanza de que esta tecnología acelere la creación de nuevos medicamentos.
ÁTOMOS A BITS, BITS A ÁTOMOS
La base de la ciencia generativa utiliza datos biológicos, químicos y físicos para entrenar la IA moderna. De la misma manera que los medios generativos analizan millones de piezas de texto e imágenes para construir réplicas creativas, los modelos de ciencia generativa se entrenan en ADN, ARN, nucleótidos, secuencias de aminoácidos de proteínas, imágenes de células, estructura química y mediciones físicas.
Unir estos componentes físicos con el mundo digital requiere una infraestructura que pueda convertir la materia química y biológica (átomos) en información rica en datos (bits) que las computadoras puedan procesar y analizar. También debe actuar en sentido inverso. Una vez que la IA predice un posible avance, como una molécula de ARNm o una secuencia de proteínas que puede instruir a las células para combatir el cáncer colorrectal, el hallazgo de datos (expresado en bits) debe convertirse de nuevo en material biológico (átomos) que pueda ser probado, validado y finalmente desplegado con alta confianza de seguridad y eficacia en pacientes con cáncer.
El nuevo hardware y software necesario para la síntesis avanzada de productos químicos y materiales biológicos será un área emocionante de progreso (y de inversión de capital riesgo) en los años venideros.
Además, sabemos por las primeras iteraciones de la ciencia generativa que la calidad de la producción científica es tan buena como la calidad de la entrada científica. Los mejores resultados se basan en datos precisos y bien curados, y que son verificables y reproducibles, especialmente cuando se aplican en áreas sensibles como la biología humana. Los datos ruidosos o las llamadas fugas de datos no sólo producen resultados poco fiables e irreproducibles. También socavan la inversión y la confianza en otras áreas de la ciencia generativa que pueden transformar industrias y salvar vidas.
CIENCIA DE LA IA EN ACCIÓN
La pieza central de la ciencia generativa es combinar el software impulsado por la IA con el hardware que puede acelerar el ritmo de la experimentación y el análisis. En 2009, los investigadores hicieron esto por primera vez con un robot llamado Adam que predijo las lagunas en el genoma conocido de la levadura de panadero. Ahora tenemos las herramientas para potenciar ese proceso.
Las próximas iteraciones llevarán a cabo de forma autónoma todo el proceso científico. Los sistemas robóticos utilizarán la IA para postular hipótesis, realizar experimentos con materiales físicos, analizar datos experimentales y luego utilizar los aprendizajes relevantes para formular nuevas hipótesis.
Este ciclo robótico no reemplaza la creatividad humana, pero sí minimiza el error humano. De la misma manera que las herramientas de desarrollo potenciaron a los ingenieros de software con nuevas características y funcionalidades, la ciencia generativa potenciará a los científicos de laboratorio para pensar de manera expansiva sin el trabajo lento y laborioso de medir, mover y observar materiales.
La robótica impulsada por la IA será especialmente poderosa en el descubrimiento de medicamentos. La compañía TechBio Recursion ha desarrollado un sistema operativo que puede realizar millones de experimentos automatizados cada semana para explorar cómo interactúan los sistemas biológicos y la química. Otras compañías están construyendo plataformas diseñadas para descubrir de forma autónoma productos químicos sintéticos y nuevos materiales. La investigación de laboratorio acelerada dará lugar a posibilidades más amplias en todos los campos de la ciencia.
CONSTRUCCIÓN DE GUARDARRAÍLES ESENCIALES
Los humanos siempre han sido los conductores centrales de la ciencia, y seguirán siéndolo. Aunque la ciencia generativa puede mejorar nuestras capacidades y acelerar el descubrimiento, la supervisión humana es clave para mantener los sistemas funcionando de manera segura y ética. Los científicos capacitados deben diseñar los experimentos, interpretar los resultados y asegurarse de que la tecnología sólo pueda ser accedida por aquellos que saben cómo manejarla y protegerla.
Tal tecnología poderosa plantea el clásico dilema del doble uso. La tecnología de la ciencia generativa que mejora la vida en la tierra podría ser cooptada en las manos humanas equivocadas. La misma impresora biológica que hace posible imprimir plástico apto para alimentos sin petróleo también podría ser utilizada para imprimir una bacteria diez veces más letal que la E. coli. El mismo motor de síntesis química que fabrica los ingredientes compuestos para una batería revolucionaria podría ser dirigido para construir bombas y explosivos devastadores.
Por eso, para que la ciencia generativa sea positiva para el mundo, debe trabajar en la amplia lista de verificación E-T-H-I-C-S que desarrollé con mis colegas de Obvious.
Los sistemas detrás de la ciencia impulsada por la IA deben ser explicables y transparentes para construir confianza en cómo los sistemas procesan datos complejos para llegar a conclusiones complejas.
Su trabajo debe ser centrado en el ser humano e inclusivo para minimizar el sesgo y las anteojeras que podrían desfavorecer a amplias comunidades, y deben promover la civilidad y el progreso en el más amplio mundo. Es crucial que estos sistemas sean sostenibles en cómo consumen energía y recursos. Mientras los gobiernos se apresuran a diseñar marcos regulatorios para la IA, animamos a los fundadores a actuar ahora, a contratar a sus propios equipos rojos, y a construir salvaguardias y guarda-railes en sus sistemas de IA.
SE NECESITAN MENTES BRILLANTES
Creemos que la ciencia generativa creará una aceleración exponencial en los avances científicos. Las startups innovadoras que impulsan estos avances necesitarán equipos interdisciplinarios que vivan en la intersección de la IA y algunas de las industrias más grandes del mundo. Hemos destacado algunos ejemplos emocionantes de IA en clima, atención sanitaria y robótica. Eso es sólo el principio. Estamos buscando startups de ciencia generativa que también estén reimaginando futuras industrias de crecimiento como la robótica y los materiales avanzados.
Para más información al artículo original: Generative Science: Our Contrarian View of AI
Este artículo ha sido traducido con ayuda de IA.
Los subrayados y colores resaltados en el texto han sido agregados formateados por el copywriter del artículo.
*Traducción/interpretación libre.