Los científicos del MIT han liberando un potente modelo de IA de código abierto, llamado Boltz-1, que puede acelerar significativamente la investigación biomédica y el desarrollo de fármacos.
Desarrollado por un equipo de investigadores de la Clínica Jameel del MIT para el Aprendizaje Automático en Salud, Boltz-1 es el primer modelo de código abierto que logra un rendimiento de última generación al nivel de AlphaFold3, el modelo de Google DeepMind que predice las estructuras 3D de proteínas y otras moléculas biológicas.
Los estudiantes graduados del MIT Jeremy Wohlwend y Gabriele Corso fueron los principales desarrolladores de Boltz-1, junto con el investigador asociado de la clínica del MIT Jameel Saro Passaro y los profesores de ingeniería eléctrica e informática del MIT Regina Barzilay y Tommi Jaakkola. Wohlwend y Corso presentaron el modelo en un evento el 5 de diciembre en el Stata Center del MIT, donde dijeron que su objetivo final es fomentar la colaboración global, acelerar los descubrimientos y proporcionar una plataforma sólida para avanzar en el modelado biomolecular.
“Esperamos que este sea un punto de partida para la comunidad”, dijo Corso. “Hay una razón por la que lo llamamos Boltz-1 y no Boltz. Este no es el final del camino. Queremos la mayor cantidad de aportes de la comunidad que podamos obtener”.
Las proteínas juegan un papel esencial en casi todos los procesos biológicos. La forma de una proteína está estrechamente relacionada con su función, por lo que comprender la estructura de una proteína es fundamental para diseñar nuevos fármacos o diseñar nuevas proteínas con funciones específicas. Pero debido al proceso extremadamente complejo mediante el cual la larga cadena de aminoácidos de una proteína se pliega en una estructura tridimensional, predecir con precisión esta estructura ha sido un gran desafío durante décadas.
AlphaFold2 de DeepMind, que otorgó a Demis Hassabis y John Jumper el Premio Nobel de Química 2024, utiliza el aprendizaje automático para predecir rápidamente estructuras de proteínas en 3D que son tan precisas que son indistinguibles de las derivadas experimentalmente por los científicos. Este modelo de código abierto ha sido utilizado por equipos de investigación académicos y comerciales de todo el mundo, lo que ha impulsado muchos avances en el desarrollo de fármacos.
AlphaFold3 mejora a sus predecesores al incorporar un modelo de IA generativo, conocido como modelo de difusión, que puede manejar mejor la cantidad de incertidumbre involucrada en la predicción de estructuras proteicas extremadamente complejas. Sin embargo, a diferencia de AlphaFold2, AlphaFold3 no es completamente de código abierto ni está disponible para uso comercial, lo que hizo crítica de la comunidad científica y comenzó una competencia global para construir una versión comercial del modelo.
Para su trabajo en Boltz-1, los investigadores del MIT siguieron el mismo enfoque inicial que AlphaFold3, pero después de estudiar el modelo de difusión subyacente, exploraron posibles mejoras. Incorporaron aquellos que aumentaron aún más la precisión del modelo, como nuevos algoritmos que mejoran la eficiencia de los pronósticos.
Junto con el modelo en sí, han abierto todo su proceso para entrenamiento y ajuste para que otros científicos puedan construir Boltz-1.
“Estoy muy orgulloso de Jeremy, Gabriele, Saro y el resto del equipo de Jameel Clinic por hacer posible esta liberación. Este proyecto requirió muchos días y noches de trabajo, con una determinación inquebrantable para llegar a este punto. Hay muchas ideas interesantes para futuras mejoras y esperamos compartirlas en los próximos meses”, afirma Barzilay.
Al equipo del MIT le llevó cuatro meses de trabajo y muchos experimentos desarrollar Boltz-1. Uno de sus mayores desafíos fue superar la ambigüedad y heterogeneidad contenida en el Banco de Datos de Proteínas, una colección de todas las estructuras biomoleculares que miles de biólogos han resuelto durante los últimos 70 años.
“He pasado muchas noches largas luchando con estos datos. Gran parte es conocimiento puro del dominio que debe adquirirse. No hay atajos”, afirma Wohlwend.
Al final, sus experimentos muestran que Boltz-1 logra el mismo nivel de precisión que AlphaFold3 en un conjunto diverso de predicciones de estructuras biomoleculares complejas.
“Lo que Jeremy, Gabriele y Saro han logrado es nada menos que extraordinario. Su arduo trabajo y perseverancia en este proyecto han hecho que la predicción de estructuras biomoleculares sea más accesible para la comunidad en general”, dice Jaakkola.
Los investigadores planean seguir mejorando el rendimiento de Boltz-1 y reducir la cantidad de tiempo que lleva hacer predicciones. También invitan a investigadores a probar Boltz-1 en ellos repositorio de GitHub y conectarse con otros usuarios de Boltz-1 en su red canal débil.
“Creemos que todavía quedan muchos, muchos años de trabajo para mejorar estos modelos. Estamos muy ansiosos por colaborar con otros y ver qué hace la comunidad con esta herramienta”, añade Wohlwend.
Mathai Mammen, director ejecutivo y presidente de Parabilis Medicines, califica a Boltz-1 como un modelo “revolucionario”. “Al abrir este progreso, la Clínica Jameel del MIT y sus colaboradores están democratizando el acceso a las herramientas de biología estructural más avanzadas”, afirma. “Este esfuerzo histórico acelerará la creación de medicamentos que cambian vidas. ¡Gracias al equipo de Boltz-1 por liderar este profundo paso adelante!
“Boltz-1 va a ser increíblemente poderoso, para mi laboratorio y para toda la comunidad”, añade Jonathan Weissman, profesor de biología en el MIT y miembro del Instituto Whitehead de Ingeniería Biomédica, que no participó en el estudio. “Vamos a ver toda una ola de descubrimientos posibles gracias a la democratización de esta poderosa herramienta”. Weissman añade que anticipa que la naturaleza de código abierto de Boltz-1 conducirá a una amplia gama de nuevas aplicaciones creativas.
Este trabajo también fue apoyado por una subvención de Expediciones de la Fundación Nacional de Ciencias de EE. UU.; Clínica Jameel; el programa de Descubrimiento de Contramedidas Médicas Contra Amenazas Nuevas y Emergentes (DOMANE) de la Agencia de Reducción de Amenazas de Defensa de Estados Unidos; y el proyecto MATCHMAKERS, respaldado por la asociación Cancer Grand Challenges financiada por Cancer Research UK y el Instituto Nacional del Cáncer de EE. UU.
(etiquetasTraducir)Jeremy Wohlwend
Este contenido incluye información obtenida de