La cooperación SAFE AI arreglará Openfold3 con datos propietarios

hace 3 meses

La cooperación SAFE AI arreglará Openfold3 con datos propietarios


“Los datos públicos están matando su límite. El éxito real solo puede ser a través de la mayor cantidad de datos y, por supuesto, aprovechando los datos industriales, luego dice Robin Roham, CEO y cofundador de Epheris, se centró en una nueva empresa con sede en Berlín Para habilitar datos de datos para el aprendizaje automático, habilitando acceso privado y seguro.

AI Biología estructural (AISB) Consorcio en una nueva iniciativa y Epheris, Openfold 3, una estructura proteica operada por el algoritmo de predicción, desarrollado por el Laboratorio de Mohammad Alkurashi, PhD, profesor asistente de biología del sistema en la Universidad de Columbia, Columbia University La atmósfera de conservación de la privacidad estará bien utilizando los datos de propiedad de Abbi y Johnson & Johnson en la atmósfera.

PálidoLa cooperación E evaluará y refinará el Openfold3 para predecir las estructuras 3D de los complejos de moléculas, que se centrarán en las interacciones de moléculas y anticuerpos por anticuerpos pequeños para el descubrimiento del fármaco.

Rham dice que la inspiración para esta iniciativa era reunir a las fiestas para crear un modelo futuro mejor para el uso profesional personal. Si bien el acceso al nuevo Openfold3 ajustado se limitará a aquellos participantes que contribuyen a sus datos patentados, Roehm se ha destacado que varias formas de accesibilidad de datos son influyentes para la industria.

"Un problema importante para cualquier parte que cree e innove una nueva arquitectura de modelos es T.Oye, no se puede comparar con los datos de propiedad. La validez para la investigación de grado industrial es algo que no puede evaluar ”, dijo Rham General"El acceso a los datos de la industria para la evaluación comparativa es un gran valor para todos los que producen modelos".

Según Alakurashi, una versión de código abierto de Openfold 3, que solo está capacitado en datos disponibles públicamente, será "pronto" para cada vez más comunidad científica con una licencia altamente permisible para uso comercial y no comercial.

"A través de este consorcio, podemos compartir datos con otros socios farmacéuticos, descubriendo la hipótesis de que cada uno de nuestros conjuntos de datos internos se complementaría altamente al capacitar al modelo de IA", dijo John Karnikolas, jefe de descubrimiento de drogas computacionales en ABBV. "El resultado puede ser transformador en la forma en que llevamos adelante el descubrimiento de la droga de mango de AI para desarrollar mejores drogas".

Complicarse

Para que los pacientes con FSHD comiencen las pruebas clínicas para su terapia epignética principalPara que los pacientes con FSHD comiencen las pruebas clínicas para su terapia epignética principal

Según Roham, "¿Quién construirá el próximo banco de datos de proteínas (PDB)?" AI ha sido una de las preguntas más importantes en el espacio.

Alfafold, Ai éxito que rLos investigadores desarrollaron una investigación biológica al proporcionar acceso a los 200 millones de estructuras de proteínas para ser identificadas, operadas por PDB, recolectadas experimentalmente por científicos. Es una alojamiento de repositorio público para más de 200,000 entradas para los datos de estructura de proteínas y ácido nucleico prescritos.

Dado que Alphabafold tenía falta de códigos y datos requeridos para entrenar el nuevo modelo, los investigadores no pudieron verificar la sensibilidad de los alfabéfolos para la composición de datos y el cambio en la arquitectura del modelo, tampoco las variantes del modelo para tratar nuevas tareas más allá de la predicción de una estructura de proteínas. El año pasado, equipo de Alakurashi Publicado Openfold Para abordar esta brecha, una implementación aguda, eficiente y capacitada de los alfabetos.

En particular, la próxima ola de modelos de IA de Alchafold 3 y Alquaishi se ha movido hacia la comprensión de las interacciones del ligando proteína, un área de enfoque es importante para el descubrimiento de fármacos, especialmente raro en las bases de datos públicas.

"Esperamos que al capacitar en cifras de propiedad, el modelo sea más capaz de problemas difíciles, que luchan con los modelos alfabéticos basados ​​en 3, como la predicción de la proteína, los complejos de moléculas pequeñas. General,

Dado el impacto del repositorio público, como PDB, Roham dijo que la industria generalmente "desea un acceso más abierto a los modelos y datos". Sin embargo, puede no ser realista esperar que las compañías farmacéuticas a gran escala liberen públicamente sus activos.

Para mantener la privacidad de los datos entre las partes, la iniciativa del Consorcio AISB aprovecha una arquitectura federada, que capacita el modelo dentro del entorno individual para cada compañía farmacéutica, y luego recopila los resultados de un modelo global de tal manera que los datos subyacentes no se pueden reverenciar. La evaluación de la calidad de los datos también se ha implementado para apoyar el intercambio de valor comercial adecuado para las partes que participan en el programa.

Aunque se argumenta un "cambio de juego" para aprovechar los datos industriales, la mayor parte de la propiedad de propiedad está sujeta a bloqueo y llave. El tiempo dirá si desarrollar los esfuerzos de cooperación de datos continuará efectivamente la próxima generación de éxitos de IA.



Escala en nuevas alturasEscala en nuevas alturas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir