ARC Institute lanzó Virtual Cell Challenge para acelerar el desarrollo del modelo de IA

hace 7 horas


Crédito: Just_Super/Getty Images

Yusuf Rohani, PhD, Lead de grupo de aprendizaje automático en el Instituto ARC, Uno del equipo de investigadores es que la inteligencia artificial (IA) entrena el modelo con datos de transcriptom, para adivinar cómo los patrones de expresión génica celular cambian con diferentes estados de células. Estas llamadas células virtuales pueden ayudar a los investigadores a encontrar nuevos medicamentos capaces de transferir células de "enfermo" a "saludable" con efectos bajos a objetivos para promover tasas de éxito clínico.

Sin embargo, la construcción de la celda virtual no es un logro fácil.

"Cuando miras las células, están viviendo el sistema dinámico", dijo Ruhani en una entrevista Edad del gen"Las células están en flujos frecuentes, están en mal estado y dependen del experimento".

Los modelos de células virtuales deben ser responsables de la complejidad biológica, como los tipos de células, los fondos genéticos y las referencias de las células. Además, muchos conjuntos de datos de un solo células existentes se ven afectados por un ruido técnico adecuado, lo que implica una fertilidad limitada de perturbaciones en experimentos independientes, lo que reduce el rendimiento del modelo.

Sin el punto de referencia estandarizado y el conjunto de datos fabricados de propósito, el área ha luchado para evaluar si los modelos de células virtuales normalmente ocupan información biológica y no un patrón específico del conjunto de datos.

En un paso hacia la evaluación comparativa y la aceleración de las células virtuales, el Instituto ARC ha anunciado una competencia pública patrocinada por NVIDIA, 10X genómica y Ultima Genomics, "Virtual Cell Challenge", con un gran premio de $ 100,000 para modelos de aprendizaje automático, que mejor predice cómo responderán las células. Descrito en desafío nuevo comentario publicado en Cámara Con Rohani como el escritor principal.

Ponte los pasos de la iniciativa Evaluación importante de la predicción de la estructura de proteínas (CASP) Competencia, diferentes experimentos que evalúan el último modelo de estado del estado en biología estructural. Patrick Hsu, PhD, cofundador e investigador central en ARC, enfatizó que las competiciones CASP han cambiado la predicción de la estructura de proteínas en 25 años y finalmente han permitido éxitos como el algoritmo ganador del Premio Nobel, Alfafafold.

HSU dijo en un comunicado público: "Creemos que ARC puede usar el mismo enfoque para acelerar el progreso hacia células virtuales amplias que originalmente pueden cambiar la forma en que estudiamos la biología e identificar objetivos para tratar las enfermedades complejas mejor".

Emma Lundberg, PhD, profesora asociada en la Universidad de Stanford y codirectora de proteínas humanas Atlas, con sede en el KTH Royal Institute of Technology en EstocolmoEl consentimiento de Benchmark es un desafío importante para evaluar y comparar el modelo de celda virtual.

"Espero que el desafío (ARC) ayude a alinear a la comunidad y acelerar el trabajo hacia los modelos de células virtuales protestantes y útiles. Con suerte, es el primero de muchos desafíos estandarizados en este lugar", dijo. Borde general.

Chan Zuckerberg Initiative (CZI) es un desarrollador activo del director senior de IA, Theofanis Karaletsos, Virtual Sale, que ha llevado a cabo modelos recientes de CZI, como Acontecer Para alteraciones de una sola célula, y Transcripción Para predicciones de especies cruzadas.

"En CZI, nos estamos centrando en la creación de modelos estatales de los modelos y proporcionando un marco de evaluación estandarizado para profundizar la comprensión de la comunidad científica de células", dijo Karaletsos. Edad del gen"Los puntos de referencia comunitarios son importantes, y creemos que las competiciones abiertas como ARC tienen un mecanismo poderoso para acelerar la innovación y el progreso colectivo".

Una organización de investigación sin fines de lucro con sede en Palo Alto, Arc Institute se estableció en 2021 HSU y Silvana Konmanman, PhD, profesor asistente de Bio Química en la Universidad de Stanford y actual Director Ejecutivo de ARC. Desde entonces, se sabe que el instituto coloca grandes apuestas en los AI propulsados ​​por datos. A principios de este año, en colaboración con NVIDIA, Arch emitió que dijo en ese momento descrito como el modelo de IA públicamente disponible para biología, dijo, dijo, dijo,. Evo 2,

Nueva referencia

ARC evaluará la competencia de ARC fuera de los datos de capacitación como un desafío importante para el modelo de IA Qué tan bien las celdas virtuales pueden competir cuando se normalizan en un nuevo contexto celular.

Para la competencia de apertura, ARC ha generado un nuevo conjunto de datos de transchriptomics de células individuales con 300 perturbaciones genéticas de las 300,000 H1 Célula madre embrionaria humana (H1 HESC), que se implementará en el segmento para el ajuste y las pruebas.

El modelo se evaluará en las siguientes tres métricas: 1) realizar las diferencias expresadas a los genes expresados; 2) discriminación del rendimiento entre diversos efectos de perturbaciones; Y 3) error común en términos de desviación del cálculo de la expresión.

El modelo de laboratorio en chip de la estación espacial explica cómo la microgravedad ejecuta la degeneración muscular

El rendimiento provisional del modelo competitivo se compartirá en una tabla de clasificación en vivo durante la fase media de la competencia. Tres equipos con los mejores modelos recibirán premios de $ 100,000, $ 50,000 y $ 25,000 con una combinación de premios en efectivo y crédito NVIDIA DGX Cloud.

Registro para la competencia Ahora abiertoJunto con contribuyentes individuales, los equipos de instituciones educativas, compañías de biotecnología y organizaciones de investigación independientes son elegibles para participar. La clasificación final se determinará por el rendimiento del modelo en el conjunto de pruebas finales, que se lanzará a fines de octubre una semana antes de la fecha límite de presentación final. Los ganadores serán anunciados en diciembre.

Estado actual

Como línea de base, los concursantes del desafío de células virtuales inicialmente irán a la cara directa con el primer modelo de ARC de células virtuales, diseñado para estimar cómo se dan varias células madre, células cancerosas y células inmunes cómo responder a los medicamentos, citocinas o trastornos genéticos. El estado fue lanzado para uso no comercial a principios de esta semana y se describe en él. A Preimpresión Publicado en el sitio web de ARC que aún no ha sido revisado por el colega.

Según los autores, el estado mejoró los efectos de las perturbaciones en más del 50% en varios conjuntos de datos grandes y genes identificados expresados ​​durante las perturbaciones genéticas, de señalización y química con una precisión de 2 veces en comparación con los modelos existentes.

Para promover la flexibilidad y la balance, el estado está compuesto por dos módulos entrelazados, conocidos como el modelo de transición de estado (ST) y el modelo de incrustación de estado (SE).

Las referencias ST70 aprenden perturbaciones mediante el uso de datos de más de 100 millones de perturbaciones. A diferencia de los modelos existentes, que se centran en predecir predicciones para una sola célula a la vez, ST aprovecha una arquitectura de transformador bidireccional separada para hacer predicciones para toda la recolección de células. El enfoque proporciona un avance al permitir la ocupación flexible de la desigualdad biológica y técnica sin depender de creencias claras sobre la distribución.

El SE está entrenado en datos de células individuales de 167 millones de células humanas para aprender la variación de la expresión génica entre las células en varios conjuntos de datos. El módulo proporciona representaciones adaptadas para detectar perturbaciones biológicas y son fuertes para que el ruido técnico capacite de manera efectiva al estado con varios conjuntos de datos grandes.

Existe un modelo basado en transformadores para predecir las perturbaciones en el conjunto de células de estado (ARC Institute)
Las perturbaciones en los conjuntos de células de estado son un modelo basado en transformadores para predecir los efectos. (Instituto ARC)

Datos sobre datos

Los concursantes de desafío de células virtuales están invitados a entrenar modelos sobre la expresión génica de la base de datos pública, incluidos más de medio mil millones de células Atlas de células virtuales de arcoQue está hecho de un gran conjunto de datos de una sola célula, scBasecount, Y Taho -100m,

Fabian This, PhD, DEctor del Instituto de Biología Computacional Helmholtz Munich es un investigador famoso que está trabajando para predecir perturbaciones genéticas y químicas a nivel celular. Él dice que la escala de datos y la mejora de la calidad han sido importantes para llevar adelante el campo.

"Estoy entusiasmado con el próximo desafío de predicción de perturbaciones de ARC", dijo esto Edad del gen"La escala de datos se ha expandido recientemente adecuadamente para permitir que el modelo de IA generativo complejo mejore el modelo lineal simple. Sería emocionante ver el verdadero comportamiento fuera de disco de varios tipos de modelos evaluados en nuevos datos".

Tess Lab Group es conocido como desarrollador Flujo de celda, Una estructura basada en la coincidencia de flujo, un enfoque de modelado común, que puede simular fenotipos de células individuales inspiradas en perturbaciones complejas. Además, Theis es un asesor científico de los problemas abiertos, un grupo científico que ha organizado el C. en cuestiónHalenges para comparar varios métodos de análisis de células individuales.

Conjuntos de datos adicionales que son juegos apropiados para el entrenamiento del modelo de desafío de celda virtual X-ATALAS/ORIANO, AI Drug Discovery Unicorn, el mayor PertBurbuBurbs disponible públicamente publicado por Xaira Theraputics la semana pasada. Conjunto de datos Proporciona el beneficio de medir Efectos genéticos dependientes de la dosis para aplicaciones médicas, sEl UCH está tan definido como un porcentaje preciso de prohibición en el que un objetivo de drogas crea un efecto deseado.

CI Chu, PhD, vicepresidente de descubrimiento temprano en Xaira, está de acuerdo en que CASP ha dado un buen ejemplo para la evaluación comparativa en la predicción de la estructura de proteínas.

"Es emocionante ver que el equipo de Arch implementa el mismo sentimiento para la comunidad de celdas virtuales", dijo Chu a Edad del gen"La progresión del sector eventualmente está vinculada a los datos. Cuanto más alta calidad, los datos públicos son para construir una comunidad, es mejor,Es por eso que también lanzamos a X-ATALAS/Orion. ,

Actualmente, Xaira está produciendo su propio modelo de células virtuales con el jefe de especialista en IA, Bo Wang, PhD, SVP y Biomedical AI, quien se unió al equipo en abril. De la Universidad de Toronto, conocido como Wang Inventor SCGPTUn modelo de base para múltiples múltiples de células individuales con capacidades aguas abajo, incluida la anotación de tipo celular, la predicción de la reacción de perturbaciones y las estimaciones de la red de genes.

A medida que los investigadores llevaron a cabo la próxima generación del modelo AI para crear una marca en la tabla de clasificación de desafíos de celdas virtuales, el área verá si los nuevos trajes de avance médico seguirían. Deje que comience el desafío.



Nueva vacuna protege al ganado de enfermedades mortales transmitidas por garrapatas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir