
Chan Zuckerberg Initiative libera el modelo de IA del transcriptor
hace 3 semanas

"Hola modelo, si te indico con un gen marcador para un tipo de célula, ¿puedes completar los factores de transcripción que crees que se expresarán altamente con la expresión de estos genes?" El jefe de inteligencia artificial (AI), Theiafanis Carletos, dijo: "dijo:" Dijo que había imaginado un futuro en el que los científicos ya no habían visto a través de montañas de literatura, datos y experimentos, que era hacer preguntas biológicas muy puntiagudas. "
En cambio, Karletes ve un punto de infección en el que el modelo AI interroga el patrón de los grandes datos para producir una visión biológica significativa de la voluntad, la diferencia entre consultas y confundiendo el chat a través de cientos de libros de la biblioteca.
En un paso hacia esa visión de los datos transcriptómicos de células individuales, Karaletsos y sus colegas en CZI han publicado un transcriptorsor modelo generativo y múltiple para verificar la biología celular en los organismos.
Publicado como uno Preimpresión en Biorxiv Esto aún no ha sido revisado por el colega, que muestra a los autores que el transcriptor puede estar motivado para predecir los factores de transcripción específicos de tipo celular e interacciones de gen génica que se combinan con comentarios experimentales independientes.
El transcriptor se capacita en datos de transcriptómica de células individuales de más de 110 millones de células de 12 especies diferentes, que cubren 1,5 mil millones de años de desarrollo. Las habilidades integrales adicionales del modelo incluyen la identificación del estado de la enfermedad, la biología comparativa, la codificación de estructura biológica de nivel múltiple y más.
"Si piensa en el campo Atlas de células, las personas han estado haciendo una lluvia de ideas durante los últimos 10 años, pero nadie ha llegado a saber cómo mantenerlo en un solo contexto", Stephen Quake, PhD, Jefe de Ciencias en CZI y autor de Science in Czi, en una entrevista en una entrevista. General"Vemos un transcriptor como una forma de igualar el ensamblaje del genoma para los datos de Atlas de células".
Además de proporcionar información evolutiva para comprender la relación entre las especies de transcriptor de los estados de terremoto, las células de ingenieros para la biología sintética y la terapia celular proporcionarán aplicaciones fuertes en el diseño de los estados celulares.

La transcripción es uno de los cuatro grandes desafíos científicos para el programa de células virtuales del CZI, uno de los cuatro grandes desafíos científicos que la organización sin fines de lucro estableció en un intento de cambiar la salud humana en la intersección de la IA y la biología antes de este abril. Los desafíos restantes incluyen el desarrollo de técnicas de imagen para mapear sistemas biológicos complejos, crear nuevas herramientas para medir la inflamación en los tejidos en tiempo real y usar el sistema inmune para la detección temprana de la enfermedad, prevención y tratamiento.
Además, CZI está apostando a eso, según Quake, "necesita más datos" mientras es estratégico sobre la elección de datos. El lanzamiento del Transcriptformer sigue el anuncio de febrero del CZI del proyecto de ventas de mil millones, una colaboración para un rápido progreso en biología en biología para generar un conjunto de datos celular sin precedentes con una colaboración con la genómica 10X y la genómica Ultima.
CZI no es la única unidad en el cultivo de espacio celular virtual. A principios de esta semana, ARC Institute anunció esfuerzos para desarrollar ARC Virtual Cell AtlasEl Instituto de Investigación con sede en Palo Alto también es conocido por hacer grandes apuestas en AIS operados con datos grandes. En febrero, el modelo de la Fundación Genome de ARC, creado en colaboración con EVO2, NVDIA, creó las olas como el modelo de IA públicamente disponible para la biología.
¿Qué es el tipo de celda?
Según los autores, el transcriptor indica cómo la extensión de los datos evolutivos de pre-entrenamiento evolutivos puede aumentar la capacidad de un modelo para normalizar las tareas y las especies.
"Tenemos el modelo 'Tipo de célula lo que es' o 'lo que es la especie". Ve millones de células y aprende estructuras emergentes ”, dijo Carletos General,
En la clasificación del tipo de célula, el transcriptor identificó con éxito tipos de células de nuevas especies, no observadas durante el entrenamiento, y se separó de más de 685 millones de años de distancia evolutiva. En la predicción del estado de la enfermedad, el modelo separó efectivamente las células infectadas con SARS-CoV-2 enfermas y saludables sin el requisito de un conjunto de datos de células específicos de COVID-19. El transcriptor también fue capaz de aprender la estructura biológica multicolor y las propiedades contingentes sobre las células del clúster basadas en varias referencias de tejido.
Además, Karlatos destacó que la capacidad de analizar las especies cruzadas brinda la oportunidad de explicar cómo los modelos pueden traducir organismos en humanos.
"Sabemos que los ratones nos enseñan mucho sobre el envenenamiento y los ensayos clínicos de fase I, pero mecánicamente no tenemos un modelo que predice qué cosas se moverán y qué no será", dijo Carlatos. General. "El transcriptor es un primer paso sólido en esa trayectoria".
En el contexto de lo que hemos venido en el CHATGPT adecuado para los datos biológicos, Karaletsos dijo que el transcriptor es un futuro largo para el desarrollo recurrente. Además, el equipo se centrará en expandir los datos del modelo para especies más diversas y muchos tipos, como la protómica y la genómica, para que el acceso normal se pueda mejorar aún más.
Transcriptformer es accedible públicamente en CZI Plataforma de celdas virtuales Disponible en el código Github. Con él Portátil de tutorial de demostración Se han publicado predicciones celulares para la comunidad de investigación biológica en especies cruzadas.
Deja una respuesta