La IA de tecnología novedosa puede controlar el problema de las correlaciones espontáneas
hace 2 meses
Crédito: dominio público Unsplash/CC0
Los modelos de IA a menudo confían en "correlaciones espontáneas", que deciden sobre la base de información insignificante y potencialmente engañosa. Los investigadores ahora han descubierto que estas correlaciones aprendidas pueden detectar una mayoría de los datos de entrenamiento muy pequeños y han demostrado una técnica que cruza el problema. El trabajo está en Publicado Pero arxiv Servidor de preimpresión.
"Esta técnica es una novela en la que se puede usar incluso cuando no sabes en qué tipo de correlación se basa la IA", Jung-yun Kim, un artículo sobre el trabajo, un escritor compatible de un artículo sobre el trabajo y profesor asistente de informática en la Universidad Estatal de Carolina del Norte.
"Si ya tiene una buena idea de qué características especiales son, nuestra tecnología es una forma calificada y efectiva de abordar el problema. Sin embargo, a pesar de que simplemente está realizando problemas, pero no se entiende que puede usar nuestra tecnología para determinar si una correlación espontánea existe y resuelve ese problema".
En general, existen correlaciones espontáneas debido a prejuicios de simplicidad durante el entrenamiento de IA. Los profesionales usan el conjunto de datos para entrenar modelos AI para realizar tareas específicas. Por ejemplo, un modelo de IA puede ser entrenado para identificar fotos de perros. El conjunto de datos de entrenamiento incluirá fotos de perros donde se le dice que AI se le dice que un perro está en la foto.
Durante el proceso de entrenamiento, la IA comenzará a identificar características específicas que pueden usarlo para identificar perros. Sin embargo, si muchos perros usan collar en las fotos, y debido a que el collar generalmente tiene características menos complejas del perro que la oreja o el pelaje, la IA puede usar el collar como una forma simple de identificar perros. De esta manera, el prejuicio de simplicidad puede causar correlaciones espontáneas.
"Y si la IA usa el collar como factor para identificar perros, la IA puede identificar a los gatos con collares como perros", dice Kim.
Las técnicas tradicionales para abordar los problemas causados por las correlaciones espontáneas dependen de los médicos que son capaces de identificar las características del problema. Luego pueden abordarlo modificando el conjunto de datos utilizado para entrenar el modelo AI. Por ejemplo, los médicos pueden aumentar el peso dado a las fotos en el conjunto de datos que contienen perros que no usan collar.
Sin embargo, en su nuevo trabajo, los investigadores demostraron que no siempre es posible identificar las características que están causando problemas, relaciones tradicionales para adquirir técnicas tradicionales para abordar las correlaciones ineficaces.
El documento se presentará en la Conferencia Internacional sobre Representación de Aprendizaje (ICLR), que se llevará a cabo en Singapur del 24 al 28 de abril. El primer escritor del periódico, Varun Mulchandani, un Ph.D. Estudiantes en el estado de Carolina del Norte.
Kim dice: "Con este trabajo, nuestro objetivo era desarrollar una tecnología que no sabemos nada sobre esas características serias".
La nueva tecnología depende de la eliminación de una pequeña porción de los datos utilizados para entrenar el modelo AI.
"Los datos incluidos en el conjunto de datos de capacitación pueden tener variaciones significativas", dice Kim. "Algunas muestras pueden ser muy simples, mientras que otras pueden ser muy complejas. Y podemos medir cómo cada muestra se basa en 'difícil' que el modelo se comporta durante el entrenamiento.
"Nuestra hipótesis fue que las muestras más difíciles en el conjunto de datos pueden ser ruidosas y poco claras, y es más probable que una red obligue a una red a confiar en información irrelevante que daña el rendimiento de un modelo", dice Kim.
"Al eliminar un pequeño escaso de datos de entrenamiento que es difícil de entender, también está eliminando muestras de datos duros que tienen características espontáneas. Esta eliminación elimina el problema de las correlaciones de correlación, sin crear efectos adversos significativos".
Los investigadores demostraron que la nueva tecnología logra los resultados de última generación, cuando el rendimiento del rendimiento en los modelos también mejora el rendimiento, donde las características tangentes fueron reconocibles.
Más información:
Varun Mulchandani et al, separando las correlaciones espontáneas con la pronta de datos, arxiv (2025). Doi: 10.48550/arxiv.2503.18258
Citación: La nueva tecnología controla el problema de las correlaciones espontáneas en IA (2025, 18 de abril), el 19 de abril de 2025 desde https://techxplore.com/news/2025-04-technique-spurious-spurious-i.html
Este documento está sujeto a derechos de autor. Además de cualquier comportamiento imparcial para el propósito de estudios o investigaciones privadas, no se puede volver a interrogarlo sin permiso por escrito. El contenido se proporciona solo para fines de información.
Deja una respuesta Cancelar la respuesta