Cómo está cambiando Deepsek AI Landscape

hace 5 meses

Crédito: Dominio público de Pixabay/CC0

El lunes 27 de enero, una pequeña empresa china conocida llamada Dipsek envió ondas de choque y pánico a través del Valle de Silicon y el mercado de valores global con el lanzamiento de su modelo generativo de inteligencia artificial (AI), que abre, meta y técnica el modelo de veteranos de veteranos son rivales. Google. Esto no es ayuda de IA. 1 Aplicación descargada en los Estados Unidos, sorprende a una industria que solo cree en las compañías de Big Western que puede dominar la IA.

Varias acciones relacionadas con la IA, incluido Nvidia, recibieron un éxito, ya que los inversores revalaron el panorama competitivo. Pero el mercado se ha arrodillado que Deepsek desarrolló su modelo de IA a una fracción del costo de modelos como Chat y Gemini. El lanzamiento de Dipsek se acuña en la carrera global para usar el poder de la IA.

¿Qué puede significar este desarrollo para el futuro de la IA y lo que puede suceder para influir en la sociedad, hablamos con Arun Rai, director del Centro de Innovación Digital de Robbinson?

¿Cómo es diferente la tecnología AI de Deepsek y qué tan barato era desarrollarla?

Ai Vikas ha estado jugando durante mucho tiempo el modelo Brout Force-Jugger, más potencia informática y chips de última generación. OpenAI, Google Deepmind y Ethropic han gastado miles de millones de modelos de entrenamiento como GPT-4, que dependen de las GPU NVIDIA de alto nivel (A100/H100) y la supercomputadora de nubes a gran escala.

Deepsek tomó una opinión diferente. En lugar de confiar en chips costosos de alta gama, se adaptaron a la eficiencia, lo que demuestra que se podría hacer una poderosa IA a través de la adaptación de software y hardware inteligente.

Las diferencias importantes incluyen:

El modelo de LampSAC no activa todos sus parámetros una vez como GPT-4. En cambio, utiliza una técnica llamada mezcla de expectativas (MOE), que actúa como un equipo de expertos en lugar de un solo modelo generalista. Pregunta por una pregunta, "despertar" para responder solo las partes más relevantes de la IA, mientras que el resto sigue siendo inútil. Reduce en gran medida las necesidades informáticas.

También diseñó su modelo para trabajar en NVIDIA H800 GPUD menos potente pero más ampliamente disponible que los chips H100/A100 restringidos. Estos chips también son muy baratos. Deepsek usó PTX, un método de programación similar a un ensamblaje que permite a los desarrolladores controlar cómo interactúa la IA con ChIP a niveles bajos. Esto les permitió exprimir más rendimiento del hardware menos potente, otra razón por la que no requirieron los chips Nvidia más avanzados para lograr los resultados del estado de los artes.

El entrenamiento también se adaptó para reducir el costoso ajuste humano. La mayoría de los modelos de IA, incluido GPT -4, se basan en grandes equipos de revisores humanos para refinar manualmente para garantizar la calidad y la seguridad. Esta vez se está tomando y costoso. Dipsek automatizó este proceso utilizando el aprendizaje de refuerzo, lo que significa que la IA aprende continuamente de manera más eficiente que la experiencia que la necesidad de monitoreo humano.

¿Cómo se lanzó Deepsek?

La aparición de Deepsek no fue gradual, fue repentino e inesperado. Establecida a fines de 2023, la compañía fue a la interrupción de la industria en un año con su primer modelo de idioma importante, el lanzamiento de Dipsek-R1.

El gobierno de los Estados Unidos impuso restricciones comerciales a los chips avanzados NVIDIA AI (A100/H100) para ralentizar el progreso de la IA de los concursantes mundiales. Pero Deepsek adaptado. Obligado a trabajar con GPU H800 menos potente pero más disponible, la compañía adaptó su modelo para caminar en hardware de gama baja sin renunciar al rendimiento.

Deepsek no solo lanzó un modelo de IA: muestra la conversación de IA, que muestra que la adaptación, el software más inteligente y el acceso abierto pueden transformarse en una potencia informática a gran escala.

Ha habido mucha discusión sobre el "modelo de código abierto" de Deepsek. ¿Qué significa código abierto y qué efecto tiene?

Los modelos de IA difieren en la cantidad de acceso que permiten, completamente cerrados, desde el sistema pavimentado hasta la liberación de código abierto. El enfoque de Deepsek se encuentra en el extremo más lejano de la apertura, uno de los modelos de IA a gran escala más sin restricciones.

La mayoría de los modelos de IA están estrechamente controlados. GPT-4 de OpenAI, Gemini de Geogle Deepmind y las nubes antrópicas son la propiedad, lo que significa que el uso de clientes a través de API está prohibido. Sus datos subyacentes de tecnología, arquitectura y capacitación se mantienen privados, y sus empresas controlan cómo se utilizan los modelos, implementan medidas de seguridad y evitan enmiendas no autorizadas.

Algunos modelos de IA, como Meta's Lama 2, son de peso abierto, pero no son fuentes completamente abiertas. Los pesos del modelo están disponibles públicamente, pero los acuerdos de licencia restringen el uso comercial y la implementación masiva. Los desarrolladores deben aceptar términos específicos antes de usar el modelo, y el meta aún inspecciona quién puede usarlo y cómo.

El modelo de Deepsek es diferente. No impone ninguna restricción. Desde investigadores independientes hasta empresas privadas: el modelo puede y implementa el modelo sin acuerdos de transporte o licencia.

Este enfoque tiene los principales beneficios. Esta startup, al proporcionar acceso a la IA del estado de arte sin tarifas de licencia para investigadores y desarrolladores, democratiza la innovación de la IA. Esto fomenta el desarrollo global de IA, que permite a los laboratorios de IA independientes mejorar los modelos. Y rompe el monopolio de las grandes empresas de IA, que ofrece una poderosa opción para la propiedad, el modelo Pavelld AI.

Pero también muestra riesgos importantes. A diferencia de la IA patentada, donde las empresas pueden monitorear y restringir aplicaciones nocivas, el modelo de Deepsek puede ser reconstruido por cualquier persona, incluidos los malos actores. Esto aumenta las preocupaciones sobre la información errónea, la producción de DeepFAC y el fraude transmitido por la IA. Sin las medidas de seguridad subyacentes, los sistemas de IA abiertos pueden usarse para la disolución a gran escala, los ataques cibernéticos o la manipulación social.

El movimiento de Deepsek ha dictaminado un debate: ¿debería el modelo AI estar completamente abierto o las empresas deben implementar restricciones para evitar el mal uso? Algunas personas analizan el lanzamiento de Deepsek como una victoria para la accesibilidad de IA y la innovación de impulso de apertura, mientras que otras advierten que la IA sin restricciones puede conducir a resultados impredecibles y nuevos riesgos que nadie puede controlar.

Nueva vacuna protege al ganado de enfermedades mortales transmitidas por garrapatas

¿Es el lanzamiento de Deepsek para deshacerse o emocionarse?

El lanzamiento del Lampsac es un momento transformador para la IA, uno que brinda oportunidades emocionantes y desafíos importantes. Esto ha revelado nuevas posibilidades para el desarrollo de la IA, al tiempo que plantea nuevas preguntas sobre seguridad, responsabilidad y control.

Por un lado, la liberación de código abierto de Dipsek amplió el acceso a AIS de última generación como nunca antes, lo que lleva a un éxito rápido en áreas como ciencia, atención médica y negocios. El enfoque de eficiencia de Deepsek también desafía la noción de que miles de millones de empresas en la energía informática solo pueden fabricar modelos de IA. Si este método es escalas, puede redefinir cómo se desarrolla AI a nivel mundial. Al mismo tiempo, su disponibilidad sin restricciones introduce riesgos complejos.

¿Cuáles son las preocupaciones con Deepsak?

El lanzamiento de Deepsek ha planteado preguntas importantes sobre la seguridad, el control y la responsabilidad moral. La principal preocupación del centro de seguridad nacional, propiedad intelectual y mal uso.

A diferencia del modelo de IA patentado, el enfoque de código abierto del DeepSAC permite a cualquiera modificarlo e implementarlo sin ninguna inspección. Crea una aprensión de que los actores malvados pueden usarlo para campañas de información errónea, Ciber Attack o Cyber Attack. Citando preocupaciones de seguridad sobre el acceso potencial de datos por parte del gobierno chino, la Marina de los Estados Unidos fue la primera en prohibir a Deepsek.

Desde entonces, Texas, Taiwán e Italia también han prohibido su uso, mientras que los reguladores en Corea del Sur, Francia, Irlanda y los Países Bajos están revisando sus prácticas de datos, lo que refleja preocupaciones generalizadas sobre la privacidad y la seguridad nacional. Preocupaciones similares estaban en el centro de la controversia de Tiktok, donde los funcionarios estadounidenses estaban preocupados de que los datos de la aplicación utilizados por millones de estadounidenses pudieran acceder al gobierno chino.

El debate no se trata solo de Deepsek, se trata de cuán abierta debería ser la IA. ¿Puede la IA ser ampliamente accesible y administrada con responsabilidad? Esta pregunta dará forma al futuro de la política y la innovación de la IA.

¿Cómo juega la regulación en el desarrollo de la IA?

La regulación AI está en una intersección. Los gobiernos se ejecutan para equilibrar la innovación con la seguridad, tratando de promover el desarrollo de la IA al tiempo que evita el mal uso. Pero el desafío es que la IA está creciendo rápidamente porque las leyes pueden mantenerse.

En los Estados Unidos, la regulación se ha centrado en el control de la exportación y la seguridad nacional, pero la IA es uno de los mayores desafíos en la regulación que asume la responsabilidad de los modelos abiertos. A medida que avanza la IA, los responsables políticos enfrentan un dilema: cómo fomentar el progreso mientras evita el riesgo. ¿Debería el modelo AI estar abierto y accesible para todos, o si los gobiernos deben aplicar un control estricto para limitar el mal uso potencial? La forma de respuesta dará cómo se desarrolla la IA, que se beneficia de ella y que tiene el poder de regular su efecto.

¿Cómo puede la influencia de Deepsek en el paisaje de IA afectar eventualmente la sociedad?

El impacto de Deepsek en la IA no se trata solo de un modelo, sino que la IA tiene acceso a la IA y cómo cambia la innovación, la competencia y la gobernanza.

Al crear un poderoso modelo de AI de código abierto, Dipsek ha reducido la obstrucción del desarrollo de la IA, lo que hace que más investigadores, nuevas empresas y organizaciones construyan y despliegan IA sin confiar en grandes empresas tecnológicas o laboratorios de investigación respaldados por el gobierno respaldados por grandes empresas tecnológicas o gubernamentales o gubernamentales. Ha sido hecho. También desafía la idea de que el progreso de la IA depende solo de la potencia informática de masa, lo que demuestra que la inteligente optimización de software y hardware puede rivalizar con la perspectiva cruel de potencia.

Al mismo tiempo, la descentralización hace que la IA sea difícil de regular. Sin una autoridad central que controle su despliegue, los modelos de IA abiertos se pueden usar y se pueden modificar de forma independiente, motivando tanto la innovación como los nuevos riesgos.

Deepsek ha forzado una pregunta importante a la vanguardia: ¿el futuro de la IA estará bien financiado por empresas occidentales y laboratorios de investigación de IA respaldados por el gobierno, o un ecosistema amplio y más abierto? Esta opción no solo determinará quién tiene acceso a la IA, sino cómo reemplaza a la sociedad.

Otorgado por la Universidad Estatal de Georgia

Citación: Preguntas y respuestas: Cómo está cambiando el paisaje de AI de Deepsek (2025, 5 de febrero).

Este documento está sujeto a derechos de autor. Además de cualquier comportamiento imparcial para el propósito de estudios o investigaciones privadas, no se puede volver a interrogarlo sin permiso por escrito. El contenido se proporciona solo para fines de información.

Resistir los antibióticos o propagar infecciones.

Deja una respuesta Cancelar la respuesta