Yúbal Fernández
2025-01-27T13:19:49Z
Vamos a explicarte qué es DeepSeek, el chat de inteligencia artificial creado por la empresa del mismo nombre. Se trata de una IA que a principios del 2025 está llamando mucho la atención, y que incluso en las tiendas móviles de aplicaciones ya conseguido superar a ChatGPT. Y no solo eso, sino también en pruebas de rendimiento y razonamiento con su modelo R1.
En los últimos meses hemos hablado bastante sobre esta empresa y sus modelos, sobre todo porque son de código abierto, lo que permite que sea más accesible para todos, y porque muestra lo mucho que está avanzando China en las tecnologías de inteligencia artificial.
DeepSeek es el nombre de una empresa china especializada en inteligencia artificial. También es el nombre de su chat de IA, una alternativa propia a Copilot, Gemini y compañía. Por lo tanto, puedes escuchar y leer menciones a DeepSeek refiriéndote a ambas cosas.
En este artículo nos vamos a centrar en el chatbot de inteligencia artificial, que es un Gran Modelo Lingüístico o Large Language Model (LLM), creado para ayudar con el desarrollo de software, el procesamiento del lenguaje natural y la automatización empresarial.
DeepSeek destaca por ser de código abierto. Esto quiere decir que cualquier persona puede ver cómo funciona internamente, es totalmente transparente, y cualquiera puede instalarse esta IA de forma local o usarla con total libertad. Un desarrollador o investigador puede descargarlo de GitHub y modificarlo para diversos escenarios, incluyendo algunos comerciales.. Esto contrasta totalmente con el secretismo de unos modelos privados.
Se suele tener la falsa percepción de que una de las cosas a favor del código privado y opaco de la mayoría de desarrolladoras es que la calidad de sus productos es superior. Sin embargo, DeepSeek es una prueba de que el código abierto puede igualar e incluso superar en unos aspectos a estas empresas.
Otra de las principales características de DeepSeek es que su chatbot nativo, el de su web oficial, es totalmente gratuito y no requiere de ninguna suscripción para utilizar su modelo más avanzado.
Si lo comparamos con ChatGPT haciendo las mismas preguntas, DeepSeek puede ser un poco más escueto a la hora de responder, va más al grano. Sin embargo, tiene la misma flexibilidad que otros modelos, y puedes pedirle que explique las cosas más ampliamente o que las adapte a ti.
DeepSeek ha dado mucho que hablar a finales del 2024 y principios del 2025 por dos modelos de IA concretos. Primero está DeepSeek V3, un modelo de larga escala LLM que supera a la mayoría de IA, y también supera a algunos propietarios. En pruebas como la de programación, este modelo logró superar a Llama 3.1 405B, a GPT-4o y a Qwen 2.5 72B, aunque todos ellos tienen muchos menos parámetros y eso puede influir en el rendimiento y las comparaciones.
Pero lo que realmente ha sorprendido de este modelo es que "solo" necesitó 2,788 millones de horas de entrenamiento, y este proceso costó tan solo 5,5 millones de dólares. Por poner un ejemplo, con el GPT-4 de OpenAI se inviertieron cerca de 80 millones de dólares. Vamos, que costó muchísimo menos de entrenar, lo que le convierte en un modelo muy eficiente, y un 60% más grande que Llama 3.1 405B, de Meta.
El otro gran modelo ha sido DeepSeek R1, que está especializado en razonamiento, y ha sido capaz de alcanza o superar el rendimiento de los modelos más avanzados de OpenAI en pruebas clave de matemáticas y programación. Con él, es la primera vez que un modelo chino de código abierto y gratuito iguala a los líderes occidentales, rompiendo el monopolio de Silicon Valley.
Por poner algunas cifras, este modelo R1 ha costado de desarrollar entre un 90% y 95% menos que sus competidores, y tiene 671.000 millones de parámetros. Además, en pruebas matemáticas MATH-500 ha conseguido un 97,3% de aciertos, frente al 96,4% de OpenAI.
Sin embargo, no todo es bueno. Igual que pasa con Gemini o ChatGPT, DeepSeek también está sujeto a los valores del país donde ha sido desarrollado. En este caso ha sido desarrollado en china, y se adapta a su regulación, debiendo "encarnar valores socialistas fundamentales". Por poner un ejemplo, esto hace que no responda a preguntas sensibles sobre política y geopolítica, como esas sobre Tiananmen o la autonomía de Taiwán.
En este aspecto, en China son más férreos a la hora de controlar las respuestas, hay un mayor control estatal. Por lo tanto, mientras que los modelos occidentales pueden tener más liebrtad para discutir temas polémicos para los valores con los que ha sido entrenado, en los modelos chinos deben alinearse siempre con la ideología y la narrativa del Partido que gobierna el país.
DeepSeek ha sido desarrollado usando aprendizaje por refuerzo puro, sin datos etiquetados previamente. Esta es una hazaña técnica que hasta ahora se consideraba imposible, y que abre nuevas puertas al entrenamiento de este tipo de sistemas.
Este aprendizaje por refuerzo permite que el modelo sea capaz de aprender por si mismo mediante prueba y error, igual que tú puedes aprender a montar en bici o a realizar algunas tareas. Esto hace que el resultado inicial sea más errático e impreciso, pero el propio modelo va descubriendo y desarrollando estrategias de razonamiento únicas para seguir mejorando.
Una vez realizado este entrenamiento, DeepSeek refinó el modelo combinándolo con otros entrenamientos supervisados para pulirlo y crear la versión final de R1, que mantiene este componente pero añadiendo consistencia y pulido.
De cara al usuario su funcionamiento es igual que el de otros modelos. Tienes una pantalla de inicio con una campo de escritura y varias opciones de funcionamiento, y luego a la hora de ver los resultados tienes una columna izquierda con un historial de todos tus chats.
Para usarlo tienes que escribir una pregunta en lenguaje natural, igual que lo harías con una pregunta. Entonces, DeepSeek analizará las palabras de tu pregunta para encontrar el resultado, y luego buscará en la base de datos con la que fue entrenado o en Internet para obtener datos con los que componer una respuesta también en lenguaje natural.
Gracias a la manera en la que ha sido creado, este modelo puede entender contextos complejos de preguntas muy largas y elaboradas. Además, también puede ir aprendiendo y mejorando. Su aplicación puede usarse gratis online o bajándose su app móvil, y no tiene ninguna cuota.
Con este modelo de IA puedes hacer prácticamente lo mismo que con otros modelos. Puedes hacerle todo tipo de preguntas, y re responderá en tiempo real. Puedes preguntarle por personajes famosos, por lugares, puedes preguntarle el significado de cosas, y todo lo que se te ocurra.
También sirve para explicarte temas complejos de manera sencilla, siempre y cuando le pidas que lo haga así. También puedes enviarle documentos para que extraiga información clave sobre ellos, y hacerle preguntas relacionadas cobre su contenido.
Sirve para la programación, permitiéndote escribir o depurar código, así como para resolver problemas matemáticos. Además, si eres un creador de contenido puedes pedirle que te genere ideas, textos, que componga poesía, o que te cree plantillas o estructuras para artículos. También puede revisar y corregir textos.
En el cuadro donde escribes tu prompt o pregunta, tienes tres botones. El del clip es para adjuntar archivos. Pero además tienes el botón de DeepThink R1 para hacer que la IA "piense" en lo que te ha respondido antes o en tu contexto, y te de una respuesta razonada. Y luego, el botón Search sirve para obtener la información de Internet, indicando las fuentes antes de la respuesta.
Luego, con cada respuesta que te da tienes botones para copiar el texto, dos botones para calificarlo positiva o negativamente dependiendo de la calidad de la respuesta, y otro para recargar la respuesta y que te la vuelva a generar desde cero basándose en tu mismo prompt.
https://www.xataka.com/basics/deepseek-que-como-funciona-que-opciones-tiene-esta-inteligencia-artificial