Tecnología

Hazlo tan barato que sea “invisible” para el usuario. – Desde dentro

DeepSeek es la punta de lanza de la inteligencia artificial china. No sólo tiene un gran rendimiento sino que

Hazlo tan barato que sea “invisible” para el usuario.

 – Desde dentro

DeepSeek es la punta de lanza de la inteligencia artificial china. No sólo tiene un gran rendimiento sino que la propia Microsoft también ha dado la voz de alarma señalando que sus políticas le permiten atraer usuarios en mercados donde otros como OpenAI lo tienen más difícil. Otras compañías como Tencent o Alibaba están dando grandes pasos en la lucha por la IA, y hace unos días ByteDance -TikTok- presentó un Seedance 2.0 que impresiona… y que ya está dando quebraderos de cabeza.

Pero los grandes no son los únicos, y mientras China se centra en el desarrollo de la robótica y la inteligencia artificial, necesitamos hablar de otros «jugadores» más pequeños. Zhipu AI y MiniMax son dos de los “tigre“que han recaudado cientos de millones de dólares en tan solo unos años y cuyos modelos tienen una filosofía radicalmente diferente a los de OpenAI y otros gigantes occidentales”.

Sus modelos se venden como compañeros de vida, herramientas que la gente puede utilizar todos los días sin tener que preocuparse por el precio. Y en este discurso MiniMax acaba de empezar el M2.5, un modelo que quiere convertirse en un “empleado digital” y que sus responsables han catalogado como su primer “modelo frontera”. tan barato que no vale la pena medir el precio.

La IA es demasiado barata para preocuparse por el precio

M2.5 ahora es oficial y como se anuncia Poste matutino del sur de ChinaMiniMax no quiso perder la oportunidad de lanzarlo en una semana agitada para la industria de la IA en China. Técnicamente, M2.5 es un LLM (modelo de lenguaje grande) que puede manejar alrededor de 230 mil millones de parámetros en total, pero solo usa 10 mil millones por token. Al tratarse de un sistema Mixto de Expertos, en cada llamada participan únicamente los expertos directamente necesarios para resolver la consulta.

Bajar la figura a la tierra significa que es un modelo potente, pero a petición del usuario. no utilizar todo su potenciallo que implica bajos costos de inferencia y precios muy bajos para los usuarios. Sus responsables dicen que el precio es de sólo un dólar por hora de funcionamiento continuo y se emiten 100 tokens por segundo. Esto significa que podrás tener un “agente” trabajando continuamente en todo momento, a un precio entre 10 y 20 veces inferior al de otros modelos como Opus, Gemini 3 Pro o GPT-5.

Una política tan agresiva, según sus responsables, convierte al M2.5 en un modelo “demasiado barato para cuantificarlo” y favorece su adopción masiva porque el usuario puede dejar de optimizar cada comando que le da a la IA. Esa frase “demasiado barata de instalar” es un guiño al comentario histórico de que la electricidad procedente de la energía nuclear sería considerablemente demasiado barata.

Puntuación interna en diversas pruebas | Imagen: MiniMax

Y algo importante es que M2.5 no es un simple chatbot. Está disponible en plataformas como Ollama, HuggingFace, ModelScope en China o GitHub y la propia MiniMax señala que el 30% de las tareas internas de la empresa ya las gestiona el propio M2.5. Además, el modelo genera el 80% del código nuevo. Eso significa que está optimizado para trabajar solo en lugar de chatear. Este código, creado por Code Thing, no es exclusivo de M2.5, y Codex y Opus también están en este barco.

El modelo ya estaba allí. poner a prueba y aunque consigue resultados notables en algunas tareas, especialmente comparado con otros modelos peso abiertosu puntuación dista mucho de la de los modelos cerrados. en los resultados interno La propia empresa logró duplicar la puntuación del modelo M2.1 anterior, pero como señala SCMP, estos resultados de las pruebas internas son difíciles de verificar de forma independiente.

Benchmark interno en codificación | Imagen: MiniMax

Pero al final, el MiniMax M2.5, sea más o menos potente respecto a otros modelos, es un ejemplo más de la estrategia que está impulsando China con la inteligencia artificial. Mientras Estados Unidos se esfuerza por demostrar que cuenta con modelos propietarios cada vez más potentes y capaces, la IA se representa en una narrativa en la que pretende promover modelos más baratos y útiles para el usuario.

Esto significa no sólo que tienen una buena relación calidad-precio, sino también que pueden ejecutarse en dispositivos cotidianos sin mucha potencia de procesamiento. Y ahora que, según se informa, algunas empresas chinas podrán conseguir algunas de las mejores GPU de NVIDIA para entrenar IA, el impulso a esta estrategia podría ser significativo.

Imágenes | minimax (editado)

En | Hay otra carrera igual de importante que la de los chips para ganar a la IA, y en este caso China lleva la delantera

Redacción Desde Dentro
About Author

Redacción Desde Dentro