Ir al contenido principal

Nuevos lenguajes minimalistas?

Pequeños modelos de lenguajes

No nos confundamos: en el mundo de la IA, el tamaño importa. Cuando OpenAI lanzó GPT-3 allá por 2020, era el modelo lingüístico más grande jamás construido. La empresa demostró que bastaba con aumentar el tamaño de este tipo de modelo para que el rendimiento se disparara. Esto dio lugar a un boom tecnológico que se ha mantenido gracias a modelos cada vez más grandes desde entonces. Como dijo Noam Brown, investigador científico de OpenAI, ante el público de TEDAI San Francisco en octubre, «el increíble progreso de la IA en los últimos cinco años puede resumirse en una sola palabra: escala». 

Pero a medida que las ganancias marginales que logran estos modelos más y más grandes son cada vez menores, los investigadores están descubriendo cómo hacer más con menos. Para determinadas tareas, los modelos modelos de lenguaje reducidos (SML, por las siglas en inglés de small language models) que se entrenan con conjuntos de datos más específicos pueden rendir tan bien como los grandes o incluso mejor. Esto supone una gran ventaja para las empresas deseosas de desplegar la IA para un puñado de aspectos específicos. No hace falta tener todo Internet en el modelo para responder al mismo tipo de petición una y otra vez. 

OpenAI ofrece GPT-4o y GPT-4o mini; Google DeepMind tiene Gemini Ultra y Gemini Nano; y Claude 3, de Anthropic, está disponible en tres tamaños: Opus, Sonnet y Haiku. Microsoft es pionera en una gama de pequeños modelos de lenguaje llamados Phi. 

Cada vez son más las empresas de menor tamaño que también ofrecen modelos pequeños. La empresa de inteligencia artificial Writer afirma que su último modelo lingüístico iguala el rendimiento de los modelos más grandes de primer nivel en muchos parámetros clave, a pesar de que en algunos casos sólo tiene la vigésima parte de parámetros (los valores que se calculan durante el entrenamiento y determinan cómo se comporta un modelo). 

Los modelos más pequeños son más eficientes, por lo que son más rápidos de entrenar y ejecutar. Es una buena noticia también para quienes están preocupados por el clima: como los modelos más pequeños funcionan con una fracción de la potencia que requieren sus primos gigantes, consumen menos energía. 

Estos pequeños modelos también viajan bien: pueden funcionar directamente en nuestros bolsillos, sin necesidad de enviar peticiones a la nube. Lo pequeño es lo próximo.  


Reseña: La IA evoluciona hacia modelos más pequeños y eficientes que rivalizan con los grandes en tareas específicas.

Fuente: https://technologyreview.es/s/17007/pequenos-modelos-de-lenguaje/
Fecha: 15 de mayo de 2025

Comentarios

Entradas más populares de este blog

La tecnología del futuro!

Chips y computación cuántica En noviembre del 2024, la   financiación de la computación cuántica   alcanzó un récord. Las startups de computación cuántica recaudaron en total $1,500 millones de dólares en financiación de riesgo en 50 acuerdos durante el 2024, según datos de Crunchbase. Crear, testar y modificar una futura realidad física sin prototiparla es clave en cualquier industria o en la modelización de sistemas complejos es parte de esta tecnología. Con ayuda de la computación cuántica se pueden entender fenómenos complejos de la naturaleza, como el caótico movimiento de los fluidos o el mapa de las neuronas, estos gigantes precisarán de la ayuda de otra tecnología prometedora que empieza a dar señales de consolidación:  la computación cuántica . Por otro lado, Microsoft, IBM y Google presentarán computadores y desarrollos que suponen pasos firmes hacia un procesamiento cuántico de un número suficiente de qubits, de mayor vida útil y tolerante a los fallos, fundame...

Robótica

Robótica Roomba y Alexa nos están haciendo la vida más fácil: no solo nos ayudan con tareas repetitivas, sino que también toman decisiones de forma   cada vez más autónoma . Estamos entrando en una era de   democratización de los robots, impulsada por la digitalización y la IA generativa . En los próximos años, veremos muchos más robots en sectores regulados (como la sanidad) y costosos y complejos (como la fabricación y la construcción). Actualmente: Las startups de robótica recaudaron más de $4.200 millones en financiación semilla en 2024, avanzando a la fase de crecimiento. En 2026, más del 30% de los robots inteligentes alcanzarán el nivel 3 de inteligencia (un alto grado de autonomía y capacidad cognitiva, que permite tomar decisiones independientes en entornos complejos y variables), frente a menos del 2% en 2022, según “Emerging Technologies AI Roadmap for Smart Robots - Journey to a Super Intelligent Humanoid Robot”, de Gartner. Reseña: Dar forma a un mundo nuevo,...

Inteligencia artificial

Inteligencia Artificial La   Inteligencia Artificial   se ha embebido en varias facetas de nuestras vidas y en los sectores más diversos, donde con cada vez más frecuencia las decisiones se basan en algún tipo de servicio brindado por ella. Pero, aunque algunas de estas decisiones se puedan conocer y sean aprobadas, son las menos comparadas con las que se desconocen.   Esta tendencia que promete grandes ventajas   no se detendrá, incluso día a día estos servicios AI van ganando mayor control, y en consecuencia las comunidades se están preocupando por el impacto de estas interacciones y mitigando los riesgos para los afectados. Esta preocupación se ha materializado en la disciplina  Responsible AI , que explora varias dimensiones del problema, entre las más importantes: privacidad, gobierno de datos, transparencia y explicabilidad, y, además, aborda las preocupaciones éticas de los diversos sectores Los esfuerzos por mejorar los servicios IA llevarán a un  n...