En una declaración publicada en WeChat, el comercio electrónico Cloud Computing y Ai Arm de Giant Alibaba Cloud dijo que su nuevo modelo QWEN 2.5-Max también superó Opadai‘s GPT-4O y Meta plataforma‘Llama-3.1-405B en LLM Performance Benchmark Platforms Arena y LiveBench. Alibaba es propietaria del South China Morning Post.
El rendimiento de referencia de Qwen 2.5-Max, parte de Alibaba’s Tongyi Qianwen Familia llm, estaba a la par con AntrópicoEl modelo Claude-3.5-Sonnet, según Alibaba Cloud. Los LLM son la tecnología que respalda IA generativa servicios como Chatgpt.
El modelo multimodal de Alibaba se ofrece en varios tamaños, de 3 mil millones a 72 mil millones de parámetros, e incluye versiones base y ajustadas a instrucciones. El modelo insignia, QWEN2.5-VL-72B-Instructo, ahora es accesible a través de la plataforma de chat Qwen, mientras que toda la serie Qwen2.5-VL está disponible en la plataforma de código abierto que abraza la cara y la propia comunidad de código abierto de Alibaba Alcance del modelo.
El parámetro es un término de aprendizaje automático para las variables presentes en un sistema de IA durante la capacitación, lo que ayuda a establecer cómo los datos indican la salida deseada. El código abierto brinda acceso público al código fuente de un programa de software, lo que permite a los desarrolladores de terceros modificar o compartir su diseño, arreglar los enlaces rotos o ampliar sus capacidades.