China

Por qué las lecciones chinas pueden hacer que Deepseek Ai sea más inteligente

Por

febrero 14, 2025

Como la firma de desarrollo de IA local de China Veterano Sacude el panorama mundial de tecnología e inversión, la discusión nacional ha comenzado a centrarse en lo que le ha dado al modelo de lenguaje de versión más barato su ventaja sorpresa sobre competidores globales como ChatGPT.

La nueva empresa de inteligencia artificial ha elogios ganados Por su fuerte rendimiento, asequibilidad y arquitectura de código abierto, pero hay un sentido creciente en las comunidades en línea de que gran parte de su éxito se debe a su incorporación de Caracteres chinos Durante su fase de pretruamiento.

La suposición es que la mayor densidad de información de los datos de entrenamiento chino mejoró las habilidades lógicas de Deepseek, lo que le permite manejar conceptos complejos de manera más efectiva. Los defensores de esta teoría argumentan que la capacitación en chinos permitió a Deepseek agudizar su comprensión del lenguaje. Los caracteres chinos, al ser ideogramas, transmiten significado incluso si se escriben incorrectamente, lo que permite a los lectores que aún comprendan el texto.

“Los caracteres chinos logran la transmisión máxima de información con un costo mínimo. Como una codificación de información eficiente, los chinos han mejorado enormemente la eficiencia y los costos reducidos en el procesamiento de la inteligencia artificial ”, dijo Xiang Ligang, analista de la industria de telecomunicaciones y líder de opinión pública, en su cuenta de redes sociales el lunes.

«La IA está entrando en la era de los chinos».

Otros argumentan que los caracteres chinos están estrechamente vinculados con información multifacética, como imágenes y audio. La poesía tradicional china a menudo se combina con pinturas o música, lo que dicen, proporcionó a Deepseek con un rico material de aprendizaje multimodal.

En un informe de DeepTech, un portal de medios de tecnología, el profesor asistente de la Universidad de Yale, Yang Zhuoran, enfatizó la importancia de la calidad de los datos en la capacitación de modelos grandes. La calidad de los datos no solo impacta la capacidad de un modelo para adquirir y expresar conocimiento, sino que también afecta el estilo y la precisión del contenido generado, dijo.

Las fuentes de datos de capacitación de Deepseek siguen siendo no reveladas, pero algunas sugieren que las fuentes de capacitación china del modelo incluyen literatura clásica, jerga de Internet, documentos académicos, documentos gubernamentales y dialectos regionales.

Fuente