La suposición es que la mayor densidad de información de los datos de entrenamiento chino mejoró las habilidades lógicas de Deepseek, lo que le permite manejar conceptos complejos de manera más efectiva. Los defensores de esta teoría argumentan que la capacitación en chinos permitió a Deepseek agudizar su comprensión del lenguaje. Los caracteres chinos, al ser ideogramas, transmiten significado incluso si se escriben incorrectamente, lo que permite a los lectores que aún comprendan el texto.
“Los caracteres chinos logran la transmisión máxima de información con un costo mínimo. Como una codificación de información eficiente, los chinos han mejorado enormemente la eficiencia y los costos reducidos en el procesamiento de la inteligencia artificial ”, dijo Xiang Ligang, analista de la industria de telecomunicaciones y líder de opinión pública, en su cuenta de redes sociales el lunes.
«La IA está entrando en la era de los chinos».
Otros argumentan que los caracteres chinos están estrechamente vinculados con información multifacética, como imágenes y audio. La poesía tradicional china a menudo se combina con pinturas o música, lo que dicen, proporcionó a Deepseek con un rico material de aprendizaje multimodal.
En un informe de DeepTech, un portal de medios de tecnología, el profesor asistente de la Universidad de Yale, Yang Zhuoran, enfatizó la importancia de la calidad de los datos en la capacitación de modelos grandes. La calidad de los datos no solo impacta la capacidad de un modelo para adquirir y expresar conocimiento, sino que también afecta el estilo y la precisión del contenido generado, dijo.
Las fuentes de datos de capacitación de Deepseek siguen siendo no reveladas, pero algunas sugieren que las fuentes de capacitación china del modelo incluyen literatura clásica, jerga de Internet, documentos académicos, documentos gubernamentales y dialectos regionales.