Una operadora estatal china dijo que ha desarrollado dos grandes modelos de lenguaje (LLM) entrenados íntegramente en chips producidos en el país, lo que ilustra el progreso que China ha logrado en su esfuerzo por lograr la autonomía de los chips en inteligencia artificial (IA).
El Instituto de IA de China Telecom, uno de los grandes operadores de telecomunicaciones respaldados por el Estado del país, dijo en un comunicado el sábado que su TeleChat2-115B de código abierto y un segundo modelo sin nombre fueron entrenados en decenas de miles de chips producidos en el país, marcando un hito en medio del endurecimiento de las restricciones estadounidenses al acceso de China a semiconductores avanzados, incluidos NVIDIALos últimos chips de IA.
El logro «indica que China realmente ha alcanzado la autosuficiencia total en la formación nacional de LLM» y marca el inicio de una nueva fase para la innovación y la autosuficiencia de China en LLM, la tecnología detrás de ChatGPT de OpenAI, dijo el instituto de IA en un comunicado publicado. a WeChat.
China Telecom dijo que el modelo sin nombre tiene 1 billón de parámetros, un término de aprendizaje automático para las variables presentes en un sistema de inteligencia artificial durante el entrenamiento. La sofisticación y eficacia de un modelo de IA dependen en gran medida de la escala de parámetros involucrados en el proceso de capacitación. TeleChat2t-115B tiene más de 100 mil millones de parámetros, dijo la compañía.