SFEIR
Technologie

GLM-5.2

Modèle open-weights de Z.ai (ex-Zhipu AI), architecture MoE sous licence MIT, optimisé pour le codage agentique et le long contexte.

Un modèle open-weights de Z.ai pour le codage agentique

GLM-5.2 est le modèle phare de Z.ai (anciennement Zhipu AI), annoncé mi-juin 2026 et optimisé pour les tâches à long horizon et le codage agentique. Publié sous licence MIT sur Hugging Face, il est l'un des premiers modèles à poids ouverts à se situer au niveau des modèles fermés de pointe sur des tâches d'ingénierie réalistes.

Architecture Mixture-of-Experts et contexte d'un million de tokens

Le modèle repose sur une architecture Mixture-of-Experts : 744 à 753 milliards de paramètres au total, mais seulement ~40 milliards activés par token, ce qui maintient le coût d'inférence sous contrôle. Sa fenêtre de contexte d'un million de tokens est annoncée comme stable, et trois niveaux de raisonnement — Low, High, Max — laissent à l'utilisateur l'arbitrage entre coût, latence et profondeur. Deux optimisations annoncées par le constructeur, IndexShare (réduction d'environ 2,9× des FLOPs à un million de tokens) et une amélioration du Multi-Token Prediction, tirent le coût de génération vers le bas.

Open-weights et souveraineté

La licence MIT autorise l'usage commercial, la modification et le déploiement privé des poids. Pour une DSI européenne, c'est précisément ce qui permet d'instruire sereinement la gouvernance d'un modèle développé par un acteur chinois : déployer dans un environnement maîtrisé, sans appel à une API tierce, neutralise une partie des risques de transfert de données. Le choix d'un modèle de fondation reste néanmoins une décision qui engage, à arbitrer au-delà du benchmark.

Une performance de premier plan, à lire avec prudence

Sur les benchmarks de codage long-horizon publiés par le constructeur — Terminal-Bench 2.1, SWE-bench Pro, FrontierSWE — GLM-5.2 se tient dans le même mouchoir de poche que Claude Opus 4.8 et GPT-5.5, là où l'écart se mesurait en générations entières un an plus tôt. Ces chiffres sont des benchmarks constructeur : ils situent un ordre de grandeur, ils ne tranchent pas un classement. Plusieurs praticiens reconnus l'ont salué publiquement comme le meilleur modèle à poids ouverts du moment.

Questions fréquentes

Qu'est-ce que GLM-5.2 ?

GLM-5.2 est le modèle phare de Z.ai (anciennement Zhipu AI), annoncé mi-juin 2026. C'est un modèle open-weights à architecture Mixture-of-Experts, sous licence MIT, optimisé pour le codage agentique et les tâches à long horizon, avec une fenêtre de contexte d'un million de tokens.

GLM-5.2 est-il vraiment open-source ?

Ses poids sont publiés sur Hugging Face (zai-org/GLM-5.2) sous licence MIT, qui autorise l'usage commercial, la modification et le déploiement privé. On parle de modèle « open-weights » : les poids sont ouverts, ce qui permet un déploiement dans un environnement maîtrisé, sans dépendre d'une API tierce.

GLM-5.2 peut-il rivaliser avec Claude Opus 4.8 ou GPT-5.5 ?

Sur les benchmarks de codage long-horizon publiés par Z.ai, GLM-5.2 se situe dans le même ordre de grandeur que Claude Opus 4.8 et GPT-5.5. Ce sont des benchmarks constructeur, à prendre comme un repère et non comme un classement définitif — mais le signal d'un modèle open-weights à ce niveau est en soi marquant.

Articles liés