GLM-5.2
Modèle open-weights de Z.ai (ex-Zhipu AI), architecture MoE sous licence MIT, optimisé pour le codage agentique et le long contexte.
Un modèle open-weights de Z.ai pour le codage agentique
GLM-5.2 est le modèle phare de Z.ai (anciennement Zhipu AI), annoncé mi-juin 2026 et optimisé pour les tâches à long horizon et le codage agentique. Publié sous licence MIT sur Hugging Face, il est l'un des premiers modèles à poids ouverts à se situer au niveau des modèles fermés de pointe sur des tâches d'ingénierie réalistes.
Architecture Mixture-of-Experts et contexte d'un million de tokens
Le modèle repose sur une architecture Mixture-of-Experts : 744 à 753 milliards de paramètres au total, mais seulement ~40 milliards activés par token, ce qui maintient le coût d'inférence sous contrôle. Sa fenêtre de contexte d'un million de tokens est annoncée comme stable, et trois niveaux de raisonnement — Low, High, Max — laissent à l'utilisateur l'arbitrage entre coût, latence et profondeur. Deux optimisations annoncées par le constructeur, IndexShare (réduction d'environ 2,9× des FLOPs à un million de tokens) et une amélioration du Multi-Token Prediction, tirent le coût de génération vers le bas.
Open-weights et souveraineté
La licence MIT autorise l'usage commercial, la modification et le déploiement privé des poids. Pour une DSI européenne, c'est précisément ce qui permet d'instruire sereinement la gouvernance d'un modèle développé par un acteur chinois : déployer dans un environnement maîtrisé, sans appel à une API tierce, neutralise une partie des risques de transfert de données. Le choix d'un modèle de fondation reste néanmoins une décision qui engage, à arbitrer au-delà du benchmark.
Une performance de premier plan, à lire avec prudence
Sur les benchmarks de codage long-horizon publiés par le constructeur — Terminal-Bench 2.1, SWE-bench Pro, FrontierSWE — GLM-5.2 se tient dans le même mouchoir de poche que Claude Opus 4.8 et GPT-5.5, là où l'écart se mesurait en générations entières un an plus tôt. Ces chiffres sont des benchmarks constructeur : ils situent un ordre de grandeur, ils ne tranchent pas un classement. Plusieurs praticiens reconnus l'ont salué publiquement comme le meilleur modèle à poids ouverts du moment.
Questions fréquentes
Qu'est-ce que GLM-5.2 ?
GLM-5.2 est le modèle phare de Z.ai (anciennement Zhipu AI), annoncé mi-juin 2026. C'est un modèle open-weights à architecture Mixture-of-Experts, sous licence MIT, optimisé pour le codage agentique et les tâches à long horizon, avec une fenêtre de contexte d'un million de tokens.
GLM-5.2 est-il vraiment open-source ?
Ses poids sont publiés sur Hugging Face (zai-org/GLM-5.2) sous licence MIT, qui autorise l'usage commercial, la modification et le déploiement privé. On parle de modèle « open-weights » : les poids sont ouverts, ce qui permet un déploiement dans un environnement maîtrisé, sans dépendre d'une API tierce.
GLM-5.2 peut-il rivaliser avec Claude Opus 4.8 ou GPT-5.5 ?
Sur les benchmarks de codage long-horizon publiés par Z.ai, GLM-5.2 se situe dans le même ordre de grandeur que Claude Opus 4.8 et GPT-5.5. Ce sont des benchmarks constructeur, à prendre comme un repère et non comme un classement définitif — mais le signal d'un modèle open-weights à ce niveau est en soi marquant.
Articles liés
GLM-5.2 : le modèle open-weights de Z.ai qui défie les modèles fermés pour agentique coding
Annoncé mi-juin 2026, GLM-5.2 de Z.ai (ex-Zhipu AI) est un modèle open-weights — MoE, 744 milliards de paramètres, contexte 1M, licence MIT — optimisé pour le codage agentique long-horizon. Specs, benchmarks constructeur, prix, et les réactions d'experts comme Jeremy Howard ou Mat Velloso.
« Coding is solved » : pourquoi votre entreprise n'a pas encore le droit d'y croire
Définition, bascule « coding is solved » et garde-fous : ce que l'agentic coding change vraiment en entreprise.
Claude Fable 5 vs Mythos 5 : ce que l'on sait du lancement de juin 2026
Claude Fable 5 vs Mythos 5 : Mythos Preview jugé trop dangereux en avril, Project Glasswing, chronologie et analyse du timing du lancement de juin 2026.
L'agentic coding ne coûte pas cher — jusqu'au jour où la facture atterrit sur le bureau du CFO
Combien coûte vraiment l'agentic coding ? Fin des assistants bon marché, ROI, et passage « de l'adoption à l'allocation ».
La Matrice Souveraineté Agentique : Buy vs Build pour l'IA
De l'assistant au décideur : une rupture qui force les arbitrages Pendant plusieurs années, l'IA générative a occupé une place confortable dans les organisations : celle du conseiller brillant qu'on consulte, mais dont on reste libre d'ignorer les recommandations. Le cop...