Technologie

GLM-5.2

Modèle open-weights de Z.ai (ex-Zhipu AI), architecture MoE sous licence MIT, optimisé pour le codage agentique et le long contexte.

ia modele open-weights agentic-coding

Un modèle open-weights de Z.ai pour le codage agentique

GLM-5.2 est le modèle phare de Z.ai (anciennement Zhipu AI), annoncé mi-juin 2026 et optimisé pour les tâches à long horizon et le codage agentique. Publié sous licence MIT sur Hugging Face, il est l'un des premiers modèles à poids ouverts à se situer au niveau des modèles fermés de pointe sur des tâches d'ingénierie réalistes.

Architecture Mixture-of-Experts et contexte d'un million de tokens

Le modèle repose sur une architecture Mixture-of-Experts : 744 à 753 milliards de paramètres au total, mais seulement ~40 milliards activés par token, ce qui maintient le coût d'inférence sous contrôle. Sa fenêtre de contexte d'un million de tokens est annoncée comme stable, et trois niveaux de raisonnement — Low, High, Max — laissent à l'utilisateur l'arbitrage entre coût, latence et profondeur. Deux optimisations annoncées par le constructeur, IndexShare (réduction d'environ 2,9× des FLOPs à un million de tokens) et une amélioration du Multi-Token Prediction, tirent le coût de génération vers le bas.

Open-weights et souveraineté

La licence MIT autorise l'usage commercial, la modification et le déploiement privé des poids. Pour une DSI européenne, c'est précisément ce qui permet d'instruire sereinement la gouvernance d'un modèle développé par un acteur chinois : déployer dans un environnement maîtrisé, sans appel à une API tierce, neutralise une partie des risques de transfert de données. Le choix d'un modèle de fondation reste néanmoins une décision qui engage, à arbitrer au-delà du benchmark.

Une performance de premier plan, à lire avec prudence

Sur les benchmarks de codage long-horizon publiés par le constructeur — Terminal-Bench 2.1, SWE-bench Pro, FrontierSWE — GLM-5.2 se tient dans le même mouchoir de poche que Claude Opus 4.8 et GPT-5.5, là où l'écart se mesurait en générations entières un an plus tôt. Ces chiffres sont des benchmarks constructeur : ils situent un ordre de grandeur, ils ne tranchent pas un classement. Plusieurs praticiens reconnus l'ont salué publiquement comme le meilleur modèle à poids ouverts du moment.

Questions fréquentes

Qu'est-ce que GLM-5.2 ?

GLM-5.2 est le modèle phare de Z.ai (anciennement Zhipu AI), annoncé mi-juin 2026. C'est un modèle open-weights à architecture Mixture-of-Experts, sous licence MIT, optimisé pour le codage agentique et les tâches à long horizon, avec une fenêtre de contexte d'un million de tokens.

GLM-5.2 est-il vraiment open-source ?

Ses poids sont publiés sur Hugging Face (zai-org/GLM-5.2) sous licence MIT, qui autorise l'usage commercial, la modification et le déploiement privé. On parle de modèle « open-weights » : les poids sont ouverts, ce qui permet un déploiement dans un environnement maîtrisé, sans dépendre d'une API tierce.

GLM-5.2 peut-il rivaliser avec Claude Opus 4.8 ou GPT-5.5 ?

Sur les benchmarks de codage long-horizon publiés par Z.ai, GLM-5.2 se situe dans le même ordre de grandeur que Claude Opus 4.8 et GPT-5.5. Ce sont des benchmarks constructeur, à prendre comme un repère et non comme un classement définitif — mais le signal d'un modèle open-weights à ce niveau est en soi marquant.

Articles liés

GLM-5.2 : le modèle open-weights de Z.ai qui défie les modèles fermés pour agentique coding

Annoncé mi-juin 2026, GLM-5.2 de Z.ai (ex-Zhipu AI) est un modèle open-weights — MoE, 744 milliards de paramètres, contexte 1M, licence MIT — optimisé pour le codage agentique long-horizon. Specs, benchmarks constructeur, prix, et les réactions d'experts comme Jeremy Howard ou Mat Velloso.

21 juin 2026

« Coding is solved » : pourquoi votre entreprise n'a pas encore le droit d'y croire

Définition, bascule « coding is solved » et garde-fous : ce que l'agentic coding change vraiment en entreprise.

31 mai 2026

Claude Fable 5 vs Mythos 5 : ce que l'on sait du lancement de juin 2026

Claude Fable 5 vs Mythos 5 : Mythos Preview jugé trop dangereux en avril, Project Glasswing, chronologie et analyse du timing du lancement de juin 2026.

11 juin 2026

L'agentic coding ne coûte pas cher — jusqu'au jour où la facture atterrit sur le bureau du CFO

Combien coûte vraiment l'agentic coding ? Fin des assistants bon marché, ROI, et passage « de l'adoption à l'allocation ».

31 mai 2026

La Matrice Souveraineté Agentique : Buy vs Build pour l'IA

De l'assistant au décideur : une rupture qui force les arbitrages Pendant plusieurs années, l'IA générative a occupé une place confortable dans les organisations : celle du conseiller brillant qu'on consulte, mais dont on reste libre d'ignorer les recommandations. Le cop...

1 avril 2026

Optimisez votre vélocité avec le Diagnostic 10x

Découvrez nos réalisations concrètes par secteur

Entreprise Agentique Conversationnelle

850+ ingénieurs, 8 agences en France et Benelux

Tu codes déjà avec l'IA. Et si tu passais au niveau supérieur ?