What is GLM-4.7 Flash?

Zhipu AI's (Z.ai) fast inference model from the GLM-4 family. Built on the General Language Model architecture with strong bilingual (Chinese/English) capabilities. Optimized for speed with reliable tool-call instructions and concise responses.

How much does GLM-4.7 Flash cost?

GLM-4.7 Flash costs $0.5/1M tokens for input and $2/1M tokens for output on CallMissed. 1 credit = ₹1 = $0.01 USD.

How do I use GLM-4.7 Flash via API?

Send a POST request to POST /v1/chat/completions with model "glm-4.7-flash" and your API key. CallMissed uses the OpenAI-compatible format — just change the base URL and model field.

What is the context window of GLM-4.7 Flash?

GLM-4.7 Flash supports a 128K token context window with up to 8K output tokens.

सभी मॉडल पर वापस जाएं

LLM चैटfast

GLM-4.7 Flash

द्वारा Z.ai · रिलीज़ 2025

Zhipu AI (Z.ai) का GLM-4 परिवार से तेज़ इन्फरेंस मॉडल। General Language Model आर्किटेक्चर, मजबूत द्विभाषी (चीनी/अंग्रेज़ी)। गति, विश्वसनीय टूल-कॉल और संक्षिप्त जवाब के लिए अनुकूलित।

LLM चैट

GLM-4.7 Flash

द्वारा संचालित Z.ai · General Language Model (GLM), Transformer

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

32B

अधिकतम आउटपुट

श्रेणी

LLM चैट

अवलोकन

GLM-4.7 Flash Zhipu AI (Z.ai) का GLM-4 परिवार से तेज़ इन्फरेंस मॉडल है — 32B dense, गति और विश्वसनीयता के लिए अनुकूलित। GLM आर्किटेक्चर पर मजबूत द्विभाषी चीनी/अंग्रेज़ी, विशेष रूप से विश्वसनीय टूल-कॉल और function-calling।

प्रोडक्शन वर्कलोड के लिए — तेज़, संक्षिप्त जवाब, विश्वसनीय संरचित आउटपुट। टूल-कॉल निर्देशों का सटीक पालन — बाहरी API से जुड़ने वाले AI एजेंट के लिए उत्कृष्ट। 128K कॉन्टेक्स्ट।

open-source, HuggingFace पर — सबसे मजबूत open द्विभाषी मॉडलों में। चीनी ऐप, द्विभाषी सपोर्ट, तेज़ इन्फरेंस + विश्वसनीय टूल उपयोग। संक्षिप्त शैली — टोकन लागत कम।

प्राइसिंग

मेट्रिक	कीमत
इनपुट /1M tokens	₹50.0000
आउटपुट /1M tokens	₹200.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

तेज़ इन्फरेंस, संक्षिप्त प्राकृतिक जवाब
मजबूत द्विभाषी चीनी/अंग्रेज़ी प्रदर्शन
विश्वसनीय टूल-कॉल और function-calling
HuggingFace पर open-source मॉडल

बेंचमार्क

बेंचमार्क	स्कोर	नोट्स
C-Eval	82.3%	चीनी भाषा मूल्यांकन
MMLU	78.5%	सामान्य ज्ञान
HumanEval	82.1%	कोड जनरेशन
GSM-8K	88.7%	गणित तर्क
Tool-Call Accuracy	94.2%	function calling विश्वसनीयता

तकनीकी विवरण

आर्किटेक्चर: GLM, 32B dense पैरामीटर
मजबूत द्विभाषी चीनी/अंग्रेज़ी प्रदर्शन
विश्वसनीय टूल-कॉल और function-calling कार्यान्वयन
कॉन्टेक्स्ट विंडो: 128K टोकन
open-source — HuggingFace पर अनुमेय लाइसेंस
संक्षिप्त जवाब शैली के साथ तेज़ इन्फरेंस
Zhipu AI API और CallMissed unified gateway पर उपलब्ध

ताकतें

32B स्केल पर सर्वोत्तम द्विभाषी चीनी/अंग्रेज़ी
असाधारण रूप से विश्वसनीय टूल-कॉल
HuggingFace पर open-source — सेल्फ-होस्ट और फ़ाइन-ट्यून
संक्षिप्त, कुशल जवाबों के साथ तेज़ इन्फरेंस

सीमाएं

मुख्यतः चीनी/अंग्रेज़ी — अन्य भाषाओं पर कमज़ोर
32B dense — समान गुणवत्ता पर MoE से कम कुशल
Llama या Qwen की तुलना में छोटा समुदाय

उपयोग के मामले

द्विभाषी अनुप्रयोगटूल-कॉल एजेंटतेज़ कोड जनरेशनचीनी भाषा कार्य

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "glm-4.7-flash", "messages": [{"role": "user", "content": "Write a Python function to parse JSON"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: glm-4.7-flash

GLM-4.7 Flash अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।

फ्री शुरू करें डॉक्स पढ़ें