GLM-4.7 Flash
द्वारा Z.ai · रिलीज़ 2025
Zhipu AI (Z.ai) का GLM-4 परिवार से तेज़ इन्फरेंस मॉडल। General Language Model आर्किटेक्चर, मजबूत द्विभाषी (चीनी/अंग्रेज़ी)। गति, विश्वसनीय टूल-कॉल और संक्षिप्त जवाब के लिए अनुकूलित।
GLM-4.7 Flash
द्वारा संचालित Z.ai · General Language Model (GLM), Transformer
कॉन्टेक्स्ट विंडो
128K
पैरामीटर
32B
अधिकतम आउटपुट
8K
श्रेणी
LLM चैट
अवलोकन
GLM-4.7 Flash Zhipu AI (Z.ai) का GLM-4 परिवार से तेज़ इन्फरेंस मॉडल है — 32B dense, गति और विश्वसनीयता के लिए अनुकूलित। GLM आर्किटेक्चर पर मजबूत द्विभाषी चीनी/अंग्रेज़ी, विशेष रूप से विश्वसनीय टूल-कॉल और function-calling।
प्रोडक्शन वर्कलोड के लिए — तेज़, संक्षिप्त जवाब, विश्वसनीय संरचित आउटपुट। टूल-कॉल निर्देशों का सटीक पालन — बाहरी API से जुड़ने वाले AI एजेंट के लिए उत्कृष्ट। 128K कॉन्टेक्स्ट।
open-source, HuggingFace पर — सबसे मजबूत open द्विभाषी मॉडलों में। चीनी ऐप, द्विभाषी सपोर्ट, तेज़ इन्फरेंस + विश्वसनीय टूल उपयोग। संक्षिप्त शैली — टोकन लागत कम।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| इनपुट /1M tokens | ₹50.0000 |
| आउटपुट /1M tokens | ₹200.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- तेज़ इन्फरेंस, संक्षिप्त प्राकृतिक जवाब
- मजबूत द्विभाषी चीनी/अंग्रेज़ी प्रदर्शन
- विश्वसनीय टूल-कॉल और function-calling
- HuggingFace पर open-source मॉडल
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| C-Eval | 82.3% |
| MMLU | 78.5% |
| HumanEval | 82.1% |
| GSM-8K | 88.7% |
| Tool-Call Accuracy | 94.2% |
तकनीकी विवरण
- आर्किटेक्चर: GLM, 32B dense पैरामीटर
- मजबूत द्विभाषी चीनी/अंग्रेज़ी प्रदर्शन
- विश्वसनीय टूल-कॉल और function-calling कार्यान्वयन
- कॉन्टेक्स्ट विंडो: 128K टोकन
- open-source — HuggingFace पर अनुमेय लाइसेंस
- संक्षिप्त जवाब शैली के साथ तेज़ इन्फरेंस
- Zhipu AI API और CallMissed unified gateway पर उपलब्ध
ताकतें
- 32B स्केल पर सर्वोत्तम द्विभाषी चीनी/अंग्रेज़ी
- असाधारण रूप से विश्वसनीय टूल-कॉल
- HuggingFace पर open-source — सेल्फ-होस्ट और फ़ाइन-ट्यून
- संक्षिप्त, कुशल जवाबों के साथ तेज़ इन्फरेंस
सीमाएं
- मुख्यतः चीनी/अंग्रेज़ी — अन्य भाषाओं पर कमज़ोर
- 32B dense — समान गुणवत्ता पर MoE से कम कुशल
- Llama या Qwen की तुलना में छोटा समुदाय
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/chat/completions \
-H "Authorization: Bearer cm_YOUR_KEY" \
-d '{"model": "glm-4.7-flash", "messages": [{"role": "user", "content": "Write a Python function to parse JSON"}]}'एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: glm-4.7-flash
GLM-4.7 Flash अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।