LLM चैटfast

GLM-4.7 Flash

द्वारा Z.ai · रिलीज़ 2025

Zhipu AI (Z.ai) का GLM-4 परिवार से तेज़ इन्फरेंस मॉडल। General Language Model आर्किटेक्चर, मजबूत द्विभाषी (चीनी/अंग्रेज़ी)। गति, विश्वसनीय टूल-कॉल और संक्षिप्त जवाब के लिए अनुकूलित।

LLM चैट

GLM-4.7 Flash

द्वारा संचालित Z.ai · General Language Model (GLM), Transformer

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

32B

अधिकतम आउटपुट

8K

श्रेणी

LLM चैट

अवलोकन

GLM-4.7 Flash Zhipu AI (Z.ai) का GLM-4 परिवार से तेज़ इन्फरेंस मॉडल है — 32B dense, गति और विश्वसनीयता के लिए अनुकूलित। GLM आर्किटेक्चर पर मजबूत द्विभाषी चीनी/अंग्रेज़ी, विशेष रूप से विश्वसनीय टूल-कॉल और function-calling।

प्रोडक्शन वर्कलोड के लिए — तेज़, संक्षिप्त जवाब, विश्वसनीय संरचित आउटपुट। टूल-कॉल निर्देशों का सटीक पालन — बाहरी API से जुड़ने वाले AI एजेंट के लिए उत्कृष्ट। 128K कॉन्टेक्स्ट।

open-source, HuggingFace पर — सबसे मजबूत open द्विभाषी मॉडलों में। चीनी ऐप, द्विभाषी सपोर्ट, तेज़ इन्फरेंस + विश्वसनीय टूल उपयोग। संक्षिप्त शैली — टोकन लागत कम।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹50.0000
आउटपुट /1M tokens₹200.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • तेज़ इन्फरेंस, संक्षिप्त प्राकृतिक जवाब
  • मजबूत द्विभाषी चीनी/अंग्रेज़ी प्रदर्शन
  • विश्वसनीय टूल-कॉल और function-calling
  • HuggingFace पर open-source मॉडल

बेंचमार्क

बेंचमार्कस्कोर
C-Eval82.3%
MMLU78.5%
HumanEval82.1%
GSM-8K88.7%
Tool-Call Accuracy94.2%

तकनीकी विवरण

  • आर्किटेक्चर: GLM, 32B dense पैरामीटर
  • मजबूत द्विभाषी चीनी/अंग्रेज़ी प्रदर्शन
  • विश्वसनीय टूल-कॉल और function-calling कार्यान्वयन
  • कॉन्टेक्स्ट विंडो: 128K टोकन
  • open-source — HuggingFace पर अनुमेय लाइसेंस
  • संक्षिप्त जवाब शैली के साथ तेज़ इन्फरेंस
  • Zhipu AI API और CallMissed unified gateway पर उपलब्ध

ताकतें

  • 32B स्केल पर सर्वोत्तम द्विभाषी चीनी/अंग्रेज़ी
  • असाधारण रूप से विश्वसनीय टूल-कॉल
  • HuggingFace पर open-source — सेल्फ-होस्ट और फ़ाइन-ट्यून
  • संक्षिप्त, कुशल जवाबों के साथ तेज़ इन्फरेंस

सीमाएं

  • मुख्यतः चीनी/अंग्रेज़ी — अन्य भाषाओं पर कमज़ोर
  • 32B dense — समान गुणवत्ता पर MoE से कम कुशल
  • Llama या Qwen की तुलना में छोटा समुदाय

उपयोग के मामले

द्विभाषी अनुप्रयोगटूल-कॉल एजेंटतेज़ कोड जनरेशनचीनी भाषा कार्य

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "glm-4.7-flash", "messages": [{"role": "user", "content": "Write a Python function to parse JSON"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: glm-4.7-flash

GLM-4.7 Flash अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।