Qwen 3.5 Flash
द्वारा Qwen · रिलीज़ February 2026
Qwen 3.5 परिवार का सबसे तेज़ और सबसे किफ़ायती मॉडल। नेटिव मल्टीमोडैलिटी, 262K नेटिव कॉन्टेक्स्ट विंडो (~1M तक विस्तार योग्य) और 201 भाषाएँ। गति और उच्च-वॉल्यूम उपयोग के लिए अनुकूलित।
Qwen 3.5 Flash
द्वारा संचालित Qwen · Sparse Mixture-of-Experts
कॉन्टेक्स्ट विंडो
128K
पैरामीटर
Undisclosed (MoE)
अधिकतम आउटपुट
8K
श्रेणी
LLM चैट
अवलोकन
Qwen 3.5 Flash Qwen 3.5 परिवार का सबसे तेज़ और सबसे किफ़ायती मॉडल है — उच्च-वॉल्यूम प्रोडक्शन वर्कलोड के लिए, जहाँ लागत और गति सर्वोपरि हैं। केवल $0.09/M इनपुट टोकन — सक्षम मॉडलों में सबसे सस्ते — प्रतिदिन लाखों अनुरोध वाले ऐप के लिए आदर्श।
262K नेटिव कॉन्टेक्स्ट विंडो (YaRN जैसी तकनीकों से लगभग 1M तक), टेक्स्ट, इमेज, वीडियो और ऑडियो में नेटिव मल्टीमोडल, और 201 भाषाएँ। गति और लागत पर फ़ोकस के बावजूद मानक बेंचमार्क पर मजबूत प्रदर्शन — विस्तृत प्रोडक्शन कार्यों के लिए उपयुक्त।
Qwen 3.5 Flash उच्च-वॉल्यूम अनुवाद, त्वरित वर्गीकरण, हल्का संवादी AI और लागत-संवेदी डिप्लॉयमेंट में उत्कृष्ट है, जहाँ Qwen 3.5 Plus की पूरी शक्ति ज़रूरी नहीं। 201 भाषाएँ वैश्विक ऐप के लिए विशेष रूप से मूल्यवान हैं।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| इनपुट /1M tokens | ₹9.0000 |
| आउटपुट /1M tokens | ₹35.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- अत्यंत कम लागत: $0.09/1M इनपुट टोकन
- नेटिव मल्टीमोडल समर्थन
- 201 भाषाओं का कवरेज
- उच्च वॉल्यूम के लिए तेज़ इन्फरेंस
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| MMLU-Pro | 74.2% |
| HumanEval | 83.5% |
| MATH-500 | 82.1% |
| GPQA Diamond | 56.8% |
तकनीकी विवरण
- Qwen 3.5 परिवार का सबसे तेज़ मॉडल — गति के लिए अनुकूलित
- 262K नेटिव कॉन्टेक्स्ट विंडो (~1M तक विस्तार योग्य)
- नेटिव मल्टीमोडल: टेक्स्ट, इमेज, वीडियो और ऑडियो इनपुट
- 201 भाषाएँ — Qwen 3.5 Plus जितना भाषाई कवरेज
- अत्यंत कम कीमत: $0.09/M इनपुट, $0.35/M आउटपुट
- कुशल इन्फरेंस के लिए MoE आर्किटेक्चर
- Alibaba Cloud API और CallMissed unified gateway के ज़रिए उपलब्ध
ताकतें
- $0.09/M इनपुट पर अत्यंत कम लागत — सबसे सस्ते सक्षम मॉडलों में
- वैश्विक ऐप के लिए 201 भाषाओं का समर्थन
- कम कीमत पर भी नेटिव मल्टीमोडल क्षमताएँ
- उच्च-वॉल्यूम प्रोडक्शन के लिए तेज़ इन्फरेंस
सीमाएं
- Qwen 3.5 Plus की तुलना में कम तर्क गहराई
- जटिल बहु-चरण तर्क या गहन विश्लेषण के लिए उपयुक्त नहीं
- OpenAI और Anthropic मॉडलों की तुलना में छोटा इकोसिस्टम
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/chat/completions \
-H "Authorization: Bearer cm_YOUR_KEY" \
-d '{"model": "qwen/qwen3.5-flash", "messages": [{"role": "user", "content": "Translate this to Japanese"}]}'एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: qwen/qwen3.5-flash
Qwen 3.5 Flash अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।