What is Qwen 3.5 Flash?

The fastest and most affordable model in the Qwen 3.5 family. Features native multimodality, 262K native context window (extendable to ~1M), and support for 201 languages. Optimized for speed and high-volume use cases.

How much does Qwen 3.5 Flash cost?

Qwen 3.5 Flash costs $0.09/1M tokens for input and $0.35/1M tokens for output on CallMissed. 1 credit = ₹1 = $0.01 USD.

How do I use Qwen 3.5 Flash via API?

Send a POST request to POST /v1/chat/completions with model "qwen/qwen3.5-flash" and your API key. CallMissed uses the OpenAI-compatible format — just change the base URL and model field.

What is the context window of Qwen 3.5 Flash?

Qwen 3.5 Flash supports a 128K token context window with up to 8K output tokens.

सभी मॉडल पर वापस जाएं

LLM चैटfastaffordable

Qwen 3.5 Flash

द्वारा Qwen · रिलीज़ February 2026

Qwen 3.5 परिवार का सबसे तेज़ और सबसे किफ़ायती मॉडल। नेटिव मल्टीमोडैलिटी, 262K नेटिव कॉन्टेक्स्ट विंडो (~1M तक विस्तार योग्य) और 201 भाषाएँ। गति और उच्च-वॉल्यूम उपयोग के लिए अनुकूलित।

LLM चैट

Qwen 3.5 Flash

द्वारा संचालित Qwen · Sparse Mixture-of-Experts

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

Undisclosed (MoE)

अधिकतम आउटपुट

श्रेणी

LLM चैट

अवलोकन

Qwen 3.5 Flash Qwen 3.5 परिवार का सबसे तेज़ और सबसे किफ़ायती मॉडल है — उच्च-वॉल्यूम प्रोडक्शन वर्कलोड के लिए, जहाँ लागत और गति सर्वोपरि हैं। केवल $0.09/M इनपुट टोकन — सक्षम मॉडलों में सबसे सस्ते — प्रतिदिन लाखों अनुरोध वाले ऐप के लिए आदर्श।

262K नेटिव कॉन्टेक्स्ट विंडो (YaRN जैसी तकनीकों से लगभग 1M तक), टेक्स्ट, इमेज, वीडियो और ऑडियो में नेटिव मल्टीमोडल, और 201 भाषाएँ। गति और लागत पर फ़ोकस के बावजूद मानक बेंचमार्क पर मजबूत प्रदर्शन — विस्तृत प्रोडक्शन कार्यों के लिए उपयुक्त।

Qwen 3.5 Flash उच्च-वॉल्यूम अनुवाद, त्वरित वर्गीकरण, हल्का संवादी AI और लागत-संवेदी डिप्लॉयमेंट में उत्कृष्ट है, जहाँ Qwen 3.5 Plus की पूरी शक्ति ज़रूरी नहीं। 201 भाषाएँ वैश्विक ऐप के लिए विशेष रूप से मूल्यवान हैं।

प्राइसिंग

मेट्रिक	कीमत
इनपुट /1M tokens	₹9.0000
आउटपुट /1M tokens	₹35.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

अत्यंत कम लागत: $0.09/1M इनपुट टोकन
नेटिव मल्टीमोडल समर्थन
201 भाषाओं का कवरेज
उच्च वॉल्यूम के लिए तेज़ इन्फरेंस

बेंचमार्क

बेंचमार्क	स्कोर	नोट्स
MMLU-Pro	74.2%	व्यावसायिक ज्ञान
HumanEval	83.5%	कोड जनरेशन
MATH-500	82.1%	प्रतियोगिता गणित
GPQA Diamond	56.8%	स्नातकोत्तर-स्तर विज्ञान

तकनीकी विवरण

Qwen 3.5 परिवार का सबसे तेज़ मॉडल — गति के लिए अनुकूलित
262K नेटिव कॉन्टेक्स्ट विंडो (~1M तक विस्तार योग्य)
नेटिव मल्टीमोडल: टेक्स्ट, इमेज, वीडियो और ऑडियो इनपुट
201 भाषाएँ — Qwen 3.5 Plus जितना भाषाई कवरेज
अत्यंत कम कीमत: $0.09/M इनपुट, $0.35/M आउटपुट
कुशल इन्फरेंस के लिए MoE आर्किटेक्चर
Alibaba Cloud API और CallMissed unified gateway के ज़रिए उपलब्ध

ताकतें

$0.09/M इनपुट पर अत्यंत कम लागत — सबसे सस्ते सक्षम मॉडलों में
वैश्विक ऐप के लिए 201 भाषाओं का समर्थन
कम कीमत पर भी नेटिव मल्टीमोडल क्षमताएँ
उच्च-वॉल्यूम प्रोडक्शन के लिए तेज़ इन्फरेंस

सीमाएं

Qwen 3.5 Plus की तुलना में कम तर्क गहराई
जटिल बहु-चरण तर्क या गहन विश्लेषण के लिए उपयुक्त नहीं
OpenAI और Anthropic मॉडलों की तुलना में छोटा इकोसिस्टम

उपयोग के मामले

उच्च-वॉल्यूम अनुवादत्वरित वर्गीकरणहल्का चैटलागत-संवेदी डिप्लॉयमेंट

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "qwen/qwen3.5-flash", "messages": [{"role": "user", "content": "Translate this to Japanese"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: qwen/qwen3.5-flash

Qwen 3.5 Flash अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।

फ्री शुरू करें डॉक्स पढ़ें