LLM चैटfastaffordable

Qwen 3.5 Flash

द्वारा Qwen · रिलीज़ February 2026

Qwen 3.5 परिवार का सबसे तेज़ और सबसे किफ़ायती मॉडल। नेटिव मल्टीमोडैलिटी, 262K नेटिव कॉन्टेक्स्ट विंडो (~1M तक विस्तार योग्य) और 201 भाषाएँ। गति और उच्च-वॉल्यूम उपयोग के लिए अनुकूलित।

LLM चैट

Qwen 3.5 Flash

द्वारा संचालित Qwen · Sparse Mixture-of-Experts

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

Undisclosed (MoE)

अधिकतम आउटपुट

8K

श्रेणी

LLM चैट

अवलोकन

Qwen 3.5 Flash Qwen 3.5 परिवार का सबसे तेज़ और सबसे किफ़ायती मॉडल है — उच्च-वॉल्यूम प्रोडक्शन वर्कलोड के लिए, जहाँ लागत और गति सर्वोपरि हैं। केवल $0.09/M इनपुट टोकन — सक्षम मॉडलों में सबसे सस्ते — प्रतिदिन लाखों अनुरोध वाले ऐप के लिए आदर्श।

262K नेटिव कॉन्टेक्स्ट विंडो (YaRN जैसी तकनीकों से लगभग 1M तक), टेक्स्ट, इमेज, वीडियो और ऑडियो में नेटिव मल्टीमोडल, और 201 भाषाएँ। गति और लागत पर फ़ोकस के बावजूद मानक बेंचमार्क पर मजबूत प्रदर्शन — विस्तृत प्रोडक्शन कार्यों के लिए उपयुक्त।

Qwen 3.5 Flash उच्च-वॉल्यूम अनुवाद, त्वरित वर्गीकरण, हल्का संवादी AI और लागत-संवेदी डिप्लॉयमेंट में उत्कृष्ट है, जहाँ Qwen 3.5 Plus की पूरी शक्ति ज़रूरी नहीं। 201 भाषाएँ वैश्विक ऐप के लिए विशेष रूप से मूल्यवान हैं।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹9.0000
आउटपुट /1M tokens₹35.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • अत्यंत कम लागत: $0.09/1M इनपुट टोकन
  • नेटिव मल्टीमोडल समर्थन
  • 201 भाषाओं का कवरेज
  • उच्च वॉल्यूम के लिए तेज़ इन्फरेंस

बेंचमार्क

बेंचमार्कस्कोर
MMLU-Pro74.2%
HumanEval83.5%
MATH-50082.1%
GPQA Diamond56.8%

तकनीकी विवरण

  • Qwen 3.5 परिवार का सबसे तेज़ मॉडल — गति के लिए अनुकूलित
  • 262K नेटिव कॉन्टेक्स्ट विंडो (~1M तक विस्तार योग्य)
  • नेटिव मल्टीमोडल: टेक्स्ट, इमेज, वीडियो और ऑडियो इनपुट
  • 201 भाषाएँ — Qwen 3.5 Plus जितना भाषाई कवरेज
  • अत्यंत कम कीमत: $0.09/M इनपुट, $0.35/M आउटपुट
  • कुशल इन्फरेंस के लिए MoE आर्किटेक्चर
  • Alibaba Cloud API और CallMissed unified gateway के ज़रिए उपलब्ध

ताकतें

  • $0.09/M इनपुट पर अत्यंत कम लागत — सबसे सस्ते सक्षम मॉडलों में
  • वैश्विक ऐप के लिए 201 भाषाओं का समर्थन
  • कम कीमत पर भी नेटिव मल्टीमोडल क्षमताएँ
  • उच्च-वॉल्यूम प्रोडक्शन के लिए तेज़ इन्फरेंस

सीमाएं

  • Qwen 3.5 Plus की तुलना में कम तर्क गहराई
  • जटिल बहु-चरण तर्क या गहन विश्लेषण के लिए उपयुक्त नहीं
  • OpenAI और Anthropic मॉडलों की तुलना में छोटा इकोसिस्टम

उपयोग के मामले

उच्च-वॉल्यूम अनुवादत्वरित वर्गीकरणहल्का चैटलागत-संवेदी डिप्लॉयमेंट

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "qwen/qwen3.5-flash", "messages": [{"role": "user", "content": "Translate this to Japanese"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: qwen/qwen3.5-flash

Qwen 3.5 Flash अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।