Mistral Small 3.1
द्वारा Mistral AI · रिलीज़ March 2025
24B पैरामीटर ओपन-सोर्स — 128K कॉन्टेक्स्ट, विज़न, function calling। GPT-4o Mini और Gemma 3 से आगे, 150 टोकन/सेक। CallMissed पर मुफ़्त।
Mistral Small 3.1
द्वारा संचालित Mistral AI · Dense Transformer (24B)
कॉन्टेक्स्ट विंडो
128K
पैरामीटर
24B (dense)
अधिकतम आउटपुट
8K
श्रेणी
LLM चैट
अवलोकन
Mistral Small 3.1 (2503) Mistral Small 3 पर अत्याधुनिक विज़न और 128K तक लंबा कॉन्टेक्स्ट — टेक्स्ट प्रदर्शन बिना समझौता। 24 अरब पैरामीटर — टेक्स्ट और विज़न में शीर्ष स्तर, एक GPU पर चलने योग्य।
Gemma 3 और GPT-4o Mini से बेहतर बेंचमार्क; 150 टोकन/सेक इन्फ़रेंस। function calling, structured outputs, JSON mode — एजेंटिक और टूल-यूज़।
Apache 2.0 — पूर्ण ओपन-सोर्स, व्यावसायिक उपयोग। CallMissed पर Cloudflare Workers AI — फ्री टियर, क्रेडिट के अलावा अतिरिक्त लागत नहीं।
Mistral Small 3 से: मल्टीमोडल विज़न, 32K→128K, लंबे दस्तावेज़। स्थानीय इन्फ़रेंस — संवाद एजेंट, function calling, लंबे दस्तावेज़, गोपनीयता-संवेदनशील डिप्लॉय।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| इनपुट /1M tokens | ₹35.0000 |
| आउटपुट /1M tokens | ₹56.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- CallMissed पर मुफ़्त — फ्री टियर
- अधिकांश बेंचमार्क पर GPT-4o Mini और Gemma 3 से आगे
- लंबे दस्तावेज़ों के लिए 128K कॉन्टेक्स्ट
- विज़न — टेक्स्ट के साथ इमेज
- Apache 2.0 ओपन-सोर्स लाइसेंस
- 150 टोकन/सेक इन्फ़रेंस
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| MMLU | 81.0% |
| HumanEval | 84.8% |
| MATH | 69.3% |
| GPQA | 40.7% |
| IFEval | 77.8% |
| Output Speed | 150 t/s |
तकनीकी विवरण
- आर्किटेक्चर: Dense Transformer, 24B पैरामीटर
- कॉन्टेक्स्ट: 128,000 टोकन (Mistral Small 3 में 32K से)
- Vision: मल्टीमोडल — टेक्स्ट और इमेज
- function calling और structured outputs
- लाइसेंस: Apache 2.0 (पूर्ण ओपन-सोर्स, व्यावसायिक उपयोग)
- Cloudflare Workers AI — फ्री टियर
- एक GPU डिप्लॉय के लिए अनुकूलित
- ज्ञान कटऑफ़: शुरुआती 2025
ताकतें
- CallMissed पर मुफ़्त — पेड प्लान नहीं
- ओपन-सोर्स (Apache 2.0) — सेल्फ़-होस्ट
- आकार के मुकाबले मज़बूत — GPT-4o Mini से आगे
- विज़न + टेक्स्ट मल्टीमोडल
- लंबे दस्तावेज़ों के लिए 128K
- 150 टोकन/सेक तेज़ इन्फ़रेंस
सीमाएं
- फ्रंटियर से छोटा — सबसे कठिन तर्क पर कम सक्षम
- विज़न नया — समर्पित विज़न मॉडल से कम परखा
- extended thinking / chain-of-thought नहीं
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/chat/completions \
-H "Authorization: Bearer cm_YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "mistral-small-3.1",
"messages": [{"role": "user", "content": "Explain the difference between async and sync programming in Python"}],
"temperature": 0.7
}'एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: mistral-small-3.1
Mistral Small 3.1 अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।