LLM चैटfree-tieropen-sourcevision

Mistral Small 3.1

द्वारा Mistral AI · रिलीज़ March 2025

24B पैरामीटर ओपन-सोर्स — 128K कॉन्टेक्स्ट, विज़न, function calling। GPT-4o Mini और Gemma 3 से आगे, 150 टोकन/सेक। CallMissed पर मुफ़्त।

LLM चैट

Mistral Small 3.1

द्वारा संचालित Mistral AI · Dense Transformer (24B)

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

24B (dense)

अधिकतम आउटपुट

8K

श्रेणी

LLM चैट

अवलोकन

Mistral Small 3.1 (2503) Mistral Small 3 पर अत्याधुनिक विज़न और 128K तक लंबा कॉन्टेक्स्ट — टेक्स्ट प्रदर्शन बिना समझौता। 24 अरब पैरामीटर — टेक्स्ट और विज़न में शीर्ष स्तर, एक GPU पर चलने योग्य।

Gemma 3 और GPT-4o Mini से बेहतर बेंचमार्क; 150 टोकन/सेक इन्फ़रेंस। function calling, structured outputs, JSON mode — एजेंटिक और टूल-यूज़।

Apache 2.0 — पूर्ण ओपन-सोर्स, व्यावसायिक उपयोग। CallMissed पर Cloudflare Workers AI — फ्री टियर, क्रेडिट के अलावा अतिरिक्त लागत नहीं।

Mistral Small 3 से: मल्टीमोडल विज़न, 32K→128K, लंबे दस्तावेज़। स्थानीय इन्फ़रेंस — संवाद एजेंट, function calling, लंबे दस्तावेज़, गोपनीयता-संवेदनशील डिप्लॉय।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹35.0000
आउटपुट /1M tokens₹56.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • CallMissed पर मुफ़्त — फ्री टियर
  • अधिकांश बेंचमार्क पर GPT-4o Mini और Gemma 3 से आगे
  • लंबे दस्तावेज़ों के लिए 128K कॉन्टेक्स्ट
  • विज़न — टेक्स्ट के साथ इमेज
  • Apache 2.0 ओपन-सोर्स लाइसेंस
  • 150 टोकन/सेक इन्फ़रेंस

बेंचमार्क

बेंचमार्कस्कोर
MMLU81.0%
HumanEval84.8%
MATH69.3%
GPQA40.7%
IFEval77.8%
Output Speed150 t/s

तकनीकी विवरण

  • आर्किटेक्चर: Dense Transformer, 24B पैरामीटर
  • कॉन्टेक्स्ट: 128,000 टोकन (Mistral Small 3 में 32K से)
  • Vision: मल्टीमोडल — टेक्स्ट और इमेज
  • function calling और structured outputs
  • लाइसेंस: Apache 2.0 (पूर्ण ओपन-सोर्स, व्यावसायिक उपयोग)
  • Cloudflare Workers AI — फ्री टियर
  • एक GPU डिप्लॉय के लिए अनुकूलित
  • ज्ञान कटऑफ़: शुरुआती 2025

ताकतें

  • CallMissed पर मुफ़्त — पेड प्लान नहीं
  • ओपन-सोर्स (Apache 2.0) — सेल्फ़-होस्ट
  • आकार के मुकाबले मज़बूत — GPT-4o Mini से आगे
  • विज़न + टेक्स्ट मल्टीमोडल
  • लंबे दस्तावेज़ों के लिए 128K
  • 150 टोकन/सेक तेज़ इन्फ़रेंस

सीमाएं

  • फ्रंटियर से छोटा — सबसे कठिन तर्क पर कम सक्षम
  • विज़न नया — समर्पित विज़न मॉडल से कम परखा
  • extended thinking / chain-of-thought नहीं

उपयोग के मामले

संवाद एजेंटfunction calling और टूल उपयोगलंबे दस्तावेज़ समझइमेज समझगोपनीयता-संवेदनशील डिप्लॉय

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "mistral-small-3.1",
    "messages": [{"role": "user", "content": "Explain the difference between async and sync programming in Python"}],
    "temperature": 0.7
  }'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: mistral-small-3.1

Mistral Small 3.1 अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।