Sarvam 105B
द्वारा Sarvam AI · रिलीज़ 2025
Sarvam AI का फ़्लैगशिप 105B MoE मॉडल, 128K context के साथ। सबसे बड़ा Indian-language-optimized LLM, 11 भारतीय भाषाओं में superior reasoning और generation quality, मज़बूत अंग्रेज़ी प्रदर्शन के साथ।
Sarvam 105B
द्वारा संचालित Sarvam AI · Mixture-of-Experts (MoE)
कॉन्टेक्स्ट विंडो
128K
पैरामीटर
105B (MoE)
अधिकतम आउटपुट
8K
श्रेणी
LLM चैट
अवलोकन
Sarvam 105B Sarvam AI lineup का फ़्लैगशिप मॉडल है, Sarvam-M (30B) पर सिद्ध post-training pipeline को 105-billion-parameter Mixture-of-Experts architecture तक scale करता है। 128K context के साथ यह पूरे legal documents, financial reports और codebases एक बार में ingest कर सकता है — native script और romanized दोनों में 11 प्रमुख भाषाओं पर best-in-class Indian language understanding बनाए रखते हुए।
Training methodology छोटे sibling जैसी तीन-चरण pipeline: quality-scored, culturally curated prompts पर supervised fine-tuning; instruction-following, math और programming curricula पर GRPO algorithm वाला RLVR; और quantization के साथ inference optimization। MoE architecture प्रति token केवल experts का subset activate करती है, बड़े total parameter count के बावजूद inference costs manageable रखती है।
सबसे बड़े Indian-language-optimized LLM के रूप में Sarvam 105B enterprise use cases — complex document analysis, regional languages में long-form content generation, accuracy और cultural sensitivity महत्वपूर्ण government/public-sector AI deployments — के लिए सर्वोच्च quality outputs देता है। मॉडल DPDP Act-aligned infrastructure पर India data residency के साथ deployed है।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| इनपुट /1M tokens | ₹35.0000 |
| आउटपुट /1M tokens | ₹35.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- फ़्लैगशिप मॉडल — भारतीय भाषाओं के लिए सर्वश्रेष्ठ quality
- लंबे दस्तावेज़ों के लिए 128K कॉन्टेक्स्ट
- Hindi, Tamil, Telugu, Bengali आदि में superior reasoning
- India data residency के साथ DPDP Act-aligned infrastructure
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| MMLU | 0.89 |
| MMLU-IN | 0.83 |
| MMLU-IN-R | 0.71 |
| HumanEval | 0.90 |
| GSM-8K | 0.96 |
| GSM-8K-IN-R | 0.87 |
| MTBench | 8.45 |
| AlpacaEval | 65.3 |
तकनीकी विवरण
- Architecture: 105B total parameters वाला Mixture-of-Experts (MoE)
- Training pipeline: SFT → RLVR (GRPO) → Inference optimization (Sarvam-M जैसा)
- Context window: long-document processing के लिए 128K tokens
- Languages: Hindi, Tamil, Telugu, Bengali, Marathi, Gujarati, Kannada, Malayalam, Odia, Punjabi, Assamese + English
- सभी 11 भारतीय भाषाओं के लिए native script और romanized input सपोर्ट
- MoE routing efficient inference के लिए प्रति token experts का subset activate करती है
- India data residency के साथ DPDP Act-aligned infrastructure पर deployed
ताकतें
- उपलब्ध सर्वोच्च quality Indian language model — 11 भाषाओं में best reasoning और generation
- superior accuracy के साथ code-mixed text (Hinglish, Tanglish) मूल रूप से संभालता है
- 128K context legal, financial और government use cases के लिए full-document analysis सक्षम
- काफ़ी अधिक capability के बावजूद 30B variant जितनी affordable pricing
- DPDP Act alignment और India data residency के साथ enterprise-grade infrastructure
सीमाएं
- MoE architecture deployment पर similar active parameter count वाले dense models की तुलना में अधिक memory चाहती है
- मुख्यतः 11 भारतीय भाषाओं के लिए अनुकूलित — 100+ भाषाएँ सपोर्ट करने वाले models से कम coverage
- बड़े model size के कारण छोटे Sarvam 30B से अधिक latency
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/chat/completions \
-H "Authorization: Bearer cm_YOUR_KEY" \
-d '{"model": "sarvam-105b", "messages": [{"role": "user", "content": "Explain quantum computing in Hindi"}]}'एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: sarvam-105b
Sarvam 105B अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।