LLM चैटaffordable

Gemma 4 26B A4B

द्वारा Google · रिलीज़ April 2, 2026

Google DeepMind का Gemma 4 परिवार से open-weight MoE। 26B कुल, प्रति फ़ॉरवर्ड पास 4B सक्रिय — 4B जितनी गति, बड़ी मॉडल जैसी गुणवत्ता। मल्टीमोडल (टेक्स्ट+इमेज), 256K कॉन्टेक्स्ट, Apache 2.0।

LLM चैट

Gemma 4 26B A4B

द्वारा संचालित Google · Mixture-of-Experts (26B total / 4B active)

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

26B total / 4B active (MoE)

अधिकतम आउटपुट

8K

श्रेणी

LLM चैट

अवलोकन

Gemma 4 26B A4B (2 अप्रैल 2026, Google DeepMind) — open-weight MoE: 26B कुल, प्रति फ़ॉरवर्ड पास 4B सक्रिय। लगभग 4B जितनी तेज़, बड़े मॉडल जैसी गुणवत्ता — सबसे कुशल open मॉडलों में।

मल्टीमोडल: टेक्स्ट और इमेज (छोटे वेरिएंट पर ऑडियो), 256K कॉन्टेक्स्ट, 140+ भाषाएँ। Apache 2.0 — पूर्ण व्यावसायिक स्वतंत्रता।

मुख्य बेंचमार्क पर open-source में #3 — MoE से वज़न वर्ग से ऊपर। किफ़ायती डिप्लॉयमेंट, edge-अनुकूल, मल्टीमोडल+बहुभाषी+अनुमेय लाइसेंस जहाँ मायने रखे।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹40.0000
आउटपुट /1M tokens₹160.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • Apache 2.0 — पूर्ण व्यावसायिक स्वतंत्रता
  • 26B कुल, 4B सक्रिय (तेज़ इन्फरेंस)
  • मल्टीमोडल: टेक्स्ट और इमेज इनपुट
  • 140+ भाषाओं का समर्थन

बेंचमार्क

बेंचमार्कस्कोर
Open-Source Ranking#3
MMLU-Pro72.8%
HumanEval80.5%
MATH-50078.3%
GPQA Diamond55.2%

तकनीकी विवरण

  • आर्किटेक्चर: MoE 26B कुल / 4B सक्रिय प्रति फ़ॉरवर्ड पास
  • 4B मॉडल जितनी गति, कहीं अधिक गुणवत्ता
  • मल्टीमोडल: टेक्स्ट+इमेज (छोटे वेरिएंट पर ऑडियो)
  • 256K नेटिव कॉन्टेक्स्ट विंडो
  • 140+ भाषाएँ — सबसे विविध open मॉडलों में
  • Apache 2.0 — बिना प्रतिबंध
  • मुख्य बेंचमार्क पर #3 open-source
  • Google AI API और CallMissed unified gateway पर उपलब्ध

ताकतें

  • Apache 2.0 — शीर्ष open मॉडलों में सबसे अनुमेय लाइसेंस
  • 4B सक्रिय — उपभोक्ता हार्डवेयर और edge पर चलता है
  • 140+ भाषाओं के साथ मल्टीमोडल टेक्स्ट+इमेज
  • #3 open-source — वज़न वर्ग से ऊपर
  • किफ़ायती: $0.40/$1.60 प्रति 1M टोकन

सीमाएं

  • बड़े मॉडलों (GPT-OSS-120B, Kimi K2.5) से कम पूर्ण क्षमता
  • 4B सक्रिय — जटिल तर्क गहराई सीमित
  • समर्पित विज़न मॉडलों से कम इमेज समझ

उपयोग के मामले

किफ़ायती चैटइमेज समझबहुभाषी कार्यedge-अनुकूल डिप्लॉयमेंट

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "gemma-4-26b-a4b-it", "messages": [{"role": "user", "content": "Describe what you see in this image"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: gemma-4-26b-a4b-it

Gemma 4 26B A4B अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।