What is Gemma 4 26B A4B?

Google DeepMind's open-weight MoE model from the Gemma 4 family. 26B total parameters with only 4B active per forward pass — runs nearly as fast as a 4B model while delivering much larger model quality. Multimodal (text + image), 256K context, Apache 2.0 license.

How much does Gemma 4 26B A4B cost?

Gemma 4 26B A4B costs $0.4/1M tokens for input and $1.6/1M tokens for output on CallMissed. 1 credit = ₹1 = $0.01 USD.

How do I use Gemma 4 26B A4B via API?

Send a POST request to POST /v1/chat/completions with model "gemma-4-26b-a4b-it" and your API key. CallMissed uses the OpenAI-compatible format — just change the base URL and model field.

What is the context window of Gemma 4 26B A4B?

Gemma 4 26B A4B supports a 128K token context window with up to 8K output tokens.

सभी मॉडल पर वापस जाएं

LLM चैटaffordable

Gemma 4 26B A4B

द्वारा Google · रिलीज़ April 2, 2026

Google DeepMind का Gemma 4 परिवार से open-weight MoE। 26B कुल, प्रति फ़ॉरवर्ड पास 4B सक्रिय — 4B जितनी गति, बड़ी मॉडल जैसी गुणवत्ता। मल्टीमोडल (टेक्स्ट+इमेज), 256K कॉन्टेक्स्ट, Apache 2.0।

LLM चैट

Gemma 4 26B A4B

द्वारा संचालित Google · Mixture-of-Experts (26B total / 4B active)

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

26B total / 4B active (MoE)

अधिकतम आउटपुट

श्रेणी

LLM चैट

अवलोकन

Gemma 4 26B A4B (2 अप्रैल 2026, Google DeepMind) — open-weight MoE: 26B कुल, प्रति फ़ॉरवर्ड पास 4B सक्रिय। लगभग 4B जितनी तेज़, बड़े मॉडल जैसी गुणवत्ता — सबसे कुशल open मॉडलों में।

मल्टीमोडल: टेक्स्ट और इमेज (छोटे वेरिएंट पर ऑडियो), 256K कॉन्टेक्स्ट, 140+ भाषाएँ। Apache 2.0 — पूर्ण व्यावसायिक स्वतंत्रता।

मुख्य बेंचमार्क पर open-source में #3 — MoE से वज़न वर्ग से ऊपर। किफ़ायती डिप्लॉयमेंट, edge-अनुकूल, मल्टीमोडल+बहुभाषी+अनुमेय लाइसेंस जहाँ मायने रखे।

प्राइसिंग

मेट्रिक	कीमत
इनपुट /1M tokens	₹40.0000
आउटपुट /1M tokens	₹160.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

Apache 2.0 — पूर्ण व्यावसायिक स्वतंत्रता
26B कुल, 4B सक्रिय (तेज़ इन्फरेंस)
मल्टीमोडल: टेक्स्ट और इमेज इनपुट
140+ भाषाओं का समर्थन

बेंचमार्क

बेंचमार्क	स्कोर	नोट्स
Open-Source Ranking	#3	कुल मिलाकर तीसरा सर्वश्रेष्ठ open-source मॉडल
MMLU-Pro	72.8%	व्यावसायिक ज्ञान
HumanEval	80.5%	कोड जनरेशन
MATH-500	78.3%	प्रतियोगिता गणित
GPQA Diamond	55.2%	स्नातकोत्तर-स्तर विज्ञान

तकनीकी विवरण

आर्किटेक्चर: MoE 26B कुल / 4B सक्रिय प्रति फ़ॉरवर्ड पास
4B मॉडल जितनी गति, कहीं अधिक गुणवत्ता
मल्टीमोडल: टेक्स्ट+इमेज (छोटे वेरिएंट पर ऑडियो)
256K नेटिव कॉन्टेक्स्ट विंडो
140+ भाषाएँ — सबसे विविध open मॉडलों में
Apache 2.0 — बिना प्रतिबंध
मुख्य बेंचमार्क पर #3 open-source
Google AI API और CallMissed unified gateway पर उपलब्ध

ताकतें

Apache 2.0 — शीर्ष open मॉडलों में सबसे अनुमेय लाइसेंस
4B सक्रिय — उपभोक्ता हार्डवेयर और edge पर चलता है
140+ भाषाओं के साथ मल्टीमोडल टेक्स्ट+इमेज
#3 open-source — वज़न वर्ग से ऊपर
किफ़ायती: $0.40/$1.60 प्रति 1M टोकन

सीमाएं

बड़े मॉडलों (GPT-OSS-120B, Kimi K2.5) से कम पूर्ण क्षमता
4B सक्रिय — जटिल तर्क गहराई सीमित
समर्पित विज़न मॉडलों से कम इमेज समझ

उपयोग के मामले

किफ़ायती चैटइमेज समझबहुभाषी कार्यedge-अनुकूल डिप्लॉयमेंट

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "gemma-4-26b-a4b-it", "messages": [{"role": "user", "content": "Describe what you see in this image"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: gemma-4-26b-a4b-it

Gemma 4 26B A4B अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।

फ्री शुरू करें डॉक्स पढ़ें