Gemini 3.1 Flash Lite
द्वारा Google · रिलीज़ 2026
Google का सबसे सस्ता Gemini 3.x मॉडल। 1M टोकन कॉन्टेक्स्ट, उच्च-वॉल्यूम कम-लेटेंसी कार्यों के लिए अनुकूलित। पास-थ्रू Google AI Studio मूल्य।
Gemini 3.1 Flash Lite
द्वारा संचालित Google · Transformer (proprietary, Gemini 3.x family)
कॉन्टेक्स्ट विंडो
1M
पैरामीटर
Undisclosed
अधिकतम आउटपुट
16K
श्रेणी
LLM चैट
अवलोकन
Gemini 3.1 Flash Lite Google का सबसे सस्ता Gemini 3.x मॉडल है — उच्च-वॉल्यूम, कम-लेटेंसी कार्यों के लिए जहाँ लागत प्राथमिक बाधा। यह पूर्ण 1M टोकन कॉन्टेक्स्ट विंडो रखता है जो Gemini 3.x परिवार परिभाषित करती है, पर लाइनअप में सबसे कम इनपुट/आउटपुट मूल्य ($0.25/$1.50 प्रति 1M टोकन) के लिए कुछ आउटपुट गुणवत्ता और तर्क गहराई का व्यापार करता है।
यह प्रोडक्शन वर्कलोड के लिए आदर्श जहाँ प्रत्येक अनुरोध साधारण पर मात्रा अधिक: वर्गीकरण, सारांश, कंटेंट मॉडरेशन, इरादा रूटिंग, retrieval-संवर्धित चैट, बहुभाषी कंटेंट टैगिंग और समान कार्य। 1M कॉन्टेक्स्ट विंडो कम लागत पर लंबे दस्तावेज़ प्रसंस्करण के लिए भी मज़बूत विकल्प।
CallMissed पर अन्य Gemini 3.x मॉडलों की तरह, यह सीधे Google AI Studio पर रूट होता है — OpenRouter हॉप नहीं, मार्कअप नहीं, मूल्य Google की प्रकाशित दर से शब्दशः मेल खाता है।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| इनपुट /1M tokens | ₹25.0000 |
| आउटपुट /1M tokens | ₹150.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- सबसे सस्ता Gemini 3.x मॉडल — $0.25/$1.50 प्रति 1M टोकन
- 1M टोकन कॉन्टेक्स्ट विंडो (Pro जैसा)
- उच्च-वॉल्यूम, कम-लेटेंसी कार्यों के लिए अनुकूलित
- Google AI Studio पर सीधा रूट — मार्कअप नहीं
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| Price (input) | $0.25 |
| Price (output) | $1.50 |
| Context window | 1M |
तकनीकी विवरण
- मॉडल ID: google/gemini-3.1-flash-lite
- सीधे Google AI Studio — कोई तीसरे पक्ष का होप नहीं
- कॉन्टेक्स्ट विंडो: 1,048,576 टोकन (3.1 Pro जैसा)
- पास-थ्रू मूल्य — $0.25 इनपुट / $1.50 आउटपुट प्रति 1M टोकन
- स्ट्रीमिंग, tool calling और structured outputs सपोर्ट
- OpenAI- और Anthropic-संगत — /v1/chat/completions और /v1/messages के माध्यम से काम
ताकतें
- Gemini 3.x परिवार में सबसे कम लागत — बड़े अंतर से
- Pro की पूर्ण 1M कॉन्टेक्स्ट विंडो बनाए रखता है
- सीधा Google रूटिंग — तेज़, मार्कअप नहीं
सीमाएं
- Gemini 3 Flash और 3.1 Pro बनाम कम तर्क गहराई
- Preview मॉडल — सामान्य उपलब्धता से पहले बदल सकता है
- जटिल बहु-चरण एजेंटिक वर्कफ़्लो के लिए आदर्श नहीं
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/chat/completions \
-H "Authorization: Bearer cm_YOUR_KEY" \
-d '{"model": "google/gemini-3.1-flash-lite", "messages": [{"role": "user", "content": "Classify this customer message"}]}'एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: google/gemini-3.1-flash-lite
Gemini 3.1 Flash Lite अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।