LLM चैटfastcheapestpass-through pricing

Gemini 3.1 Flash Lite

द्वारा Google · रिलीज़ 2026

Google का सबसे सस्ता Gemini 3.x मॉडल। 1M टोकन कॉन्टेक्स्ट, उच्च-वॉल्यूम कम-लेटेंसी कार्यों के लिए अनुकूलित। पास-थ्रू Google AI Studio मूल्य।

LLM चैट

Gemini 3.1 Flash Lite

द्वारा संचालित Google · Transformer (proprietary, Gemini 3.x family)

कॉन्टेक्स्ट विंडो

1M

पैरामीटर

Undisclosed

अधिकतम आउटपुट

16K

श्रेणी

LLM चैट

अवलोकन

Gemini 3.1 Flash Lite Google का सबसे सस्ता Gemini 3.x मॉडल है — उच्च-वॉल्यूम, कम-लेटेंसी कार्यों के लिए जहाँ लागत प्राथमिक बाधा। यह पूर्ण 1M टोकन कॉन्टेक्स्ट विंडो रखता है जो Gemini 3.x परिवार परिभाषित करती है, पर लाइनअप में सबसे कम इनपुट/आउटपुट मूल्य ($0.25/$1.50 प्रति 1M टोकन) के लिए कुछ आउटपुट गुणवत्ता और तर्क गहराई का व्यापार करता है।

यह प्रोडक्शन वर्कलोड के लिए आदर्श जहाँ प्रत्येक अनुरोध साधारण पर मात्रा अधिक: वर्गीकरण, सारांश, कंटेंट मॉडरेशन, इरादा रूटिंग, retrieval-संवर्धित चैट, बहुभाषी कंटेंट टैगिंग और समान कार्य। 1M कॉन्टेक्स्ट विंडो कम लागत पर लंबे दस्तावेज़ प्रसंस्करण के लिए भी मज़बूत विकल्प।

CallMissed पर अन्य Gemini 3.x मॉडलों की तरह, यह सीधे Google AI Studio पर रूट होता है — OpenRouter हॉप नहीं, मार्कअप नहीं, मूल्य Google की प्रकाशित दर से शब्दशः मेल खाता है।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹25.0000
आउटपुट /1M tokens₹150.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • सबसे सस्ता Gemini 3.x मॉडल — $0.25/$1.50 प्रति 1M टोकन
  • 1M टोकन कॉन्टेक्स्ट विंडो (Pro जैसा)
  • उच्च-वॉल्यूम, कम-लेटेंसी कार्यों के लिए अनुकूलित
  • Google AI Studio पर सीधा रूट — मार्कअप नहीं

बेंचमार्क

बेंचमार्कस्कोर
Price (input)$0.25
Price (output)$1.50
Context window1M

तकनीकी विवरण

  • मॉडल ID: google/gemini-3.1-flash-lite
  • सीधे Google AI Studio — कोई तीसरे पक्ष का होप नहीं
  • कॉन्टेक्स्ट विंडो: 1,048,576 टोकन (3.1 Pro जैसा)
  • पास-थ्रू मूल्य — $0.25 इनपुट / $1.50 आउटपुट प्रति 1M टोकन
  • स्ट्रीमिंग, tool calling और structured outputs सपोर्ट
  • OpenAI- और Anthropic-संगत — /v1/chat/completions और /v1/messages के माध्यम से काम

ताकतें

  • Gemini 3.x परिवार में सबसे कम लागत — बड़े अंतर से
  • Pro की पूर्ण 1M कॉन्टेक्स्ट विंडो बनाए रखता है
  • सीधा Google रूटिंग — तेज़, मार्कअप नहीं

सीमाएं

  • Gemini 3 Flash और 3.1 Pro बनाम कम तर्क गहराई
  • Preview मॉडल — सामान्य उपलब्धता से पहले बदल सकता है
  • जटिल बहु-चरण एजेंटिक वर्कफ़्लो के लिए आदर्श नहीं

उपयोग के मामले

इरादा वर्गीकरणउच्च-वॉल्यूम रूटिंगकंटेंट मॉडरेशनलंबे-दस्तावेज़ सारांशबहुभाषी टैगिंग

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "google/gemini-3.1-flash-lite", "messages": [{"role": "user", "content": "Classify this customer message"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: google/gemini-3.1-flash-lite

Gemini 3.1 Flash Lite अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।