LLM चैटfastaffordablepass-through pricing

Gemini 3 Flash Preview

द्वारा Google · रिलीज़ 2026

Google का तेज़ और सस्ता मॉडल। 1M टोकन कॉन्टेक्स्ट के साथ बिजली-जैसी तेज़ inference। गति और उच्च-वॉल्यूम डेवलपर उपयोग के लिए अनुकूलित, मज़बूत तर्क क्षमताएँ बनाए रखते हुए।

LLM चैट

Gemini 3 Flash Preview

द्वारा संचालित Google · Transformer (proprietary)

कॉन्टेक्स्ट विंडो

1M

पैरामीटर

Undisclosed

अधिकतम आउटपुट

16K

श्रेणी

LLM चैट

अवलोकन

Gemini 3 Flash Preview Google का गति-अनुकूलित मॉडल है, डेवलपरों के लिए जिन्हें 1M टोकन कॉन्टेक्स्ट त्यागे बिना स्केल पर तेज़ inference चाहिए। टेक्स्ट, इमेज और अन्य मोडैलिटी में मज़बूत तर्क क्षमताएँ बनाए बिजली-जैसी तेज़ जवाब देता है।

मॉडल उच्च-वॉल्यूम प्रोडक्शन वर्कलोड के लिए बना जहाँ लेटेंसी और लागत प्राथमिक हैं। $0.70/M इनपुट और $4.00/M आउटपुट पर, यह क्षमता और affordability का उत्कृष्ट संतुलन — Gemini 3.1 Pro से काफ़ी सस्ता, मल्टीमोडल इनपुट और पूर्ण 1M कॉन्टेक्स्ट बनाए रखते हुए। रियल-टाइम चैट, त्वरित सारांश और लागत-संवेदनशील डिप्लॉयमेंट के लिए आदर्श।

Flash-टियर मॉडल के रूप में, कच्ची गति के लिए कुछ तर्क गहराई का व्यापार करता है। सारांश, वर्गीकरण, अनुवाद और संवादात्मक AI जैसे सीधे कार्य उच्च गुणवत्ता से संभालता है, जबकि अधिक जटिल बहु-चरण तर्क कार्य Pro वेरिएंट से लाभान्वित हो सकते हैं।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹50.0000
आउटपुट /1M tokens₹300.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • बिजली-जैसी तेज़ inference गति
  • 1M टोकन कॉन्टेक्स्ट विंडो
  • अपनी कीमत पर अत्यधिक सक्षम
  • मल्टीमोडल इनपुट सपोर्ट
  • Google AI Studio पर सीधा रूट — पास-थ्रू मूल्य

बेंचमार्क

बेंचमार्कस्कोर
MMLU-Pro78.5%
HumanEval86.2%
MATH-50085.4%
GPQA Diamond62.1%

तकनीकी विवरण

  • कॉन्टेक्स्ट विंडो: 1,000,000 टोकन — Gemini 3.1 Pro जैसा
  • बिजली-जैसी तेज़ inference और कम लेटेंसी के लिए अनुकूलित
  • मूल मल्टीमोडल: टेक्स्ट, इमेज और अन्य इनपुट प्रकार
  • Function calling, structured outputs और search grounding सपोर्ट
  • पास-थ्रू Google AI Studio मूल्य — $0.50/$3 प्रति 1M टोकन
  • Google AI Studio पर सीधा रूट (OpenRouter हॉप नहीं, मार्कअप नहीं)

ताकतें

  • बिजली-जैसी तेज़ inference — सबसे तेज़ frontier-टियर मॉडलों में
  • Pro मूल्य के अंश पर 1M कॉन्टेक्स्ट विंडो
  • टेक्स्ट, इमेज और अधिक के लिए मल्टीमोडल इनपुट
  • प्रोडक्शन वर्कलोड के लिए उत्कृष्ट लागत-से-क्षमता अनुपात

सीमाएं

  • Gemini 3.1 Pro की तुलना में कम तर्क गहराई
  • Preview मॉडल — सामान्य उपलब्धता से पहले बदल सकता है
  • जटिल बहु-चरण एजेंटिक कार्यों पर कम सक्षम

उपयोग के मामले

रीयल-टाइम चैटत्वरित सारांशउच्च-वॉल्यूम प्रसंस्करणलागत-संवेदनशील अनुप्रयोग

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "google/gemini-3-flash-preview", "messages": [{"role": "user", "content": "Quickly summarize these meeting notes"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: google/gemini-3-flash-preview

Gemini 3 Flash Preview अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।