GPT-5.4 Nano
द्वारा OpenAI · रिलीज़ March 2026
GPT-5.4 family का सबसे छोटा और सबसे affordable मॉडल। Ultra-high-volume, latency-sensitive workloads के लिए। सबसे कम per-token cost के साथ 1M context window retain।
GPT-5.4 Nano
द्वारा संचालित OpenAI · Transformer (proprietary, distilled)
कॉन्टेक्स्ट विंडो
1M
पैरामीटर
Undisclosed
अधिकतम आउटपुट
16K
श्रेणी
LLM चैट
अवलोकन
GPT-5.4 Nano GPT-5.4 family का सबसे छोटा और cost-effective मॉडल है, ultra-high-volume, latency-sensitive workloads के लिए जहाँ हर millisecond और हर fraction of cent matter करता है। $0.27/M input और $1.70/M output पर, signature 1M token context window retain करते हुए सबसे सस्ता OpenAI model।
छोटे size के बावजूद GPT-5.4 Nano entity extraction, text classification, routing और lightweight conversational AI जैसे tasks पर surprisingly capable performance देता है। Massive scale पर products में embed करने के लिए purpose-built — millions of API calls per day auto-complete, content moderation या intent detection features के लिए।
Complex reasoning और deep analysis capability के लिए trade कर raw speed और cost efficiency — multi-step coding या nuanced research के लिए right choice नहीं, लेकिन fast, reliable, cheap inference चाहने वाले अधिकांश production AI features के लिए OpenAI lineup में optimal pick।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| इनपुट /1M tokens | ₹27.0000 |
| आउटपुट /1M tokens | ₹170.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- GPT-5.4 family में सबसे कम cost
- 1M टोकन कॉन्टेक्स्ट विंडो
- Real-time use के लिए ultra-low latency
- Scale पर products में embed करने के लिए ideal
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| MMLU-Pro | 72.4% |
| HumanEval | 82.1% |
| MATH-500 | 80.5% |
| GPQA Diamond | 58.7% |
तकनीकी विवरण
- GPT-5.4 family का सबसे छोटा मॉडल — cost और speed के लिए optimized
- Context window: छोटे model size के बावजूद retained 1,000,000 tokens
- Real-time applications के लिए ultra-low latency inference
- Pricing: $0.27/M input, $1.70/M output — सबसे सस्ता OpenAI model
- Structured outputs, function calling और JSON mode सपोर्ट
- बड़े GPT-5.4 models से distilled
- High-volume product features embed करने के लिए ideal
ताकतें
- $0.27/M input tokens पर GPT-5.4 family का सबसे सस्ता model
- Ultra-low latency real-time product features के लिए ideal
- Minimal model size के बावजूद 1M context window retain
- Classification, extraction और routing जैसे high-volume tasks के लिए excellent
सीमाएं
- GPT-5.4 और Pro की तुलना में significantly reduced reasoning capability
- Complex coding, research या multi-step planning tasks के लिए suitable नहीं
- Proprietary — self-hosting या fine-tuning options नहीं
- Nuanced या ambiguous prompts पर lower quality outputs हो सकते हैं
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/chat/completions \
-H "Authorization: Bearer cm_YOUR_KEY" \
-d '{"model": "openai/gpt-5.4-nano", "messages": [{"role": "user", "content": "Extract the key entities from this text"}]}'एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: openai/gpt-5.4-nano
GPT-5.4 Nano अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।