LLM चैटfastaffordable

GPT-5.4 Nano

द्वारा OpenAI · रिलीज़ March 2026

GPT-5.4 family का सबसे छोटा और सबसे affordable मॉडल। Ultra-high-volume, latency-sensitive workloads के लिए। सबसे कम per-token cost के साथ 1M context window retain।

LLM चैट

GPT-5.4 Nano

द्वारा संचालित OpenAI · Transformer (proprietary, distilled)

कॉन्टेक्स्ट विंडो

1M

पैरामीटर

Undisclosed

अधिकतम आउटपुट

16K

श्रेणी

LLM चैट

अवलोकन

GPT-5.4 Nano GPT-5.4 family का सबसे छोटा और cost-effective मॉडल है, ultra-high-volume, latency-sensitive workloads के लिए जहाँ हर millisecond और हर fraction of cent matter करता है। $0.27/M input और $1.70/M output पर, signature 1M token context window retain करते हुए सबसे सस्ता OpenAI model।

छोटे size के बावजूद GPT-5.4 Nano entity extraction, text classification, routing और lightweight conversational AI जैसे tasks पर surprisingly capable performance देता है। Massive scale पर products में embed करने के लिए purpose-built — millions of API calls per day auto-complete, content moderation या intent detection features के लिए।

Complex reasoning और deep analysis capability के लिए trade कर raw speed और cost efficiency — multi-step coding या nuanced research के लिए right choice नहीं, लेकिन fast, reliable, cheap inference चाहने वाले अधिकांश production AI features के लिए OpenAI lineup में optimal pick।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹27.0000
आउटपुट /1M tokens₹170.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • GPT-5.4 family में सबसे कम cost
  • 1M टोकन कॉन्टेक्स्ट विंडो
  • Real-time use के लिए ultra-low latency
  • Scale पर products में embed करने के लिए ideal

बेंचमार्क

बेंचमार्कस्कोर
MMLU-Pro72.4%
HumanEval82.1%
MATH-50080.5%
GPQA Diamond58.7%

तकनीकी विवरण

  • GPT-5.4 family का सबसे छोटा मॉडल — cost और speed के लिए optimized
  • Context window: छोटे model size के बावजूद retained 1,000,000 tokens
  • Real-time applications के लिए ultra-low latency inference
  • Pricing: $0.27/M input, $1.70/M output — सबसे सस्ता OpenAI model
  • Structured outputs, function calling और JSON mode सपोर्ट
  • बड़े GPT-5.4 models से distilled
  • High-volume product features embed करने के लिए ideal

ताकतें

  • $0.27/M input tokens पर GPT-5.4 family का सबसे सस्ता model
  • Ultra-low latency real-time product features के लिए ideal
  • Minimal model size के बावजूद 1M context window retain
  • Classification, extraction और routing जैसे high-volume tasks के लिए excellent

सीमाएं

  • GPT-5.4 और Pro की तुलना में significantly reduced reasoning capability
  • Complex coding, research या multi-step planning tasks के लिए suitable नहीं
  • Proprietary — self-hosting या fine-tuning options नहीं
  • Nuanced या ambiguous prompts पर lower quality outputs हो सकते हैं

उपयोग के मामले

Entity extractionRouting और classificationहल्का चैटEdge deployment

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "openai/gpt-5.4-nano", "messages": [{"role": "user", "content": "Extract the key entities from this text"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: openai/gpt-5.4-nano

GPT-5.4 Nano अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।