GPT-OSS 120B
द्वारा OpenAI · रिलीज़ 2026
OpenAI का open-source 120B पैरामीटर मॉडल। Cloudflare Workers AI पर मजबूत सामान्य-उद्देश्य मॉडल। कोडिंग, तर्क और सामान्य कार्य — प्रतिस्पर्धी कीमत।
GPT-OSS 120B
द्वारा संचालित OpenAI · Transformer (open-source)
कॉन्टेक्स्ट विंडो
128K
पैरामीटर
120B
अधिकतम आउटपुट
16K
श्रेणी
LLM चैट
अवलोकन
GPT-OSS 120B OpenAI का पहला बड़ा open-source मॉडल — रणनीति में महत्वपूर्ण बदलाव। 120B dense Transformer — कोडिंग, तर्क, ज्ञान में मजबूत — सेल्फ-होस्टिंग या vendor lock-in से बचने वाली टीमों के लिए विकल्प।
Cloudflare Workers AI पर — वैश्विक edge, कम विलंबता। 128K कॉन्टेक्स्ट। मानक बेंचमार्क पर समान कीमत के proprietary मॉडलों से प्रतिस्पर्धी। फ़ाइन-ट्यून, क्वांटाइज़, कस्टम इन्फ्रा।
open-source LLM इकोसिस्टम की मजबूत बेसलाइन; NVIDIA Nemotron 3 Super जैसे व्युत्पन्न इस पर। OpenAI प्रशिक्षण पद्धति + सेल्फ-होस्टेबल — तो यही पसंद।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| इनपुट /1M tokens | ₹100.0000 |
| आउटपुट /1M tokens | ₹400.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- open-source 120B पैरामीटर मॉडल
- मजबूत सामान्य-उद्देश्य प्रदर्शन
- Cloudflare Workers AI के ज़रिए उपलब्ध
- क्षमता-स्तर के लिए प्रतिस्पर्धी कीमत
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| MMLU-Pro | 79.8% |
| HumanEval | 87.3% |
| MATH-500 | 86.5% |
| GPQA Diamond | 65.2% |
| SWE-bench Verified | 55.1% |
तकनीकी विवरण
- OpenAI का पहला बड़ा open-source — 120B dense Transformer
- edge डिप्लॉयमेंट के लिए Cloudflare Workers AI
- कॉन्टेक्स्ट विंडो: 128K टोकन
- फ़ाइन-ट्यून और कस्टम डिप्लॉयमेंट की open-source लाइसेंस
- व्युत्पन्न का आधार (जैसे NVIDIA Nemotron 3 Super)
- संरचित आउटपुट और function calling
- छोटे हार्डवेयर पर क्वांटाइज़ डिप्लॉयमेंट
ताकतें
- open-source — सेल्फ-होस्ट, फ़ाइन-ट्यून, कस्टमाइज़
- OpenAI प्रशिक्षण पद्धति से मजबूत सामान्य प्रदर्शन
- वैश्विक edge के लिए Cloudflare Workers AI
- प्रतिस्पर्धी: $1.00/$4.00 प्रति 1M टोकन
सीमाएं
- 120B dense — सेल्फ-होस्ट पर भारी कम्प्यूट
- proprietary GPT-5.4 वेरिएंट से कम बेंचमार्क
- समान गुणवत्ता पर MoE से कम कुशल
- नेटिव मल्टीमोडल नहीं — केवल टेक्स्ट
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/chat/completions \
-H "Authorization: Bearer cm_YOUR_KEY" \
-d '{"model": "gpt-oss-120b", "messages": [{"role": "user", "content": "Explain the difference between REST and GraphQL"}]}'एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: gpt-oss-120b
GPT-OSS 120B अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।