LLM चैट

GPT-OSS 120B

द्वारा OpenAI · रिलीज़ 2026

OpenAI का open-source 120B पैरामीटर मॉडल। Cloudflare Workers AI पर मजबूत सामान्य-उद्देश्य मॉडल। कोडिंग, तर्क और सामान्य कार्य — प्रतिस्पर्धी कीमत।

LLM चैट

GPT-OSS 120B

द्वारा संचालित OpenAI · Transformer (open-source)

कॉन्टेक्स्ट विंडो

128K

पैरामीटर

120B

अधिकतम आउटपुट

16K

श्रेणी

LLM चैट

अवलोकन

GPT-OSS 120B OpenAI का पहला बड़ा open-source मॉडल — रणनीति में महत्वपूर्ण बदलाव। 120B dense Transformer — कोडिंग, तर्क, ज्ञान में मजबूत — सेल्फ-होस्टिंग या vendor lock-in से बचने वाली टीमों के लिए विकल्प।

Cloudflare Workers AI पर — वैश्विक edge, कम विलंबता। 128K कॉन्टेक्स्ट। मानक बेंचमार्क पर समान कीमत के proprietary मॉडलों से प्रतिस्पर्धी। फ़ाइन-ट्यून, क्वांटाइज़, कस्टम इन्फ्रा।

open-source LLM इकोसिस्टम की मजबूत बेसलाइन; NVIDIA Nemotron 3 Super जैसे व्युत्पन्न इस पर। OpenAI प्रशिक्षण पद्धति + सेल्फ-होस्टेबल — तो यही पसंद।

प्राइसिंग

मेट्रिककीमत
इनपुट /1M tokens₹100.0000
आउटपुट /1M tokens₹400.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • open-source 120B पैरामीटर मॉडल
  • मजबूत सामान्य-उद्देश्य प्रदर्शन
  • Cloudflare Workers AI के ज़रिए उपलब्ध
  • क्षमता-स्तर के लिए प्रतिस्पर्धी कीमत

बेंचमार्क

बेंचमार्कस्कोर
MMLU-Pro79.8%
HumanEval87.3%
MATH-50086.5%
GPQA Diamond65.2%
SWE-bench Verified55.1%

तकनीकी विवरण

  • OpenAI का पहला बड़ा open-source — 120B dense Transformer
  • edge डिप्लॉयमेंट के लिए Cloudflare Workers AI
  • कॉन्टेक्स्ट विंडो: 128K टोकन
  • फ़ाइन-ट्यून और कस्टम डिप्लॉयमेंट की open-source लाइसेंस
  • व्युत्पन्न का आधार (जैसे NVIDIA Nemotron 3 Super)
  • संरचित आउटपुट और function calling
  • छोटे हार्डवेयर पर क्वांटाइज़ डिप्लॉयमेंट

ताकतें

  • open-source — सेल्फ-होस्ट, फ़ाइन-ट्यून, कस्टमाइज़
  • OpenAI प्रशिक्षण पद्धति से मजबूत सामान्य प्रदर्शन
  • वैश्विक edge के लिए Cloudflare Workers AI
  • प्रतिस्पर्धी: $1.00/$4.00 प्रति 1M टोकन

सीमाएं

  • 120B dense — सेल्फ-होस्ट पर भारी कम्प्यूट
  • proprietary GPT-5.4 वेरिएंट से कम बेंचमार्क
  • समान गुणवत्ता पर MoE से कम कुशल
  • नेटिव मल्टीमोडल नहीं — केवल टेक्स्ट

उपयोग के मामले

सामान्य-उद्देश्य चैटकोड सहायतासामग्री जनरेशनज्ञान Q&A

API उदाहरण

curl https://api.callmissed.com/v1/chat/completions \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "gpt-oss-120b", "messages": [{"role": "user", "content": "Explain the difference between REST and GraphQL"}]}'

एंडपॉइंट: POST /v1/chat/completions · मॉडल ID: gpt-oss-120b

GPT-OSS 120B अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।