How much does Bulbul v3 cost?

Bulbul v3 costs $0.53/10K chars on CallMissed. 1 credit = ₹1 = $0.01 USD.

How do I use Bulbul v3 via API?

Send a POST request to POST /v1/audio/speech with model "bulbul:v3" and your API key. CallMissed uses the OpenAI-compatible format — just change the base URL and model field.

What is the context window of Bulbul v3?

Bulbul v3 supports a N/A token context window with up to N/A output tokens.

सभी मॉडल पर वापस जाएं

टेक्स्ट टू स्पीचindian-languages

Bulbul v3

द्वारा Sarvam AI · रिलीज़ February 5, 2026

Sarvam AI's natural text-to-speech model. 37 voices across 11 Indian languages with production-ready quality. Supports SSML for fine-grained control over speed, pitch, pauses, and emphasis. Handles code-mixed text and number normalization out of the box.

टेक्स्ट टू स्पीच

Bulbul v3

द्वारा संचालित Sarvam AI · Proprietary TTS model

कॉन्टेक्स्ट विंडो

N/A

पैरामीटर

Undisclosed

अधिकतम आउटपुट

N/A

श्रेणी

टेक्स्ट टू स्पीच

अवलोकन

Bulbul v3, released February 5, 2026, is Sarvam AI's production-ready text-to-speech model offering 37 natural-sounding voices across 11 Indian languages. The voices are designed to sound natural and conversational rather than robotic, making them suitable for customer-facing applications like IVR systems, voice agents, and telephony platforms.

The model supports SSML (Speech Synthesis Markup Language) for fine-grained control over prosody — developers can adjust speed, pitch, volume, add pauses, and emphasize specific words. It handles code-mixed text natively, correctly pronouncing Hindi-English mixed sentences without requiring language tags. Number normalization, date formatting, and currency reading are handled automatically.

Bulbul v3 is production-ready for telephony and call center deployments, with consistent quality across all 37 voices and 11 languages. The voices cover a range of genders, ages, and regional accents, allowing applications to match the voice to their target audience. At $0.53 per 10K characters, it is competitively priced for high-volume TTS workloads.

प्राइसिंग

मेट्रिक	कीमत
कीमत /10K chars	₹53.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

37 natural voices across 11 Indian languages
प्रोसोडी, विराम, ज़ोर के लिए SSML सपोर्ट
कोड-मिक्स्ड टेक्स्ट हैंडलिंग (Hinglish आदि)
कॉल सेंटर और टेलीफ़ोनी के लिए प्रोडक्शन-रेडी

बेंचमार्क

बेंचमार्क	स्कोर	नोट्स
MOS Score	4.2/5	प्राकृतिकता के लिए Mean Opinion Score
Voices	37	11 भारतीय भाषाओं में
Languages	11	प्रमुख भारतीय भाषाएँ
SSML Support	Full	प्रोसोडी, विराम, ज़ोर, फ़ोनेम

तकनीकी विवरण

11 भारतीय भाषाओं में 39 प्राकृतिक-सुनाई आवाज़ें
SSML सपोर्ट: गति, पिच, वॉल्यूम, विराम, ज़ोर, फ़ोनेम
मूल कोड-मिक्स्ड टेक्स्ट हैंडलिंग (Hinglish, Tanglish आदि)
स्वचालित संख्या सामान्यीकरण, तारीख फ़ॉर्मेटिंग, मुद्रा पढ़ना
टेलीफ़ोनी और कॉल सेंटर डिप्लॉयमेंट के लिए प्रोडक्शन-रेडी
सभी आवाज़ों और भाषाओं में सुसंगत गुणवत्ता

ताकतें

37 natural voices — widest selection for Indian languages
बारीक प्रोसोडी नियंत्रण के लिए पूर्ण SSML सपोर्ट
भाषा टैग के बिना मूल कोड-मिक्स्ड टेक्स्ट हैंडलिंग
टेलीफ़ोनी और कॉल सेंटर के लिए प्रोडक्शन-रेडी गुणवत्ता

सीमाएं

केवल 11 भारतीय भाषाएँ — वैश्विक भाषा कवरेज नहीं
वॉयस क्लोनिंग और कस्टम आवाज़ निर्माण अभी सपोर्टेड नहीं
बहुत लंबे टेक्स्ट इनपुट पर ऑडियो गुणवत्ता भिन्न हो सकती है

उपयोग के मामले

वॉयस एजेंटIVR सिस्टमऑडियोबुक जनरेशनएक्सेसिबिलिटी ऐप्लिकेशन

API उदाहरण

curl https://api.callmissed.com/v1/audio/speech \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "bulbul:v3", "input": "Namaste, aapka order confirm ho gaya hai.", "voice": "meera"}' \
  --output speech.mp3

एंडपॉइंट: POST /v1/audio/speech · मॉडल ID: bulbul:v3

Bulbul v3 अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।

फ्री शुरू करें डॉक्स पढ़ें