Aura 2 English
द्वारा Deepgram · रिलीज़ 2025
Deepgram Aura 2 — 39 आवाज़ों के साथ प्राकृतिक, संवादात्मक अंग्रेज़ी TTS। कम-विलंबता वॉइस एजेंट और IVR के लिए। स्ट्रीमिंग MP3 आउटपुट।
Aura 2 English
द्वारा संचालित Deepgram · Proprietary low-latency neural TTS
कॉन्टेक्स्ट विंडो
N/A
पैरामीटर
Undisclosed
अधिकतम आउटपुट
N/A
श्रेणी
टेक्स्ट टू स्पीच
अवलोकन
Aura 2 Deepgram का दूसरी पीढ़ी का TTS मॉडल है, संवादात्मक वॉइस ऐप के लिए जहाँ विलंबता और प्राकृतिकता समान महत्व। 39 अलग अंग्रेज़ी आवाज़ें — गर्म संवादात्मक (luna, athena, iris), आत्मविश्वासी पेशेवर (apollo, atlas, hera), कथात्मक (orion, hyperion, jupiter)।
Cloudflare Workers AI पर, MP3-एन्कोडेड ऑडियो स्ट्रीमिंग HTTP रिस्पॉन्स — पहले ध्वन्यात्मक तैयार होते ही बोलने वाले वॉइस एजेंट के लिए। Sarvam Bulbul (भारतीय भाषाएँ) और ElevenLabs (क्लोनिंग के साथ अंग्रेज़ी) की तुलना में Aura 2 उत्पादन-गुणवत्ता मध्य और सबसे कम विलंबता।
$0.40 प्रति 10K वर्ण, केवल-अंग्रेज़ी वर्कलोड में Bulbul से लगभग 25% सस्ता, ElevenLabs से काफी सस्ता।
प्राइसिंग
| मेट्रिक | कीमत |
|---|---|
| कीमत /10K chars | ₹40.0000 |
1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।
मुख्य बातें
- 39 प्राकृतिक अंग्रेज़ी आवाज़ें
- रियल-टाइम वॉइस एजेंट के लिए स्ट्रीमिंग MP3 आउटपुट
- एन्कोडिंग: mp3, opus, linear16, mulaw, alaw, flac, aac
- कॉन्फ़िगर करने योग्य सैंपल रेट और बिटरेट
बेंचमार्क
| बेंचमार्क | स्कोर |
|---|---|
| Voices | 39 |
| Latency | ~200ms |
| Cost | $0.40 |
तकनीकी विवरण
- Cloudflare Workers AI पर (`@cf/deepgram/aura-2-en`)
- MP3 ऑडियो का ReadableStream लौटाता है
- आवाज़ें: amalthea, andromeda, apollo, arcas, aries, asteria, athena, atlas, aurora, callista, cora, cordelia, delia, draco, electra, harmonia, helena, hera, hermes, hyperion, iris, janus, juno, jupiter, luna (डिफ़ॉल्ट), mars, minerva, neptune, odysseus, ophelia, orion, orpheus, pandora, phoebe, pluto, saturn, thalia, theia, vesta, zeus
- एन्कोडिंग: mp3 (डिफ़ॉल्ट), opus, linear16, mulaw, alaw, flac, aac
ताकतें
- 39 आवाज़ें — प्लेटफ़ॉर्म पर सबसे व्यापक अंग्रेज़ी चयन
- रियल-टाइम वॉइस एजेंट के लिए कम पहला-ऑडियो विलंबता
- स्ट्रीमिंग आउटपुट, डिफ़ॉल्ट MP3
- केवल-अंग्रेज़ी में Bulbul से 25% सस्ता
सीमाएं
- केवल अंग्रेज़ी (स्पेनिश के लिए aura-2-es)
- वॉइस क्लोनिंग या कस्टम वॉइस ट्रेनिंग नहीं
- SSML नहीं — Bulbul की तुलना में सीमित प्रोसोडी नियंत्रण
उपयोग के मामले
API उदाहरण
curl https://api.callmissed.com/v1/audio/speech \
-H "Authorization: Bearer cm_YOUR_KEY" \
-d '{"model": "aura-2-en", "input": "Hello, how can I help you today?", "voice": "luna"}' \
--output speech.mp3एंडपॉइंट: POST /v1/audio/speech · मॉडल ID: aura-2-en
Aura 2 English अभी आज़माएं
साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।