टेक्स्ट टू स्पीचenglishlow-latencyvoice-agents

Aura 2 English

द्वारा Deepgram · रिलीज़ 2025

Deepgram Aura 2 — 39 आवाज़ों के साथ प्राकृतिक, संवादात्मक अंग्रेज़ी TTS। कम-विलंबता वॉइस एजेंट और IVR के लिए। स्ट्रीमिंग MP3 आउटपुट।

टेक्स्ट टू स्पीच

Aura 2 English

द्वारा संचालित Deepgram · Proprietary low-latency neural TTS

कॉन्टेक्स्ट विंडो

N/A

पैरामीटर

Undisclosed

अधिकतम आउटपुट

N/A

श्रेणी

टेक्स्ट टू स्पीच

अवलोकन

Aura 2 Deepgram का दूसरी पीढ़ी का TTS मॉडल है, संवादात्मक वॉइस ऐप के लिए जहाँ विलंबता और प्राकृतिकता समान महत्व। 39 अलग अंग्रेज़ी आवाज़ें — गर्म संवादात्मक (luna, athena, iris), आत्मविश्वासी पेशेवर (apollo, atlas, hera), कथात्मक (orion, hyperion, jupiter)।

Cloudflare Workers AI पर, MP3-एन्कोडेड ऑडियो स्ट्रीमिंग HTTP रिस्पॉन्स — पहले ध्वन्यात्मक तैयार होते ही बोलने वाले वॉइस एजेंट के लिए। Sarvam Bulbul (भारतीय भाषाएँ) और ElevenLabs (क्लोनिंग के साथ अंग्रेज़ी) की तुलना में Aura 2 उत्पादन-गुणवत्ता मध्य और सबसे कम विलंबता।

$0.40 प्रति 10K वर्ण, केवल-अंग्रेज़ी वर्कलोड में Bulbul से लगभग 25% सस्ता, ElevenLabs से काफी सस्ता।

प्राइसिंग

मेट्रिककीमत
कीमत /10K chars₹40.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • 39 प्राकृतिक अंग्रेज़ी आवाज़ें
  • रियल-टाइम वॉइस एजेंट के लिए स्ट्रीमिंग MP3 आउटपुट
  • एन्कोडिंग: mp3, opus, linear16, mulaw, alaw, flac, aac
  • कॉन्फ़िगर करने योग्य सैंपल रेट और बिटरेट

बेंचमार्क

बेंचमार्कस्कोर
Voices39
Latency~200ms
Cost$0.40

तकनीकी विवरण

  • Cloudflare Workers AI पर (`@cf/deepgram/aura-2-en`)
  • MP3 ऑडियो का ReadableStream लौटाता है
  • आवाज़ें: amalthea, andromeda, apollo, arcas, aries, asteria, athena, atlas, aurora, callista, cora, cordelia, delia, draco, electra, harmonia, helena, hera, hermes, hyperion, iris, janus, juno, jupiter, luna (डिफ़ॉल्ट), mars, minerva, neptune, odysseus, ophelia, orion, orpheus, pandora, phoebe, pluto, saturn, thalia, theia, vesta, zeus
  • एन्कोडिंग: mp3 (डिफ़ॉल्ट), opus, linear16, mulaw, alaw, flac, aac

ताकतें

  • 39 आवाज़ें — प्लेटफ़ॉर्म पर सबसे व्यापक अंग्रेज़ी चयन
  • रियल-टाइम वॉइस एजेंट के लिए कम पहला-ऑडियो विलंबता
  • स्ट्रीमिंग आउटपुट, डिफ़ॉल्ट MP3
  • केवल-अंग्रेज़ी में Bulbul से 25% सस्ता

सीमाएं

  • केवल अंग्रेज़ी (स्पेनिश के लिए aura-2-es)
  • वॉइस क्लोनिंग या कस्टम वॉइस ट्रेनिंग नहीं
  • SSML नहीं — Bulbul की तुलना में सीमित प्रोसोडी नियंत्रण

उपयोग के मामले

अंग्रेज़ी वॉइस एजेंटIVR सिस्टमऑडियोबुक जनरेशनएक्सेसिबिलिटी रीडर

API उदाहरण

curl https://api.callmissed.com/v1/audio/speech \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "aura-2-en", "input": "Hello, how can I help you today?", "voice": "luna"}' \
  --output speech.mp3

एंडपॉइंट: POST /v1/audio/speech · मॉडल ID: aura-2-en

Aura 2 English अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।