टेक्स्ट टू स्पीचbudgetopen-source

MeloTTS

द्वारा MyShell AI · रिलीज़ 2024

MyShell AI का हल्का ओपन-सोर्स TTS। अंग्रेज़ी + फ़्रेंच। छोटे वाक्य और उच्च थ्रूपुट नोटिफ़िकेशन / ट्रांज़ैक्शनल स्पीच के लिए सर्वोत्तम।

टेक्स्ट टू स्पीच

MeloTTS

द्वारा संचालित MyShell AI · Open-source multilingual TTS

कॉन्टेक्स्ट विंडो

N/A

पैरामीटर

Open-source (~6M params per language)

अधिकतम आउटपुट

N/A

श्रेणी

टेक्स्ट टू स्पीच

अवलोकन

MeloTTS MyShell AI का ओपन-सोर्स बहुभाषी TTS मॉडल है, छोटे वाक्यों की तेज़ जनरेशन के लिए अनुकूलित। अंग्रेज़ी और फ़्रेंच — नोटिफ़िकेशन ऑडियो, ट्रांज़ैक्शनल कन्फ़र्मेशन, हल्के वॉयस प्रॉम्प्ट जैसे उच्च-थ्रूपुट छोटे-टेक्स्ट केस के लिए उपयुक्त।

Cloudflare Workers AI पर — एक रिस्पॉन्स में base64-एन्कोडेड MP3। छोटे इनपुट (<5 सेकंड) पर बहुत कम विलंबता; प्लेटफ़ॉर्म पर सबसे सस्ता TTS।

$0.05 प्रति 10K अक्षर — Aura 2 से लगभग 8× और Bulbul से 10× सस्ता। जब लागत आवाज़ विविधता या प्रोसोडी से ज़्यादा मायने रखे (स्केल पर छोटे नोटिफ़िकेशन क्लिप) MeloTTS चुनें।

प्राइसिंग

मेट्रिककीमत
कीमत /10K chars₹5.0000

1 क्रेडिट = ₹1 = $0.01 USD। कीमतें प्रोवाइडर से दिखाई गई हैं; CallMissed ~35% मार्कअप के साथ पास-थ्रू करता है।

मुख्य बातें

  • प्लेटफ़ॉर्म पर सबसे सस्ता TTS
  • अंग्रेज़ी + फ़्रेंच सपोर्ट
  • छोटे वाक्यों के लिए अनुकूलित
  • ओपन-सोर्स वेट (MIT-लाइसेंस)

बेंचमार्क

बेंचमार्कस्कोर
Languages2
Cost$0.05
Best for<5s

तकनीकी विवरण

  • Cloudflare Workers AI (`@cf/myshell-ai/melotts`) पर चलता है
  • JSON रिस्पॉन्स में base64-एन्कोडेड MP3
  • Body: {"prompt": "<text>", "lang": "en"|"fr"}
  • छोटे वाक्यों के लिए सर्वोत्तम; लंबे इनपुट पर गुणवत्ता घट सकती है

ताकतें

  • उपलब्ध सबसे सस्ता TTS
  • छोटे वाक्यों की तेज़ जनरेशन
  • ओपन-सोर्स — स्पष्ट, वेंडर लॉक-इन नहीं

सीमाएं

  • केवल अंग्रेज़ी + फ़्रेंच
  • आवाज़ विविधता नहीं — प्रति भाषा एक आवाज़
  • लंबे इनपुट (>30s) पर गुणवत्ता घटती है
  • प्रोसोडी / SSML नियंत्रण नहीं

उपयोग के मामले

नोटिफ़िकेशन ऑडियोट्रांज़ैक्शनल कन्फ़र्मेशनहल्के वॉयस प्रॉम्प्टउच्च-वॉल्यूम छोटे-टेक्स्ट TTS

API उदाहरण

curl https://api.callmissed.com/v1/audio/speech \
  -H "Authorization: Bearer cm_YOUR_KEY" \
  -d '{"model": "melotts", "input": "Your order has been shipped.", "language": "en"}' \
  --output speech.mp3

एंडपॉइंट: POST /v1/audio/speech · मॉडल ID: melotts

MeloTTS अभी आज़माएं

साइनअप पर 1000 फ्री API क्रेडिट पाएं। कोई क्रेडिट कार्ड ज़रूरी नहीं।