Providers
Inworld
Inworld یک ارائهدهنده پخش جریانی متن به گفتار (TTS) است. در OpenClaw، صدای پاسخ خروجی را میسازد (بهصورت پیشفرض MP3، و برای یادداشتهای صوتی OGG_OPUS) و برای کانالهای تلفنی مانند تماس صوتی، صدای PCM تولید میکند.
OpenClaw درخواست را به نقطه پایانی TTS جریانی Inworld ارسال میکند، قطعههای صوتی base64 برگشتی را در یک بافر واحد به هم متصل میکند، و نتیجه را به خط لوله استاندارد صوت پاسخ تحویل میدهد.
| ویژگی | مقدار |
|---|---|
| شناسه ارائهدهنده | inworld |
| Plugin | همراه، enabledByDefault: true |
| قرارداد | speechProviders (فقط TTS) |
| متغیر محیطی احراز هویت | INWORLD_API_KEY (HTTP Basic، اعتبارنامه داشبورد Base64) |
| URL پایه | https://api.inworld.ai |
| صدای پیشفرض | Sarah |
| مدل پیشفرض | inworld-tts-1.5-max |
| خروجی | MP3 (پیشفرض)، OGG_OPUS (یادداشتهای صوتی)، PCM 22050 Hz (تلفن) |
| وبسایت | inworld.ai |
| مستندات | docs.inworld.ai/tts/tts |
شروع به کار
کلید API خود را تنظیم کنید
اعتبارنامه را از داشبورد Inworld خود کپی کنید (Workspace > API Keys) و آن را بهعنوان یک متغیر محیطی تنظیم کنید. مقدار بدون تغییر بهعنوان اعتبارنامه HTTP Basic ارسال میشود، بنابراین دوباره آن را Base64-encode نکنید و آن را به bearer token تبدیل نکنید.
INWORLD_API_KEY=<base64-credential-from-dashboard>
Inworld را در messages.tts انتخاب کنید
{
messages: {
tts: {
auto: "always",
provider: "inworld",
providers: {
inworld: {
voiceId: "Sarah",
modelId: "inworld-tts-1.5-max",
},
},
},
},
}
یک پیام بفرستید
از طریق هر کانال متصل، یک پاسخ بفرستید. OpenClaw صدا را با Inworld میسازد و آن را بهصورت MP3 تحویل میدهد (یا وقتی کانال انتظار یادداشت صوتی دارد، بهصورت OGG_OPUS).
گزینههای پیکربندی
| گزینه | مسیر | توضیح |
|---|---|---|
apiKey |
messages.tts.providers.inworld.apiKey |
اعتبارنامه داشبورد Base64. در صورت نبود، از INWORLD_API_KEY استفاده میکند. |
baseUrl |
messages.tts.providers.inworld.baseUrl |
بازنویسی URL پایه API Inworld (پیشفرض https://api.inworld.ai). |
voiceId |
messages.tts.providers.inworld.voiceId |
شناسه صدا (پیشفرض Sarah). |
modelId |
messages.tts.providers.inworld.modelId |
شناسه مدل TTS (پیشفرض inworld-tts-1.5-max). |
temperature |
messages.tts.providers.inworld.temperature |
دمای نمونهگیری 0..2 (اختیاری). |
یادداشتها
احراز هویت
Inworld از احراز هویت HTTP Basic با یک رشته اعتبارنامه واحد
کدگذاریشده با Base64 استفاده میکند. آن را بدون تغییر از داشبورد
Inworld کپی کنید. ارائهدهنده آن را بدون هیچ کدگذاری بیشتر، بهصورت
Authorization: Basic <apiKey> ارسال میکند، بنابراین خودتان آن را
Base64-encode نکنید و token به سبک bearer ارسال نکنید.
برای همین نکته، یادداشتهای احراز هویت TTS را ببینید.
مدلها
شناسههای مدل پشتیبانیشده: inworld-tts-1.5-max (پیشفرض)،
inworld-tts-1.5-mini، inworld-tts-1-max، inworld-tts-1.
خروجیهای صوتی
پاسخها بهصورت پیشفرض از MP3 استفاده میکنند. وقتی مقصد کانال voice-note
باشد، OpenClaw از Inworld درخواست OGG_OPUS میکند تا صدا بهصورت
حباب صوتی بومی پخش شود. ساخت صدای تلفنی از PCM خام با 22050 Hz
برای تغذیه پل تلفنی استفاده میکند.
نقاط پایانی سفارشی
میزبان API را با messages.tts.providers.inworld.baseUrl بازنویسی کنید.
اسلشهای انتهایی پیش از ارسال درخواستها حذف میشوند.