Providers

Inworld

Inworld là nhà cung cấp chuyển văn bản thành giọng nói (TTS) dạng phát trực tuyến. Trong OpenClaw, dịch vụ này tổng hợp âm thanh phản hồi gửi đi (mặc định là MP3, OGG_OPUS cho ghi chú thoại) và âm thanh PCM cho các kênh điện thoại như Cuộc gọi thoại.

OpenClaw gửi yêu cầu đến endpoint TTS phát trực tuyến của Inworld, nối các đoạn âm thanh base64 được trả về thành một bộ đệm duy nhất, rồi chuyển kết quả cho pipeline âm thanh phản hồi tiêu chuẩn.

Thuộc tính Giá trị
ID nhà cung cấp inworld
Plugin được đóng gói sẵn, enabledByDefault: true
Hợp đồng speechProviders (chỉ TTS)
Biến env xác thực INWORLD_API_KEY (HTTP Basic, thông tin xác thực dashboard Base64)
URL cơ sở https://api.inworld.ai
Giọng mặc định Sarah
Mô hình mặc định inworld-tts-1.5-max
Đầu ra MP3 (mặc định), OGG_OPUS (ghi chú thoại), PCM 22050 Hz (điện thoại)
Trang web inworld.ai
Tài liệu docs.inworld.ai/tts/tts

Bắt đầu

  • Thiết lập khóa API của bạn

    Sao chép thông tin xác thực từ dashboard Inworld của bạn (Workspace > API Keys) và đặt nó làm biến env. Giá trị này được gửi nguyên văn dưới dạng thông tin xác thực HTTP Basic, vì vậy đừng mã hóa Base64 lại hoặc chuyển nó thành token bearer.

    INWORLD_API_KEY=<base64-credential-from-dashboard>
    
  • Chọn Inworld trong messages.tts

    {
      messages: {
        tts: {
          auto: "always",
          provider: "inworld",
          providers: {
            inworld: {
              voiceId: "Sarah",
              modelId: "inworld-tts-1.5-max",
            },
          },
        },
      },
    }
    
  • Gửi tin nhắn

    Gửi phản hồi qua bất kỳ kênh nào đã kết nối. OpenClaw tổng hợp âm thanh bằng Inworld và phân phối dưới dạng MP3 (hoặc OGG_OPUS khi kênh yêu cầu ghi chú thoại).

  • Tùy chọn cấu hình

    Tùy chọn Đường dẫn Mô tả
    apiKey messages.tts.providers.inworld.apiKey Thông tin xác thực dashboard Base64. Dùng lại INWORLD_API_KEY nếu không đặt.
    baseUrl messages.tts.providers.inworld.baseUrl Ghi đè URL cơ sở API Inworld (mặc định https://api.inworld.ai).
    voiceId messages.tts.providers.inworld.voiceId Mã định danh giọng nói (mặc định Sarah).
    modelId messages.tts.providers.inworld.modelId ID mô hình TTS (mặc định inworld-tts-1.5-max).
    temperature messages.tts.providers.inworld.temperature Nhiệt độ lấy mẫu 0..2 (tùy chọn).

    Ghi chú

    Xác thực

    Inworld dùng xác thực HTTP Basic với một chuỗi thông tin xác thực duy nhất đã được mã hóa Base64. Sao chép nguyên văn từ dashboard Inworld. Nhà cung cấp gửi chuỗi này dưới dạng Authorization: Basic <apiKey> mà không mã hóa thêm, vì vậy đừng tự mã hóa Base64 và đừng truyền token kiểu bearer. Xem ghi chú xác thực TTS để biết cùng lưu ý này.

    Mô hình

    ID mô hình được hỗ trợ: inworld-tts-1.5-max (mặc định), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.

    Đầu ra âm thanh

    Phản hồi mặc định dùng MP3. Khi đích của kênh là voice-note, OpenClaw yêu cầu Inworld xuất OGG_OPUS để âm thanh phát dưới dạng bong bóng thoại gốc. Tổng hợp cho điện thoại dùng PCM thô ở 22050 Hz để cấp dữ liệu cho cầu nối điện thoại.

    Endpoint tùy chỉnh

    Ghi đè máy chủ API bằng messages.tts.providers.inworld.baseUrl. Dấu gạch chéo ở cuối sẽ bị loại bỏ trước khi gửi yêu cầu.

    Liên quan