Providers
ElevenLabs
OpenClaw sử dụng ElevenLabs để chuyển văn bản thành giọng nói, chuyển giọng nói thành văn bản theo lô bằng Scribe v2, và STT truyền phát bằng Scribe v2 Realtime.
| Khả năng | Bề mặt OpenClaw | Mặc định |
|---|---|---|
| Chuyển văn bản thành giọng nói | messages.tts / talk |
eleven_multilingual_v2 |
| Chuyển giọng nói thành văn bản theo lô | tools.media.audio |
scribe_v2 |
| Chuyển giọng nói thành văn bản truyền phát | truyền phát Voice Call hoặc Google Meet realtime.transcriptionProvider |
scribe_v2_realtime |
Xác thực
Đặt ELEVENLABS_API_KEY trong môi trường. XI_API_KEY cũng được chấp nhận để
tương thích với công cụ ElevenLabs hiện có.
export ELEVENLABS_API_KEY="..."
Chuyển văn bản thành giọng nói
{
messages: {
tts: {
providers: {
elevenlabs: {
apiKey: "${ELEVENLABS_API_KEY}",
voiceId: "pMsXgVXv3BLzUgSXRplE",
modelId: "eleven_multilingual_v2",
},
},
},
},
}
Đặt modelId thành eleven_v3 để dùng ElevenLabs v3 TTS. OpenClaw giữ
eleven_multilingual_v2 làm mặc định cho các bản cài đặt hiện có.
Các kênh thoại Discord dùng điểm cuối TTS truyền phát của ElevenLabs khi ElevenLabs là
nhà cung cấp voice.tts/messages.tts được chọn. Việc phát bắt đầu từ luồng âm thanh
được trả về thay vì chờ OpenClaw tải xuống và ghi toàn bộ tệp âm thanh trước.
latencyTier ánh xạ tới tham số truy vấn optimize_streaming_latency của ElevenLabs
đối với các mô hình chấp nhận tham số đó; OpenClaw bỏ qua tham số đó cho eleven_v3,
vì mô hình này từ chối tham số đó.
Chuyển giọng nói thành văn bản
Dùng Scribe v2 cho tệp đính kèm âm thanh đầu vào và các đoạn thoại ngắn đã ghi:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "elevenlabs", model: "scribe_v2" }],
},
},
},
}
OpenClaw gửi âm thanh multipart tới ElevenLabs /v1/speech-to-text với
model_id: "scribe_v2". Gợi ý ngôn ngữ ánh xạ tới language_code khi có.
STT truyền phát
Plugin elevenlabs được đóng gói đăng ký Scribe v2 Realtime cho Voice Call và
phiên âm truyền phát ở chế độ tác nhân của Google Meet.
| Thiết lập | Đường dẫn cấu hình | Mặc định |
|---|---|---|
| Khóa API | plugins.entries.voice-call.config.streaming.providers.elevenlabs.apiKey |
Dự phòng về ELEVENLABS_API_KEY / XI_API_KEY |
| Mô hình | ...elevenlabs.modelId |
scribe_v2_realtime |
| Định dạng âm thanh | ...elevenlabs.audioFormat |
ulaw_8000 |
| Tần số lấy mẫu | ...elevenlabs.sampleRate |
8000 |
| Chiến lược commit | ...elevenlabs.commitStrategy |
vad |
| Ngôn ngữ | ...elevenlabs.languageCode |
(chưa đặt) |
{
plugins: {
entries: {
"voice-call": {
config: {
streaming: {
enabled: true,
provider: "elevenlabs",
providers: {
elevenlabs: {
apiKey: "${ELEVENLABS_API_KEY}",
audioFormat: "ulaw_8000",
commitStrategy: "vad",
languageCode: "en",
},
},
},
},
},
},
},
}
Đối với chế độ tác nhân Google Meet, đặt
plugins.entries.google-meet.config.realtime.transcriptionProvider thành
"elevenlabs" và cấu hình cùng khối nhà cung cấp dưới
plugins.entries.google-meet.config.realtime.providers.elevenlabs.