快速开始

Vydra

内置 Vydra 插件会添加:

  • 通过 vydra/grok-imagine 生成图像
  • 通过 vydra/veo3vydra/kling 生成视频
  • 通过 Vydra 的 ElevenLabs 支持的 TTS 路由合成语音

OpenClaw 对这三项能力使用同一个 VYDRA_API_KEY

属性
提供商 ID vydra
插件 内置,enabledByDefault: true
认证环境变量 VYDRA_API_KEY
新手引导标志 --auth-choice vydra-api-key
直接 CLI 标志 --vydra-api-key <key>
契约 imageGenerationProviders, videoGenerationProviders, speechProviders
基础 URL https://www.vydra.ai/api/v1(使用 www 主机)

设置

  • 运行交互式新手引导

    openclaw onboard --auth-choice vydra-api-key
    

    或者直接设置环境变量:

    export VYDRA_API_KEY="vydra_live_..."
    
  • 选择默认能力

    从以下能力中选择一个或多个(图像、视频或语音),并应用匹配的配置。

  • 能力

    图像生成

    默认图像模型:

    • vydra/grok-imagine

    将它设为默认图像提供商:

    {
      agents: {
        defaults: {
          imageGenerationModel: {
            primary: "vydra/grok-imagine",
          },
        },
      },
    }
    

    当前内置支持仅限文本转图像。Vydra 托管的编辑路由需要远程图像 URL,而 OpenClaw 还没有在内置插件中添加 Vydra 专用的上传桥接。

    视频生成

    已注册的视频模型:

    • vydra/veo3 用于文本转视频
    • vydra/kling 用于图像转视频

    将 Vydra 设为默认视频提供商:

    {
      agents: {
        defaults: {
          videoGenerationModel: {
            primary: "vydra/veo3",
          },
        },
      },
    }
    

    备注:

    • vydra/veo3 内置为仅支持文本转视频。
    • vydra/kling 目前需要远程图像 URL 引用。本地文件上传会在一开始就被拒绝。
    • Vydra 当前的 kling HTTP 路由在要求 image_url 还是 video_url 上一直不一致;内置提供商会将同一个远程图像 URL 映射到两个字段。
    • 内置插件保持保守,不会转发文档未说明的样式控制项,例如宽高比、分辨率、水印或生成音频。
    视频真实环境测试

    提供商专属真实环境覆盖范围:

    OPENCLAW_LIVE_TEST=1 \
    OPENCLAW_LIVE_VYDRA_VIDEO=1 \
    pnpm test:live -- extensions/vydra/vydra.live.test.ts
    

    内置的 Vydra 真实环境测试文件现在覆盖:

    • vydra/veo3 文本转视频
    • vydra/kling 使用远程图像 URL 进行图像转视频

    需要时覆盖远程图像测试夹具:

    export OPENCLAW_LIVE_VYDRA_KLING_IMAGE_URL="https://example.com/reference.png"
    
    语音合成

    将 Vydra 设为语音提供商:

    {
      messages: {
        tts: {
          provider: "vydra",
          providers: {
            vydra: {
              apiKey: "${VYDRA_API_KEY}",
              voiceId: "21m00Tcm4TlvDq8ikWAM",
            },
          },
        },
      },
    }
    

    默认值:

    • 模型:elevenlabs/tts
    • 声音 ID:21m00Tcm4TlvDq8ikWAM

    内置插件目前公开一个已知可用的默认声音,并返回 MP3 音频文件。

    相关内容