Providers

Venice AI

Venice AI는 비검열 모델 지원과 익명화 프록시를 통한 주요 독점 모델 접근을 제공하는 개인정보 보호 중심 AI 추론을 제공합니다. 모든 추론은 기본적으로 비공개입니다. 데이터 학습도, 로깅도 없습니다.

OpenClaw에서 Venice를 사용하는 이유

  • 오픈소스 모델을 위한 비공개 추론(로깅 없음).
  • 필요할 때 사용할 수 있는 비검열 모델.
  • 품질이 중요할 때 독점 모델(Opus/GPT/Gemini)에 대한 익명화 접근.
  • OpenAI 호환 /v1 엔드포인트.

개인정보 보호 모드

Venice는 두 가지 개인정보 보호 수준을 제공합니다. 이를 이해하는 것이 모델 선택의 핵심입니다.

모드 설명 모델
비공개 완전히 비공개입니다. 프롬프트/응답은 절대 저장되거나 로깅되지 않습니다. 일시적입니다. Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored 등
익명화 Venice를 통해 프록시되며 메타데이터가 제거됩니다. 기본 제공자(OpenAI, Anthropic, Google, xAI)는 익명화된 요청을 봅니다. Claude, GPT, Gemini, Grok

기능

  • 개인정보 보호 중심: "비공개"(완전 비공개) 및 "익명화"(프록시) 모드 중 선택
  • 비검열 모델: 콘텐츠 제한이 없는 모델에 접근
  • 주요 모델 접근: Venice의 익명화 프록시를 통해 Claude, GPT, Gemini, Grok 사용
  • OpenAI 호환 API: 쉬운 통합을 위한 표준 /v1 엔드포인트
  • 스트리밍: 모든 모델에서 지원
  • 함수 호출: 일부 모델에서 지원(모델 기능 확인)
  • 비전: 비전 기능이 있는 모델에서 지원
  • 엄격한 속도 제한 없음: 극단적인 사용량에는 공정 사용 제한이 적용될 수 있음

시작하기

  • API 키 받기

    1. venice.ai에서 가입합니다
    2. Settings > API Keys > Create new key로 이동합니다
    3. API 키를 복사합니다(형식: vapi_xxxxxxxxxxxx)
  • OpenClaw 구성

    선호하는 설정 방법을 선택합니다.

    대화형(권장)

    openclaw onboard --auth-choice venice-api-key
    

    이렇게 하면 다음을 수행합니다.

    1. API 키를 입력하라는 메시지를 표시합니다(또는 기존 VENICE_API_KEY 사용)
    2. 사용 가능한 모든 Venice 모델을 표시합니다
    3. 기본 모델을 선택할 수 있게 합니다
    4. 제공자를 자동으로 구성합니다

    환경 변수

    export VENICE_API_KEY="vapi_xxxxxxxxxxxx"
    

    비대화형

    openclaw onboard --non-interactive \
      --auth-choice venice-api-key \
      --venice-api-key "vapi_xxxxxxxxxxxx"
    
  • 설정 확인

    openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"
    
  • 모델 선택

    설정 후 OpenClaw는 사용 가능한 모든 Venice 모델을 표시합니다. 필요에 따라 선택하세요.

    • 기본 모델: 강력한 비공개 추론과 비전을 위해 venice/kimi-k2-5.
    • 고성능 옵션: 가장 강력한 익명화 Venice 경로를 위해 venice/claude-opus-4-6.
    • 개인정보 보호: 완전 비공개 추론을 위해 "비공개" 모델을 선택합니다.
    • 기능: Venice의 프록시를 통해 Claude, GPT, Gemini에 접근하려면 "익명화" 모델을 선택합니다.

    언제든지 기본 모델을 변경할 수 있습니다.

    openclaw models set venice/kimi-k2-5
    openclaw models set venice/claude-opus-4-6
    

    사용 가능한 모든 모델을 나열합니다.

    openclaw models list --all --provider venice
    

    openclaw configure를 실행하고 Model/auth를 선택한 다음 Venice AI를 선택할 수도 있습니다.

    DeepSeek V4 재생 동작

    Venice가 venice/deepseek-v4-pro 또는 venice/deepseek-v4-flash 같은 DeepSeek V4 모델을 노출하는 경우, OpenClaw는 프록시가 이를 생략하면 어시스턴트 메시지에 필요한 DeepSeek V4 reasoning_content 재생 자리 표시자를 채웁니다. Venice는 DeepSeek의 네이티브 최상위 thinking 제어를 거부하므로 OpenClaw는 해당 제공자별 재생 수정 사항을 네이티브 DeepSeek 제공자의 thinking 제어와 분리해 유지합니다.

    내장 카탈로그(총 41개)

    비공개 모델(26개) — 완전 비공개, 로깅 없음
    모델 ID 이름 컨텍스트 기능
    kimi-k2-5 Kimi K2.5 256k 기본값, 추론, 비전
    kimi-k2-thinking Kimi K2 Thinking 256k 추론
    llama-3.3-70b Llama 3.3 70B 128k 일반
    llama-3.2-3b Llama 3.2 3B 128k 일반
    hermes-3-llama-3.1-405b Hermes 3 Llama 3.1 405B 128k 일반, 도구 비활성화
    qwen3-235b-a22b-thinking-2507 Qwen3 235B Thinking 128k 추론
    qwen3-235b-a22b-instruct-2507 Qwen3 235B Instruct 128k 일반
    qwen3-coder-480b-a35b-instruct Qwen3 Coder 480B 256k 코딩
    qwen3-coder-480b-a35b-instruct-turbo Qwen3 Coder 480B Turbo 256k 코딩
    qwen3-5-35b-a3b Qwen3.5 35B A3B 256k 추론, 비전
    qwen3-next-80b Qwen3 Next 80B 256k 일반
    qwen3-vl-235b-a22b Qwen3 VL 235B (Vision) 256k 비전
    qwen3-4b Venice Small (Qwen3 4B) 32k 빠름, 추론
    deepseek-v3.2 DeepSeek V3.2 160k 추론, 도구 비활성화
    venice-uncensored Venice Uncensored (Dolphin-Mistral) 32k 비검열, 도구 비활성화
    mistral-31-24b Venice Medium (Mistral) 128k 비전
    google-gemma-3-27b-it Google Gemma 3 27B Instruct 198k 비전
    openai-gpt-oss-120b OpenAI GPT OSS 120B 128k 일반
    nvidia-nemotron-3-nano-30b-a3b NVIDIA Nemotron 3 Nano 30B 128k 일반
    olafangensan-glm-4.7-flash-heretic GLM 4.7 Flash Heretic 128k 추론
    zai-org-glm-4.6 GLM 4.6 198k 일반
    zai-org-glm-4.7 GLM 4.7 198k 추론
    zai-org-glm-4.7-flash GLM 4.7 Flash 128k 추론
    zai-org-glm-5 GLM 5 198k 추론
    minimax-m21 MiniMax M2.1 198k 추론
    minimax-m25 MiniMax M2.5 198k 추론
    익명화 모델(15개) — Venice 프록시 경유
    모델 ID 이름 컨텍스트 기능
    claude-opus-4-6 Claude Opus 4.6 (Venice 경유) 1M 추론, 비전
    claude-opus-4-5 Claude Opus 4.5 (Venice 경유) 198k 추론, 비전
    claude-sonnet-4-6 Claude Sonnet 4.6 (Venice 경유) 1M 추론, 비전
    claude-sonnet-4-5 Claude Sonnet 4.5 (Venice 경유) 198k 추론, 비전
    openai-gpt-54 GPT-5.4 (Venice 경유) 1M 추론, 비전
    openai-gpt-53-codex GPT-5.3 Codex (Venice 경유) 400k 추론, 비전, 코딩
    openai-gpt-52 GPT-5.2 (Venice 경유) 256k 추론
    openai-gpt-52-codex GPT-5.2 Codex (Venice 경유) 256k 추론, 비전, 코딩
    openai-gpt-4o-2024-11-20 GPT-4o (Venice 경유) 128k 비전
    openai-gpt-4o-mini-2024-07-18 GPT-4o Mini (Venice 경유) 128k 비전
    gemini-3-1-pro-preview Gemini 3.1 Pro (Venice 경유) 1M 추론, 비전
    gemini-3-pro-preview Gemini 3 Pro (Venice 경유) 198k 추론, 비전
    gemini-3-flash-preview Gemini 3 Flash (Venice 경유) 256k 추론, 비전
    grok-41-fast Grok 4.1 Fast (Venice 경유) 1M 추론, 비전
    grok-code-fast-1 Grok Code Fast 1 (Venice 경유) 256k 추론, 코딩

    모델 탐색

    OpenClaw는 읽기 전용 모델 목록을 위해 매니페스트 기반 Venice 시드 카탈로그를 제공합니다. 런타임 새로 고침은 여전히 Venice API에서 모델을 탐색할 수 있으며, API에 연결할 수 없는 경우 매니페스트 카탈로그로 대체됩니다.

    /models 엔드포인트는 공개입니다(목록 조회에는 인증 필요 없음). 하지만 추론에는 유효한 API 키가 필요합니다.

    스트리밍 및 도구 지원

    기능 지원
    스트리밍 모든 모델
    함수 호출 대부분의 모델(API에서 supportsFunctionCalling 확인)
    비전/이미지 "Vision" 기능으로 표시된 모델
    JSON 모드 response_format를 통해 지원

    가격

    Venice는 크레딧 기반 시스템을 사용합니다. 현재 요금은 venice.ai/pricing에서 확인하세요.

    • 비공개 모델: 일반적으로 더 낮은 비용
    • 익명화 모델: 직접 API 가격 + 소액의 Venice 수수료와 유사

    Venice(익명화) vs 직접 API

    측면 Venice(익명화) 직접 API
    개인정보 보호 메타데이터 제거, 익명화 계정이 연결됨
    지연 시간 +10-50ms(프록시) 직접 연결
    기능 대부분의 기능 지원 전체 기능
    청구 Venice 크레딧 제공자 청구

    사용 예시

    # Use the default private model
    openclaw agent --model venice/kimi-k2-5 --message "Quick health check"
    
    # Use Claude Opus via Venice (anonymized)
    openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"
    
    # Use uncensored model
    openclaw agent --model venice/venice-uncensored --message "Draft options"
    
    # Use vision model with image
    openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"
    
    # Use coding model
    openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"
    

    문제 해결

    API 키가 인식되지 않음
    echo $VENICE_API_KEY
    openclaw models list | grep venice
    

    키가 vapi_로 시작하는지 확인하세요.

    모델을 사용할 수 없음

    Venice 모델 카탈로그는 동적으로 업데이트됩니다. 현재 사용 가능한 모델을 보려면 openclaw models list를 실행하세요. 일부 모델은 일시적으로 오프라인일 수 있습니다.

    연결 문제

    Venice API는 https://api.venice.ai/api/v1에 있습니다. 네트워크에서 HTTPS 연결을 허용하는지 확인하세요.

    고급 구성

    구성 파일 예시
    {
      env: { VENICE_API_KEY: "vapi_..." },
      agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
      models: {
        mode: "merge",
        providers: {
          venice: {
            baseUrl: "https://api.venice.ai/api/v1",
            apiKey: "${VENICE_API_KEY}",
            api: "openai-completions",
            models: [
              {
                id: "kimi-k2-5",
                name: "Kimi K2.5",
                reasoning: true,
                input: ["text", "image"],
                cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
                contextWindow: 256000,
                maxTokens: 65536,
              },
            ],
          },
        },
      },
    }
    

    관련 항목