AI

VS Code Copilot BYOK — 내 API 키로 원하는 모델 골라 쓰기

Bring Your Own Key 기능으로 OpenRouter, Ollama, Cerebras 등 원하는 모델을 VS Code에서 직접 사용하는 방법을 설명한다.

6 min read
VS CodeCopilotAILLMAPI
VS Code Copilot BYOK — 내 API 키로 원하는 모델 골라 쓰기

VS Code Copilot에서 쓸 수 있는 모델이 갑자기 많아졌다. GPT-4o, Claude, Gemini 정도였던 선택지가 수백 개로 늘어났다. BYOK(Bring Your Own Key) 기능 덕분이다.

BYOK가 뭔가

내 API 키를 가져오면, 그 키가 지원하는 모든 모델을 VS Code에서 쓸 수 있다.

기존 방식은 Microsoft가 중앙에서 지원 가능한 모델 목록을 관리했다. 새 모델이 나와도 Microsoft가 공식 지원을 추가할 때까지 기다려야 했다.

이제 구조가 바뀌었다. Language Model Chat Provider API를 통해 확장 프로그램이 직접 모델을 제공할 수 있다. 확장 하나를 설치하면, 그 확장이 지원하는 모든 모델이 VS Code 채팅에 즉시 추가된다.

[💡 잠깐! 이 용어는?] OpenRouter: 수백 개의 LLM 모델을 단일 API로 접근할 수 있는 서비스. Claude, GPT, Gemini, Llama, Mistral 등을 같은 인터페이스로 쓸 수 있다. 모델별 가격 비교도 지원한다.

현재 지원되는 확장

확장제공하는 모델특징
AI ToolkitAzure AI Foundry, GitHub ModelsAzure 인프라 기반
Cerebras InferenceQwen3 Coder, GPT OSS 120B초고속 처리 (낮은 레이턴시)
Hugging Face ProviderDeepSeek V3.1, GLM 4.5오픈소스 LLM 특화

Cerebras가 흥미롭다. 전용 하드웨어 기반으로 다른 클라우드 대비 레이턴시가 크게 낮다. 코드 자동완성처럼 빠른 응답이 중요한 작업에서 체감 차이가 난다.

설정 방법

명령 팔레트에서 Chat: Manage Language Models를 실행한다.

모델 목록이 뜨면 원하는 제공자를 선택하고 API 키를 입력한다. 이후 채팅 모델 선택기에 새 모델들이 나타난다.

OpenAI 호환 API를 쓰는 경우(로컬 Ollama, 자체 서버 등)에는 별도 설정으로 엔드포인트를 직접 지정할 수 있다.

.vscode/settings.json
{
  "github.copilot.chat.customOAIModels": [
    {
      "id": "my-local-model",
      "endpoint": "http://localhost:11434/v1",
      "modelName": "qwen2.5-coder:7b"
    }
  ]
}

[💡 잠깐! 이 용어는?] Ollama: 로컬 PC에서 LLM을 실행할 수 있는 오픈소스 도구. 인터넷 연결 없이도 AI 코딩 지원이 가능하다. 코드가 외부로 나가지 않아서 보안이 중요한 프로젝트에 유용하다.

어떤 상황에 유용한가

보안 제약이 있는 환경: 코드가 외부 클라우드로 나가면 안 될 때, Ollama 같은 로컬 모델을 연결하면 된다. API 키도 회사 내부에만 존재한다.

특정 작업에 특화된 모델: 코드 생성에는 Qwen3 Coder, 코드 설명에는 GPT-4o, 빠른 자동완성에는 Cerebras 모델 - 작업마다 최적 모델을 직접 선택할 수 있다.

비용 최적화: 간단한 질문은 저렴한 모델로, 복잡한 설계 작업은 고성능 모델로 구분해서 쓸 수 있다. OpenRouter를 쓰면 모델별 비용을 비교하면서 선택할 수 있다.

최신 오픈소스 모델 즉시 사용: DeepSeek, Qwen, Mistral 등 새 오픈소스 모델이 나와도 Microsoft의 공식 지원을 기다릴 필요가 없다. Hugging Face Provider 확장을 통해 거의 바로 쓸 수 있다.

기존 Copilot과 함께 사용

BYOK 모델을 추가해도 기존 Copilot 구독과 함께 사용할 수 있다. 채팅 모델 선택기에서 Copilot 기본 모델과 추가한 외부 모델 사이를 자유롭게 전환한다.

비유하면 회사 제공 업무폰(Copilot 기본 모델)을 쓰면서 개인폰(외부 모델)도 갖고 다니는 것이다. 업무용으로는 회사 폰, 특별한 작업에는 개인 폰을 쓰는 식으로 용도에 따라 선택한다.

모델 유형과금 방식적합한 사용
Copilot 기본 모델Copilot 구독 포함일반 코딩 지원
BYOK 외부 모델해당 API 비용 별도특정 작업 최적화
로컬 Ollama무료 (전력 비용만)보안 민감 코드

마무리

BYOK는 VS Code를 특정 제공자에 종속되지 않는 모델 중립적 IDE로 만드는 변화다.

  • 보안 → 로컬 모델 연결
  • 속도 → Cerebras 같은 저레이턴시 서비스
  • 비용 → 작업 유형에 따라 모델 분리
  • 최신성 → 오픈소스 신모델 즉시 연결

"VS Code에서 그 모델을 지원하나요?"라는 질문의 답이 이제 대부분 "네"가 됐다.


참고: