코드를 치는 손에서 지시를 내리는 입으로 — Spotify가 AI 개발을 증명한 방법

출근길 지하철에서 Slack을 열고 "iOS 앱의 재생 목록 버그 수정해줘"라고 입력한다. 사무실에 도착하기도 전에 AI가 코드를 수정하고, 테스트를 통과시키고, 새 버전의 앱을 Slack으로 보내준다. 엔지니어는 결과물을 확인하고 프로덕션에 머지한다. 공상이 아니다. 2025년 12월 이후 Spotify의 시니어 엔지니어들이 실제로 일하는 방식이다.

무대 위의 폭탄 선언

2026년 2월 10일, Spotify의 2025 Q4 실적 발표. 공동 CEO이자 CTO인 Gustaf Soderstrom이 투자자들에게 꺼낸 이야기는 업계를 흔들었다. Spotify의 가장 시니어한 엔지니어들이 12월 이후로 직접 코드를 작성하지 않고 있다는 것이다.

코드를 쓰는 대신, AI 시스템에 지시를 내리고 결과물을 검증하는 역할로 전환했다. 단순한 코파일럿 수준의 자동 완성이 아니다. Spotify는 Honk이라는 내부 AI 시스템을 구축했고, 이 시스템이 버그 수정부터 기능 추가, 코드 배포까지 전 과정을 수행한다.

비유하면 이런 전환이다. 기존에는 엔지니어가 직접 벽돌을 쌓는 벽돌공이었다면, 이제는 설계도를 그리고 시공을 감독하는 건축가가 된 것이다. 벽돌을 안 쌓는다고 해서 건축가가 건설을 모르는 것은 아니다. 오히려 벽돌보다 더 큰 그림을 보는 역할이다.

[💡 잠깐! 이 용어는?] Honk: Spotify가 Anthropic의 Claude Code를 기반으로 구축한 내부 AI 코딩 시스템. Slack과 통합되어 있으며, 엔지니어가 자연어 명령으로 코드 변경을 지시할 수 있다.

3년짜리 토대 위에 올린 AI — Honk의 구조

Honk은 하루아침에 뚝딱 만든 것이 아니다. Spotify가 2022년부터 구축해온 Fleet Management라는 인프라 위에 올라가 있다. Fleet Management는 수백~수천 개의 리포지토리에 걸쳐 코드 변경을 적용할 수 있는 프레임워크로, 이미 Spotify 전체 PR의 절반 정도가 이 시스템을 통해 처리되고 있었다.

Honk은 여기에 AI 코딩 능력을 얹은 것이다.

Honk 워크플로우

[엔지니어] → Slack 명령 입력
     │         "iOS 앱 재생 목록 정렬 버그 수정해줘"
     ▼
[Honk/Claude Code] → 코드베이스 분석
     │                 관련 파일 탐색
     │                 버그 원인 파악
     │                 코드 수정
     │                 테스트 실행
     ▼
[Slack 알림] → 수정된 앱 빌드 전달
     │           변경 사항 요약
     ▼
[엔지니어] → 결과 확인 → 프로덕션 머지

택시를 타면서 집 수리를 의뢰하고, 도착했을 때 수리가 끝나있는 것과 같은 구조다. 다만 이 "수리공"은 24시간 일하고, 동시에 수십 개의 작업을 처리하며, 실수율이 낮다.

[💡 잠깐! 이 용어는?] Fleet Management: Spotify가 대규모 코드 변경을 자동화하기 위해 구축한 내부 인프라. 수백 개의 마이크로서비스 리포지토리에 동시에 변경을 적용하고, PR을 생성하고, 리뷰를 요청하는 과정을 자동화한다.

숫자로 읽는 성과

Spotify는 2025년 한 해 동안 스트리밍 앱에 50개 이상의 신규 기능과 업데이트를 출시했다. AI 기반 개발이 본격화된 이후의 대표적 결과물이다.

기능	설명	AI 기여도
Prompted Playlists	AI가 자연어 프롬프트로 생성한 플레이리스트	높음
Page Match	오디오북 페이지 매칭 기능	높음
About This Song	곡에 대한 배경 정보 표시	높음
기타 업데이트	버그 수정, UI 개선, 성능 최적화	전반적으로 활용

엔지니어는 사라지지 않았다 — 역할이 바뀌었다

Spotify의 사례에서 가장 중요한 지점은 개발자가 사라진 것이 아니라 역할이 이동했다는 것이다.

기존 역할	변화된 역할
코드 타이핑	AI에 지시 내리기
버그 디버깅	AI 결과물 검증
반복적 리팩토링	아키텍처 의사결정
보일러플레이트 작성	시스템 설계에 집중

시간 배분의 변화를 보면 더 선명하다.

시간 배분 변화

[기존]
코드 작성 60% → 코드 리뷰 15% → 설계/아키텍처 15% → 회의 10%
 
[Honk 도입 후]
AI 지시/검증 30% → 설계/아키텍처 35% → 코드 리뷰 20% → 회의 15%

창업자 Daniel Ek는 "우리 최고의 엔지니어들이 마침내 그들의 진짜 가치에 집중할 수 있게 되었다"고 표현했다. 문법을 아는 것보다 무엇을 만들어야 하는지 아는 것이 더 중요한 시대가 온 것이다.

IDE 없이 개발하기 — Slack이 곧 개발 환경

Honk의 가장 파격적인 지점은 IDE가 필요 없다는 것이다. Slack이 곧 개발 환경이 된다.

Slack 기반 개발 흐름 예시

엔지니어:  @honk iOS 앱에서 오프라인 재생 시 목록 순서가
           뒤바뀌는 버그 수정해줘. #playlist-offline-bug
 
Honk:     분석 중... PlaylistOfflineSync.swift에서
          정렬 기준이 lastPlayed 대신 addedAt로
          설정되어 있는 것을 발견했다.
          수정 PR을 생성하고 테스트를 실행한다.
 
Honk:     PR #4521 생성 완료. 모든 테스트 통과.
          TestFlight 빌드를 전송한다.
          [앱 다운로드 링크]
 
엔지니어:  확인 완료. 머지한다.

이 모든 과정이 출근길 핸드폰 Slack 앱에서 일어난다.

[💡 잠깐! 이 용어는?] Claude Code: Anthropic이 개발한 AI 코딩 에이전트. 코드베이스를 이해하고, 파일을 탐색하고, 코드를 수정하고, 터미널 명령을 실행할 수 있다. Spotify의 Honk은 이 Claude Code를 핵심 엔진으로 사용한다.

장밋빛만은 아니다 — 우려와 한계

기술 부채의 그림자. AI가 빠르게 만들어낸 코드가 나중에 유지보수 비용으로 돌아올 수 있다. 속도와 품질 사이의 긴장은 여전히 존재한다.

일자리 불안의 오독. "최고 개발자가 코드를 안 쓴다"는 표현이 "개발자가 필요 없다"로 오해되기 쉽다. 실제로는 역할이 바뀐 것이다. 다만 주니어 레벨의 반복적인 코딩 작업이 줄어드는 것은 부정하기 어렵다.

비결정성의 부담. AI의 출력은 본질적으로 비결정적이다. 같은 지시를 내려도 다른 결과가 나올 수 있고, 이는 코드 리뷰의 부담을 높인다.

보안 경계. 코드베이스 전체에 AI 접근 권한을 주는 것은 보안 관점에서 신중해야 한다.

마무리

Spotify의 사례는 AI 코딩 도구가 "보조 도구"에서 "핵심 개발 인프라"로 진화하고 있음을 보여준다. 중요한 것은 AI가 코드를 대신 써주는 것 자체가 아니라, 개발자의 시간을 더 가치 있는 곳에 쓸 수 있게 만든다는 점이다.

다만 이런 전환이 모든 조직에서 가능한 것은 아니다. Spotify가 가능했던 이유는 Fleet Management 같은 자동화 인프라를 3년간 미리 구축해왔기 때문이다. AI 도구를 도입하기 전에 먼저 물어봐야 할 질문은 "어떤 AI를 쓸 것인가"가 아니라 **"우리 코드베이스와 배포 파이프라인이 자동화에 준비되어 있는가"**다.

참고:

코드를 치는 손에서 지시를 내리는 입으로 — Spotify가 AI 개발을 증명한 방법

무대 위의 폭탄 선언

3년짜리 토대 위에 올린 AI — Honk의 구조

숫자로 읽는 성과

엔지니어는 사라지지 않았다 — 역할이 바뀌었다

IDE 없이 개발하기 — Slack이 곧 개발 환경

장밋빛만은 아니다 — 우려와 한계

마무리

같은 카테고리 · AI

AI는 아키텍트가 아니다 — 에이전트에게 설계를 맡기면 생기는 일

AWS MCP Server GA — AI 에이전트에게 AWS를 안전하게 여는 표준 인터페이스

Claw Patrol — 에이전트에게 프로덕션 접근을 허용하는 방법

코딩 에이전트 시대의 의사결정 피로 — 코드는 쉬워졌는데 왜 더 지치는가

태그가 겹치는 글

Constraint Decay — LLM 에이전트가 구조적 제약 앞에서 무너지는 이유

AGENTS.md — AI 에이전트를 위한 npm 패키지 문서화 전략

Lighthouse 13.3 Agentic Browsing — AI 에이전트가 내 웹사이트를 잘 탐색할 수 있나

LLM 위임의 함정 — 문서 편집을 맡기면 25%가 훼손된다