코드를 치는 손에서 지시를 내리는 입으로 — Spotify가 AI 개발을 증명한 방법

10 min read
SpotifyAIClaude-CodeHonkdeveloper-productivity
코드를 치는 손에서 지시를 내리는 입으로 — Spotify가 AI 개발을 증명한 방법

출근길 지하철에서 Slack을 열고 "iOS 앱의 재생 목록 버그 수정해줘"라고 입력한다. 사무실에 도착하기도 전에 AI가 코드를 수정하고, 테스트를 통과시키고, 새 버전의 앱을 Slack으로 보내준다. 엔지니어는 결과물을 확인하고 프로덕션에 머지한다. 공상이 아니다. 2025년 12월 이후 Spotify의 시니어 엔지니어들이 실제로 일하는 방식이다.


무대 위의 폭탄 선언

2026년 2월 10일, Spotify의 2025 Q4 실적 발표. 공동 CEO이자 CTO인 Gustaf Soderstrom이 투자자들에게 꺼낸 이야기는 업계를 흔들었다. Spotify의 가장 시니어한 엔지니어들이 12월 이후로 직접 코드를 작성하지 않고 있다는 것이다.

코드를 쓰는 대신, AI 시스템에 지시를 내리고 결과물을 검증하는 역할로 전환했다. 단순한 코파일럿 수준의 자동 완성이 아니다. Spotify는 Honk이라는 내부 AI 시스템을 구축했고, 이 시스템이 버그 수정부터 기능 추가, 코드 배포까지 전 과정을 수행한다.

비유하면 이런 전환이다. 기존에는 엔지니어가 직접 벽돌을 쌓는 벽돌공이었다면, 이제는 설계도를 그리고 시공을 감독하는 건축가가 된 것이다. 벽돌을 안 쌓는다고 해서 건축가가 건설을 모르는 것은 아니다. 오히려 벽돌보다 더 큰 그림을 보는 역할이다.

[💡 잠깐! 이 용어는?] Honk: Spotify가 Anthropic의 Claude Code를 기반으로 구축한 내부 AI 코딩 시스템. Slack과 통합되어 있으며, 엔지니어가 자연어 명령으로 코드 변경을 지시할 수 있다.


3년짜리 토대 위에 올린 AI — Honk의 구조

Honk은 하루아침에 뚝딱 만든 것이 아니다. Spotify가 2022년부터 구축해온 Fleet Management라는 인프라 위에 올라가 있다. Fleet Management는 수백~수천 개의 리포지토리에 걸쳐 코드 변경을 적용할 수 있는 프레임워크로, 이미 Spotify 전체 PR의 절반 정도가 이 시스템을 통해 처리되고 있었다.

Honk은 여기에 AI 코딩 능력을 얹은 것이다.

Honk 워크플로우
[엔지니어] → Slack 명령 입력
     │         "iOS 앱 재생 목록 정렬 버그 수정해줘"

[Honk/Claude Code] → 코드베이스 분석
     │                 관련 파일 탐색
     │                 버그 원인 파악
     │                 코드 수정
     │                 테스트 실행

[Slack 알림] → 수정된 앱 빌드 전달
     │           변경 사항 요약

[엔지니어] → 결과 확인 → 프로덕션 머지

택시를 타면서 집 수리를 의뢰하고, 도착했을 때 수리가 끝나있는 것과 같은 구조다. 다만 이 "수리공"은 24시간 일하고, 동시에 수십 개의 작업을 처리하며, 실수율이 낮다.

[💡 잠깐! 이 용어는?] Fleet Management: Spotify가 대규모 코드 변경을 자동화하기 위해 구축한 내부 인프라. 수백 개의 마이크로서비스 리포지토리에 동시에 변경을 적용하고, PR을 생성하고, 리뷰를 요청하는 과정을 자동화한다.


숫자로 읽는 성과

Spotify는 2025년 한 해 동안 스트리밍 앱에 50개 이상의 신규 기능과 업데이트를 출시했다. AI 기반 개발이 본격화된 이후의 대표적 결과물이다.

기능설명AI 기여도
Prompted PlaylistsAI가 자연어 프롬프트로 생성한 플레이리스트높음
Page Match오디오북 페이지 매칭 기능높음
About This Song곡에 대한 배경 정보 표시높음
기타 업데이트버그 수정, UI 개선, 성능 최적화전반적으로 활용

엔지니어는 사라지지 않았다 — 역할이 바뀌었다

Spotify의 사례에서 가장 중요한 지점은 개발자가 사라진 것이 아니라 역할이 이동했다는 것이다.

기존 역할변화된 역할
코드 타이핑AI에 지시 내리기
버그 디버깅AI 결과물 검증
반복적 리팩토링아키텍처 의사결정
보일러플레이트 작성시스템 설계에 집중

시간 배분의 변화를 보면 더 선명하다.

시간 배분 변화
[기존]
코드 작성 60% → 코드 리뷰 15% → 설계/아키텍처 15% → 회의 10%
 
[Honk 도입 후]
AI 지시/검증 30% → 설계/아키텍처 35% → 코드 리뷰 20% → 회의 15%

창업자 Daniel Ek는 "우리 최고의 엔지니어들이 마침내 그들의 진짜 가치에 집중할 수 있게 되었다"고 표현했다. 문법을 아는 것보다 무엇을 만들어야 하는지 아는 것이 더 중요한 시대가 온 것이다.


IDE 없이 개발하기 — Slack이 곧 개발 환경

Honk의 가장 파격적인 지점은 IDE가 필요 없다는 것이다. Slack이 곧 개발 환경이 된다.

Slack 기반 개발 흐름 예시
엔지니어:  @honk iOS 앱에서 오프라인 재생 시 목록 순서가
           뒤바뀌는 버그 수정해줘. #playlist-offline-bug
 
Honk:     분석 중... PlaylistOfflineSync.swift에서
          정렬 기준이 lastPlayed 대신 addedAt로
          설정되어 있는 것을 발견했다.
          수정 PR을 생성하고 테스트를 실행한다.
 
Honk:     PR #4521 생성 완료. 모든 테스트 통과.
          TestFlight 빌드를 전송한다.
          [앱 다운로드 링크]
 
엔지니어:  확인 완료. 머지한다.

이 모든 과정이 출근길 핸드폰 Slack 앱에서 일어난다.

[💡 잠깐! 이 용어는?] Claude Code: Anthropic이 개발한 AI 코딩 에이전트. 코드베이스를 이해하고, 파일을 탐색하고, 코드를 수정하고, 터미널 명령을 실행할 수 있다. Spotify의 Honk은 이 Claude Code를 핵심 엔진으로 사용한다.


장밋빛만은 아니다 — 우려와 한계

기술 부채의 그림자. AI가 빠르게 만들어낸 코드가 나중에 유지보수 비용으로 돌아올 수 있다. 속도와 품질 사이의 긴장은 여전히 존재한다.

일자리 불안의 오독. "최고 개발자가 코드를 안 쓴다"는 표현이 "개발자가 필요 없다"로 오해되기 쉽다. 실제로는 역할이 바뀐 것이다. 다만 주니어 레벨의 반복적인 코딩 작업이 줄어드는 것은 부정하기 어렵다.

비결정성의 부담. AI의 출력은 본질적으로 비결정적이다. 같은 지시를 내려도 다른 결과가 나올 수 있고, 이는 코드 리뷰의 부담을 높인다.

보안 경계. 코드베이스 전체에 AI 접근 권한을 주는 것은 보안 관점에서 신중해야 한다.


마무리

Spotify의 사례는 AI 코딩 도구가 "보조 도구"에서 "핵심 개발 인프라"로 진화하고 있음을 보여준다. 중요한 것은 AI가 코드를 대신 써주는 것 자체가 아니라, 개발자의 시간을 더 가치 있는 곳에 쓸 수 있게 만든다는 점이다.

다만 이런 전환이 모든 조직에서 가능한 것은 아니다. Spotify가 가능했던 이유는 Fleet Management 같은 자동화 인프라를 3년간 미리 구축해왔기 때문이다. AI 도구를 도입하기 전에 먼저 물어봐야 할 질문은 "어떤 AI를 쓸 것인가"가 아니라 **"우리 코드베이스와 배포 파이프라인이 자동화에 준비되어 있는가"**다.


참고:

관심 있을 만한 포스트

VS Code 팀의 AI 에이전트 병렬화 — 월간 릴리스를 주간으로 만든 워크플로우

VS Code 팀이 월간 릴리스에서 주간 릴리스로 전환한 비결. 에이전트 세션 병렬화, 자동화 파이프라인, 품질 게이트 설계 전반을 공개했다.

VS CodeAI

회의론자의 전향 — Steve Yegge가 그리는 AI 에이전트 시대의 생존 지도

실리콘밸리 베테랑 Steve Yegge가 말하는 AI 에이전트 시대의 핵심 주장과 엔지니어에게 주는 시사점을 정리한다.

AI에이전트

Long-Distance NES — VS Code Copilot이 커서 너머까지 코드를 고치는 방법

VS Code Copilot의 Next Edit Suggestions가 파일 전체로 확장되면서, 멀리 떨어진 코드도 자동으로 제안하는 기술적 배경을 분석한다.

VS CodeCopilot

Cursor Cloud Agents — 퇴근해도 코드를 짜는 AI 개발자가 등장했다

Cursor가 발표한 Cloud Agents는 독립 VM에서 코드 작성, 브라우저 테스트, PR 제출까지 자율적으로 수행하는 AI 에이전트다.

CursorCloud Agents

Claude Code 원격 제어 — 커피 마시면서 코딩시키는 시대가 열렸다

Claude Code의 Remote Control 기능으로 스마트폰에서 로컬 코딩 세션을 제어할 수 있게 되었다.

Claude CodeRemote Control

새벽 3시의 탐조등 — Google SRE가 Gemini CLI로 장애를 잡는 법

Google Cloud SRE 팀이 Gemini CLI를 장애 대응 워크플로우에 통합한 방법, 효과, 한계를 분석한다.

SREGoogle

Claude Code 에이전트 팀 — 여러 AI가 협업하는 새로운 방식

Claude Code의 에이전트 팀을 정리했다. 설정법, 사용 사례, 10만 줄 C 컴파일러 구축 실전 사례, 훅을 활용한 품질 관리, 토큰 비용 분석까지 다룬다.

Claude CodeAI

JiTTesting — AI가 코드를 쓰는 시대, 테스트는 누가 하나

Meta가 제안한 Just-in-Time Testing은 에이전트가 생성한 코드를 LLM이 그때그때 테스트하는 새로운 패러다임이다.

테스팅AI