2025년, Klarna는 자랑스럽게 발표했어요. "AI로 고객 상담사 700명 분량의 업무를 대체했다." 비용은 즉시 줄었고, 주가는 올랐고, 업계는 "이제 CS는 끝났다"고 술렁였죠. 그런데 1년도 안 돼서 Klarna는 조용히 사람 상담사를 다시 채용하기 시작했어요. CEO 세바스찬 시미아트코프스키가 직접 인정했고요 — "비용이 유일한 기준이었다(cost was the dominant metric)."

같은 해, Intercom의 AI 에이전트 Fin은 4천만 건이 넘는 대화를 처리하며 문의의 67%를 사람 개입 없이 자동 해결하고 있었어요. 정확도 96%, 해결 건당 비용 $0.99. 똑같은 LLM 기술, 똑같은 시기. 한쪽은 후퇴했고 한쪽은 자리를 잡았어요. 차이는 기술이 아니었어요.

이 글이 주는 것
Klarna가 놓친 한 가지 성패를 가른 5가지 운영 원칙 "AI 뺑뺑이"를 막는 에스컬레이션 규칙 10%부터 시작하는 도입 5단계 + 도구 비교표

"AI 상담 도입했더니 문의 65%가 자동으로 해결됩니다." 이런 헤드라인을 보면 마음이 급해져요. 그런데 아무도 크게 말하지 않는 숫자가 하나 있어요 — 나머지 35%. 그 35%에서 고객이 이탈하고, 브랜드 신뢰가 무너져요. Forbes에 따르면 2026년 기업의 약 65%가 CS에 AI를 도입했거나 도입 중이에요. 이제 질문은 "할까 말까"가 아니라 "어떻게 하느냐"로 완전히 넘어왔어요. 그리고 Klarna와 Intercom의 차이가 그 답을 말해줘요.

Klarna가 놓친 것: 비용은 결과지, 목표가 아니다

Klarna의 실패를 한 줄로 요약하면 이래요 — 고객 경험 지표를 보지 않고 비용 지표만 봤다. "상담사 몇 명을 줄일 수 있나"가 의사결정의 전부였고, CSAT(고객만족도)나 NPS는 대시보드에 없었어요. 비용은 떨어졌지만, 측정하지 않은 곳에서 만족도가 무너졌고, 그게 매출로 돌아왔을 때는 이미 700명을 내보낸 뒤였죠.

두 번째 실수는 일괄 대체였어요. 점진적 도입 없이 하루아침에 전환했기 때문에, 문제가 터졌을 때 되돌릴 단계가 없었어요. 그리고 세 번째 — 가장 치명적인 — 실수는 에스컬레이션 설계의 부재였어요.

"AI 뺑뺑이" — 2026년 고객 이탈의 새로운 원인

Forbes는 이 현상을 "AI frustration crisis"라고 명명했어요. AI가 고객의 질문을 이해하지 못하면서도 사람에게 넘기지 않고, 같은 응답을 반복하거나 "다시 말씀해 주세요"를 되풀이하는 현상이에요. 한국에서는 이걸 "AI 뺑뺑이"라고 부르죠. 고객이 "사람이랑 연결해달라"고 외쳐도 AI가 계속 응대하는 구조 — 이게 신뢰를 가장 빠르게 파괴하는 경로예요.

여기서 핵심 통찰이 나와요. Klarna가 실패한 이유는 AI가 약해서가 아니라, AI를 "설치하는 소프트웨어"로 다뤘기 때문이에요. 켜고, 끄고, 비용을 계산하는 도구로요.

Intercom이 한 것: AI를 팀원으로 다뤘다

HBR은 성공하는 접근을 한 문장으로 정리해요 — AI 에이전트를 "온보딩하는 팀원"으로 봐라. 사람을 채용할 때 우리는 역할을 정의하고, 권한을 부여하고, 처음엔 쉬운 일부터 맡기고, 성과를 보면서 범위를 넓히잖아요? AI 에이전트도 똑같이 다뤄야 한다는 거예요. 구체적으로는 세 축이에요:

  • 정체성(Identity) — 이 AI가 누구인지 명확히 정의. "우리는 친절하지만 정확한 답변을 우선시하는 CS팀입니다."
  • 권한(Credentials) — 주문 조회는 가능하지만 환불 승인은 사람에게 넘기는 식으로, 할 수 있는 일의 범위를 칼같이 설정.
  • 전문화(Specialization) — 하나의 만능 에이전트 대신 "주문 추적 전담", "기술 지원 전담"처럼 역할별로 나눠야 스케일링이 돼요.

그리고 Intercom Fin이 돋보이는 진짜 이유 — 해결률 67%라는 숫자가 아니라, AI가 모를 때 확실하게 사람에게 넘기는 설계예요. Fin은 자신의 확신도가 낮으면 "이 질문은 전문 상담사가 더 잘 도와드릴 수 있어요"라고 자발적으로 에스컬레이션해요. 고객이 뺑뺑이를 도는 일이 구조적으로 차단되는 거죠. Klarna가 빠뜨린 바로 그 장치예요.

실전에서 AI 에이전트를 운영해 온 Sean Henri는 교훈을 이렇게 압축해요 — "AI에게 더 좋은 컨텍스트를 줄수록, 더 좋은 결과를 얻는다." 문서화가 부실하면 AI도 부실하게 답하고, 지식 베이스가 정확하면 AI도 정확해져요. AI의 품질은 결국 인풋의 품질이라는 얘기죠.

성패를 가른 5가지 원칙

같은 기술인데 결과가 정반대였던 이유를, 두 회사를 나란히 놓으면 5개의 축으로 정리돼요. 왼쪽이 Klarna 패턴, 오른쪽이 Intercom 패턴이라고 보면 돼요.

원칙 실패 패턴 (Klarna형) 성공 패턴 (Intercom형)
도입 목표 "비용 절감이 최우선" "고객 경험 유지하면서 효율화"
에스컬레이션 AI가 끝까지 응대, 사람 연결 어려움 확신 낮으면 즉시 사람에게 연결
역할 정의 하나의 만능 에이전트 유형별 전문 에이전트로 분리
품질 관리 도입 후 방치 주간 답변 리뷰 + 지식 베이스 업데이트
도입 방식 전면 교체 (Big Bang) 10% → 30% → 60% 점진적 확대

표를 보면 다섯 줄 모두 기술이 아니라 운영의 선택이에요. 더 똑똑한 모델을 사서 해결되는 문제가 아니라는 뜻이죠. Sean Henri의 조언이 여기에 딱 들어맞아요 — "작게 시작하라. 하나의 유즈케이스에서 성공한 다음 확장하라." FAQ 응답처럼 실패 위험이 낮은 영역부터 시작해서, 데이터가 쌓이면 주문 관리, 기술 지원 같은 복잡한 영역으로 넓혀가는 거예요.

실전 도입 가이드: 10%부터 시작하는 5단계

이론은 충분해요. 이제 월요일 아침에 바로 시작할 수 있는 순서로 정리할게요.

  1. 자동화 대상 분류하기
    지난 3개월의 CS 문의를 카테고리별로 분류하세요. "주문 어디까지 왔어요?", "비밀번호 재설정", "영업시간 문의" 같은 반복 문의가 전체의 몇 %인지 파악하는 게 첫 번째예요. 보통 40~60%가 반복 문의고, 여기가 AI의 최적 타겟이에요.
  2. 도구 선택하기
    자율 해결을 원하면 Intercom Fin($0.99/건), 상담사 보조가 목표면 Zendesk AI, 고도의 커스터마이징이 필요하면 직접 구축(LLM API + RAG)을 고려하세요. 대부분의 경우 SaaS로 시작하는 게 가장 빠르고 안전해요. (아래 비교표 참고)
  3. 지식 베이스 정비하기
    AI의 답변 품질 = 지식 베이스의 품질이에요. 기존 FAQ, 도움말 문서, 매뉴얼을 최신 상태로 업데이트하세요. 빈틈이 있으면 AI가 그 빈틈만큼 잘못된 답을 하게 돼요.
  4. 에스컬레이션 규칙 설계하기 — Klarna가 빠뜨린 단계
    이게 가장 중요해요. AI가 사람에게 넘겨야 하는 조건을 명확히 정의하세요 — "3회 이상 같은 질문 반복", "고객이 명시적으로 사람 연결 요청", "결제·환불·개인정보 관련 문의". "AI 뺑뺑이"를 구조적으로 차단하는 게 핵심이에요. 이 규칙 하나가 성공과 실패를 가른다고 해도 과언이 아니에요.
  5. 10%부터 시작, 주간 리뷰
    전체 문의의 10%만 AI로 돌려보세요. 매주 답변 로그를 리뷰하면서 오답률, 에스컬레이션 비율, CSAT 변화를 추적하세요. 지표가 안정되면 30%, 60%로 점진적으로 확대하고요. Klarna처럼 한 번에 100%로 가면 안 돼요.

도구 비교표

Intercom Fin Zendesk AI 직접 구축 (LLM + RAG)
접근 방식 자율 해결 (autonomous) 상담사 보조 (agent-assist) 자유 설계
자동 해결률 최대 67% 비공개 (보조 중심) 구현에 따라 다름
정확도 96% 높음 (공식 수치 미공개) 모델·프롬프트 의존
가격 모델 해결 건당 $0.99 시트 기반 + AI 애드온 API 호출 + 인프라 비용
도입 속도 1~2주 2~4주 2~6개월
커스터마이징 중간 (톤, 규칙 설정) 중간 (워크플로우 빌더) 무제한
적합한 팀 자동 해결률을 빠르게 높이고 싶은 팀 기존 상담사 생산성을 강화하려는 팀 CS가 핵심 경쟁력인 제품 (핀테크, 헬스케어)

참고로 Fin과 Zendesk AI는 자주 비교되지만 철학이 달라요. Fin은 자율 해결에 집중해 고객과 직접 끝까지 대화하고, Zendesk AI는 상담사 보조에 집중해 사람에게 답변 초안과 관련 문서를 제안해요. "어느 쪽이 더 좋냐"가 아니라, 우리 팀의 목표가 "자동 해결률 극대화"인지 "상담사 생산성 향상"인지에 따라 답이 갈려요. 그리고 Wix처럼 제대로 도입하면 티켓 볼륨이 50% 줄기도 하죠.

67%
Intercom Fin 자동 해결률
$0.99
Fin 건당 해결 비용
40M+
Fin 누적 대화 수
96%
Fin 답변 정확도

다시 처음 질문으로 돌아가 볼게요. Klarna는 왜 700명을 다시 뽑아야 했을까요? 더 나은 AI를 사지 않아서가 아니에요. AI를 켜기 전에 "무엇을 측정할지, 언제 사람에게 넘길지, 얼마나 천천히 늘릴지"를 정하지 않아서예요. 기술은 사면 되지만, 이 세 가지는 직접 설계해야 해요. 그게 이 글 전체의 결론이에요.