대졸 직원과 고졸 직원이 같은 비즈니스 과제를 풀면, 보통 대졸 쪽이 잘하잖아요. 당연하다고 생각했던 이 격차가 AI 하나로 4분의 1 수준으로 쪼그라들었어요. NBER에 발표된 무작위 대조 실험(RCT) 결과예요.
이게 뭔데?
아르헨티나·영국 연구팀(Cruces, Galiani 등)이 25~45세 성인 1,174명을 대상으로 온라인 무작위 대조 실험을 했어요. 참가자들은 교육 수준이 다양했고(고졸~대학원졸), 실제 직장에서 만날 법한 비즈니스 문제 해결 과제를 수행했어요.
절반에게는 생성형 AI 어시스턴트를 제공하고, 나머지 절반은 AI 없이 같은 과제를 풀게 했어요. 핵심 발견은 이거예요:
AI 없이 과제를 수행하면 고학력 참가자가 저학력 참가자보다 0.548 표준편차 높은 성과를 냈어요. 그런데 AI를 사용하면 이 격차가 0.139 표준편차로 줄었어요. 교육 수준에 따른 생산성 격차의 75%가 사라진 거예요.1
중요한 건 이 결과가 기존 회사 내부 연구와 다른 점이에요. 기존 연구들은 같은 회사, 같은 직군 안에서 상위-하위 성과자를 비교했어요. 하지만 이 연구는 교육 수준이 근본적으로 다른 사람들을 비교했다는 점에서 더 강력해요. 회사가 이미 비슷한 사람들만 뽑는 채용 필터를 거친 뒤가 아니라, 진짜 다양한 배경의 사람들을 대상으로 한 실험이에요.
한 가지 더. 연구팀은 AI를 사용한 뒤 다시 AI 없이 과제를 수행하게 했는데, 교육 격차가 그대로 남아 있었어요. 이건 AI가 근본적인 역량을 바꾼 게 아니라, 역량 차이의 영향을 완충해준다는 뜻이에요. AI는 교사가 아니라 이퀄라이저인 셈이죠.
뭐가 달라지는 건데?
이 연구 하나만 있으면 우연일 수 있어요. 그런데 같은 방향을 가리키는 연구가 계속 나오고 있어요.
| 연구 | 대상 | AI의 격차 해소 효과 |
|---|---|---|
| Cruces et al. (2026)1 | 성인 1,174명 (다양한 교육 수준) | 교육 격차 75% 감소 |
| Dell'Acqua et al. (2025)2 | P&G 전문가 776명 | 전문 분야 경계 소멸, 비전문가→전문가급 성과 |
| Dell'Acqua et al. (2023)3 | BCG 컨설턴트 758명 | 하위 50% 성과 43%↑ vs 상위 50% 17%↑ |
| Brynjolfsson et al. (2023)4 | 고객 지원 상담사 5,179명 | 하위 성과자 생산성 35%↑, 상위는 미미한 변화 |
P&G에서 진행된 Cybernetic Teammate 실험이 특히 인상적이에요. 776명의 R&D와 마케팅 전문가가 실제 제품 혁신 과제를 수행했는데, AI를 사용한 개인이 AI 없는 팀(2인)과 동일한 성과를 냈어요. 더 놀라운 건 전문성 경계가 무너진 거예요 — R&D 전문가도 AI와 함께하면 마케팅 관점의 솔루션을, 마케팅 전문가도 기술적 솔루션을 내놓았어요.
BCG 컨설턴트 실험에서는 이미 엘리트 중의 엘리트인 집단에서도 격차 축소가 확인됐어요. 하위 50% 컨설턴트의 성과가 AI로 43% 올랐지만, 상위 50%는 17%만 올랐어요. AI가 상향 평준화를 만드는 도구라는 뜻이에요.
이 연구들의 공통 패턴을 한마디로 정리하면 이래요:
AI는 모든 사람의 성과를 높이지만, 덜 가진 사람에게 더 많이 준다.
핵심만 정리: 우리 조직에 적용하는 법
AI가 교육 격차를 75% 줄인다면, 4년제 학위를 필수 자격으로 거는 게 과연 합리적인지 다시 생각해볼 때예요. 특히 AI 도구를 적극 활용하는 포지션이라면, 학력보다 AI 활용 역량과 문제 해결 접근법을 평가하는 게 더 나을 수 있어요.
기존 교육이 "이 분야의 지식을 채워주겠다"였다면, 이제는 "AI를 써서 어떤 분야든 빠르게 파악하는 법"을 가르치는 게 ROI가 높아요. BCG 실험에서도 프롬프트 훈련을 받은 그룹이 안 받은 그룹보다 더 높은 품질의 결과물을 냈어요.
P&G 실험에서 AI를 사용한 개인이 AI 없는 2인 팀과 같은 성과를 냈어요. 이건 "전문가 2명이 필요한 일"을 "AI를 쓰는 1명"이 해낼 수 있다는 뜻이에요. 팀을 크게 만드는 대신, 소수 인원 + AI 조합으로 실험해보세요. 단, 상위 10% 수준의 탁월한 결과는 여전히 사람+AI 팀에서 나왔어요.
AI가 격차를 줄이는 건 좋지만, 근본 역량까지 바뀌는 건 아니에요. AI를 빼면 격차가 다시 나타났거든요. 그래서 "AI와 함께한 성과"와 "AI 없이 내린 판단력"을 모두 평가하는 이중 프레임이 필요해요. 특히 관리자 역할에서는 AI 결과물의 오류를 잡아내는 능력이 여전히 중요해요.
더 깊이 파고 싶다면
Cruces et al.의 원문. 1,174명 RCT 설계, 교육 수준별 성과 비교, AI 사용 후 격차 75% 감소의 통계적 근거를 상세히 볼 수 있어요.
P&G 776명 현장 실험의 핵심 결과를 Mollick 교수가 직접 정리한 글이에요. AI가 팀워크, 전문성, 감정까지 바꾸는 과정이 잘 정리되어 있어요.
시카고대 경제학 교수가 AI 생산성 연구들의 마이크로-매크로 증거를 종합 정리한 리빙 문서예요. 개별 연구들을 큰 그림에서 이해하고 싶을 때 좋아요.





