컨설턴트 코너맨의 블로그
시간을 넘나드는 탐정 놀이: 이중차분법으로 정치 현상의 진실을 찾아서 본문
이중차분법은 영어로 'Difference-in-Differences', 줄여서 'DiD'라고 부릅니다. 이름이 좀 어려워 보이지만, 실제로는 아주 직관적인 아이디어입니다. 마치 시간여행을 하는 탐정처럼, 어떤 정책이나 사건이 일어나기 전과 후를 비교하고, 그 영향을 받은 그룹과 받지 않은 그룹을 동시에 비교해서 '진짜 효과'를 찾아내는 방법입니다.
이중차분법의 기본 아이디어: 차이의 차이로 진실을 찾다
이중차분법을 이해하기 위해 간단한 예시부터 시작해볼까요? 여러분 동네에 새로운 도서관이 생겼다고 가정해봅시다. 이 도서관이 정말로 학생들의 성적을 높이는 데 도움이 되었을까요?
만약 도서관이 생긴 후 우리 동네 학생들의 성적이 올랐다고 해서 "도서관 덕분이다!"라고 결론내릴 수 있을까요? 아니에요. 시간이 지나면서 선생님들이 더 열심히 가르쳤을 수도 있고, 새로운 교육 정책이 도입되었을 수도 있거든요.
그렇다면 같은 시기에 도서관이 생긴 우리 동네와 도서관이 생기지 않은 옆 동네를 비교하면 될까요? 이것도 완벽하지 않아요. 원래부터 우리 동네가 교육에 더 관심이 많았을 수도 있고, 다른 여러 조건들이 달랐을 수도 있거든요.
이중차분법은 이 두 가지 문제를 한 번에 해결합니다. "우리 동네의 전후 성적 변화"에서 "옆 동네의 전후 성적 변화"를 빼는 것이죠. 이렇게 하면 시간의 흐름으로 인한 자연스러운 변화와 원래부터 있던 동네 간 차이를 모두 제거하고, 도서관의 순수한 효과만 남길 수 있습니다.
도서관의 효과=(우리동네후−우리동네전)−(옆동네후−옆동네전)
이것이 바로 '차이의 차이', 즉 이중차분법의 핵심 아이디어입니다.
노벨상 수상자의 연구: 뉴저지와 펜실베이니아의 최저임금 이야기
이중차분법의 대표적인 사례로, 노벨 경제학상을 받은 데이비드 카드 교수와 앨런 크루거 교수의 연구를 살펴보겠습니다. 이들은 1992년 최저임금 인상이 고용에 어떤 영향을 미치는지 분석했어요.
경제학 이론으로는 최저임금이 오르면 기업들이 비용 부담 때문에 직원을 덜 고용할 것이라고 예상할 수 있습니다. 특히 패스트푸드점처럼 최저임금 노동자가 많은 곳에서 더 큰 영향이 있을 것이라고 생각할 수 있죠.
카드와 크루거 교수는 이를 검증하기 위해 1992년에 최저임금을 올린 뉴저지주(처치군)와 같은 시기에 최저임금을 올리지 않은 인근 펜실베이니아주(통제군)를 비교했습니다.
왜 단순 비교로는 안 될까요?
뉴저지만 전후 비교: 최저임금 외의 다른 시대적 변화(경기 변동, 계절적 요인 등)가 섞여서 순수한 효과를 알기 어려움
같은 시점에 두 주만 비교: 원래부터 존재하던 지역 간 차이(문화, 산업구조, 인구 특성 등)가 섞여서 최저임금의 효과인지 구분하기 어려움
이중차분법은 이 두 문제를 동시에 해결합니다. 뉴저지와 펜실베이니아의 최저임금 인상 전후 고용률 변화의 차이를 계산하여, 최저임금 인상의 순수한 인과효과를 추정하는 것이죠.
이중차분법이 작동하는 두 가지 핵심 약속
이중차분법이 올바른 결과를 주기 위해서는 두 가지 중요한 가정이 충족되어야 합니다.
첫 번째 약속: 평행추세 가정 (Parallel Trends Assumption)
이는 "만약 처치군이 처치를 받지 않았다면, 통제군과 비슷한 추세로 변화했을 것이다"라는 가정입니다. 마치 두 개의 평행선처럼 같은 방향으로 움직였을 것이라는 뜻이에요.
그림으로 설명하면, 우리가 실제로 관찰할 수 있는 것은 실선들입니다:
파란색 실선: 처치군의 처치 전과 처치 후 값
빨간색 실선: 통제군의 처치 전과 처치 후 값
우리가 알고 싶은 것은 "처치군이 만약 처치를 받지 않았다면 어떻게 되었을까?"인데, 이는 점선으로 표현되는 반사실적 결과입니다. 평행추세 가정은 이 점선이 통제군의 변화 추세와 평행할 것이라고 가정하는 것이죠.
두 번째 약속: 기대효과 부재 (No Anticipation Effects)
이는 처치를 받기 전에 "곧 처치를 받을 것"이라는 기대 때문에 미리 결과가 변하면 안 된다는 가정입니다. 예를 들어, 최저임금 인상이 발표되자마자 기업들이 미리 고용을 줄여버린다면, 처치 전의 고용률이 이미 영향을 받은 것이 되어 정확한 효과 측정이 어려워집니다.
이 두 가정이 충족되면, 처치 효과는 다음과 같이 계산할 수 있습니다:
처치 효과=(처치군후−처치군전)−(통제군후−통제군전)
여러 시기에 걸친 데이터가 있고 모든 처치군이 같은 시점에 처치를 받았다면, '이원 고정효과 모형'을 사용할 수 있습니다. 이 모형은 각 단위의 고유한 특성(단위 고정효과)과 각 시기의 공통적인 변화(시기 고정효과)를 모두 통제하면서 처치 효과를 측정합니다.
쟁점 1: 처치 시기가 제각각일 때의 함정
실제 연구에서는 모든 단위가 같은 시기에 처치를 받지 않는 경우가 많습니다. 예를 들어, 어떤 주는 2000년에 정책을 도입하고, 어떤 주는 2005년에, 또 어떤 주는 2010년에 도입하는 식이죠. 이를 '계단식 처치 시점(staggered treatment timing)'이라고 합니다.
무엇이 문제일까요?
전통적인 이원 고정효과 모형을 이런 상황에 사용하면, 실제로는 여러 개의 2×2 비교를 가중평균한 결과를 얻게 됩니다. 여기에는 건전한 비교도 있지만, 문제가 되는 '금지된 비교(forbidden comparison)'도 포함됩니다.
예를 들어:
건전한 비교: 한 번도 처치받지 않은 통제군 vs 특정 시점에 처음 처치받은 그룹
금지된 비교: 이미 처치받은 '얼리 그룹'을 마치 통제군처럼 사용해서 나중에 처치받는 '레이트 그룹'과 비교
이런 금지된 비교가 섞이면, 특히 처치 효과가 그룹마다 다를 때(이질적일 때) 추정치가 왜곡될 수 있습니다.
쟁점 2: 평행추세 가정, 정말 믿을 수 있을까?
평행추세 가정은 이중차분법의 핵심이지만, 실제로는 검증하기 어려운 가정입니다. 왜냐하면 처치군이 처치를 받지 않았을 때 어떻게 변했을지는 관찰할 수 없기 때문이죠.
기존 검증 방법의 한계:
처치 이전 시기의 추세만 보고 판단하는데, 이전에 평행했다고 해서 이후에도 평행할 것이라는 보장은 없음
검정력이 낮아서 실제로 평행추세가 깨졌는데도 깨지지 않았다고 잘못 판단할 위험이 있음
새로운 해결책: 민감도 분석
최근에는 평행추세 가정이 어느 정도 위반되더라도 처치 효과의 범위를 추정할 수 있는 '민감도 분석'이 개발되었습니다. 이 방법은 "처치 이전의 두 그룹 간 차이가 처치 이후에도 어느 정도 지속된다면, 처치 효과는 어떤 범위에 있을까?"를 계산해줍니다.
이중차분법은 완벽한 도구는 아니지만, 복잡한 사회 현상 속에서 진실에 한 걸음 더 가까이 다가갈 수 있게 해주는 소중한 방법입니다. 앞으로 이중차분법을 활용한 연구를 할 때는 전통적인 방법뿐만 아니라 최신 기법들도 함께 적용하여 다각도로 검증하는 것이 중요합니다.
데이터 과학의 목적은 멋진 숫자를 만드는 것이 아니라, 설득력 있는 진실에 가까워지는 것입니다. 이중차분법이라는 훌륭한 도구와 함께, 여러분도 사회의 복잡한 현상들을 더 깊이 이해하고 더 나은 정책을 만드는 데 기여하시길 바랍니다.
'Data & Statistics' 카테고리의 다른 글
| 데이터 분석에서 로그를 쓰는 이유: 평균의 함정과 성장률의 착각 (0) | 2026.01.04 |
|---|---|
| 인과추론, 지역화폐 정책 효과를 제대로 평가하려면 꼭 알아야 합니다 (0) | 2025.04.23 |