선거여론조사는 반드시 틀린다(1) 전북타임즈

선거여론조사는 반드시 틀린다(1)

총선을 앞두고 쓰는 마지막 칼럼이라 여론조사 이야기를 더 하겠다. 선거법이 공표를 허용하는 마지막 여론조사 날까지 사흘이 남았다. 최근 여론조사가 민심을 정확히 포착했다면 국힘당의 처지는 4년 전보다 더 어렵다고 할 수 있다.
언론이 지나치다 싶을 정도로 많은 여론조사 결과를 쏟아낸 한강 벨트에는 확실한 여당 우세지역이 하나도 없다. 동작(을)도 경합 우세를 벗어나지 못했다. 서울‧경기‧인천에서 국힘당이 의석을 늘릴 가능성은 높지 않아 보인다. 대전·충청·강원·제주 분위기도 4년 전과 크게 다르지는 않다. 반면 낙동강 벨트에서 국힘당은 열세에 빠졌고 부산·울산·경남의 여러 선거구가 승패를 알 수 없는 혼전에 휩쓸렸다. 대구·경북을 벗어나면 유권자 평균 연령이 매우 높은 농촌지역에서만 여당이 확실한 우위를 보이고 있다.
신뢰할 수 있는 모든 여론조사를 종합해 선거 판세를 가늠하는 MBC의 ‘여론M’에 접속해 보라. 언론은 선거구 여론조사 결과를 5백여 개 공표했다. 여론조사가 셋 이상 나온 ‘관심 선거구’는 60개 정도인데 여론조사공표 금지 시점까지 조금 더 늘어날 것이다. 현재 시점에서 국힘당 후보가 오차범위를 벗어난 우위를 보인 선거구를 손가락으로 꼽자면 한 손으로 충분하다. 여론조사가 둘 이하인 선거구에서도 야당이 앞선 곳이 더 많다. 여론조사가 하나도 나오지 않은 선거구는 4년 전 이긴 정당이 이번에도 이긴다고 보아도 크게 틀릴 일은 없다.
여론조사는 여당의 참패를 예고한다. 어떤 마케팅 회사에 의뢰해 실시한 <한국경제>의 ‘웹 여론조사’에서는 여당 후보가 서울과 충청권의 몇몇 접전지에서 압승했지만 무시해도 된다. 한국갤럽, 리얼미터, 한국리서치, 코리아리서치, 여론조사꽃 등 이름이 알려진 여론조사 회사의 조사도 문제가 없지는 않지만 적절하게 해석하면 판세 분석에 활용해도 된다. 하지만 잊지 말아야 할 것이 하나 있다. 선거여론조사는 아무리 잘해도 틀린다는 사실이다. 정말이다. 선거여론조사는 반드시 틀린다.
몇 가지 이유가 있다.
첫째, 여론은 움직인다. 유권자는 언제든 마음을 바꿀 수 있다. 이유가 합리적이든 아니든 상관없다. 우리 선거법은 선거일 6일 이전 시점에 실시한 여론조사만 공표를 허용한다. 엿새 후 유권자의 마음이 어떨지 지금 어찌 정확하게 알아낼 수 있겠는가.
둘째, 선거여론조사는 모집단(母集團)을 확정할 수 없다. 모든 유권자가 투표하지는 않기 때문이다. 지난 총선 투표율은 66.2퍼센트, 유권자 셋 가운데 둘만 투표했다. 누가 투표했는지는 선거인명부로 사후에 확인할 수 있다. 하지만 오는 4월 10일 누가 투표할지는 아무도 모른다. 여론조사는 유권자 전체를 모집단으로 삼지만, 실제 선거 승패 결정에는 투표한 유권자만 영향을 준다. 여론조사에서 반드시 투표하겠다는 사람만 추려서 후보 지지율을 비교하는 보완책도 완전한 해법이 되지는 않는다. 투표하겠다고 대답한 사람이 정말 한다는 보장이 없다.
셋째, 모집단을 확정할 수 있다고 해도 완벽한 표본집단을 얻을 수 없다. 기껏해야 표본의 연령·성별·동네별 수 정도를 모집단에 맞출 수 있을 뿐이다. 직업·학력·소득수준 등 정치적 의사결정에 영향을 줄 가능성이 있는 변수는 헤아릴 수 없이 많지만 그런 것은 대부분 무시하고 표본을 채운다.
그런데 여론조사를 왜 하는가? 틀려도 유용하기 때문이다. 선거여론조사는 ‘확률 게임’이다. 맞는지 틀리는지를 가리는 게임이 아니다. 실제 선거결과에 더 가까이 다가서면 이기는 게임이다. 언론이 보도하는 선거구 여론조사 표본(응답자) 수는 보통 500이다. ‘95퍼센트 신뢰 수준, 표본오차 ±4.4퍼센트’라는 단서를 붙인다. 이 단서를 이해하려면 가상적 사고실험을 해야 한다. 동전을 되풀이 던지는 것처럼 선거를 백 번 반복한다고 하자. 그러면 아흔 다섯 번은 후보들의 실제 득표율과 여론조사 지지율의 차이가 위아래 4.4퍼센트를 벗어나지 않을 것이다. ‘95퍼센트 신뢰 수준, 표본오차 ±4.4퍼센트’는 그런 뜻이다.
일상 언어로 번역하면 이렇게 된다. “경쟁하는 두 후보의 지지율 격차가 8.8퍼센트 넘는 경우에도 뒤진 후보가 당선할 가능성이 조금은 있다. 지지율 격차가 8.8퍼센트를 넘지 않는 경우에는 어느 후보가 이길 것이라고 판단할 수 없다.” 기자들이 여론조사 결과를 보도할 때 흔히 하는 ‘오차 범위 내의 우세’라는 표현은 틀린 말이다. ‘두 후보의 우열을 가릴 수 없다’고 해야 맞다.
표본 수를 늘리면 표본오차를 줄일 수 있지만 돈이 많이 들고 효과는 적다. 표본을 1천 개로 늘려도 표본오차는 약 1퍼센트 포인트밖에 줄지 않는다. 여기서 또 1퍼센트 포인트 정도를 줄이려면 표본을 3천 개로 늘려야 한다. MBC의 ‘여론M’은 그런 점에서 ‘가성비’가 뛰어나다. 최소한 셋 이상의 선거구 여론조사 결과를 조사기관의 성향과 조사 시점 등을 고려해 수학적으로 처리함으로써 여론조사의 표본오차를 만들어내는 ‘통계적 잡음’을 줄인다. 다시 말한다. 선거여론조사는 반드시 틀린다. 후보들의 득표율을 정확하게 맞추는 것은 근본적으로 불가능하다. 승패를 맞추기도 쉽지 않다. 초박빙 선거구에서는 실제 득표율이 여론조사 결과와 조금만 달라도 승패 예측이 빗나간다.<계속>