메뉴 건너뛰기

close

통계 전공자, 비전공자 각각 다섯 명에게 오차범위가 뭔지 물어봤다. 개념을 정확히 설명한 응답자는 통계 전공자 한 명뿐이다. 권다영(25)씨는 오차범위가 조사원 실수에서 비롯되는 것이라 했다. 실수로 인한 오차는 전문가들이 비표본오차로 정의한다. 비표본오차도 중요한 개념이지만 오차범위에 반영되지는 않는다. 통계 전공 임연빈(25)씨는 오차는 알아도 오차범위는 뭔지 잘 모르겠다고 답했다. 
 
표본비율의 오차범위
 표본비율의 오차범위
ⓒ 김성진

관련사진보기

 
표본조사는 오차를 수반한다··· 오차범위만큼 실제 값과 차이 허용해야

오차를 허용하는 구간을 오차범위라고 한다. 표본조사는 모집단 일부를 샘플링하기 때문에 조사 결과와 실제 값 사이에 차이가 있다. 시식코너에서 귤 한 조각을 맛본 뒤 전체 귤의 맛을 가늠하는 것과 비슷하다. 시식한 귤과 집에 온 귤 맛이 다른 것처럼 표본조사 결과도 실제 값과 다를 수 있다. 조사한 값과 실제 값의 차이가 바로 오차다.

표본조사 결과가 전체 집단을 대표할 수 있는 것은 오차를 일정 수준 허용하기 때문이다. 이때 허용한 오차의 구간을 허용오차 또는 오차범위라고 한다. 위 그림에선 이해를 돕기 위해 면적으로 표시했지만 진짜 오차범위는 빨간 점선으로 표시된 구간이다.

오차범위 안에서는 조사 결과가 들어맞지 않을 수 있다. 2004년 미 대선 당시 헤리스폴 온라인 출구조사는 존 케리가 49%의 득표율로 부시를 누르고 당선될 것이라 예측했다. 결과는 부시가 50.74%, 존 케리가 48.27%로 뒤집혔다. 여론조사와 실제 결과가 다르면 사람들이 혼란에 빠질 수 있다. 한국기자협회 등 5개 단체는 선거여론조사 보도준칙으로 "지지율이 오차범위 안에 있을 경우 서열화하지 말고 '경합' 또는 '오차범위 내에 있다'"고 보도하라는 지침을 제시했다.
 
문재인 대통령 긍/부정 표본분포. 오차범위가 겹친다
 문재인 대통령 긍/부정 표본분포. 오차범위가 겹친다
ⓒ 김성진

관련사진보기

 
리얼미터 11월 4주차 주중동향에서 문재인 대통령을 긍정적으로 평가한 응답자는 48.8%다. 부정적인 평가와 오차범위가 겹치기 때문에 긍정적인 여론이 우세하다고 단정하면 안 된다. 실제론 부정적인 평가가 더 클 수도 있다.

언론사도 헷갈리는 오차범위… 잘못된 해석으로 이어져

 
국제 신문이 이해한 PK 지역 정당 지지율 오차범위 & 실제 PK 지역 정당 지지율 오차범위
 국제 신문이 이해한 PK 지역 정당 지지율 오차범위 & 실제 PK 지역 정당 지지율 오차범위
ⓒ 김성진

관련사진보기

 
오차범위는 응답자 수에 따라 달라진다. 국제 신문은 지난달 "PK 지지도 한국당 36% > 민주당 27%… 오차범위 고려해도 역전"이라는 기사를 냈다. 리얼미터가 발표한 오차범위 를 고려해 정당지지율의 결과가 오차범위를 벗어난다고 해석했다. 그런데 논의를 PK 지역으로 한정했기 때문에 그에 맞게 표본 수도 조정해야한다. PK 지역의 표본 수 216명에 맞춰 계산하면 오차범위가 서로 겹친다. 보도 내용과 다르게 PK 한국당 및 민주당 지지율은 여전히 오차범위 내에서 1ㆍ2위를 다투고 있다.
 
차기 대선주자 선호도 조사 (출처 : 리얼미터 홈페이지)
 차기 대선주자 선호도 조사 (출처 : 리얼미터 홈페이지)
ⓒ 김성진

관련사진보기

오차범위를 구하는 이차방정식. 햇(^)이 달린 p는 조사결과, 즉 표본비율을 의미한다
 오차범위를 구하는 이차방정식. 햇(^)이 달린 p는 조사결과, 즉 표본비율을 의미한다
ⓒ 김성진

관련사진보기


오차 범위 작을수록 좋다? 일부러 늘리는 경우도 있어

오차범위를 늘리면 그만큼 실제 값과 조사결과의 차이를 허용할 수 있다. 오차범위는 이차방정식으로 구하는데 방정식이 "표본비율 = 0.5" 에서 최대가 되기 때문에 표본값 대신 0.5를 대입하면 오차범위를 최대로 늘릴 수 있다.

리얼미터 정례월간 11월에 의하면 이낙연 총리를 차기 대선주자로 지지하는 비율이 15.1%, 오차범위는 ±2.0%p다. 이론대로라면 "표본비율 = 0.151"을 대입해서 오차범위가 ±1.4%p가 돼야한다. 하지만 리얼미터는 "표본비율 = 0.5"를 대입해 오차범위를 ±2.0%p로 늘렸다. 방정식에 0.5를 대입하면 동일한 결과를 얻을 수 있다.

태그:#통계, #조사, #여론, #오차, #설문
댓글
이 기사가 마음에 드시나요? 좋은기사 원고료로 응원하세요
원고료로 응원하기

통계분석(데이터 & 텍스트 마이닝)으로 사실을 검증하고 가짜뉴스를 바로 잡습니다


독자의견

연도별 콘텐츠 보기