비례정당 득표율 예측, '단순 검색량'보다는 'SNS언급량'의 정확도 높아...

‘시민당 vs. 한국당’ 양강 구도 속 한국당 우세 점쳐
정당별 평균오차 1.5%p 이내 수렴, 민생당 예측은 어긋나
2020-04-17 16:47:08
차트=4.15 총선 비례대표 득표율 vs. 빅데이터 예측 비교
차트=4.15 총선 비례대표 득표율 vs. 빅데이터 예측 비교

빅데이터 분석이 선거 예측의 또다른 가능성을 제시했다.

빅터뉴스가 선거전날인 14일 보도한 바에 따르면 SNS언급량을 기반으로 한 정당별 관심도가 실제 정당별 득표율과 상당한 유사성을 보인 것이다.

빅터뉴스는 본격적인 선거운동이 시작된 2일부터 13일까지 민생당·미래한국당·더불어시민당·정의당·국민의당·열린민주당 등 6개 정당에 대한 네이버 검색량 비교 및 SNS의 비정형 빅데이터를 분석해 각 정당별로 누리꾼들의 관심도를 기사화한바 있다.

당시 기사에서 각 '비례정당별 검색량'은 미래한국당이 31.0%, 더불어시민당 21.2%, 열린민주당 15.4%, 국민의당 12.4%, 민생당 11.9%, 정의당 8.1% 순으로 보도됐다. 같은 기간 'SNS 언급량 점유율'을 비교한 결과는 미래한국당이 가장 많은 35.2%를 기록했고, 이어 더불어시민당 34.8%, 정의당 11.5%, 열린민주당 7.4%, 국민의당 5.6%, 민생당 5.5% 순으로 집계됐다. 이중 SNS언급량 점유율이 실제 득표율과 유사한 결과를 보인 것이다.

SNS언급량은 6개 정당만을 대상으로 조사한 결과였는데, 이 수치에 기타 군소정당의 득표율을 반영해 보정한 결과 실제 득표율과 매우 근사치의 언급량 점유율이 집계된 것이다.

4.15 총선에서 6개 주요정당을 제외하면 29개 군소정당의 득표율은 총 8.19%로 집계됐다. 이 수치를 빅터뉴스가 발표한 데이터에 반영해 보정한 결과 더불어시민당과 미래한국당의 양강 구도 속에서 미래한국당이 근소한 차이로 앞서고, 정의당이 정당 득표율 3위를 기록하는 등의 윤곽이 나타났다.

빅터뉴스가 보정한 결과는 실제 정당별 득표율과 대체로 1%p대 이내에서 오차를 보였는데 미래한국당의 관심도는 실제 득표율 33.84%보다 1.51%p 낮은 32.33%을, 더불어시민당은 실제 득표율 33.36%보다 1.47%p 낮은 31.89%로 나타났다.

정의당 분석결과는 실제 득표율 9.67%에 비해 0.93%p 높은 10.60%, 국민의당은 실제 득표율 6.80%보다 1.62%p 낮은 5.18%로, 열린민주당은 실제 득표율 5.42%보다 1.37%p 높은 6.79%로 나타나며 이상 1%p 대의 오차범위에 수렴했다. 다만 민생당은 실제 득표율은 2.72%인데 반해 빅터뉴스의 분석결과는 5.02%로 산출되 2.30%의 오차를 보이며 원내진입 실패를 예측하지 못했다.

이번 빅데이터 분석은 인스타그램·온라인커뮤니티·블로그·뉴스 등 SNS 채널에서 각 정당명이 언급된 게시물 11만8533건을 수집해 분석한 결과다. 이번 조사에서 여권 지지층의 활동이 활발한 트위터는 통계적 편향성을 고려해 조사대상에서 제외했다.

SNS 비정형 빅데이터 분석은 특정 지역의 국한된 데이터만을 추출할 수 없다보니 소선거구의 민심을 가늠하기에는 한계가 있다. 그러나 광역단체장 선거나 대통령 선거 등 선거구 단위가 커질수록 정확도는 상승한다. 빅데이터 분석은 우리사회의 전반적인 민심과 트렌드를 가늠할 수 있는 새로운 대안으로 제시되고 있다.

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300