이경재 박사과정 통계학과

통계에 대한 사람들의 관심과 활용도는 계속해서 증대되고 있다. ‘지역별 국회의원 당선자는 누가 될 것인가?’ ‘특정 조건을 가진 사람이 보험 상품에 가입했을 때 보험료를 어떻게 책정해야 하는가?’ 등과 같은 물음에 답하기 위해서 사람들은 통계에 대해 알아야 한다. 특히 자신의 주장을 관철하고 상대를 설득하려 할 때, 통계는 강력한 도구가 될 수 있다. 똑같은 주장을 해도 말로만 번지르르하게 포장할 때보다는 통계를 이용한 정확한 수치와 확률을 보여줄 때 청중에게 더욱 객관적이고 설득력 있게 들리기 마련이다.

문제는 통계가 제대로 사용되지 못할 때의 문제점 또한 크다는 것이다. 실수에 의해서든 고의적으로든 통계는 오용되기 매우 쉽다. 예를 들어 어떤 병원에 의사 A와 B가 있다고 가정하자. 지금까지 두 의사의 수술 기록을 보면 A는 100번의 수술 중 68번을 성공했고, B는 100번의 수술 중 75번을 성공했다고 한다. 해당 병원에서 수술을 해야 한다면 당신은 의사 A와 B 중 어떤 의사를 택할 것인가? 갖고 있는 자료에 기반한다면 수술 성공률 68%인 의사 A보다는 성공률이 75%인 의사 B를 선택하는 것이 언뜻 당연해 보인다. 하지만 사실은 그렇지 않다는 것이 이 문제의 함정이다. 합리적인 결정을 위해서는 추가적인 정보를 반드시 알아야 한다. 그 중 하나가 ‘해당 의사가 집행한 수술의 난이도’라는 조건이다. 만약 의사 A는 오랜 경력으로 뛰어난 실력을 인정받아 해당 병원의 최고난이도 수술만을 집행했고, 의사 B는 아직 경험과 실력이 부족해서 가장 간단한 수술만을 집행했다고 한다면 어떨까. 일반적으로 성공률이 10%에도 미치지 못하는 최고난이도 수술의 성공률을 68%까지 올린 의사 A와, 너무 간단해서 90% 이상 성공한다고 알려진 수술을 75%밖에 성공하지 못한 의사 B 중 누구를 선택해야 할까? 이제 이 문제는 처음과는 다른 의미로 당연해 보인다. 이 예시는 너무나도 유명한 ‘심슨의 역설’을 간단하게 적용해 본 것이다. 살펴본 바와 같이, 같은 자료를 가지고도 어떤 식으로 자료를 바라보는지에 따라 극과 극의 해석을 이끌어낼 수 있다. 올바른 통계의 적용이 매우 중요하다는 사실을 반증하는 사례라고 할 수 있다.

간혹 통계 분석의뢰가 들어올 때면 난감할 때가 있다. 통계 분석을 통해서 원하는 결론을 뒷받침할 근거가 있는지 없는지를 알아보는 것이 아니라, 어떻게든 의뢰인 본인이 원하는 결론을 이끌어내기 위해 통계 분석을 의뢰하는 경우가 많기 때문이다. 물론 이러한 욕구는 어떻게 보면 당연할 수도 있다. 자신의 주장이 틀렸다는 것을 굳이 돈 내고 확인하려는 사람은 많지 않을 것이다. 또한 이러한 분석의뢰가 들어왔을 때 중요한 가정을 무시하고서라도 의뢰인의 요구를 들어주려는 유혹이 통계학자에게 찾아올 수 있다. 하지만 그러한 유혹을 참아내는 것 또한 통계학자가 당연히 가져야 할 마음가짐이다.

통계는 많은 의사 결정 과정에 사용될 수 있는 중요한 툴이다. 또한 이제는 많은 사람들이 그 중요성을 인지하고 강력한 도구로서 주목을 받고 있는 상황이다. 강력한 만큼 오용됐을 때 심각한 문제를 야기할 수 있는 통계. 지금 받고 있는 신뢰에 금이 가지 않게 오직 정직한 도구로서 사용돼야 할 것이다.

 

이경재 박사과정

통계학과

저작권자 © 대학신문 무단전재 및 재배포 금지