게임이론을 아우른 내쉬의 흔적을 따라가다
게임이론을 아우른 내쉬의 흔적을 따라가다
  • 대학신문
  • 승인 2015.10.04 20:24
  • 댓글 0
이 기사를 공유합니다

삶은 ‘선택’의 연속이다. 여러분은 이 기사를 읽기로 선택했고 현재 도입부를 읽어나가고 있다. 기사를 다 읽기까지 드는 시간과 기사를 읽어서 얻을 이득에서 여러분이 후자를 선택한 결과다. 뭇 학자들은 선택과 그에 따른 변화의 집약체를 ‘게임’이라 불러왔다. 그에 따라 게임에 대한 이론인 ‘게임이론’은 선택의 이론으로 여겨져 왔다. 게임이론은 프린스턴대 교수였던 존 폰 노이만에 의해 탄생했다. 그는 체스와 같은 보드게임을 수학적으로 분석해오다 경제학자 오스카 모르겐슈테른과의 공동 연구를 통해 처음으로 경제학에 게임이론을 도입했다. 그러나 게임이론이 경제학에서 그 존재감을 확실하게 드러내기 시작한 것은 당시 같은 학교 대학원생이던 22세 청년 존 내쉬를 거친 후부터였다. 지난 5월 내쉬는 안전띠를 매지 않은 순간의 ‘선택’으로 인해 안타깝게 세상을 떠났다. 『대학신문』에선 이번 기획을 통해 그의 흔적인 ‘내쉬의 게임이론'의 발자취를 따라가며 선택의 세상을 다시금 들여다보려 한다.

 

갓 태어난 게임이론이 보여준 '선택'

내쉬 게임이론의 시작점엔 폰 노이만과 모르겐슈테른의 초창기 게임이론이 있다. 이 둘의 이론은 ‘2인 제로섬 게임’ 상황에 대한 해석이다. 예컨대 샤돌이와 샤순이가 ‘이순신’이라는 게임을 한다고 해 보자. 이 게임에선 각자가 100원짜리 동전의 그림과 숫자 중 어느 면이 위로 갈지 결정한 후 서로에게 동시에 보여준다. 만일 둘이 같은 면을 보인다면 각자의 동전을 다시 가져가고, 다른 면을 보인다면 그림을 보여준 쪽이 상대방의 동전을 가져간다. 이때 이순신 게임은 한쪽이 얻는 동전의 수가 상대방이 잃은 동전의 수와 같은 ‘제로섬 게임’이다.

이제 샤돌이와 샤순이는 어떤 면을 보여줄지 ‘전략’을 선택할 것이다. 게임 규칙에 따라 가능한 (샤돌, 샤순) 전략쌍은 (이순신, 이순신) (이순신, 100) (100, 이순신) (100, 100)이 된다.

폰 노이만과 모르겐슈테른은 두 명이 참여한 제로섬 게임에서 합리적 선택에 다다르는 방법을 ‘최소 극대화 원리’로 제시했다. 샤돌이와 샤순이가 얻고 잃을 동전의 수를 전략쌍에 대응시켜 다음 표와 같이 나타내면 아래와 같다. 가령 (이순신, 이순신)이 선택되면 이 전략쌍의 결과는 (0,0)이 된다.

위 표에 따르면 샤돌이가 ‘이순신’ 전략을 취하게 되면 샤순이의 전략에 따라 샤돌이의 보수는 0이 될 수도, 1이 될 수도 있다. 반대로 샤돌이가 ‘100’ 전략을 취하면 상대의 전략에 따라 -1 혹은 0의 보수를 얻는다. 따라서 샤돌이가 ‘이순신’ 전략을 통해 얻을 수 있는 보수의 최솟값은 0이고, ‘100’ 전략을 통해서는 최소 -1의 보수가 발생한다.

이때 폰 노이만과 모르겐슈테른은 상대방의 전략에 따라 자신이 얻을 수 있는 보수에 집중하라고 말한다. ‘이순신’ 전략을 취하면 0 아래로 보수가 떨어지지 않지만, ‘100’이라는 전략을 취하면 -1부터 보수가 시작된다. 그들의 최소 극대화 원리에 따라 샤돌이와 샤순이가 ‘이순신’을 선택하는 것이 가장 합리적인 선택이 된다.

 

내쉬, 게임이론의 시야를 확장하다

내쉬는 폰 노이만의 세미나에서 게임이론을 처음 접한 뒤, 이들이 해결하지 못한 지점이 있음을 깨닫는다. 2명의 경기자가 펼치는 제로섬 게임에서는 ‘최악의 상황을 최소화하라’는 답이 유효하지만, 제로섬 게임이 아닌 경우나 경기자가 더 많을 경우에는 이를 적용하기 어려워 보였다. 이런 의문 끝에 내쉬는 전혀 다른 방법으로 게임이론을 해석해 폰 노이만과 모르겐슈테른이 설명하지 못했던 영역까지 포괄하는 이론체계를 구축했다.

앞의 ‘이순신’ 게임을 내쉬의 시각에서 다시 살펴보면 다음과 같다. 무심코 ‘100’을 위로 놓으려던 샤돌이는 만일 자신의 전략을 샤순이가 예측한다면 샤순이가 ‘이순신’ 전략을 택할 것을 깨닫는다. 따라서 그는 샤순이가 ‘이순신’ 전략을 고를 때 자신의 동전을 뺏기지 않도록 자신도 ‘이순신’을 위로 내놓기로 한다. 여기서 샤돌이는 더 나아가 둘 다 이순신 전략을 선택한 후엔 ‘100’ 전략으로 전환하는 쪽이 동전을 뺏기므로 ‘이순신’ 전략을 계속해 유지할 것이라는 확신에 다다른다. 샤순이도 같은 방식으로 ‘이순신’ 전략을 고른다. 생각을 마친 둘은 동시에 그림이 윗면으로 오도록 동전을 내민다.

그의 게임이론에 등장하는 경기자는 자신의 결과만을 바라보지 않는다. 모든 경기자는 보수에 따라 상대방과 자신의 전략을 동시에 고려하는 역동적인 주체다. 게임이론을 연구하던 내쉬는 경기자들이 샤돌이와 샤순이의 경우처럼 서로의 전략을 바꾸지 않는 지점에 다다르게 됨을 발견했고, 이 지점을 ‘내쉬균형점’이라 명명했다. 내쉬의 27쪽짜리 짧은 박사학위 논문에는 몇 명의 경기자가 참여함에 상관없이 모든 일반적인 게임에서 내쉬균형점은 홀수개로 유한하거나 무수히 많이 존재한다는 증명이 수록돼 있다. 특수한 상황만 분석할 수 있다고 여겨졌던 게임이론은 그의 손을 거쳐 비로소 일반화된 것이다.

 

내쉬의 뒤로 이어지는 발자취

1994년, 내쉬의 게임이론을 발전시킨 공로로 라인하르트 젤텐과 존 하사니가 내쉬와 함께 노벨상을 받았다. 이들의 공은 내쉬가 게임에 적용한 가정에서 벗어난 상황까지 그의 이론을 발전시킨 점에 있었다. 일찍이 내쉬는 내쉬균형의 기반으로 두 가지 가정이 필요하다고 봤다. 첫 번째는 경기자들이 동시에 전략을 결정한다는 것이고, 두 번째는 경기자들은 서로에 대해 완전한 정보를 갖고 예측할 수 있다는 것이다.

젤텐은 이 중 첫 번째 가정에서 나아가 경기자들이 차례로 전략을 취하는 게임의 ‘부분게임완전내쉬균형’을 제시했다. 두 번째 가정을 발전시킨 하사니는 다른 경기자에 대해 정보가 부족한 상황의 게임에서 ‘베이즈내쉬균형’을 제시했다. 예컨대 내쉬의 이순신 게임에선 샤돌이와 샤순이는 행동은 하지 않는 상태로 서로에 대해 치열하게 분석한 뒤 동시에 동전을 냈다. 반면 젤텐의 이순신 게임에선 샤돌이가 먼저 동전을 보이며 게임이 시작되고, 하사니의 이순신 게임에선 샤돌이는 샤순이가 동전을 보일 때 그가 얼마만큼 보수를 얻는지 정확히 모르는 상태에서 게임이 시작된다고 할 수 있다. 이들의 노력으로 내쉬 게임이론은 정교화돼 보다 복잡한 상황을 설명할 수 있게 됐다.

더 나아가 게임이론은 사회현상을 ‘실험’할 수 있는 방법론의 기초로도 자리 잡았다. 게임이론이 이론적 배경으로 자리 잡은 사회과학적 실험 중 하나로 ‘선거예측시장’이 있다. 선거예측시장은 선거에 출마한 각 후보자가 당선되는 사건을 일종의 주식으로 만들어 거래하는 시장이다. 시장 참가자들은 거래하는 매 순간 게임적인 상황에 부닥친다. 자신이 팔고자 하는 가격과 상대방이 사고자 하는 가격을 모두 고려해 최대한의 이익을 낼 수 있는 전략을 선택해야 하기 때문이다.

선거예측시장은 예측을 정확히 할수록 높은 보상을 얻는 게임이다. 따라서 경기자들은 새로이 얻는 정보에 따라 빠르게 반응하기 때문에 실제 결과에 가까운 예측이 가능해진다. 분배정의연구센터 조남운 박사는 선거예측시장을 “실시간으로 정보를 얻으며 마권을 사고팔 수 있는 경마”에 비유했다. 시장 속에선 참가자들은 실시간으로 얻는 정보에 따라 매매전략을 수정하며 선거일에 가까워질수록 시장에서 각 후보의 주가는 참가자들의 수없이 많은 거래가 반영된 평형점에 다다른다. 미국의 공신력 있는 선거예측시장 중 하나인 미국 아이오와대 선거예측시장은 이 평형점이 실제 득표율과 유사하게 나타나는 것으로 알려졌다.

본교 정치커뮤니케이션센터에서도 2012년 대선 당시 일정 수의 피실험자를 대상으로 선거예측시장을 운영했다. 조 박사는 “선거 1주일 전부터 여론조사 결과 공표가 금지돼 참가자들이 얻는 정보가 제한된다”며 정보가 더욱 부족한 상황이기에 실제 결과와 시장의 예측이 다를 수 있다고 전했다. 실제로 당시 예측시장은 문재인 후보가 더 득표율이 높을 것이라는 결과로 마감됐다.

 

'내쉬균형'의 지평을 넘으려는 여러 시도들

내쉬의 이론에서 경기자들은 최선의 선택을 위해 끊임없이 고민한다. 따라서 내쉬균형은 최선의 결과로 여겨졌다. 하지만 1968년 생명과학자 개릿 하딘에 의해 내쉬균형을 찾아가는 과정에서 모두가 손해를 보는 사례, 이른바 ‘공유지의 비극’이 제시됐다. 하딘은 양치기 목동의 예시를 들어 공유지의 황폐화를 설명했다. 목동들은 자신이 목초지에 풀어놓은 양으로부터 직접적인 이익을 얻지만, 과도한 방목으로 인한 손실은 공동으로 부담한다. 따라서 이해관계를 완전히 파악한 합리적인 목동이라면 다른 경기자보다 가능한 많은 양을 방목할 것이기에 결국 목초지는 황폐해져 누구도 사용하지 못하게 된다. 하딘의 의견이 제시되자 학자들은 공유지의 비극을 해결하기 위해선 공유지를 완전히 사유화하거나 이를 제어할 강력한 중앙정부의 통제가 필요하다고 주장했다.

하지만 터키 알라니아 지역의 어장같이 사유화와 중앙정권의 통제정책을 시행하지 않고도 성공적으로 관리된 공유지의 사례도 있다. 이곳에서는 매년 조업 가능한 어부들의 명단을 받아 추첨을 통해 어장 내의 구역을 배정한다. 9월에 구역을 지정받으면 이듬해 1월까지 어민들은 매월 동쪽의 다음 위치로 옮겨 조업하고, 1월부터는 다시 서쪽으로 이동하며 조업한다. 이러한 자리 이동은 9월부터 1월까지는 동에서 서로, 1월부터 5월까지는 서에서 동으로 이동하는 물고기들에 대해 어부들이 동등한 조업 기회를 얻게 한다.

이 제도의 이행 여부에 대한 감시는 어민들 스스로에 의해 진행됐다. 만일 좋은 조업자리를 배정받은 어민이 있다면 그 어민은 일찌감치 해역에 나가 물고기를 잡을 것이기 때문에 몰래 그 해역에 들어가려 하는 다른 어민은 반드시 적발되며 시스템 내의 다른 어민들도 부정행위를 하는 어민을 제지할 것이다. 그래야만 좋은 조업자리가 자신에게 돌아왔을 때 역시 그 권리를 침해받지 않기 때문이다. 주민들은 규칙을 이행하는 것이 어장 문제를 모두에게 좋은 방향으로 해결하는 방법임을 깨달았고, 그에 따라 어장은 성공적으로 관리될 수 있었다.

위의 사례는 정치학자 엘리너 오스트롬이 『공유의 비극을 넘어』에서 제시한 것으로, 그는 공유지의 비극을 해결하기 위한 실마리를 게임의 ‘경기자’에서 찾았다. 지금까지 살펴온 바에 따르면 내쉬균형으로 향하는 경기자들은 타협 없이 서로의 수를 치밀하게 예측하고 가장 좋은 전략을 취할 뿐이었다. 하지만 그는 공유지의 비극을 성공적으로 극복한 구성원들에겐 더 나은 해결책을 찾으려는 강한 동기가 있음을 발견했다. 안도경 교수(정치외교학부)는 오스트롬의 이러한 견해에 대해 “내쉬가 내쉬균형으로 제시했던 인간의 ‘합리성’을 재정의한 것”이라고 말했다.

이후에도 많은 학자는 실제 사례들을 분석해 내쉬의 게임이론에 등장하는 합리적인 경기자를 재검토했고, 그에 따라 이론적인 영역에서도 내쉬균형을 이루는 경기자들의 합리성에 대한 의구심이 제기됐다.

일례로 바둑은 양 경기자가 차례로 돌을 놓기 때문에 젤텐의 부분게임완전내쉬균형 개념을 도입할 수 있는데, 젤텐이 가정한 바에 따르면 경기자는 게임을 시작하기도 전에 바둑 경기가 끝나는 방법의 경우의 수와 그로부터 얻을 보수를 따지고 한 수씩 역으로 올라가며 내쉬균형점을 찾아 나가야 한다. 하지만 실제 바둑을 두고 있는 두 사람은 둘의 게임이 어떤 상황으로 끝날지 몇 수 앞도 미처 헤아릴 수 없는 경우가 허다하다.

이런 실상에서 뭇 경제학자들은 이에 대한 답을 찾으려는 노력의 일환으로 ‘행동주의 게임이론’에 주목하고 있다. 행동주의 게임이론은 실험적으로 주어진 게임 상황에서 실제로 사람들이 어떻게 행동하는지를 연구하며 기존의 내쉬균형에 더 ‘인간적’인 면모를 가미할 대안적인 균형이론을 모색하고 있다. 최승주 교수(경제학과)는 “몇 실험에서는 사람들이 놀라울 정도로 내쉬균형에 가깝게 행동하지만, 조금의 변화를 주면 내쉬균형에서 벗어난 결과를 보인다”며 “내쉬균형에 일치하지 않아도 그의 가정을 유지하고 해석하려는 견해도 있지만 다른 시도들도 있다”고 덧붙였다.

이러한 시도의 한 예로는 ‘레벨-k’ 모형이 있다. 내쉬균형에서는 각 경기자가 서로의 수를 무한히 내다볼 수 있지만 레벨-k 모형에서는 k의 값으로 경기자가 몇 수를 내다볼 수 있는지를 제한한다. 최 교수는 “우리가 아는 대부분의 이야기는 레벨-k 이론의 적용이라고 볼 수 있다”며 『삼국지』를 예로 들었다. 적벽대전이 일어나기 직전 제갈량은 주유에게 동남풍을 일으켜 줄 것을 약속하며 바람 방향이 바뀔 시점에 칠성단에 올랐다. 주유는 바람이 바뀌는 것을 보며 제갈량이 미래의 강적이 될 것을 예감해 칠성단으로 군사를 몰래 보낸다. 하지만 제갈량은 동남풍을 타고 도망칠 계획까지 마련해 칠성단의 위치를 지정해 놓아 주유의 군사가 다다랐을 땐 이미 순풍을 타고 빠르게 멀어지고 있었다.

이 이야기를 게임이론의 시각으로 본다면 주유는 제갈량에 대해 나름의 수를 내다본, k가 1인 L1 경기자라 할 수 있다. 하지만 제갈량은 L1 경기자보다 한 수 더 내다볼 수 있는 L2 경기자였기에 주유의 손아귀에서 유유히 빠져나갔다. 내쉬의 게임이론에서 경기자들은 서로의 전략을 무한히 내다보면서 상대방의 전략이 더 변하지 않을 평형점을 예측했다. 하지만 레벨-k 이론의 경기자들은 내다볼 수 있는 수가 k의 값으로 제한돼 있다. 이처럼 행동주의 게임이론은 기존의 게임이론이 고려하지 않았던 새로운 변수를 도입해 현실에 더 가까운 상황을 설명할 힘을 키워나가고 있다.

 

내쉬 게임이론의 꺼지지 않는 숨결

안도경 교수는 게임이론을 다음과 같이 평했다. “게임이론은 새로운 언어체계와도 같다.” 게임이론은 경제학의 한 귀퉁이를 차지하는 것이 아니라 게임이론의 입장에서 경제학을 다시 기술할 수 있을 정도로 빼어난 도구다.

내쉬의 이론은 그러한 게임이론의 단단한 초석이 돼왔다. 많은 학자는 연구와 제안을 통해 내쉬의 이론을 보다 정교하게 갈고 닦았지만 그 중심엔 여전히 내쉬의 업적이 자리 잡고 있다. 특히 내쉬가 떠올린 ‘모든 경기자가 최선의 선택을 하며 체계적으로 균형을 찾아간다’는 발상은 그의 가장 큰 공헌으로 꼽힌다. 조석주 교수(성균관대 경제학과)는 “게임이론에 가장 중요한 이바지를 한 사람은 내쉬이며, 그 이후의 학자들은 내쉬가 생각해 보지 못한 게임에 그의 발상을 확장해 적용해왔다”고 전했다.

게다가 내쉬의 이론은 내쉬균형점의 존재를 보장해 본격적으로 게임이론이 널리 적용될 수 있는 기반을 마련했다. 안 교수는 “내쉬균형점의 존재를 명확히 알 수 없었다면 게임이론을 다른 분야로 적용하기 어려웠을 것”고 말했다. 실제로 대부분 경제정책은 게임이론을 기본 골격으로 해 사람들이 합리적으로 반응할 것이라는 전제하에 수립되며 경제행위와 연관되지 않은 사회현상도 마찬가지의 방식으로 분석되곤 한다.

또한 이상적인 모델을 벗어나 실제 현상을 들여다볼 때, 내쉬 게임이론은 수학의 언어를 빌려 구축된 이론이라는 점에서 더욱 돋보인다. 최승주 교수는 대안적 이론을 구축하려는 시도들이 활발히 진행됨에도 “현재로선 실제 현상을 분석하기에 내쉬균형보다 더 적합한 것은 없다”고 짚었다. 내쉬의 게임이론은 수학적 증명을 통해 균형을 제시하기에 상당히 명확하다. 따라서 그의 이론은 복잡한 실제 현상 속에서 의미 있는 통찰을 발견할 수 있도록 하는 이정표 역할을 해왔다.

내쉬는 이토록 뛰어난 업적을 낸 직후 조현병에 걸려 약 30년간 정신병동과 집을 오갔다. 기적적으로 병을 이겨낸 후 일상으로 돌아왔지만 그는 결국 지난 5월 86세의 나이로 눈을 감았다. 그럼에도 그의 게임이론은 끊임없는 발전을 거듭해왔고 지금도 그 발전은 진행 중이다. 앞으로도 내쉬의 게임이론은 후학들에 의해 끊임없이 회자되며 살아있는 이론으로 남을 것이다.

 

경제학을 휩쓴 게임이론이라는 혁명은,
폰 노이만과 내쉬의 기초 수학 정리에서 비롯했으며
그 이상의 새로운 정리는 없다

- 『폴그레이브 경제학 사전』 중 ‘게임이론’

 

삽화: 이종건 기자 jonggu@snu.kr


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.