승자와 패자는 우연히 결정된다   

2011. 5. 3. 09:02



여러분이 친구와 함께 동전 던지기 게임을 한다고 상상해보기 바랍니다. 이 게임은 동전을 모두 1,000 번 던져서 앞면이 나온 횟수와 뒷면이 나온 횟수 중 무엇이 더 큰가를 가지고 승패를 결정합니다. 여러분은 앞면을 선택하고 친구는 뒷면을 선택했다고 해보죠. 동전을 1,000 번 던져서 앞면이 나온 횟수가 뒷면이 나온 횟수보다 크면 여러분이 이기는 겁니다.

여러분과 친구 중 누가 이길까요? 아마 여러분은 동전을 1,000 번 정도 던지면 앞면과 뒷면이 각각 나올 확률이 50%이니까, 앞면이 대략 500 번 정도 나오리라(뒷면도 500 번 정도) 예상할 겁니다. 그래서 여러분과 친구는 승패를 가리지 못한 채 서로 비길 것이라고  생각할지 모르겠군요.

하지만 그렇지는 않습니다. 동전을 1,000 번 던져서 앞면이 나온 횟수(혹은 뒷면이 나온 횟수)가 500 인 경우는 그리 흔치 않습니다. 대개 500 번보다 조금 크거나 적게 나오는 게 보통이죠. 이를테면 508 대 492, 이렇게 말입니다. 그래서 여러분과 친구는 이 게임에서 승패가 가리지 못하면 어쩌나, 하는 고민은 할 필요가 없습니다. 500 대 500, 이렇게 나오는 경우는 아주 드무니까요. 여기까지는 여러분이 익히 예상하는 바라서 그리 특별할 것이 없습니다.

총 1,000번을 모두 던져서 승자와 패자를 결정하지 말고, 동전을 매번 던질 때마다 승자와 패자를 따지기로 게임의 룰을 바꿔볼까요? 다시 말해 동전을 던지고 나서 그동안 앞면이 몇번 나왔는지(그리고 뒷면이 몇번 나왔는지)를 기록해서 '매번 승자와 패자를 새로 결정'하자는 겁니다. 이렇게 하면 어떤 현상이 나타날까요?

아마 여러분은 앞면을 택한 여러분과 뒷면을 택한 여러분의 친구가 서로 승자와 패자를 골고루 나눠 가지면서 1,000 회까지 갈 거라고 예상할지 모릅니다. 실제로 어떤 결과가 나올지 Excel을 통해 시뮬레이션해볼까요?

Excel에서 randbetween() 함수를 사용해서 동전 던지기를 모사해 보겠습니다. 이 함수를 모두 1,000 번 사용한 다음, 앞면이 나온 누적 횟수와 뒷면이 나온 누적 횟수를 계산합니다. 그런 다음, 앞면이 나온 횟수가 더 크면(즉 여러분이 승자이면) 1, 뒷면의 횟수가 더 크면 -1, 두 횟수가 같으면 0 이라고 설정하고 그래프로 나타냅니다.

아래의 그림은 이렇게 해서 나온 그래프 중 하나입니다.



위의 그래프는 여러분과 여러분의 친구가 승자와 패자를 비교적 공평하게 나눠 가지는 패턴을 보여 줍니다. 이런 패턴이 전형적인 것 같지만, 시뮬레이션을 계속해 보면 이런 패턴이 자주 나타나지 않는다는 걸 알게 됩니다. 바로 아래의 그래프처럼 초기에는 앞면과 뒷면이 경합을 하다가 어느 순간부터 앞면이 앞서는(즉 여러분이 앞서는) 상황이 제법 자주 나타납니다.



반대로 초기에 경합하다가 뒷면이 계속해서 승자가 되는 패턴도 자주 나타납니다(아래 그래프).



더욱 기이한(?) 현상은 앞면이 처음부터 끝까지 계속 승자가 되는 패턴도 가끔 나온다는 것입니다(아래 그래프).



마찬가지로 뒷면(여러분의 친구)이 시종일관 승자인 패턴도 동일한 확률로 나타나죠(아래 그래프).



물론 아래의 그래프처럼 처음에는 앞면이 기선을 제압하다가 나중에 뒷면이 승자가 되는(혹은 그 반대의) 패턴도 나타납니다.




여러분이 Excel을 써서 직접 시뮬레이션을 해보면(혹은 수고스럽게 동전 1,000 번 던지기를 수 차례 해보면) 여러 그래프를 보게 될 텐데, 위에서 제시한 패턴들에서 크게 벗어나지 않을 겁니다.

이 시뮬레이션에서 얻을 수 있는 시사점은 무엇일까요? 한번 승자이면 계속해서 승자이거나, 한번 패자이면 계속해서 패자인 경우가 생각보다 많다는 점입니다. 물론 바로 위에 있는 그래프처럼 승자와 패자가 바뀌는 경우도 있지만, 승자와 패자가 '고정적'으로 유지되는 경우가 제법 흔하다는 것을 시뮬레이션은 보여줍니다.

앞면과 뒷면이 나올 확률이 동일한 동전 던지기에서조차 이렇게 승자와 패자가 꽤 자주 '고정적으로 유지'되는 현상은 무엇을 말하는 걸까요? 어떤 사람이 승자가 되고, 또 어떤 사람이 패자가 되는 이유는 초기에 각자가 어떤 초기 조건을 가졌느냐에 따라 우연히 결정되는 것을 아닐까요? 우연하게 처음에 앞면이 많이 나온 덕에 동전을 1,000 번 던지고도 계속해서 승자의 위치를 고수하는 것처럼 말입니다.

물론 누가 승자가 되느냐(혹은 패자가 되느냐)는 개인의 노력도 아주 중요한 결정요소입니다. 개인의 노력 여하에 따라 오늘의 패자였던 사람이 내일의 승자가 될 수 있죠. 하지만 '우연'은 개인의 노력에 결코 뒤지지 않는 영향력을 발휘하는 요소입니다. 그 사람에게 어떤 환경이 우연하게 주어지느냐에 따라 개인의 노력이 상승효과를 일으킬 수 있지만, 반대로 노력을 좌절시키고 절망케 하는 환경이 조성될 수 있기 때문입니다. 우연이란 요소를 가볍게 볼 일이 아닙니다.

우리는 사회적으로 성공한 사람(혹은 성공한 기업)의 성공요소를 그 사람이 지닌 역량이나 노력으로 보는 경향이 매우 강합니다. 그래서 그들을 본받아 행동하면 성공할 수 있다는 희망을 갖습니다. 성공에 향한 열망과 희망을 갖는 것이 의미 없음을 말하려는 게 아닙니다. 그들의 성공은 어쩌다 처음에 앞면이 많이 나온 '우연'도 크게 작용했음을 고려해야(그리고 어떤 면에서는 경계해야) 한다는 점을 말하고 싶을 뿐입니다.

패자에 대한 낙인은 승자에 대한 숭상보다 바람직하지 않습니다. 승자와 패자를 결정하는 데에 우연이 큰 작용을 한다는 것을 안다면 실패한 사람들을 무능력하고 뭔가 부족한 사람이라고 평가하려는 우리의 관성에 제동을 걸어야 합니다. 패자가 아무리 노력해도 승자가 되지 않는 환경적인 우연이 우리 곁에 너무나 많기 때문입니다.

승자와 패자는 전적으로 우연히 결정되지는 않습니다. 하지만 자주 우연하게 결정됩니다. 동의하십니까?

(*참고도서 : '숫자에 약한 사람들을 위한 우아한 생존 매뉴얼')
(*위에서 실행한 시뮬레이션을 직접 해보고 싶다면, 아래의 Excel 파일을 다운로드 받기 바랍니다.)


inFuture 아이폰 앱 다운로드       inFuture 안드로이드 앱 다운로드


  
,

프로야구 경기를 보는 동안(보기 전이 아님) 어느 팀이 승리할 지 알아맞히려면 어떤 정보들이 필요할까? 팀의 승률, 팀 방어율, 팀 타율 등 팀 성적은 물론이고 선발투수의 방어률, 피안타율, 타자의 출루율, 혹은 그날의 날씨, 홈경기 여부 등 수많은 정보들을 따져봐야 승리팀을 알 수 있을까?

물론 충분한 크기의 다양한(그리고 좀 복잡한) 데이터가 주어지고 분석만 잘 한다면 (완벽하지는 않지만) 근사한 예측 적중률을 보이는 모델을 만들 수 있다. 그러나 그렇게 하려면 시간이 너무 오래 걸려서 경기가 이미 끝나버리고 만다.

해서, 나는 이런 가설을 세웠다.

4회까지의 점수만 보면, 그 경기의 승리팀을 70% 적중률로 예측할 수 있다.

이 가설의 아이디어는 게르츠 기거렌처의 '생각이 직관에 묻다'에서 얻었다. 그 책은 농구 경기에서 팀별 승률과 전반전 스코어만 보면 승리팀을 78%의 적중률로 맞힐 수 있다는 결과를 소개한다.

여러분이 A팀과 B팀 간의 야구 경기를 4회까지만 관전하고 그 경기의 승리팀이 어디인지 알아맞힌다면, 그 적중율은 얼마나 될까? 50%, 아니면 60%? 시간이 없어서 4회까지만 경기를 봐야 한다면, 이 가설의 증명 여부가 도움이 될지 모른다.

가설을 증명하기 위해 직접 실험을 해보기로 했다. 실험의 순서는 다음과 같다.

1. 2009년 4월 4일부터 5월 10일까지 치러진 124개의 경기 결과를 확보했다.

2. 각 경기의 4회까지 점수 결과를 일일이 수집했다 (좀 힘들었다. -_-).

3. 4회까지의 점수가 앞서는 팀이 승리팀이 되리라 예측했다.

4. 만일 4회까지의 점수가 동점이면, 2008년의 승률이 높은 팀이 승리팀이 되리라 예측했다.

[실험 결과]
엑셀 파일에 이와 같은 로직을 담아 시뮬레이션해 보니, 71.8%라는 적중률이 도출됐다(비긴 경기를 감안하면 77% 정도가 된다). 가설보다 높은 수치다. 이 결과를 바꿔 생각하면, 5회 이후에 역전이 짐작만큼 많이 일어나지 않는다는 의미로 해석된다(아래의 엑셀 파일 참조). '우리팀이 역전하기를' 고대하지만, 실망스럽게도 역전할 확률은 기껏해야 30%정도 밖에 되지 않는다.


이 실험은 시즌 초반에 해당하는 경기에만 적용했는데, 시즌 마지막 경기까지 적용한다면 적중률이 다소 변하리라 예상된다.


불확실성이 큰 상황에서 의사결정 내릴 때마다 정보가 부족하기 일쑤다. 좀더 많은 정보, 지식, 방법론을 적용하면 예측의 정확성이 커질 텐데, 그러지 못해서 안타까워 하는 경우가 많다. "아, 다양한 데이터를 충분히 확보한다면 좋겠는데..."라며 탄식한다. 많은 정보가 예측의 적중률 향상시킨다고 믿는다.

그러나, 적은 정보만 가지고도 꽤 근사한 적중률로 예측이 가능한 경우가 의외로 많다. 많은 데이터와 정보를 가진다고 해서 예측의 적중률을 높이지는 못한다. 추가되는 데이터의 '한계(Marginal)예측적중률'은 '한계효용'처럼 급격히 체감된다. 100%에 가까운 적중율을 얻으려면 거의 무한대의 정보가 필요할지도 모른다.

불확실하고 복잡한 시대, 간단한 판단법으로 쉽게 살아도 되지 않을까?


  
,

일전에 동전 던지기와 관련한 글을 올린 적이 있다. 앞면과 뒷면이 고루 나오지 않고, 예상보다 자주 무리져(덩어리져) 나온다는 사실을 실험으로 증명하고(비록 조악하지만) 예측전문가들의 예측을 동전 던지기에 빗댄 글이었다.

그 글에 이어서 오늘은 '주식 투자와 동전 던지기'를 한데 엮은 실험을 소개할까 한다. 실험 주제는 다음과 같다.

 동전을 던져 주식 매매를 결정하면 수익률이 어떨까?

뜨악한 주제인가? 엘리어트 파동 이론이니, 가치 투자니, 주식 매매를 다루는 유명한 이론이 쟁쟁한데, 고작 동전 던지기로 주식 투자를 해보자는 건가? 하지만 해보기 전에는 모르니 실험으로 동전 던지기가 효과가 있는지 없는지 가려보자.

아래의 실험 내용을 보기 전에 머리 속으로 한번 예상해 보자. "동전을 던져 주식 매매를 결정하면 그 수익률은 얼마 정도일까?" 마이너스 20%? 혹은 플러스 5% 정도?  아마도 '동전으로 주식 매매를 결정한다고? 돈 까먹지 않으면 다행히지'라면서 수익률을 상당히 낮게 잡으리라 예상된다.

그러나 실험을 진행해 보니, 동전 던지기로 주식 매매를 결정하여 얻은 수익률이 나쁘지 않았으며, 어떤 경우에는 연평균 수익률이 10%을 넘기도 했다.

그것이 진짜인지 보이기 위해, 지금부터 여러분과 같이 실험을 진행하고자 한다. 실험에 들어가기 전에 먼저 다음과 같은 투자의 규칙과 가정사항을 알아두자.

- 투자 대상은 주가지수(KOSPI)로 한다.
- 최초 보유 주식수는 2만주로 시작한다.
- 주가지수 데이터는 2000.1.1부터 2009.5.4일까지(약 9.3년간)를 사용한다.

- 동전을 던져 앞면이 나오면 '사고', 뒷면이 나오면 '판다'.
- 매매 가격은 직전 영업일의 주가지수 종가(終價)로 한다.
- 거래량은 하루 100주로 고정한다.

- '주식가치=주가지수*보유주식수' 로 가정한다.
- 주문은 매장 개시와 동시에 내고, 주문 즉시 거래가 체결된다고 가정한다.
- 매매 수수료율은 0.015%
- 매도시 세금은 거래세 0.15%, 농특세 0.15%

보다시피, 동전을 던져 앞면이 나오면 사고(Buy), 뒷면이 나오면 파는(Sell) 단순한 투자원칙이다. 동전을 직접 던져서 결정하는 일은 꽤나 고단한 일이라서, Excel의 Randbetween(0,1) 함수를 써서 동전 던지기 효과를 시뮬레이션했다. 이 함수가 무작위하게 결과를 낼까 의심할지도 모르겠다.

하지만 실제의 동전도 앞 뒷면의 문양 차이, 밀도 차이 등으로 무게중심이 완벽히 '가운데'가 아니라는 점을 감안한다면, Excel의 함수를 사용해도 무방하다고 가정했다(혹시 무작위성이 증명된 random number 추출 프로그램이나 알고리즘을 안다면, 알려주면 고맙겠습니다).

서설이 길었는데, 이제부터 같이 실험을 해보자.

[실험 방법]
- 우선 아래의 Excel 파일을 다운로드해서 열어 보자. 


- '동전던지기 투자 게임 1'이란 sheet를 열자.
- 그 sheet 맨 밑에 '연평균 수익률' 값이 나온다.
- randbetween()함수를 리프레시 해보자. 아무 '빈 셀'로 이동해서 Del 키를 누르면 그때마다 리프레시 된다. 연평균 수익률 값이 그때마다 변하는 모습이 나타난다. 어떨 때는 수익률이 꽤 좋아서 10%를 넘기도 하고, 또 어떨 때는 마이너스 수익률을 보이기도 한다.
- 그리고 sheet의 상단 오른쪽을 보면 아래와 같은 '부(wealth)의 그래프'도 있으니 참조하자.



연평균수익률이 어떻게 변하는지 대략 감을 잡았는가? 간혹 마이너스 수익률이 나타나지만 플러스 수익률이 더 자주 나타남을 느끼지 않았는가? 

진짜 그러한지 판단하기 위해, 직접 리프레시해서 얻은 값을 일일이 손으로 옮겨 적어서 다음과 같은 그래프를 얻었다. 모두 250번 리프레시한 결과다. 250번 밖에 리프레시 하지 않아서 매끄럽게 곡선이 그려지지 않았다. 시간과 프로그래밍 실력이 뒷받침된다면, 플러스 수익률 쪽으로 약간 기울어진 '종형 그래프'가 그려지지 않을까 예상된다(물론 적어도 수만번 시행해야지만...).


보다시피 평균 3.78%의 수익률이 나온다. 은행 이자 정도(세후) 되니 나쁘지 않은 수익률이다. 실험을 하기 전에 예상했을지도 모를 형편없는 수익률은 적어도 아니다.

[어떻게 해석해야 할까?]
이 실험 결과를 어떻게 해석해야 할까? 동전 던지기가 투자 자문을 대신할 수 있단 말인가? 2000년 1월 1일부터 동전던지기로 투자한 결과와 실제로 여러분의 투자수익률을 비교하면 어떤가? 동전던지기보다 더 나은가, 아니면 더 나쁜가? 개인별로 다르지 싶다.

다음의 2가지 해석이 가능하다. 

(해석 1) 동전던지기가 이성적인 투자의사결정보다 나쁘지 않다. 혹은 더 낫다.
(해석 2) 투자자문이나 투자예측의 결과를 믿느니 동전던지기로 투자하는 게 더 낫다.

나는 1번의 해석에 심적으로 동의한다(그런 가설을 가지고 이 실험을 시행했으니까...) 하지만 이 해석이 전적으로 유효하려면 이 글에 실린 실험보다 정밀하고 통계적으로 유의한 실험이 시행돼야 한다.

능력이 안 되는 나는 여기까지 동전던지기의 효과를 제기하는 데 만족하련다. 혹시 여러분 중 통계와 수리에 능하다면 동전던지기 투자 게임을 주제로 논문을 써도 좋겠지 싶다(나에게 공동연구를 제안한다면 더 좋겠다  ^^ ).


[추가]
첨부된 Excel 파일에는 '동전던지기 투자 게임 2'라는 sheet도 있다. 매매 여부 뿐만 아니라, 거래량도 동전던지기로 결정하는 게임인데, 평균적으로 거래량이 많아서 그런지 최고수익률과 최저수익률 사이의 스프레드가 위의 경우(거래량을 100으로 고정시킨 경우)보다 컸다.

동전던지기 투자 게임을 할 때 수익률을 최대로 높이는 '최적 거래량'은 얼마일까, 란 새로운 의문이 든다. 거래량을 크게 해야 좋을까, 아니면 주가지수 증가율에 연동하여 거래량을 정해야 할까? 이 주제도 연구를 해보면 좋겠지 싶다.

또한, 이 실험은 인덱스 펀드마냥 주가지수 전체에 투자를 했는데, 개별 종목이나 특정 포트폴리오를 대상으로 동전 던지기를 해보면 어떨까?

해보고 싶은 주제는 많은데, 능력이 안 되니 아쉬울 따름이다. ^^

(*수정사항이 많아 재발행합니다.)


  
,