예측은 제2의 천성이라 일컬을 만큼 인간들에게 본능적인 습성입니다. 우리는 미래의 불확실함에 대해 불안감을 느끼기 때문에 미래를 예측하는 일에 몰두를 하거나 지대한 관심을 지닙니다. 수많은 종류의 예측 기법들이 난무하고 예측을 주업으로 하는 사람들(경제학자, 컨설턴트, 기상예보관, 미래학자 등)이 세상에 많이 존재한다는 점(그리고 그들이 제법 돈을 잘 번다는 점)이 이를 증명하지요.

그러나 적어도 지금까지 알려진 바에 따르면 미래를 정확하게, 아니 근사한 수준으로 예측하는 기법은 없습니다. 더군다나 미래의 변화를 미리 짚어낸 예측전문가들도 거의 없습니다. 가까이는 서브 프라임 모기지 사태가 전세계적인 경제 위기를 촉발할 거라 예측한 사람은 아무도 없었죠. 어쩌다가 예측이 적중한 예측전문가가 있을지 모르지만, 따지고 보면 그것은 행운에 지나지 않다는 점이 여러 연구에서 밝혀졌습니다. 예측의 허구에 대해서는 여러 번 다른 글을 통해 이야기했기 때문에 여기서는 언급하지 않겠습니다.



그렇다면 모든 예측은 부질없고 소용없는 일일까요? 예측은 항상 틀리기만 한 것일까요? 그렇지 않습니다. 다음에 나오는 '예측의 조건' 2가지를 충족한 예측은 타당하고 또한 충분히 납득 가능합니다.

예측의 조건

(1) 현재 시점에서 미래 시점으로 이어지는 '입증된 자연법칙'이 필요하다
(2) 시작점인 현재 상태(초기조건)를 정확하게 알아야 한다

첫 번째 조건은 이런 뜻입니다. 방정식이든 논리적인 추론이든 예측에 사용되는 도구나 기법이 자연법칙이어야 한다는 의미입니다. 즉 언제라도(적어도 아주 오랫동안) 변하지 않는 법칙이어야 한다는 것입니다. 예를 들어, "공중에서 공을 놓으면 몇 초 후에 땅에 닿을 것이다"라고 누군가가 예측할 때 그의 말이 타당하고 옳은 이유는 예측에 사용된 중력 법칙이 자연법칙이기 때문입니다.

그런데 어떤 사람이 이렇게 주장한다고 해보죠. "내일의 주가는 오늘의 주가에 0.1을 곱하고 10을 더하면 예측할 수 있다"고 말입니다. 그는 y=0.1x + 10 이라는 방정식에 따라 주가가 움직인다고 주장하는 것입니다. 이 방정식은 '주가의 법칙'으로 보이긴 하지만, 자연법칙은 절대 아닙니다. 그 사람의 경험법칙이거나 과거 데이터를 회귀분석해서 얻은 '추세식'에 불과합니다. 따라서 그 사람의 예측은 타당하지 않습니다.

여러분도 알다시피 주가를 결정하는 변수와 변수 간의 관계는 매우 복잡하기 때문입니다. 변수가 많더라도 그것들이 뭔지 알면 좋으련만, 무엇이 주가를 변동시키는지 집어내기가 어렵습니다. 게다가 주가에 영향을 미치는 정도도 매순간 바뀌기 때문에 주가의 변동에서 일반적인 자연법칙을 이끌어내기란 불가능합니다.

수많은 주식전문가들이 갖가지 '자연법칙스러운' 예측 모델을 만들어냈노라고 주장했고 또 주장하고 지만 주장하지만 시장수익률을 상회하는 예측 모델은 존재하지 않습니다. 그 이유는 주식 시장이 합리적인 요인과 비합리적인 요인이 동시에 작용하는 '복잡계(complex system)'이기 때문입니다. 복잡계는 일정한 패턴이나 법칙을 찾을 수 없는 시스템을 말합니다. 그래서 워런 위버란 사람은 "알거지가 되는 최고의 방법은 운에 좌우되는 게임에서 일정한 패턴을 발견했다고 믿는 것이다"라고 말하면서 주가 예측의 위험을 경고합니다.

그런데 천년에 1명 나올까 말까한 천재가 나타나서 '언제 어디서라도' 기업가치를 예측하는 방정식을 찾아냈다고 가정해 보죠. 우리는 그를 '기업가치 법칙'이란 자연법칙을 발견해낸 위대한 사람이라고 칭송할 겁니다. 아마 노벨상을 100개 정도 수여해도 부족함이 없다고 생각할 겁니다. 이럴 때 그가 규명한 방정식을 사용하면 특정 기업의 미래 가치를 정확하게 예측할 수 있을까요?

아직 확답할 수 없습니다. 왜냐하면 예측의 조건 중 두 번째인 '시작점인 현재 상태를 정확하게 알아야 한다'를 따져봐야 하기 때문이죠. 위에서 복잡계는 합리적인 요인과 비합리적인 요인이 동시에 작용하는 시스템이라고 했는데, 이 말은 천재가 규명한 방정식이 '비선형 방정식'임을 의미합니다. X의 값에 Y의 값이 비례하지 않는다는 말입니다.

천재가 규명했음직한 기업가치 방정식을 다음과 같이 간단하게 가정해 볼까요? (이 방정식은 상징적인 예시일 뿐입니다. 실제 기업가치를 구하는 방정식이 아닙니다. 오해 마시길....)

Y = 4X * (1 - X)

X : 현재의 기업가치
Y : 1분 후의 기업가치

아마 기업가치 방정식(실제로 존재할 리는 없겠지만)은 이보다 훨씬 복잡하겠죠. 어쨋든 이 방정식은 X의 제곱항이 있기 때문에 비교적 간단한 복잡계를 나타내는 비선형 방정식입니다. 게다가 2분, 3분 이후의 기업가치를 구하기 위해 Y가 다시 방정식에 대입되는 '되먹임(feedback)'이 존재합니다.

이 방정식에서 중요한 것은 바로 X라는 현재의 기업가치입니다. 이것을 간단하게 '초기조건'이라고 부릅니다. 초기조건의 값이 잘 입력돼야 그 후의 기업가치가 잘 계산되겠죠. 그런데 문제는 이런 '비선형 되먹임 방정식'은 초기조건에 굉장히 민감하다는 것입니다. X가 조금만 달라져도 예측이 틀어진다는 점이죠. 진짜 그런지 살펴볼까요?

초기 기업가치의 실제값을 0.7 이라고 가정하겠습니다. 그런데 측정하는 과정에서 현재의 기업가치를 0.700001 이라고 잘못 측정했다고 해보죠. 겨우 백만분의 1의 오차라서 별것 아니라 생각하겠지만, 결과는 엄청나게 달라집니다.

아래의 그래프에서 파란 선은 이 방정식에 0.7을 입력한 실제의 기업가치 곡선입니다. 반면, 붉은 점선은 0.700001을 입력한 예측 곡선이죠.


보다시피, 17분까지는 실제값과 예측값이 거의 일치합니다. 하지만 18분부터는 갑자기 예측 곡선이 실제 곡선을 벗어나 요동치기 시작합니다. 겨우 오차가 백만분의 1인데도 18분 이후의 예측이 실제와 달라지는 겁니다. 만일 이보다 세밀하지 못하게 초기 기업가치를 측정(대부분 이렇겠죠)한다면 18분 이내는 커녕 2~3분 후의 미래 기업가치도 예측하지 못하겠죠. 이처럼 기업가치를 오차 없이 완벽하게 측정할 수 없다면 천재가 규명한 방정식도 무용지물입니다.

즉, 복잡계 성격을 띠는 시스템을 움직이는 자연법칙을 발견했다 하더라도, 초기조건을 완벽하게 측정할 수 없다면 예측은 불가능합니다. 위에서 봤듯이 제법 정밀하게 측정했다 해도 조그만 오차가 '되먹임' 과정을 통해 빠르게 증폭되어 예측이 빗나가 버리고 맙니다.

예측할 수 있는 것과 예측할 수 없는 것을 잘 구분하는 지혜가 필요합니다. 예측 모델이 있다는 것과 예측할 수 있다는 것은 다릅니다. 예측할 수 있으려면 예측에 필요한 자연법칙이 존재해야 합니다. 또한 시작점인 현재의 상태(즉 초기조건)를 정확하게 측정할 수 있어야 합니다. 이 2가지 조건을 만족해야 우리의 예측은 의미가 있습니다. 두 조건 중 하나라도 만족하지 못하면, 예측할 수 없는 것에 해당합니다.

여러분에게 필요한 능력은 예측을 잘 하는 능력이 아닙니다. 예측할 수 없는 것을 예측하려는 오류에 빠지진 않았는지 위의 예측의 조건으로 여러분이 가진 예측 모델을 살펴보기 바랍니다. 그리고 다른 사람의 예측이 '예측의 조건'을 만족하지 않는다면 그의 예측을 신뢰해서는 안되겠죠.

예측할 수 없는 것을 예측하려는 노력보다 예측할 수 없는 결과(혹은 바라지 않는 결과)가 나올 때를 대비하는 일이 보다 현명하다는 것을 더불어 기억하기 바랍니다.

(*참고도서 : '혼돈의 과학', '욕망을 파는 사람들')


inFuture 아이폰 앱 다운로드       inFuture 안드로이드 앱 다운로드


  
,

혼돈과 나비효과가 지배하는 세상   

2009. 12. 18. 13:26

어떤 동물(토끼나 쥐)들이 한정된 공간에서 서식할 때, 다음 세대의 군집 크기를 어떻게 예측할 수 있을까요? 우리는 보통 다음과 같은 방정식을 써서 다음 세대의 군집 크기를 예상합니다. 여기서 출생률은 1마리의 토끼가 낳은 새끼의 수라고 간주하면 됩니다. 

다음세대의 군집 크기 = 출생률 * 지금세대의 군집 크기

하지만, 위의 '선형(線形) 방정식'은 한정된 공간이 가지는 제약조건인 '자원의 한계'를 반영하지 못합니다. 먹이와 거주 공간의 부족 때문에 다음세대의 군집이 일정하게 늘어나지 않습니다. 군집의 크기가 일정 수준을 넘어서면 먹이와 거주지 경쟁으로 서로 공격하거나 스트레스를 받아서 군집의 크기가 줄어들거나 정체되기 때문입니다.

한정된 공간과 자원을 두고 경쟁하는 동물(혹은 사람)의 군집 크기 변화를 보다 잘 반영하려면, 아래와 같은 '비선형(非線形) 방정식'을 고려해야 합니다.

다음세대 군집 크기 = 출생률 * 지금세대 군집 크기 * (1 - 지금세대 군집 크기)

이 방정식은 현재 군집이 점유한 부분과, 군집이 채우지 않은 부분이 서로 상호작용하여 다음세대의 군집 크기를 결정한다는 의미를 담았습니다. '(1 - 지금세대 군집 크기)'라는 항이 군집이 채우지 않은 부분을 가리킵니다. 예를 들어, 최대 정원이 100명인 버스가 있을 때, 현재 60명이 탑승 중이라면 다음 정류장에서 태울 수 있는 사람의 수는 현 탑승자인 60명과 40명분의 빈 자리의 관계로 결정된다는 뜻입니다.

'채워진 부분'과 '채워지지 않은 부분' 사이의 상호작용은 때론 크게, 때론 작게 나타납니다. 그 결과가 바로 출생률이죠. 세대를 거치면서 출생률은 고정되지 않고 매번 '진동'합니다.

다음세대의 군집 크기가 비선형 방정식을 따르고, 출생률이 진동한다고 가정하면, 흥미로운 그래프를 얻을 수 있습니다. 아래의 그래프가 바로 그것입니다. (대학 다닐 때 이 그래프를 PC로 그리느라 C 언어로 무진 고생했는데, 이제 Excel로 쉽게 그릴 수 있으니 편리한 세상입니다.)


출생률이 2.3에서 약 3.0이 될 때까지는 군집의 크기가 66% 정도로 수렴됩니다. 그러나 3.0을 넘어서면, 군집의 크기는 두 개의 가능성을 가집니다. 예를 들어, 출생률이 3.3일 때, 군집의 크기는 약 45%이거나 80%가 됩니다.

헌데, 출생률이 3.45를 넘어서면 군집의 크기는 4개의 가능성을 갖고, 3.55를 넘으면 8개의 가능성이 드러납니다. 그 이상을 넘어가면, 군집의 크기는 그래프에서 보다시피 무수히 많은 가능성을 가지게 되죠. 그야말로 '혼돈(카오스)'에 빠지는 모습입니다. 출생률이 3.55 이상인 구간에서는 출생률이 아주 미묘하게 변화한다 해도 그 결과가 크게 달라지기 때문에 다음세대의 군집 크기를 예측하기가 불가능합니다.

이 그래프에서 한 가지 재미있는 것은 '자기유사성(Self-similarity)'을 갖는다는 사실입니다. 그래프의 검은 부분(출생률이 3.55 이상인 부분)을 확대하면 수많은 '갈래'들이 나타나는데, 그 모양이 3.0에서 3.55사이의 구간에서 보는 갈래 모양과 같다는 것이죠. 모양을 끊임없이 반복하는 겁니다. 이런 그림을 프랙탈(Fractal)이라고 하죠.

군집 크기에서 나타나는 혼돈(카오스) 현상은 '나비효과'의 개념과 이어집니다. 아마존에서 나비가 펄럭거리면 그것이 멕시코만에 허리케인을 일으킨다는 개념이죠. 기상학자인 로렌쯔가 처음 제시한 현상이죠. 나비효과는 Excel을 써서 여러분도 쉽게 재현할 수 있습니다. 

원래 0.808080 의 질량을 갖는 물체가 있는데, 측정 오차에 의해서 0.808081 로 측정했다고 가정해 보겠습니다. 고작 0.000001 의 오차라서 이 정도는 무시할 수 있겠다 싶지만, 그 측정치가 다시 '시스템' 속에 피드백(되먹임)되면 오차는 폭증합니다.

아래의 그래프는 0.808080 을 두배씩 증가시킨 값에서, 0.808081을 두배씩 증가시킨 값을 뺀 '오차'를 나타냅니다. 30회만 진행했는데도, 오차가 기하급수적으로 증가하는 모습을 나타냅니다. 아마존의 나비가 허리케인을 일으킬 만합니다.


위에서 언급한 '군집크기에서 나타나는 혼돈 현상'과 '오차의 폭증'은 지난 번에 포스팅한 '개인의 미시적 동기가 큰 변화를 일으킨다'와 연결됩니다. 위의 그래프는 미묘한 변화가 걷잡을 수 없는 커다란 결과로 나타남을 수학적인 이미지로 그려낸 것이기 때문입니다.

우리는 지구라는 '닫힌 계' 속에 비선형 방정식의 지배를 받으며 삽니다. 우주여행이 일상화되지 않은 한, 우리가 누릴 수 있는 자원은 한계가 있습니다. 통신수단의 발달로 상호작용이 활발해졌습니다. 그로 인해 작은 오차가 우리의 네트워크 속에 피드백되면 큰 파국(catastrophe)을 발생시킬 가능성이 존재합니다. 우리에게 놓인 불확실성이란 바로 이런 겁니다. 그리고 그 파국의 조짐은 등 뒤에서 우리를 늘 응시하고 있습니다.

위의 그래프는 아래의 Excel 파일에 있습니다. 여러 가지 조건으로 시뮬레이션 해보면 재미있을 겁니다. ^^



  
,