지난 번 글에서 상대방으로부터 좋은 인상을 얻어내려면 차가운 커피 대신에 뜨거운 커피를 대접하는 것이 유리하다고 이야기한 바 있습니다. 우리가 내리는 판단이 전혀 의식할 수 없는 것들에 의해 좌우되기 때문에 객관적인 판단이 사실상 어렵다는 점을 지적했습니다. 오늘은 지난 번 글의 후속편으로서 온도 뿐만 아니라 촉감이나 무게감 등도 판단에 상당한 영향을 미친다는 사실을 이야기할까 합니다.

MIT의 조슈아 애커만(Joshua M. Ackerman)과 동료들은 참가자들에게 어떤 후보의 역량을 평가하라고 하면서 평가지가 끼워진 클립보드를 나눠 주었습니다. 참가자들 중 절반은 무거운 클립보드(약 2 kg)를, 나머지 절반은 가벼운 클립보드(약 340 g)를 들고 평가에 임했는데, 무거운 클립보드를 사용한 참가자들이 후보자를 전반적으로 더 좋게 평가하는 경향이 발견되었습니다. 



이번엔 정부가 대기 오염 기준과 같이 사회적으로 매우 중요한 이슈와 공중목욕탕 규제처럼 그다지 중요하지 않은 이슈에 각각 예산을 배정한다면 어떻게 해야 하는지 참가자들에게 물었습니다. 역시 참가자들은 둘로 나뉘어 가벼운 클립보드와 무거운 클립보드를 사용해야 했죠. 그랬더니 남성과 여성이 다른 결과가 나왔습니다. 무거운 클립보드를 든 남성들이 가벼운 클립보드를 쓴 남성들보다 사회적으로 중요한 이슈에 더 많은 예산을 배정했습니다. 

반면, 여성들은 클립보드 무게와 상관없이 사회적인 이슈에 배정 가능한 최대의 예산을 부여했습니다. 상대적으로 남성이 손으로 느껴지는 무게감에 더 많은 영향을 받는다고 추측되는 결과입니다. 중요한 이슈에 관해 결재나 승인을 받아내야 하는 상대방이 남자라면, 무거운 물건을 들어달라고 부탁하는게 유리하지 않을까요? 

무게가 아니라 감촉은 판단에 어떤 영향을 미칠까요? 애커만은 참가자들에게 다섯 조각으로 된 퍼즐을 완성하도록 했는데, 참가자 중 절반에게는 매끈매끈한 원래 상태의 퍼즐을, 나머지 절반에게는 표면이 사포로 되어 있어 까끌까끌한 퍼즐을 나눠 주었습니다. 퍼즐을 끝낸 참가자들은 사회적인 관계를 표현한 글을 읽고 느껴지는 인상을 평가해야 했습니다. 그 결과, 거친 감촉을 느낀 참가자들은 부드러운 퍼즐을 사용한 참가자들보다 글에서 나타난 사회적 관계가 덜 조화롭다(어렵고 힘겹다)고 생각한다는 결과가 도출되었습니다. 

이번에는 복권을 사용하여 최후통첩게임을 하도록 하자 거친 퍼즐을 만졌던 참가자들이 게임 상대방에게 더 많은 복권을 제시하는 경향을 보였습니다. 거친 감촉이 상대방을 거친 사람으로 인식케 하여 참가자들로 하여금 더 많은 복권을 제시하도록 은연 중 유도했다는 의미입니다. 협상할 때 상대방으로부터 좋은 조건을 제시 받고 싶다면, 상사에게 좋은 평가를 받고 싶다면, 사전에 거친 사포를 만지게 하는 것이 유리할지 모릅니다.

딱딱하다는 느낌도 역시 판단에 영향을 미친다는 사실이 후속실험에서 밝혀졌습니다. 애커만은 마술사의 마술을 보고 비법을 추측해보라고 요청하면서 마술에 사용된 물건에 이상한 점이 있는지 참가자들에게 직접 만져보라고 했습니다그 후 참가자들은 상사를 대하는 부하직원의 성격을 평가해야 했는데, 딱딱한 나무 블럭을 만졌던 참가자들은 부드러운 천 조각을 만진 참가자들에게 비해 부하직원을 융통성 없고 엄격한 사람으로 평가하는 경향을 나타냈습니다.

이처럼 무게감은 중요성과 심각성에, 거침은 조화성에, 딱딱함은 융통성과 유연성에 대한 판단에 각각 상당한 영향을 미칩니다.애커만이 실행한 일련의 실험들은 손으로 느껴지는 여러 촉감들이 사람들로 하여금 어떤 대상을 은유적으로 나타내는 신호로 인식하도록 한다는 점을 분명하게 보여줄 뿐만 아니라, 인간의 판단이 객관적이기 어렵다는 또 하나의 증거를 제시합니다. 

객관적 판단이 불가능하다면 이제 '객관적'이라는 말의 정의를 바꾸거나 그저 갖다 붙이기 좋은 클리셰(cliche)에 불과한 말이라고 인식해야 할 겁니다. 여러분이 오늘 중요한 평가나 결재를 앞두고 있다면 상대방에게 어떤 촉감을 느끼게 해야 할지 곰곰이 생각해 보기 바랍니다. 그것도 전략입니다. 


  
,


손에 찬 것이 닿은 후와 뜨거운 것이 닿은 후에 어떤 사람에 대해 평가해 달라는 요청을 받았다면 여러분은 손에 느껴진 온도와 상관없이 그 사람의 성격이나 능력을 동일하게 평가할까요? 객관적인 평가가 가능하다고 믿는 사람은 그까짓 촉감이 무슨 영향을 미치겠냐며 무시하겠지만, 그렇지 않다는 연구 결과는 많습니다. 로렌스 윌리엄스(Lawrence E. Williams)와 존 바그(John A. Bargh)는 솔로몬 애쉬(Solomon Asch)가 수행했던 실험을 확장하여 흥미로운 실험을 진행했습니다(솔로문 애쉬는 동조 실험으로도 유명한 심리학자죠). 당초 애쉬는 사전에 느낀 차갑거나 따뜻한 촉감이 처음 본 누군가의 첫인상을 결정하는 데 중요한 영향을 미친다는 점을 실험으로 밝혔는데, 윌리엄스와 바그는 그러한 촉감이 미치는 영향을 정량적으로 측정하고자 했죠.

윌리엄스와 바그는 41명의 학부생들을 두 그룹으로 나눠 한 그룹에겐 손에 차가운 느낌이 전달되도록 하고 다른 그룹에게는 따뜻한 온기가 전해지도록 했습니다. 학생들은 실험장소가 있는 건물에 도착한 후 실험의 목적을 모르는 도우미의 안내를 받아 단 둘이 엘레베이터에 타야 했죠. 도우미는 양손에 아이스 커피(혹은 뜨거운 커피), 교과서, 클립보드를 들고 있었는데, 무언가를 하는 시늉을 하며 학생에게 커피를 잠깐 들어 달라고 학생에게 부탁했습니다. 그렇게 하여 학생의 손에 차갑거나 따뜻한 촉감이 느껴지도록 했죠.




실험장소에 앉은 학생들은 'Person A'라고 불리는 가상의 사람에 대한 자료를 읽고서 그 사람이 얼마나 지적이고 단호하며 조심스러운지 등과 같은 10가지 성격 특성을 평가하도록 요청 받았습니다. 그랬더니, 손에 따뜻한 커피를 잡았던 학생들이 차가운 커피를 쥐었던 학생들보다 Person A를 더 따뜻한 사람으로 평가하는 경향이 발견되었습니다. 이는 통계적으로 유의미했죠. 이로써 손에 느껴지는 온기처럼 무시하기 쉬운 것조차 다른 사람을 평가하는 데에 의미 있는 차이를 유발한다는 점이 증명됐습니다.

윌리엄스와 바그는 손에 느껴지는 촉감이 다른 사람에 대한 평가 뿐만 아니라 자기 자신의 '행동'에 어떤 영향을 미치는지 후속실험으로 알아보기로 했습니다. 하지만 첫 번째 실험 방식을 취하지는 않았습니다. 도우미로 참가한 사람이 비록 실험의 목적을 알지 못한 상태였지만 그도 차갑거나 뜨거운 커피를 들고 있었기에 알게 모르게 실험참가자에게 영향을 미쳤을 수도 있다고 의심했기 때문입니다. 찬 커피를 든 도우미는 학생들을 쌀쌀맞게 대하거나 뜨거운 커피를 쥔 도우미는 학생들을 친절하게 대함으로써 그 감정이 학생들에게 전달됐을지도 모르는 일이었죠. 그래서 후속 실험에서는 오직 실험참가자인 학생들만 차갑거나 뜨거운 물체를 잡도록 했습니다.

실험장소에 도착한 53명의 학생들은 두 그룹으로 나뉘어 각각 냉찜질팩과 온찜질팩을 손에 잡아보고 제품을 평가 해달라는 요청을 받았습니다. 제품 평가는 사실 위장하기 위한 것이었고 학생들의 손에 차갑거나 뜨거운 느낌이 전달되도록 하기 위함이었습니다. 그런 다음 실험진행자는 학생들에게 실험 참가에 대한 보상으로 두 가지 중 하나를 고르라고 했습니다. 학생들 중 절반은 자신이 마시기 위해 스내플(Snapple)이란 음료를 선택할지, 친구를 위해서 1달러 짜리 아이스크림 무료 쿠폰을 선택할지 결정해야 했죠. 반면 나머지 절반의 학생들은 친구에게 주기 위해 스내플 음료를 선택할지, 자신이 먹기 위해 1달러 짜리 쿠폰을 선택할지 역시 결정해야 했습니다.

손에 냉찜질팩을 잡았던 학생들 중 친구를 위한 상품을 선택한 사람은 25%에 불과했고 자신을 위한 보상을 선택한 사람은 75%나 됐습니다. 반대로, 손에 온찜질팩을 쥐었던 학생들 중 54%가 친구를 위한 상품을 택했고 46%는 자신에게 보상하겠다고 답했습니다. 손에 느껴진 온기가 어떠냐가 이타심과 이기심에 영향을 미쳤다는 결과였습니다.

비록 간단하지만 윌리엄스와 바그의 두 실험은 인간의 판단과 행동이 별것 아닌 듯 보이는 미묘한 것에 크게 영향을 받는다는 사실을 단적으로 보여줍니다. 이는 평가자의 감정 뿐만 아니라 평가자가 평가 전에 어떤 촉감에 '프라이밍(priming)'되느냐도 중요한 차이를 야기한다는 결과입니다. 동절기 때 동일한 모양의 두 사무실의 온도를 다르게 하면, 동일한 사람에 대한 평가가 큰 차이를 보일 거라고 추측할 수 있습니다.

아래의 동영상은 EBS에서 방영된 바 있는 '인간의 두 얼굴'이란 프로그램에서 발췌한 것인데, 위 실험과 비슷한 실험 결과를 담고 있습니다. 인간의 객관적 평가 능력은 미신이라는 생각이 들 겁니다.


혹시 지금 상사에게 평가 받거나 결재를 받아야 한다면, 혹은 누군가와 중요한 협상을 하기 전이라면 그에게 아이스 커피보다는 뜨거운 커피를 권하세요. 시원한 게 좋더라도 그렇게 하는 게 유리할지 모르니까요.


(*참고논문)
Experiencing Physical Warmth Promotes Interpersonal Warmth



  
,



어떤 IT회사에서 KY라고 불리는 가상의 컴퓨터 언어를 능숙하게 다를 줄 아는 프로그래머 1명을 채용하려고 합니다. 동일한 대학교의 전산학과 학사 학위를 가진 두 명의 지원자가 서류를 제출했는데, 그들의 이력서에는 각각 다음과 같은 정보가 씌여 있습니다.

지원자 A : 최근 2년간 KY 프로그램 70개 작성,  대학교 평점 3.0 (5.0만점)
지원자 B : 최근 2년간 KY 프로그램 10개 작성,  대학교 평점 4.9 (5.0만점)

여러분이 지원자의 연봉을 결정하는 위치에 있다면, 그리고 서류에 적힌 이 정보만을 가지고 A와 B에게 적당한 연봉을 정해야 한다면 어떻게 하겠습니까? 아마도 여러분 대부분은 지원자 A가 B보다 더 많은 연봉을 받을 자격이 있다고 생각할 겁니다. 충원하려는 직무가 요구하는 조건이 KY언어를 능숙하게 다루느냐의 여부이기 때문이겠죠. 대학교 때의 평점이 얼마인가는 그리 중요하지 않다고 생각할 겁니다. 어제 올린 포스팅에서 소개한 크리스토퍼 흐시가 112명의 실험참가자에게 2만 달러에서 4만 달러 사이에서 지원자 각각에게 얼마씩의 연봉을 줄 의향이 있는지를 물었을 때도 동일한 결과가 나왔습니다. 참가자들은 지원자 A에게는 33,200 달러를 주겠다고 했으나 지원자 B에게는 31,200달러의 연봉을 주겠다고 답했습니다.



하지만 지원자 A와 B를 비교 평가하도록 하지 않고, 지원자 각각을 독립적으로 평가하도록 하자 지급하고 싶은 연봉 수준이 뒤바뀌는 결과가 나왔습니다. 지원자 A의 연봉만을 가늠하도록 요청 받은 참가자들은 겨우 26,800달러를 주겠다고 했고, 지원자 B의 연봉만을 산정한 참가자들은 32,700달러를 지급하겠다고 답했습니다. 지원자끼리 서로 비교하지 못하게 하고 각각을 독립적으로 평가하도록 하자 지원자에게 느끼는 가치(즉 연봉)가 역전되고 만 것입니다.

왜 그럴까요? 흐시는 연봉에 대해 묻기 전에 참가자들에게 KY언어 프로그래밍 경력과 대학교 평점 중에서 무엇이 더 평가하기 쉬운 요소인지를 질문했습니다. 그랬더니 참가자들은  연봉을 결정하는 데에 평점이 더 쉽게 인지된다는 의견을 뚜렷하게 밝혔습니다. 평점은 0.0에서 5.0점 사이의 범위가 주어지는 반면, KY언어는 실체가 불문명한 프로그래밍 언어인데가 어느 범위의 경력이 적절한지 쉽게 인지되지 않기 때문이겠죠.

취할 수 있는 두 개의 대안을 따로 평가할 때 '선호'가 역전됐다는 이 실험의 결과는 사람들이 상대적으로 쉬운 척도에 가중치를 더 많이 부여하는 경향이 있음을 우리에게 일러줍니다. 두 가지의 평가 요소 중 분명히 KY언어가 더 중요함에도 불구하고 다른 대안(여기서는 다른 지원자)이 비교 대상으로 제시되지 않으면 쉽게 인지되는 요소(여기서는 평점)를 더 중요시하는 모순이 발생하는 것입니다.

물론 서로 비교하지 않고 모든 직원을 독립적으로 평가하는 경우(한 사람의 평가자가 오직 한 사람의 피평가자를 평가하는 경우)는 그리 많지 않습니다. 그렇다고 모든 평가 요소를 가지고 모든 직원들을 완벽하게 비교 평가하는 경우도 드뭅니다. 현실에서 벌어지는 평가는 두 극단 사이에 어딘가에 위치하죠. 상대적으로 중요한 평가 요소가 상대적으로 낮은 가중치를 가진 채 평가될 우려가 없다고는 말할 수 없습니다. 특히 어떤 직무를 수행하는 직원이 오직 1명이거나, 그 직무에 둘 이상이 존재해도 서로를 비교 대상으로 삼기 어려운 경우에는 위 실험에서 나타난 '가중치 절하' 현상이 뚜렷하게 나타날 가능성이 큽니다.

어제 올린 포스팅에서는 상사의 기대를 충족시키지 못하는 직원의 성과가 비록 절대적으로 볼 때 더 우수하더라도 자신의 역량 이상의 성과를 내는 직원의 성과보다 낮은 평가를 받을 수 있다는 점, 더 우수한 성과를 보이는 직원에게 결점으로 느껴지는 무언가가 있다면 그 직원의 성과를 평가절하할 위험이 있다는 점을 지적했습니다. 오늘의 글은 직무 수행에 상대적으로 더 중요한 요소임에도 불구하고 쉽게 평가하기 어렵다는 이유만으로, 쉽게 머리 속에 '박히지 않는다'는 이유만으로 '가중치 절하' 효과를 일으킨다는 것으로 정리됩니다. 이것 역시 객관적인 평가가 얼마나 요원하고 불가능한 일임을 보여주는 또 하나의 증거입니다. 

평가하기 어려운 요소(실력, 경력, 잠재력 등)로 올바로 평가 받지 못한 채 평가가 쉬운 요소(출신 학교나 학점, 외모, 소문, 사적인 의견 등)에 의해 나쁘게 평가 받는 일, 여러분의 조직에는 과연 없습니까?


(*참고 논문)
The Evaluability Hypothesis: An Explanation for Preference Reversalsbetween Joint and Separate Evaluations of Alternatives



  
,



여러분은 지금 아주 더운 여름날에 아이스크림 가게 앞에 서 있습니다. 그 가게는 오직 한 종류의 아이스크림을 두 가지 용량으로 판매합니다. 하나는 10온스 짜리 컵에 8온스의 아이스크림이 담겨져 있고, 다른 하나는 5온스 짜리 작은 컵에 7온스의 아이스크림이 컵보다 높게 가득 담겨져 있습니다. 아래의 그림처럼 말입니다.
 

(출처 : Less Is Better: When Low-value OptionsAre Valued More Highly thanHigh-value Options )



누군가가 여러분에게 이렇게 묻습니다. "두 개의 아이스크림을 구입한다면 각각 얼마에 살 용의가 있습니까?" 큰 컵에 아이스크림이 가득 담기지 않았지만 용량으로 보면 작은 컵보다 많기 때문에 큰 겁에 컵에 더 많은 돈을 지불하는 것이 당연하겠죠. 크리스토퍼 흐시(Cristopher Hsee)가 실시한 이 실험에서 미국 중서부에 위치한 모 대학교 학생들은 큰 컵에 평균 1.85달러를 지불하고 작은 컵에는 평균 1.56달러를 지불하겠다고 답했습니다.

하지만 흐시가 두 개의 아이스크림을 함께 보여주지 않고, 한 그룹의 학생들에게는 큰 컵을 제시하고, 다른 그룹에게는 작은 컵만을 보여준 다음 가격을 매겨보라고 요청하자 반대의 결과가 나왔습니다. 큰 컵만을 본 학생들은 평균 1.66달러를 내겠다고 말했으나 작은 컵만을 본 학생들은 평균 2.26달러를 지불할 용의가 있다고 답했습니다. 두 아이스크림을 함께 보며 비교할 때는 아이스크림 양에 따라 가격을 적절하게 정했지만, 둘 중 하나만의 가격을 독립적으로 매길 때는 남은 공간 없이 아이스크림이 가득 담겨져 있는가라는 느낌에 영향을 받았습니다. 큰 컵에 존재라는 '빈 공간'이 가치를 절하시키는 효과를 일으킨 겁니다.

함께 평가할 때(joint evaluation)와 따로 평가할 때(separate evaluation)의 결과가 다르다는 사실은 흐시가 실시한 추가 실험에서도 나타났습니다. 흐시는 두 가지 종류의 식기 세트를 실험참가자들에게 제시했습니다. 24개의 용기로 구성된 A세트에는 큰 접시 8개, 샐러드 그릇 8개, 디저트용 접시 8개가 있었고, B세트에는 여기에 8개의 컵과 8개의 받침접시가 더 포함되어 있었습니다. 그런데 B세트에 있는 8개의 컵 중 2개가, 8개의 받침접시 중 7개가 깨진 것들이었습니다. 두 개의 세트를 구입한다면 얼마를 지불할 용의하겠냐는 질문에 실험참가자들은 A세트에 29.70달러를, B세트에 32.03달러를 지불하겠다고 답했습니다. B세트에 깨진 용기들이 포함돼 있긴 하지만, 온전한 용기가 31개나 되기 때문에 A세트보다는 더 많은 돈을 지불하는 게 당연하겠죠.

하지만 A세트와 B세트를 각각 따로 보고 가격을 매긴 실험참가자들은 A세트에는 32.69달러를, B세트에는 23.25달러를 지불하겠다고 답했습니다. A세트보다 B세트의 가격을 거의 10달러나 절하시킨 이유(즉 선호가 역전된 이유)는 아이스크림 실험에서 큰 컵의 빈 공간과 마찬가지로 온전한 그릇들의 가치에 집중하기보다는 깨진 그릇들이 일으키는 불편한 느낌에 판단이 좌우됐기 때문일 겁니다. 비교 대상이 없을 때, 즉 단독으로 평가 받을 때는 '더 적은 것이 더 좋은 것이다'라는 결론을 얻을 수 있습니다.

흐시의 실험 결과로부터 우리는 여러 가지 시사점을 얻을 수 있습니다. 첫 번째는 소비자로부터 제품의 가치를 정당하게(혹은 실제보다 더 크게) 인정 받으려면 '아이스크림의 빈 공간'이나 '깨진 그릇'과 같은 부분이 소비자에게 인식되지 않도록 해야 한다는 점입니다. 또한 여러 개의 개별 상품을 하나로 묶어 팔 때 더 많은 종류의 '그저 그런' 상품을 끼워 판다고 해서 소비자들이 큰 가치를 느끼지 못한다는 것도 유추할 수 있죠. 끼워팔기 상품은 오히려 세트의 가치를 떨어뜨리고 소비자들에게 덜 선택되도록 만들 뿐만 아니라 전체적으로 이익을 갉아먹는 요인이 될지도 모릅니다. 판촉 활동 시에 이 점을 염두에 둘 필요가 있습니다.

두 번째 시사점은 직원의 역량과 성과를 평가할 때 의도하지 않았는데도 오류를 일으킬 수 있다는 점입니다. 아이스크림 실험의 큰 컵처럼 잠재력이 크지만 실제로 드러내는 역량과 업적이 그 잠재력에 미치지 못하는 직원들을 낮게 평가할지 모릅니다. 물론, 평가자는 직원 개개인을 완전히 독립적으로 평가(절대평가)하지 않고 다른 직원들과 어느 정도 비교(상대평가)를 하기 때문에 아이스크림이 더 많이 담긴 큰 컵의 가격을 낮게 매긴 경우와 완전히 동일하지는 않겠죠. 그러나 더 해낼 수 있는 잠재력을 100퍼센트 발휘하지 못하는 직원이거나, 예년에 비해 성과가 뚝 떨어진 직원에게 평가자들은 불편한 감정을 갖지 쉽고 그에 따라 평가를 실제 받아야 할 수준보다 박하게 줄 가능성이 있습니다. 

반대로, 기대하지 않았던 직원이 놀랄 만한 성과를 이번에 나타냈다면(작은 컵에 넘치도록 담긴 아이스크림처럼) 그 자체가 '기특하고 기쁜' 일이라 평가를 후하게 줄지도 모릅니다. 절대적으로 보면 전자의 직원이 후자의 직원보다 더 높은 성과를 나타냈더라도 말입니다.

식기 세트 실험에서 더 많은 그릇이 포함된 세트의 가격이 깨진 그릇 몇 개 때문에 가치가 절하된 것에서도 인사평가의 오류 가능성을 짐작할 수 있습니다. 더 나은 성과를 달성하고 더 뛰어난 역량을 발휘하더라도 평가자인 팀장과 인간적으로 관계가 좋지 않다든지, 다른 직원들과 쉽게 어울리지 못한다든지, 자기 주장이 강해 논쟁을 자주 일으킨다든지와 같은 몇 가지 단점들이 옳은 평가를 어렵게 만들지 모릅니다. 

평가의 객관성은 과연 달성 가능한 일일까요? 역량이 뛰어난 직원이 평가절하되고 반대로 역량이 보통인 직원이 평가절상될지 모른다는 시사점을 전달하는 흐시의 실험은 평가의 객관성은 환상이고 이제는 버려야 할 유물이라는 주장에 또 하나의 방점을 찍습니다. 여러분은 어떻게 생각합니까? 


(*참고 논문)
Less Is Better: When Low-value OptionsAre Valued More Highly thanHigh-value Options



  
,



이스라엘의 심리학자 샤이 댄지거(Shai Danziger)는 수감자의 가석방 여부를 결정하는 심사관들이 내린 의사결정 패턴을 살펴보던 중 재미있는 사실을 발견했습니다. 바로 밥을 언제 먹었느냐가 가석방 신청을 통과시키느냐 기각시키냐에 영향을 미친다는 것이었습니다. 그것도 아주 뚜렷하고 지대하게 말입니다. 댄지거가 8명의 가석방 심사관들이 내린 1112건의 심사건을 수집해보니, 한 명의 심사관은 하루 동안 14건에서 35건 정도(평균 22.6건)를 심리했고, 하나의 신청건에 대해서 가석방 여부를 결정하는 데에 평균 6분 정도의 시간을 소요했습니다.

또한 심사관들은 심리를 진행하다가 두 번의 식사 겸 휴식 시간을 가졌습니다. 아침 일찍부터 심리를 진행하다가 9시49분에서 10시27분 사이에 새참을 먹고, 12시46분에서 2시10분 사이에 점심식사를 했죠. 새참을 먹기 전에 심리관들은 평균적으로 7.8건의 심리를 진행했고, 새참을 먹고 점심을 먹기 전까지는 11.4건의 신청건을 처리했습니다. 심리관들은 전체적으로 가석방 신청의 65% 정도를 기각했습니다.




댄지거는 1112건의 가석방 신청건들을 심리 받은 시간대별로 정렬하고 승인 비율이 얼마나 되는지 따져보았습니다. 그랬더니 어느 시간대에 심리를 받느냐가 승인과 기각 여부를 결정하는 중요한 변수였습니다. 아침에 처음 심리를 받거나 식사시간 후에 바로 심리를 받는 가석방 신청건들은 평균적으로 65%의 승인률을 기록했지만, 시간이 흐를수록 승인률은 뚝뚝 떨어지는 패턴이 발견됐습니다. 그렇게 승인률이 급감하다가 식사시간에 임박해서는 승인률이 거의 0으로 떨어져 버렸습니다.

또한, 식사시간 직후에 심리한 최초의 3건과 식사시간이 임박할 때 처리한 마지막 3건을 비교하니 전자의 경우엔 52~61%의 승인율을, 후자의 경우에는 9~27%의 승인율을 보였습니다. 아이러니하게도 운이 좋게 아침에 제일 먼저 심리를 받거나 식사시간 후에 바로 심리를 받는 수감자들은 가석방 승인을 받을 가능성이 상당히 높지만, 식사할 시간에 임박할 때 자신의 가석방 여부를 심리 받는 수감자들은 가석방될 확률을 기대하지 말아야 한다는 의미였죠. 

심사관들은 스스로 가석방 승인 기준에 따라 엄격하게 판단을 내린다고 생각할지 모르지만, 자신들의 피로도와 혈당 수치가 가석방 승인률에 지대한 영향을 미친다는 사실을 인정할 수밖에 없었죠. 가석방을 결정짓는 중요한 요소로서 죄질의 높고 낮음, 수감 태도, 수감자의 교정 정도 등은 '밥'에 비하면 별것 아니었습니다. 정의(Justice)와는 한참 거리가 먼 '밥'이라는 요소가 심리에 영향을 끼친다는 것은 참으로 아이러니한 일이죠.

가석방 심사관들의 '휴식 및 식사' 여부가 의사결정의 중요한 변수라는 댄지거의 연구를 기업의 관점에서 해석하면, 회사 내에서 벌어지는 여러 종류의 심사, 평가, 승인은 대상이나 내용의 본질보다는 참석자의 피로도와 배고픔 정도에 따라 좌지우지될지 모른다는 걸 추측할 수 있습니다. 휴식과 식사시간 후에 처음 면접하는 입사지원자들은 높은 합격률을 보이고, 운이 없게 식사시간이나 퇴근시간에 임박할 때 면접관을 만난 지원자들은 어쩌면 실력과는 무관한 '밥(즉 혈당)'이라는 요소 때문에 불행하게도 떨어질지 모릅니다(지원자 데이터가 충분한 회사에서 댄지거의 연구와 비슷한 분석을 해보면 어떨까 제안해 봅니다). 매년 벌어지는 인사평가도 상사가 지금 얼마나 피곤한가, 얼마나 배가 고픈가에 따라 부하직원의 실력과는 별개로 관대하게 혹은 가혹하게 평가가 이루어질 수 있습니다.

'밥' 뿐만 아니라, 의사결정 사항과는 아무런 관계가 없는 정보가 판단에 지대한 영향을 끼친다는 연구 결과는 상당히 많습니다. 독일의 연구자들은 법률 전문가들에게 범죄를 저지른 사람의 형량을 개별적으로 판단하라고 요청하기 전에 한 그룹의 전문가들에게는 1과 2만 나오는 주사위 한 쌍을, 다른 그룹에게는 3과 6만 나오는 주사위 한 쌍을 던지게 했습니다. 두 개의 주사위 숫자를 합하면, 3이나 9를 얻게 되겠죠. 주사위를 던진 후에 범죄자의 형량이 주사위 숫자 합보다 큰지 작은지를 물었습니다. 그리고 최종적으로 형량을 정하게 했죠.

법률 전문가들이 제시한 형량은 1개월부터 12개월까지 다양하게 분포했는데, 숫자의 합이 3인 주사위를 던진 그룹은 평균 5.28개월, 9인 주사위를 던진 그룹은 평균 7.81개월의 형량을 내렸습니다. 주사위 숫자라는 정보는 형량에 아무런 관련이 없음에도 불구하고 이런 차이가 나왔다는 사실은 전문가들의 의견을 취한다고 해도 객관성을 담보하지 못함을 시사합니다.

사람들은 보통 누군가를 평가하거나 의사결정을 내릴 때 대상의 본질을 객관적으로 판단한다고 자신하는 경향이 있습니다. 대상의 본질과는 아무 상관 없는 상황의 조건들이 평가나 의사결정에 큰 영향을 끼친다는 사실을 인식하지 못합니다. 그러나 배가 부르거나(피 속의 혈당이 충분하거나) 정신이 맑을 때는 과감하거나 관대한 결정을, 배가 고프거나 어깨가 처지며 피로가 업습할 때는 현상을 유지하려는 성향이 발동하여 새로운 사안을 거부하거나 '까칠하게' 평가하는 경향이 있음을 부정해서는 안 됩니다. 평가나 의사결정의 객관성은 지표와 판단기준이 아무리 정교할지라도 사실상 불가능한 일입니다.

혹시 지금 무언가를 평가 받거나 결재를 받는다면, 의사결정자에게 이렇게 말하면 어떨까요? "밥 먹고 합시다!" 예상보다 좋은 평가를 받거나 결재를 빨리 받을지 모르는 일이니까요.

(*참고논문 : Extraneous factors in judicial decisions )
(*참고논문 : Playing Dice With Criminal Sentences )

 

  
,



여러분들은 자기 자신을 얼마나 객관적으로 평가합니까? 그리고 다른 사람을 얼마나 옳게 평가할 수 있습니까? 만일 자신이나 타인에 대한 평가가 잘못됐음을 깨달았을 경우, 그 잘못된 평가를 깨끗이 지워내고 제로 베이스에서 다시 평가를 할 수 있다고 자신합니까? 사람(자신이나 타인)에 대한 가졌던 처음의 인상이나 견해는 부족하거나 부정확한 정보에서 비롯되었음을 알기에 그 후에 추가로 얻는 정보를 가지고 수정해 갈 수 있다고 믿습니까?

그런 믿음이 모래 위에 지은 집과 같음을 알려주는 실험이 있습니다. 리 로스(Lee Ross) 등 3명의 심리학자들은 자기 자신과 타인에 대한 인식의 오류가 얼마나 끈질지게 지속되는지의 여부를 실험을 통해 규명했습니다. 그들은 스탠포드 대학교에 다니는 144명의 여학생들을 피실험자로 모집한 다음, 무작위로 '수행자(actor)'와 '관찰자(observer)'의 역할을 부여했습니다.



연구자들은 72명의 '수행자'에게 25개 세트로 구성된 '자살 노트(suicide note)'를 읽도록 했습니다. 자살 노트란 자살을 감행한 사람들이 일을 저지르기 전에 남긴 글을 말하는데, 한 세트의 자살 노트에는 실제의 것과 가상의 것이 각각 하나씩 적혀 있었습니다. '수행자'들은 그것들을 읽어본 후에 그 중에서 무엇이 실제의 것인지 알아 맞혀야 했습니다.

수행자들은 25개 세트를 읽으면서 연구자들에게 자신의 답을 제시했지만 그가 무엇을 답하든지 결과는 이미 정해져 있었습니다. 수행자의 실력과 관계없이 잘 맞히는 사람과 못 맞히는 사람을 미리 정해 놓았던 겁니다. 연구자들은 25개 중 24개 이상을 맞히는 경우를 '우수한 수행자'로, 25개 중 10개를 맞히는 경우를 '저조한 수행자'로 설정했죠.

이렇게 과제를 끝마치고 난 후에 연구자들은 수행자들에게 '향후에 이런 과제를 다시 수행하게 되면 정답률이 어느 정도 될 것 같은가'라고 질문을 던졌습니다. 그랬더니 '우수한 수행자'들은 21개 이상을 맞힐 수 있다고 자신한 반면, '저조한 수행자'들은 11개 정도만 맞힐 수 있을 거라 답했습니다. 또한 실제의 자살 노트를 알아맞힐 수 있는 자신의 능력을 7점 척도로 평가해 보라고 하자 '우수한 수행자'는 5.25로, '저조한 수행자'는 2.58로 평가했습니다. 이와 같은 결과는 연구자들이 무작위하게 설정한 결과를 자신의 실력으로 오인한다는 점을 분명하게 보여줍니다.

하지만 이보다 더 흥미로운 것은 그 후에 벌어졌습니다. 연구자들은 자살 노트의 진위 여부를 가리는 실력과 상관없이 무작위로 우수한 수행자와 저조한 수행자를 배정했노라고 실험의 진실을 밝혔습니다. 자살 노트의 진위 여부에 대한 평가가 의미 없음을 분명히 알린 것이죠. 연구자들은 수행자들에게 자살 노트를 알아맞힐 수 있는 능력을 평가하라고 설문을 돌렸습니다. 그랬더니 우수하다는 평가를 들은 수행자들은 5.00, 저조하다는 평가를 들은 수행자들은 3.83으로 자신을 평가했습니다. 연구자들이 거짓으로 실력을 알려줬음을 고백했는데도 여전히 자신의 실력을 평가하는 데에 영향을 받고 있다는 점을 보여주는 결과입니다.

더욱이 연구자들은 이 실험의 목적이 다른 사람의 평가로 인해 자기 자신에 대한 잘못된 인식이 얼마나 오랫동안 지속되는지를 알아보기 위한 것이라고 더욱 자세히 설명했음에도 불구하고 그런 경향은 (약해지긴 했지만) 계속 남아 있었습니다. 실력에 대한 신념이 얼마나 강하게 지속되었는지 우수하다는 평가를 들은 수행자는 4.75로, 저조하다는 평가를 들은 수행자는 3.83으로 자신의 실력을 평가했으니 말입니다.

리 로스 등의 연구자들이 수행자들을 대상으로 이런 실험을 진행할 때, 관찰자(observer)로 참여한 학생들은 수행자들이 과제를 수행하는 과정을 지켜볼 수 있었습니다. 연구자들이 관찰자들에게 수행자의 실력을 평가하라는 설문을 돌렸을 때, 관찰자들은 우수한(우수하다고 평가 받은) 수행자들의 능력을 5.67로, 저조한 수행자들의 능력을 3.83으로 평가했습니다. 연구자들이 거짓으로 우수한 수행자들과 저조한 수행자를 배정했기에 이것은 당연한 결과입니다. 연구자들이 관찰자들에게도 동일하게 실력과 상관없이 무작위로 '우수와 저조' 여부를 배정한 것이라고 실험의 진실을 밝히고 나서도 그런 경향은 지속됐습니다. 실험의 진짜 목적을 소상하게 밝히고 나서도 마찬가지였죠. 타인의 능력을 평가할 임무를 맡은 관찰자들도 연구자들이 무작위로 설정한 '우수와 저조' 여부에 여전히 묶여 있었다는 의미입니다.

자신 혹은 타인에 대해 최초로 가졌던 인상이나 견해가 시간이 흘러도 계속 지속된다는 점, 더욱이 그 인상이 거짓으로부터 나왔음을 안다 해도 처음 가졌던 인상(혹은 견해)이 사라지지 않는다는 점을 이 실험이 극명하게 시사합니다. 우리는 처음에 가진 인상이나 견해에 반대되는 증거를 수도 없이 접하면서도 자신의 신념을 웬만하면 바꾸지 않으려 합니다. 자살 노트의 진위 여부를 가리는 능력과 같이 어찌보면 별것 아닌 것에도 그런 경향이 매우 강합니다. 

사람들은 신념과 반대되는 증거가 나타나도 그것을 보지 않으려 합니다. 자신의 판단을 뒷받침해 주는 증거만 받아들이고 그 증거를 통해서 자신의 신념을 발전시킵니다. 반대되는 증거라도 자신의 신념에 맞게 다시 재단하거나 왜곡하여 해석하기도 합니다. 그리고 신념에 부합되는 증거만 선별적으로 기억함으로써 반대되는 증거를 아예 기억조차 못하는 경우도 많죠. 또한 반대되는 증거에 따라 자신의 신념을 바꾼다는 것이 자존심을 훼손하는 일이라 여겨서 잘못된 신념을 고집하기도 합니다.

자신과 타인에 대한 견해가 선입견, 첫인상, 최초의 평가 등에 의해 좌우되고 그것이 꽤 오랫동안 지속된다는 점은 인사 평가로 인해 발생하는 팀장과 부하직원들 사이의 갈등에 불씨로 작용합니다. 애초에 '나는 이런이런 능력이 뛰어나(혹은 부족해)' 그리고 '저 사람은 이런이런 능력이 뛰어나(혹은 부족해)'라는 인상을 가지게 되면 신념으로 이어지고 서로에 대한 평가가 충돌되기 쉽습니다. 예를 들어 팀장이 A라는 부하직원의 프레젠테이션 역량이 별로 좋지 않다는 견해를 한번 가지게 되면 A가 제아무리 뛰어난 프레젼테이션 실력을 보여주더라도 무의식적으로 잘하는 점보다도 잘못하는 점만을 집어내려 할 겁니다. A가 프레젠테이션을 잘하지 못하는 그럴싸한 이유를 찾으려 할 겁니다.

팀장과 부하직원이 자기 자신이나 타인에게 가지는 최초의 견해가 잘못된 정보로부터 비롯됐을 수 있고 한번 굳어진 견해가 매우 오랫동안 지속된다는 점을 순순히 인정하는 수밖에는 없습니다. 평가지표를 정교화하고 계량화한다고 해서 해결될 문제는 결코 아닙니다. 오히려 계량적 지표는 신념을 강화하고 잘못된 신념을 정당화하는 수단일 뿐입니다. 서로 대화를 나누면서 잘못된 견해를 희석시키려는 적극적인 노력 없이는 객관적인 평가란 또 하나의 미신입니다.


(*참고논문 : Perseverance in Self-Perception and Social Perception )
 


  
,



여러분은 평소 가지고 있는 신념이나 지식과 반대되는 결과를 접할 때 어떤 반응을 보일까요? 그 반하는 결과가 그냥 제시된 것이 아니라 엄정한 과학적인 방법을 통해 나온 것이라면, 여러분은 자신의 신념을 버리거나 의심하게 될까요, 아니면 여전히 믿음을 고수할까요? 우리는 보통 '나는 객관적인 사람이야'라고 스스로를 평가합니다. 그래서 철저한 조건과 방법을 통해 산출된 객관적인 결과는 선입견이나 고정관념 없이 수용할 수 있다는 생각을 하곤 합니다. 무엇이든 포용할 수 있는, 너그러운 사람이라고 자신을 평가하죠. 하지만 과연 그럴까요?

마이클 마호니(Michael J. Mahoney)라는 학자는 교묘한 실험을 실시함으로써 '나는 객관적인 사람이야'라고 자평하는 사람들의 믿음이 얼마나 취약한지, 자신이 평소 가지고 있는 신념이 사물을 객관적으로 바라보는 데 얼마나 영향을 미치는지 알아보기로 했습니다.



마호니가 실험 대상으로 삼은 자들은 75명의 행동주의 심리학자들이었습니다. 행동주의 심리학이란 간단히 말해서 어떤 외부 자극(보상과 처벌 등)을 지속적으로 가하면 원하는 행동을 이끌어낼 수 있고 원하는 행동 패턴을 강화하고 유지할 수 있다고 믿는 심리학의 분파입니다. 쥐로 하여금 지렛대를 눌러 먹이를 먹도록 훈련시킨 B. F. 스키너가 행동주의 심리학을 대표하는 학자였죠.

마호니는 75명의 행동주의 심리학자에게 학술지에 게재될 예정인 논문 하나를 읽고 그 논문의 질과 학술잡지 게재 여부를 평가하도록 했습니다. 그 논문에는 아이들에게 나무 퍼즐 놀이와 책 읽기를 할 때 보상을 하느냐에 따라 그 두 가지 활동에 아이들이 계속 흥미를 느끼는지의 여부를 실험한 내용이 담겨 있었습니다.

만약 그 논문이 보상을 통해 두 가지 활동에 대한 흥미가 계속 유지됐다는 결과를 담고 있다면, 행동주의 심리학자들에게는 '마음에 쏙 드는' 논문일 겁니다. 반대로 보상이 오히려 놀이에 대한 아이들의 흥미를 떨어뜨린다는 논문이라면 행동주의 심리학자들의 심기는 꽤 불편하겠죠? 허나 그 논문은 엄밀한 데이터를 담고 있기에 실험 대상자인 행동주의 심리학자들은 아무리 마음에 안 드는 내용이더라도 그 논문을 객관적으로 평가해야 합니다. 과학자로서 지성과 양심이 있다면 말입니다.

마호니는 동일한 주제와 동일한 실험 방법을 담았지만 실험 결과가 다르게 조작된 5가지 버전의 논문을 만들었고, 심리학자들을 5개의 그룹으로 나누었습니다. 그런 다음, 각 그룹에게 5가지 버전 중 하나를 읽고 논문의 질과 잡지 게재 여부를 평가하여 45일 안에 보내 달라고 요청했습니다. 예를 들어, 1그룹에게는 행동주의 심리학을 뒷받침하는 논문을 보냈고, 2그룹에게는 데이터만 살짝 바꿔 상반되는 내용의 논문을 보냈던 것이죠(나머지 3개 그룹은 비교 목적으로 설정. 자세한 사항은 이 글 맨 아래의 참고논문 참조). 

수거된 행동주의 심리학자들의 평가 결과는 전문가들도 '믿고 싶은 것만 믿는다'는 보통 사람들의 편향에서 자유롭지 못하다는 점을 뚜렷하게 나타냈습니다. 동일한 실험 방법론을 적용한 논문이기에 객관적인 눈을 가진 학자라면 편견 없이 두 가지 논문을 거의 비슷한 점수로 평가해야 옳습니다. 하지만 현실은 그렇지 않았습니다.행동주의 심리학자들은 자신들의 견해와 일치하는 논문은 높게 평가하고 학술지에 게재해도 무난한 수준이라 평했습니다. 하지만 자신들의 믿음과 상반되는 논문은 질이 낮고 실험 방법에도 문제가 있으며 학술지에 게재하면 안 된다는 의견을 나타냈습니다.

마호니의 실험으로부터 우리는 전문가들이 무언가를 평가할 때 자신이 가지고 있는 주관적 편향이 강하게 개입한다는 결론을 이끌어낼 수 있습니다. 믿는 것만 보이고 믿는 것만 믿는다는 '확증 편향'은 보통 사람들보다 한 분야의 지식과 경험의 수준이 높은 전문가들에게도 만연된 현상이라는 점을 느끼게 합니다. 객관적인 판단이라는 것이 얼마나 달성 불가능한 목표인지 실감케 합니다.

알게 모르게 확증편향에 좌우된다면 우리가 내리는 판단이나 평가가 얼마나 취약한지 반성할 필요가 있습니다. 그리고 한번 내려진 평가를 고수할 것이 아니라 '내 판단에 무슨 문제는 없는가? 나의 주관성이 개입되지 않았나?'라는 질문을 통해 수정해 가야 합니다. 또한 '나는 객관적인 사람이다'라며 자신감을 보이는 사람의 말을 한번 정도는 걸러서 들어야겠죠. 오히려 '나는 결코 객관적이지 못하다'는 인식을 가져야 합니다. 자신의 판단을 되돌아볼 때 비로소 주관적 편향에서 벗어나 객관적 판단으로 한걸음 더 나아갈 수 있죠.

상사가 부하직원의 성과와 역량을 평가할 때, 신사업의 타당성을 평가할 때, 새로운 제도와 시스템을 도입할 때, 확증편향은 도처에서 우리의 객관적 판단에 검은 안대를 씌웁니다. 그 검은 안대는 벗기려 해도 절대 벗겨지지 않습니다. 앞이 보이지 않는 이런 상황에서 어떻게 행동하는 것이 현명할까요? '이쪽으로 가는 게 맞으니' 한 방향을 정해서 뚜벅뚜벅 걸어 가야할까요, 아니면 조금씩 앞을 더듬으며 나아가야 할까요? 후자의 행동이 확증 편향이라는 검은 안대의 방해로부터 우리의 판단을 보호할 수 있는 최선의 방법일 겁니다.

(*참고논문 : Publication Prejudices: An Experimental Study of Confirmatory Bias in the Peer Review System )



  
,