면접관의 능력을 믿지 마라   

2012. 3. 14. 10:43



노벨 경제학상을 수상한 심리학자 다니엘 카네만이 아직 햇병아리 심리학자였던 1955년의 일이었습니다. 당시 21살이었던 그는 심리학 학사 학위를 취득하자마자 이스라엘 군에 배속되어 지원병들을 대상으로 한 '적성 인터뷰'를 총괄하게 되었습니다. 어떻게 보면 이 임무는 대학을 갓 졸업한 햇병아리에게 맡기기엔 중책이었지만 1955년은 이스라엘이 새로 건국한지 겨우 7년 밖에 안 된 터라 카네만 같이 심리학 학사 학위 밖에 없는 사람조차 중용될 수밖에 없었죠.

그가 담당한 적성 인터뷰의 목적은 심리적 측정 테스트와 면담을 통해 지원병들의 특성을 파악하고 전투 임무를 수행하기에 적정한지를 평가하기 위함이었습니다. 이런 과정을 통해 지원병 개개인이 보병, 포병, 장갑병 등과 같은 병과(兵科)에 얼마나 적합한지 점수를 매겨야 했죠. 먼저 카네만은 대부분 젊은 여성으로 구성된 인터뷰어 그룹을 조직하여 몇 주 동안 인터뷰에 관련한 교육을 실시했습니다. 인터뷰는 지원병 1명 당 15~20분 정도 소요하기로 했는데, 지원병이 군대에서 얼마나 적응을 잘 할지에 관한 전반적인 인상을 파악하는 데 초점이 모아졌습니다.



그러나 이 시도는 거의 효과를 거두지 못했다고 카네만은 후에 자신의 책 'Thinking, Fast and Slow'에서 밝힙니다. 지원병이 군대에서 얼마나 임무를 잘 수행할지를 예측하는 데에 인터뷰는 아무런 도움이 되지 못했던 겁니다. 카네만은 이런 상황을 시정하라는 독촉을 받았지만 인터뷰 방식을 개선하기 위한 충분한 시간은 주어지지 않았습니다. 주변의 아랍국가와의 '2차 중동 전쟁'을 앞두던 때였기 때문입니다. 햇병아리 심리학자로서는 아주 난감한 상황이었겠죠.

고심을 거듭하던 카네만은 폴 밀(Paul Meehl)이 쓴 'Clinical vs. Statistical Prediction'이란 책을 1년 전에 읽었다는 것을 기억해 냅니다. 그 책에서 밀은 통계적 공식을 기반으로 한 판단이 직관적인 판단보다 우수함을 여러 가지 증거로 증명해 보였습니다. 예를 들어, 전문 면접관들로 하여금 대학교 신입생을 45분간 인터뷰하여 그 해 말의 성적을 예상하도록 하는 연구가 있었습니다. 물론 면접관들에게 각 학생의 고등학교 성적, 적성검사 결과, 자기소개서 등이 주어졌죠. 허나 그들의 예측력은 실망스러운 수준이었습니다. 단순하게 신입생의 고등학교 성적과 적성검사 점수만 가지고 공식을 만들어 예측한 결과보다 못했기 때문입니다. 통계 공식을 통한 예측은 14명의 면접관 중 11명의 것보다 더 정확했습니다. 

카네만은 밀의 연구로부터 인터뷰 개선의 방향을 명확히 정할 수 있었습니다. 인터뷰어에게 주관적 판단을 폭넓게 인정한 것이 실패의 원인이었고 그들의직관적인 판단이 개입될 여지를 최소화할 '공식'을 찾아 적용하는 것이 문제의 해법이었던 겁니다. 인터뷰어가 개인적으로 무엇에 더 관심을 두고 무엇에 더 많은 흥미를 느끼느냐에 따라 예측의 결과가 왜곡될 가능성이 높았기 때문이죠. 그는 지원병의 특성을 '책임감', '사회성', '남성으로서의 자존심' 등 6개의 항목으로 구분하여 항목별로 구조화된 질문을 설계한 다음, 인터뷰어들이 각 항목을 독립적으로 평가하도록 절차를 변경했습니다. 그리고 지원병을 어느 병과에 배속시킬지를 최종 결정하는 권한은 인터뷰어들에게 허용하지 않고 오직 각 항목의 점수들을 합산하여 결정하는 방식을 취했습니다.

인터뷰어들은 자신들의 권한이 사라지는 데 대해 약간 반발하긴 했지만, 이렇게 개선된 방법은 확실히 효과가 있었습니다. 인터뷰가 끝나고 몇 개월 후에 지원병이 배속된 각 지휘본부의 평가 기록을 살펴보니, 과거에 했던 인터뷰 방식보다 훨씬 예측력이 높은 것으로 나타났습니다. 물론 예측이 완벽하지는 못했지만 6개 항목으로 지원병의 특성을 각각 계량화하여 측정한 방식이 인터뷰어가 직관에 의해 총점을 매기는 방식보다 훨씬 정교했던 겁니다. 카네만은 이러한 개인적 경험을 통해 직관적 판단을 묵살해서는 안 되지만 그것을 믿지는 말아야 함을 깊이 깨달았습니다. 

노벨상을 타고 유명해진 그가 45년만에 자신이 근무했던 육군 기지에 초대됐을 때 그는 자신이 개선했던 인터뷰 방식이 거의 그대로 쓰인다는 사실을 발견하고 감회에 젖습니다. 이렇게 크게 변화되지 않고 오랫동안 쓰인다는 것 자체가 직관보다 데이터를 바탕으로 한 '공식'이 더욱 우수함을 알리는 또 하나의 증거라고 그는 말합니다.

카네만의 사례는 비록 오래 전의 에피소드이지만 기업이 인터뷰를 통해 지원자를 평가하고 선별하는 방식을 어떻게 개선해야 할지를 분명하게 보여줍니다. 인터뷰 전에 충원하고자 하는 직무를 성공적으로 수행하기 위해 필요한 특성(역량)들을 결정해야겠죠. 이때 너무나 많은 특성을 설정하는 것은 금물입니다. 카네만이 했듯이 6개 내외가 적절합니다. 또한 각 특성은 서로 겹치는 부분 없이 배타적이어야 합니다. 그런 다음, 각 특성별로 서너 개의 구조화된 질문을 설정하고 5점 척도나 7점 척도로 측정할 준비를 갖춰야 합니다.

인터뷰에 임할 때 반드시 하나의 특성에 대한 점수를 평가하고나서 다음 특성의 평가를 위한 질문으로 넘어가야 합니다. 한 지원자의 인터뷰가 끝나고 다른 지원자가 들어오기 전의 토막 시간에 모든 특성을 몰아서 측정하면 흔히 말하는 '후광 효과'에 의해 평가가 왜곡될지 모르기 때문입니다. 카네만은 이 점을 특히 강조하면서 주의를 당부합니다. 

지금 여러분 조직에서 실시하는 면접의 방식이 카네만이 초기에 멋모르고 실시했던 방법과 비슷하다면, 면접관(보통 조직 내의 관리자나 경영자)들의 직관을 과대평가한다는 것입니다. 밀을 위시한 여러 명의 학자들이 이미 밝혔듯이, 경험 많은 전문가들의 '눈'은 의외로 정확하지 못합니다. 물론 직관이 우수할 때도 있습니다. 하지만, 인상(impression)이나 감각에 의해 평가가 크게 좌우될 우려가 있을 때, 기존의 데이터가 많이 존재하거나 과정을 진행하는 가운데 데이터를 충분히 생성할 수 있을 때, 현재 확보할 수 있는 데이터와 미래의 사건 사이의 인과관계가 어느 정도 존재할 때, 직관은 데이터에 자리를 내주어야 옳습니다.

직관보다는 데이터를 중시하고 그것에 근거하여 판단을 내리는 것이 실수를 줄일 수 있는 방법입니다. 겉으로 보기에 복잡한 주관적 판단보다는 단순하게 숫자 몇 개를 더하거나 빼서 결과를 추측하는 것이 더 정확할 때가 많다는 점을 염두에 둔다면, 여러분 조직의 면접 관행을 어떻게 개선해야 하는지 초점을 명확히 할 수 있을 겁니다.

면접은 지원자의 인상을 평가하기 위한 자리가 아닙니다. 면접은 최대한 과학적이어야 합니다. 감으로 하는 면접은 버리세요.


(*참고 도서) 
Thinking, Fast and Slow
Clinical vs. Statistical Prediction




  
,



기업들이 인재를 채용할 때 반드시 거치는 과정 중 하나가 면접(인터뷰)입니다. 아마 서류심사만으로 사람을 뽑는 회사는 거의 없을 겁니다. 면접도 1번에 그치지 않고 면접관을 달리 해 여러 번 실시하면서 그 사람이 얼마나 능력이 있고 얼마나 우리 회사에 적합한 사람인지를 평가하고자 합니다. 면접의 강도와 회수만 다를 뿐입니다. 이렇게 면접을 중요시하는 이유는 학교 성적, 다른 사람들의(전 직장 동료) 평가, 과거의 업무 실적보다 면접이 더 많은 정보를 얻는 수단이라 믿기 때문입니다. 

하지만 사회심리학자 리처드 니스벳(Richard Nisbett)은 기업의 면접관들이 '인터뷰 착각(Interview Illusion)에 빠져 있다고 단언합니다. 면접관들은 30분에서 1시간 정도 인터뷰를 하면 지원자의 능력과 적성을 파악할 수 있다고 자신하지만, 니스벳은 면접이 근거가 미약하고 정확하지 않은 도구라는 증거는 이미 많다고 말합니다.



가장 단적인 사례가 로빈 도스(Robyn Dawes)의 조사입니다. 텍사스 대학교의 의과대학에서는 매년 800명의 지원자 중에서 면접 점수로 150명을 선발했습니다. 그런데 텍사스 주의회가 갑자기 정원을 50명 더 늘리라고 하는 바람에 면접에서 떨어진 학생들 중에서 50명을 추가로 뽑아야 했습니다. 헌데, 추가로 뽑으려고 명단을 살펴보니 뽑을 수 있는 대상자들은 면접 점수가 700~800등에 해당하는 학생들 밖에 남아있지 않았습니다. 게다가 그 중 43명의 학생들은 그 어떤 의과대학에서도 선발되지 못한 학생들이었죠. 하지만 주의회의 명령이었기에 학교측은 면접 점수가 하위권인 학생 50명을 합격시킬 수밖에 없었습니다.

교수들은 어떤 학생이 면접 점수가 높은지 낮은지 알지 못한 채 학생들을 가르쳤습니다. 나중에 면접 점수 상위권 그룹(150명)과 하위권 그룹(50명)을 비교했더니 학업성취도의 차이가 전혀 없는 것으로 조사됐습니다. 두 그룹의 학생들은 의학박사 학위를 받은 비율이 82%로 동일했고, 우등상을 받은 비율도 비슷했으며, 레지던트 1년차를 이수한 이후의 성과도 별 차이가 없었죠. 50명 중 43명이 모든 의과대학에서 거부된 학생들이었다는 게 무색할 정도입니다. 면접 점수가 미래의 성과를 예측하는 데 있어 설명력이 거의 없었다는 결과입니다.

그렇다면 왜 면접관들은 인터뷰 착각에 빠지는 걸까요? 면접에 소요되는 시간은 지원자가 앞으로 그 분야에 종사할 시간에 비한다면 찰나에 비유될 만큼 매우 짧습니다. ‘척 보면 안다’라고 자신하지만, 평소에 가진 편견, 그날의 컨디션, 개인적인 호불호(好不好) 등에 따라 지원자를 지나치게 긍정적으로, 혹은 지나치게 부정적으로 평가 내리기도 하고, 당황한 지원자가 말 실수를 하면 뭔가 숨겨진 의미 때문은 아닌지 민감하게 반응하는 경향이 큽니다.

또한 '후광 효과'로부터 모든 면접관들은 자유롭지 못합니다. 어떤 지원자가 옷을 잘 입고 외모가 훌륭한데다가 겸손까지 갖추고 있다면 업무 능력과 상관없이 높은 점수를 주게 됩니다. 그리고 여러 지원자들을 면접하다 보면 '대조 효과'에 의해 잘못된 평가를 할 수도 있습니다. 직전 지원자가 유난히 '멍청하게' 면접에 응했다면 다음에 인터뷰하는 지원자가 그저그런 실력이라 할지라도 실제보다 좋게 평가하게 됩니다. 

프랭스 슈미트(Frank L. Schmitt)와 존 헌터(John E. Hunter)라는 심리학자는 무려 85년간의 인력 채용을 자료를 검토한 연구 결과를 통해 직장에서의 성공 여부를 예측할 수 있는 가장 좋은 지표가 지원자의 지적 능력(General mentality ability)과 구조화된 면접(단순한 면접이 아님)이라고 말합니다. 특히 전문적이고 리더십을 발휘해야 할 직무에서는 더욱 그러합니다(그렇다고 해서 지적 능력이 완벽한 잣대는 아닙니다).

그렇다면, 면접을 통해 지원자의 지적 능력을 과연 파악할 수 있을까요? 어제 포스팅한 글('압박 면접이 우수인재를 쫓아낸다')에서 봤듯이 짧은 시간 동안 집중적으로 주어지는 질문 포화에 지적 능력이 뛰어난 인재들은 초킹(choking) 현상으로 무너질 가능성이 큽니다. 심리학자 스튜어트 서덜랜드(Stuart Sutherland)는 구조화된 면접이라 할지라도 마주보는 지원자에 대해 편견을 가지기 쉽기 때문에 차라리 서면으로 답변을 받는 것이 더 낫다고 말합니다(이에 대해서는 심리학자들간의 의견이 팽팽히 맞섭니다). 또한 비용과 시간을 고려하면 구조화된 면접은 그리 효율적이지 못합니다.

도스는 '당사자를 30여 분 면접하면서 더 많은 것을 알아낼 수 있다고 하는 주장이 더 뻔뻔하다'고 단적으로 말합니다. 면접자들이 자신들의 능력을 과대평가하는 한 지원자의 능력을 올바르게 평가하지 못할 겁니다. 면접의 효과가 근거 없는 믿음이라면 면접을 지원자와 안면을 익히는 것 이상의 의미를 두지 말아야 합니다. 지원자가 직장에서 나타낼 성과를 설명력 있게 가리키는 지표가 적어도 면접은 아니라는 점을 깨닫는다면 말입니다.

면접으로 좋은 인재를 뽑을 수 있다는 것은 미신(Myth)입니다. 그런데도 이 순간에도 수많은 회사에서 면접이 이루어지고 면접에 의해 누군가는 붙고 누군가는 떨어집니다. 과연 괜찮은 걸까요?

(*참고문헌 : House of Cards : Psychology and Psychotherapy Built on Myth )
(*참고논문 : The validity and utility of selection methods in personnel psychology )



  
,