자원봉사는 말 그대로 자신이 원해서 노동력을 무상으로 제공하는 행위를 말합니다. 서양에서는 자원봉사가 활성화되어 있어서 미국에는 총 고용인구 중 6.8%(1990년 기준)가 자원봉사자일 정도입니다. 2011년에 기획재정부에서 발간한 '국가경쟁력 보고서'에 따르면 우리나라의 자원봉사자 비율은 OECD 28개국 가운데 16위에 불과하다고 합니다. 

이런 의문이 듭니다. 자원봉사자들에게 금전적인 보상을 제공한다면 좀더 많은 시간을 봉사하지 않을까요? 직업을 가지고 있는 사람이 자원봉사자가 되려면 자원봉사로 인한 기회비용을 감내해야 합니다. 자원봉사 시간 동안 돈을 못 버는 상태가 되기 때문이죠. 자원봉사자들에게 기회비용의 일부를 보전해 준다면 자원봉사자들로부터 좀더 많은 봉사 시간을 끌어낼 수 있고 더 많은 자원봉사자들을 모을 수 있다는 것이 논리적인 추론입니다. 하지만 진짜 그럴까요?



취리히 대학의 브루노 프레이(Bruno S. Frey)와 로렌쯔 괴테(Lorenz Goette)는 1997년에 실시된 '스위스 노동력 조사' 데이터를 확보하여 금전적 보상과 자원봉사 간의 관계를 분석했습니다. 정치기관, 공공기관, 지방자치기관 등에서 일하는 자원봉사자들의 데이터를 추출해 보니 약 20퍼센트의 자원봉사자들이 금전적 보상을 받고 있었습니다. 

보상을 받지 않는 그룹은 한 달에 14시간을 자원봉사에 투여했지만, 한 달에 50스위스프랑 이하를 받는 그룹의 자원봉사 시간은 월 평균 12시간도 되지 않았습니다. 돈을 지급했음에도 오히려 자원봉사 시간이 줄어든 것입니다. 프레이와 괴테는 추가 분석을 통해 14시간의 자원봉사 시간(돈을 안 주고도 확보할 수 있었던 시간)을 보상으로 확보하려면 적어도 75프랑 이상의 돈이 주어져야 한다는 점을 밝혔습니다. 

반면 월 50스위스프랑 이상을 받는 그룹은 21시간을 자원봉사에 쏟았습니다. 이는 보상을 더욱 높이면 자원봉사 시간이 늘어난다는 점을 보여주는 결과라고 해석될 수 있습니다. 하지만 보상 없이도 14시간의 자원봉사를 확보할 수 있는데 50프랑 이상의 보상이 과연 효과적이라고 볼 수 있는지 의문이라고 프레이와 괴테는 덧붙입니다. 자원봉사자들에게 주어지는 보상의 중간값 수준에서 볼 때 보상이 자원봉사 시간을 줄인다는 점은 분명했죠. 프레이와 괴테는 보상으로 인해 4시간 가량 자원봉사 시간이 줄어든다고 최종적으로 결론 내렸습니다.

보상이 내적동기를 갉아 먹는다는, 소위 구축효과(Crowding-out Effect)는 자원봉사자들에게서도 여실히 나타난다는 점을 이 연구 결과가 보여줍니다. 열심히 일하려는 욕구는 돈이 아니라 충만한 내적동기(intrinsic motivation)에서 나온다는 점을 염두에 둔다면, 무언가를 장려하기 위해 돈이라는 손쉬운 도구를 사용하려는 안일함을 버릴 수 있을 겁니다.


(*참고논문)
Does Pay Motivate Volunteers?



  
,


목표를 달성하고 역량을 계발하는 데에 상사의 피드백이 무엇보다 중요하다는 점은 누구나 알고 있습니다. 또한 피드백은 공식적인 절차가 아니라 현장에서 상사와 직원 사이에서 끊임없이 오고가는 일상적인 일이 되어야 한다는 점도 우리는 압니다. 1년 내내 가만히 있다가 평가 시즌이 되어서야 피드백하는 것처럼 우스꽝스러운 일도 없죠. 상사나 직원이나 각자 업무가 바빠 피드백할 시간이 없다는 핑계는 자식이 어떻게 행동하는 1년 내내 가만히 있다가 12월에 가서 지난 1년을 되돌아보겠다는 말과 같습니다. 시간이 흐르면 피드백해야 하는 상황이나 이유를 잊어버리고 각자가 서로 다르게(보통 자기에게 유리하게) 기억하기 때문에 피드백은 즉각적이고 일상적이야 합니다.

그렇다면 상사가 부하직원에게 전달하는 피드백은 아주 자세해야 좋을까요? 아마 여러분은 모호한 정보보다 정확하고 자세한 피드백이 목표를 달성하는 데에 도움이 된다고 생각할 겁니다. 그 동안 피드백을 거의 하지 않는 상사를 모시고 있다면 더더욱 그러할 겁니다. 그런데 정말 그럴까요? 자세한 피드백이 모호한 피드백보다 성과 달성에 긍정적일까요?



하지만 그렇지 않을지도 모른다는 의견이 대두되었습니다. 유타 대학의 히만슈 미쉬라(Himanshu Mishra)와 동료들은 모호한 정보나 피드백이 성과에 긍정적인 영향을 미친다는, 직관에 반하는 실험 결과를 내놓았습니다. 먼저 미쉬라는 사전 테스트를 위해 38명의 참가자들에게 플라바놀(flavanol)이 함유돼 있어 정신적 활동을 활발하게 해 준다는 초콜릿을 먹도록 했습니다. 참가자 중 절반에게는 플라바놀이 정확히 1그램이 들어있다고 말한 반면, 나머지 절반의 참가자에게는 플라바놀이 0.5~1.5그램 들어있다고 알려줬습니다. 초콜릿을 먹은 후에 참가자들은 초콜릿이 자신들의 정신적 활동에 얼마나 긍정적인 영향을 미칠 것 같은지를 평가했습니다. 그 결과, 정확한 함유량을 들은 참가자들보다 모호한 함유량을 들은 참가자들이 초콜릿이 두뇌 활동에 좋은 영향을 미칠 거라고 답했습니다. 

미쉬라는 이 사전 테스트 후에 106명의 참가자를 모집하여 '브레인 에이지(Brain Age)'라 불리는 닌텐도 DS 게임을 하도록 하여 각자의 기준점수를 확보했습니다. 그런 다음, 사전 테스트와 같은 조건을 설정하여 참가자들에게 초콜릿을 먹이고 다시 브레인 에이지 게임을 하도록 했죠. 그랬더니 대체적으로 점수가 향상됐지만 플리바놀 함유량에 대해 모호한 정보를 들은 참가자들이 정확한 정보를 들은 참가자들보다 게임 점수가 더 나아지는 결과가 도출되었습니다. 참 특이한 일이었죠. 모호한 정보를 접한 참가자들은 플라바놀의 최대값인 1.5그램을 더 의미 있는 수치로 받아들인 까닭일까요? 어쨌든 모호한 정보가 정확한 정보보다 성과에 긍정적인 영향을 끼친 것만은 분명했습니다.

그렇다면 정확하거나 모호한 정보의 차이가 게임과 같은 두뇌 활동보다 신체적인 능력에도 영향을 미칠까요? 미쉬라는 캠페롤(Kaempferol)이 함유되어 있어 근육의 힘을 키워준다는 과일 쥬스 한 잔을 참가자들에게 주고 손의 악력을 측정하는 후속 실험을 진행했습니다. 137명의 참가자 중 절반은 캠페롤이 1그램이 정확히 들어있다는 말을 들었고, 다른 그룹은 0.5~1.5그램 들어있다는 정보를 전달 받았죠. 미쉬라는 한 가지 실험 조건을 추가했는데, 참가자 중 절반에게 조심스럽고 정확한 의사결정을 위해 정보를 수집하고 만들기 위해 노력했던 일을 상기시킴으로써 정확성을 강조하는 조건에 프라이밍(priming)되도록 만들었죠. 나머지 절반에게는 최근에 일어난 일을 묘사해 보라고만 했습니다.

악력을 측정한 결과,  정확성에 프라이밍되지 않은 참가자 중 모호한 정보를 들은 사람들은 정확하 정보를 들은 자들보다 더 높은 악력 수치를 나타냈습니다(217.22 대 168.30). 반면, 정확성에 프라이밍된 참가자들은 캠페롤 함유량을 정확하게 알든 모호하게 알든 악력 측정치 사이에 차이가 발견되지 않았습니다. 사전에 미쉬라는 정확성을 강조하는 환경에 놓이면 정확한 정보(피드백)를 들을 때 성과가 더 높아진다고 생각했지만 그렇지 않았던 것이죠. 모호하게 제시된 정보는 참가자로 하여금 자기 식대로 재해석할 수 있는 여지를 제공함으로써 두뇌 활동과 신체 능력에 긍정적인 영향을 미친다고 추측할 수 있습니다.

이번엔 두뇌 활동이나 신체 능력이 아니라 '목표 달성'에 피드백의 정확성 여부가 어떻게 작용할지를 살피기 위해 또다른 실험이 3주 동안 실시됐습니다. 미쉬라는 39명의 학생들을 일주일에 한번 실험실에 찾아와 HHI라고 불리는 가상의 건강지수와 체중 등을 측정 받도록 했습니다. 그런 다음 학생들 중 절반에게는 정확한 HHI 지수를 제시한 반면, 나머지 학생들에게는 (+/-) 3퍼센트의 구간으로 HHI 값을 알려줬습니다. 3주 동안의 체중 변화를 살펴본 결과, 정확한 HHI 지수를 피드백 받은 학생들은 몸무게가 변하지 않거나 약간 늘었지만, 모호한 HHI 지수를 피드백 받은 학생들은 상대적으로 체중이 더 많이 감소했습니다. 예를 들어 최초에 HHI값이 85였던 참가자 중 정확한 HHI값을 피드백 받은 사람은 체중이 1파운드 늘었지만, 모호하게 HHI값을 피드백 받은 사람은 4파운드 가까이 몸무게가 줄었죠. 정확한 피드백보다 약간은 모호한 피드백이 체중 감량이라는 목표 달성에 도움이 된다는 결과였습니다.

여러분은 미쉬라의 실험들이 조직 내 현장에서 벌어지는 피드백 상황을 정확하게 재현하지는 못하고 피드백의 내용과 방식도 같지 않기에 '모호한 피드백이 정확한 피드백보다 좋다'는 실험 결과를 받아들이기 힘들다고 생각할지 모릅니다. 맞습니다. 하지만 이 실험의 의미는 상사가 부하에게 지나치게 상세하게 피드백할 경우 부하직원들의 자율성을 떨어뜨리고 그에 따라 목표를 이루려는 동기도 저하될지 모른다는 데에 있습니다. 시시콜콜한 피드백은 부하직원에게 잔소리로 느껴질 위험이 있다는 뜻이죠. 부하직원이 상사의 피드백을 듣고 자기 나름대로 해석할 '여백'을 주어야 성과 달성의 동기가 유지되거나 높아지는 법입니다. 

또한 상사들도 부하직원에게 자세하게 피드백해야 한다는 부담을 느낄 필요가 없다고 이 실험은 일러줍니다. 오히려 상세한 피드백으로 대변되는 '마이크로 매니지먼트'는 여러 모로 부정적인 분위기를 초래할지 모릅니다. 상사가 부족한 면을 상세하게 피드백한다면 부하직원의 마음 속에는 '내 사정도 잘 모르면서...', '날 얼마나 감시하고 있길래...'라는 불만이 자라나기 마련입니다. 성과를 달성하고자 하는 내적동기가 상사의 피드백에 의해 훼손될지 모르죠. 어느 정도는 모른 척하면서 상사 자신이 기대하는 바를 모호하게 제시하는 것이 부하직원의 자율성과 동기를 제고합니다. 물론 정확하고 상세한 피드백(정보)가 필요할 때가 있습니다. 상황이 급박하게 돌아갈 때, 의사결정을 바로 내려야 할 때, 정보를 모호하게 제시하거나 뭉뚱그려 피드백한다면 곤란하겠죠. 그런 상황이 아니라면 상사는 소위 '대리급 팀장'이 되지 않도록 조심해야 합니다.

피드백도 중용이 필요합니다. 모호한 피드백과 상세한 피드백 사이에서 적절한 균형을 맞출 수 있어야 합니다. 무엇이 직원들의 내적동기를 해치지 않으면서 피드백의 효과를 높일 수 있을지 고민해야 하겠죠. 쉽지 않은 일입니다. 극단은 쉽지만 중용은 어려운 법이니까요.


(*참고논문)
In Praise of Vagueness: Malleability of VagueInformation as a Performance Booster


  
,


여러분이 어려운 일을 수행할 때 누군가가 옆에서 도와준다면 당연히 그에게 고마움을 느낄 겁니다. 특히 도와주는 사람의 능력이 뛰어나다면 그에게서 느끼는 고마움의 감정은 더 크기 마련입니다. 그런데 그 사람의 도움을 받아 일을 마치고 난 후에 느끼는 고마움의 정도를 일을 수행하는 도중에 느끼던 고마움의 정도와 비교한다면 무엇이 더 클까요? 아마 여러분은 그 사람의 도움으로 일을 잘 마쳤기에 일이 완료된 이후에 느끼는 감사의 정도가 더 클 것이라고 생각할 겁니다.

그러나 버지니아 대학의 벤자민 콘버스(Benjamin A. Converse)와 시카고 대학의 에일렛 피시바흐(Ayelet Fishbach)의 실험은 그 반대가 옳다는 사실을 증명했습니다. 즉 도움을 받는 도중에 느끼는 고마움의 정도가 일을 마치고 난 후에 느끼는 고마움의 정도보다 더 크다는 것이죠. 콘버스와 피시바흐는 시카고 시민 42명을 모집하여 수고료로 2달러를 지급한 후에 4개의 객관식 퀴즈를 모두 맞히면 12달러를 주기로 약속했습니다. 처음 두 문제는 쉬웠지만 나머지 문제는 어렵게 출제하여 세 번째 퀴즈는 '지우개 찬스'를 쓰도록 하고 네 번째 문제는 '친구에게 전화 찬스'를 사용하도록 했습니다.
 



참가자들은 친구가 문제를 듣고 고민하는 동안, 그리고 게임이 종료된 이후에(하지만 결과는 공개되지 않은 상태)에 각각 얼마나 친구에게 고마움을 느끼는지 평가했습니다. 결과를 보니, 참가자들은 문제를 푸는 동안 친구에게 고마움을 더 크게 느꼈습니다(5.72점 대 4.84점). 친구에게서 도움을 얼마나 받았느냐와 상관없이 참가자들은 게임이 끝난 후에는 친구에게 고마움을 덜 느꼈던 겁니다.

그렇다면 도움을 주는 사람에 입장에서는 어떨까요? 그는 도움을 받는 사람이 느끼는 고마움의 정도가 일이 완료된 이후에 줄어들 거라는 점을 알고 있을까요? 도움을 주는 사람은 일이 진행되는 도중보다 일이 완료된 이후에 더 많은 감사를 기대한다는 점이 후속실험을 통해 규명됐습니다. 콘버스와 피시바흐는 40명의 시카고 시민을 실험에 참가시켜서 데이터를 입력하는 과제를 부여했습니다. '입력자'들은 '도우미'가 큰 소리로 값을 불러주면 그걸 입력해야 했죠. 입력자들은 과제를 수행하는 도중과 과제를 완료한 이후에 도우미의 도움에 얼마나 감사하는 마음을 갖는지 100점 만점으로 평가했습니다. 마찬가지로 도우미들도 입력자들이 자신들의 도움에 얼마나 감사하는 마음을 가질 것 같은지를 100점 만점으로 평가했죠. 

입력자들이 느끼는 '부채감'과 도우미들이 입력자들에게서 기대하는 감사의 정도를 분석하니, 서로 다른 생각을 가지고 있음이 드러났습니다. 입력자들은 과제를 수행하는 동안에는 72.0점의 감사를 느꼈지만 과제가 끝난 후에는 65.4점로 떨어졌습니다. 반면 도우미들은 과제가 진행 중일 때는 40.8점의 감사를 기대했고 과제가 완료된 후에는 48.1점으로 높아졌습니다. 과제가 끝나면 도움 받는 사람은 도움에 대한 부채감이 경감되지만, 도움을 주는 사람은 상대방이 자신에게 더 감사한 마음을 가져야 한다고 생각한다는 의미입니다.

콘버스와 피시바흐가 실시한 세 번째 실험에서도 이러한 기대의 차이가 분명하게 드러났습니다. 튜터가 학생의 시험 준비를 도와줄 때 학생은 튜터에게 4.40점(7점 만점)의 고마움을 느끼지만 시험이 끝나고 난 후에는 3.17점으로 떨어졌습니다. 튜터는 시험 준비 기간 동안 학생이 자신에게 3.17점의 고마움을 느껴야 한다고 생각했지만 시험이 끝난 후에는 그 정도가 3.39점으로 높아졌습니다. 학생들이 시험 결과에 만족하느냐의 여부는 튜터에게 느끼는 고마움의 정도와 관계가 없었습니다. 튜터가 주는 도움의 유용성(instrumentality)을 평가하라고 하자 학생들은 시험 준비 기간 동안의 값이 시험 종료 후의 값보다 컸습니다. 학생들이 튜터에게 느끼는 유용성의 정도와 튜터에게 가지는 고마움의 정도가 상관성을 갖는다는 의미였죠. 

도움을 주는 사람과 도움을 받는 사람들이 느끼고 기대하는 고마움의 정도가 이렇게 차이가 난다는 사실을 조직으로 투영시키면 어떤 시사점을 발견할 수 있을까요? 팀의 성과 달성에 도움을 주는 사람을 부하직원으로, 부하직원들로부터 도움을 받는 사람을 상사라고 가정하면, 부하직원들은 목표를 달성하는 과정에 있을 때보다 그것을 완료한 후에 상사로부터 더 많은 인정과 칭찬을 기대한다고 유추할 수 있습니다. 반면 상사의 입장에서는 부하직원이 목표를 완수한 후에는 그 전보다 부하직원의 공로를 덜 인정하고 당연시할지도 모름을 위의 실험이 일러줍니다. 어려운 목표라 해도 일단 달성한 후에는 그 목표가 별것 아니라고 여기는 것처럼 말입니다. 

이렇게 상호 간의 인식 차이는 평가 불만의 원인 중 하나로 작용할 가능성이 큽니다. 부하직원은 자신의 목표 달성 결과에 100 정도의 인정 혹은 평가를 기대하는데 상사는 그것을 80 정도로 절하하여 평가할지도 모릅니다. 콘버스와 피시바흐의 실험은 평가 시즌에만 부하직원들의 목표 달성 결과를 평가할 경우 상호 간의 갈등이 야기될 가능성뿐만 아니라 평가 측정의 왜곡도 발생할 수 있음을 보여줍니다. 따라서 상사는 연말에 가서 한번만 평가할 것이 아니라, 부하직원이 목표 달성 과정에 있을 때 중간중간 보여주는 노력의 결과나 중간산출물을 바로바로 평가하고 축적해 둬야 한다는 시사점도 이 연구를 통해 얻을 수 있습니다. 지속적으로 부하직원을 관찰하고 평가하고 피드백해야 하는 또 하나의 이유입니다. 또한 부하직원들도 자신의 목표 달성 과정을 상사에게 지속적으로 알리고 어필할 필요가 있습니다.

혹시 어려운 목표를 잘 완수했더니 상사가 당연시하거나 평가절하했던 경험이 있습니까? 생각보다 덜 인정해 주던가요? 그렇다면 그것은 인간 심리가 원래 그러하기 때문이지 상사가 못됐기 때문이 아닙니다.


(*참고논문)
Instrumentality Boosts Appreciation: Helpers Are More Appreciated While They Are Useful.



  
,


손에 찬 것이 닿은 후와 뜨거운 것이 닿은 후에 어떤 사람에 대해 평가해 달라는 요청을 받았다면 여러분은 손에 느껴진 온도와 상관없이 그 사람의 성격이나 능력을 동일하게 평가할까요? 객관적인 평가가 가능하다고 믿는 사람은 그까짓 촉감이 무슨 영향을 미치겠냐며 무시하겠지만, 그렇지 않다는 연구 결과는 많습니다. 로렌스 윌리엄스(Lawrence E. Williams)와 존 바그(John A. Bargh)는 솔로몬 애쉬(Solomon Asch)가 수행했던 실험을 확장하여 흥미로운 실험을 진행했습니다(솔로문 애쉬는 동조 실험으로도 유명한 심리학자죠). 당초 애쉬는 사전에 느낀 차갑거나 따뜻한 촉감이 처음 본 누군가의 첫인상을 결정하는 데 중요한 영향을 미친다는 점을 실험으로 밝혔는데, 윌리엄스와 바그는 그러한 촉감이 미치는 영향을 정량적으로 측정하고자 했죠.

윌리엄스와 바그는 41명의 학부생들을 두 그룹으로 나눠 한 그룹에겐 손에 차가운 느낌이 전달되도록 하고 다른 그룹에게는 따뜻한 온기가 전해지도록 했습니다. 학생들은 실험장소가 있는 건물에 도착한 후 실험의 목적을 모르는 도우미의 안내를 받아 단 둘이 엘레베이터에 타야 했죠. 도우미는 양손에 아이스 커피(혹은 뜨거운 커피), 교과서, 클립보드를 들고 있었는데, 무언가를 하는 시늉을 하며 학생에게 커피를 잠깐 들어 달라고 학생에게 부탁했습니다. 그렇게 하여 학생의 손에 차갑거나 따뜻한 촉감이 느껴지도록 했죠.




실험장소에 앉은 학생들은 'Person A'라고 불리는 가상의 사람에 대한 자료를 읽고서 그 사람이 얼마나 지적이고 단호하며 조심스러운지 등과 같은 10가지 성격 특성을 평가하도록 요청 받았습니다. 그랬더니, 손에 따뜻한 커피를 잡았던 학생들이 차가운 커피를 쥐었던 학생들보다 Person A를 더 따뜻한 사람으로 평가하는 경향이 발견되었습니다. 이는 통계적으로 유의미했죠. 이로써 손에 느껴지는 온기처럼 무시하기 쉬운 것조차 다른 사람을 평가하는 데에 의미 있는 차이를 유발한다는 점이 증명됐습니다.

윌리엄스와 바그는 손에 느껴지는 촉감이 다른 사람에 대한 평가 뿐만 아니라 자기 자신의 '행동'에 어떤 영향을 미치는지 후속실험으로 알아보기로 했습니다. 하지만 첫 번째 실험 방식을 취하지는 않았습니다. 도우미로 참가한 사람이 비록 실험의 목적을 알지 못한 상태였지만 그도 차갑거나 뜨거운 커피를 들고 있었기에 알게 모르게 실험참가자에게 영향을 미쳤을 수도 있다고 의심했기 때문입니다. 찬 커피를 든 도우미는 학생들을 쌀쌀맞게 대하거나 뜨거운 커피를 쥔 도우미는 학생들을 친절하게 대함으로써 그 감정이 학생들에게 전달됐을지도 모르는 일이었죠. 그래서 후속 실험에서는 오직 실험참가자인 학생들만 차갑거나 뜨거운 물체를 잡도록 했습니다.

실험장소에 도착한 53명의 학생들은 두 그룹으로 나뉘어 각각 냉찜질팩과 온찜질팩을 손에 잡아보고 제품을 평가 해달라는 요청을 받았습니다. 제품 평가는 사실 위장하기 위한 것이었고 학생들의 손에 차갑거나 뜨거운 느낌이 전달되도록 하기 위함이었습니다. 그런 다음 실험진행자는 학생들에게 실험 참가에 대한 보상으로 두 가지 중 하나를 고르라고 했습니다. 학생들 중 절반은 자신이 마시기 위해 스내플(Snapple)이란 음료를 선택할지, 친구를 위해서 1달러 짜리 아이스크림 무료 쿠폰을 선택할지 결정해야 했죠. 반면 나머지 절반의 학생들은 친구에게 주기 위해 스내플 음료를 선택할지, 자신이 먹기 위해 1달러 짜리 쿠폰을 선택할지 역시 결정해야 했습니다.

손에 냉찜질팩을 잡았던 학생들 중 친구를 위한 상품을 선택한 사람은 25%에 불과했고 자신을 위한 보상을 선택한 사람은 75%나 됐습니다. 반대로, 손에 온찜질팩을 쥐었던 학생들 중 54%가 친구를 위한 상품을 택했고 46%는 자신에게 보상하겠다고 답했습니다. 손에 느껴진 온기가 어떠냐가 이타심과 이기심에 영향을 미쳤다는 결과였습니다.

비록 간단하지만 윌리엄스와 바그의 두 실험은 인간의 판단과 행동이 별것 아닌 듯 보이는 미묘한 것에 크게 영향을 받는다는 사실을 단적으로 보여줍니다. 이는 평가자의 감정 뿐만 아니라 평가자가 평가 전에 어떤 촉감에 '프라이밍(priming)'되느냐도 중요한 차이를 야기한다는 결과입니다. 동절기 때 동일한 모양의 두 사무실의 온도를 다르게 하면, 동일한 사람에 대한 평가가 큰 차이를 보일 거라고 추측할 수 있습니다.

아래의 동영상은 EBS에서 방영된 바 있는 '인간의 두 얼굴'이란 프로그램에서 발췌한 것인데, 위 실험과 비슷한 실험 결과를 담고 있습니다. 인간의 객관적 평가 능력은 미신이라는 생각이 들 겁니다.


혹시 지금 상사에게 평가 받거나 결재를 받아야 한다면, 혹은 누군가와 중요한 협상을 하기 전이라면 그에게 아이스 커피보다는 뜨거운 커피를 권하세요. 시원한 게 좋더라도 그렇게 하는 게 유리할지 모르니까요.


(*참고논문)
Experiencing Physical Warmth Promotes Interpersonal Warmth



  
,


보상의 증감에 따라 생산성과 직원만족도가 어떻게 달라지는지 실험하는 것은 그리 쉬운 일이 아닙니다. 실험을 위해 기존의 보상을 줄이겠다면 직원들이 가만히 있을 리 없을뿐더러, 보상 수준을 높여 봤다가 아무런 효과가 없다고 해서 다시 원상으로 복귀하면 역시 직원들의 반발이 예상되기 때문입니다. 보상이 생산성을 향상시키는 데 어느 정도는 도움이 되지만 생산성이 보상에 비례하여 증가하지 않는다는 실험은 많았습니다. 하지만 실험의 편의를 위해서 조건을 단순화시킨 모델에 쉽게 조달 가능한 학생들(회사에서 아직 일해보지 않은)을 참가자로 참여시켰기 때문에 현실을 과연 올바르게 반영한 결과인지를 놓고 논란이 있죠.

실험적 연구의 한계를 극복하려면 실제하는 기업에서 보상의 수준과 방식에 변화를 주기 전과 변화가 일어난 후의 차이를 분석해야 합니다. 그러나 이 또한 쉽지 않은 까닭은 처음부터 연구자들이 보상의 효과를 분석하기 위해 개입하지 않으면 사전적인 데이터를 확보하지 못한 채 사후적인 데이터만 가지고 추론해야 하는 한계가 있기 때문입니다. 



기업의 구성원들과 합의하여 초기부터 보상의 전후 효과를 분석한 몇 안 되는 연구 중 하나가 잔느 라메르(Jeanne M. LaMere)와 동료들이 '미시건 폐기물 서비스'라고 불리는 폐기물 수거업체를 대상으로 한 연구입니다. 이 회사의 CEO는 폐기물 수거 차량을 모는 운전수들의 생산성을 높이기 위해 인센티브 프로그램을 도입하고자 했습니다. 라메르에게는 새로운 보상 프로그램이 실행되기 전과 실행된 이후의 변화를 분석하기에 더 없이 좋은 기회였죠. 

이 회사에는 여러 부서가 있었지만, '수거 부문'에 속한 22명의 트럭 운전수를 실험 대상으로 삼았습니다. 라메르는 제비뽑기를 통해 운전수들을 두 그룹으로 나눴습니다. 1그룹에게는 20주 동안 기본적인 보상을 받다가 인센티브 프로그램을 적용 받게 했고, 2그룹에게는 1그룹보다 14주 늦게 인센티브 프로그램을 적용했습니다. 인센티브는 전체 보상 금액의 3% 정도가 되었죠. 이렇게 3~5개월 정도 진행하다가 경영진은 새로운 회계년도의 시작(1990년 9월 30일)과 함께 인센티브의 크기를 94% 증가시켰습니다. 단 기본급은 인상하지 않았죠. 그리고 39주가 흐른 1991년 7월 1일에 다시 인센티브의 크기를 57% 인상하는 조치가 이뤄졌습니다. 이때도 역시 기본급은 동결시켰습니다. 기본급을 그대로 유지했기에 인센티브(성과급)가 성과에 미치는 영향만을 따로 분석할 수 있었습니다. 라메르는 이 기간 동안 트럭 운전수들의 생산성, 성과 포인트, 직무만족도, 사고 발생건수, 순노무비 절감액, 투자수익률 등의 변화를 분석했습니다. 

제비뽑기를 해서 그룹을 나눴음에도 인센티브 프로그램이 도입되기 전에 1그룹의 성과는 2그룹보다 현저히 낮았습니다. 하지만 이것은 중요하지 않았습니다. 인센티브 프로그램이 도입되자 두 그룹 모두 생산성이 크게 향상되는 모습이 관찰되었고 그룹의 성과 차이도 줄어들었기 때문입니다. 그러나 두 번의 인센티브 인상과 생산성 증가는 비례하지 않았습니다. 인센티브 크기를 94% 증가시켜 전체 보상 금액의 6% 수준으로 끌어올렸음에도 불구하고, 오히려 2그룹의 생산성은 첫 번째 인상이 이뤄진 후에 약간 감소하기도 했습니다. 인센티브 크기를 57% 증가시켜 전체 보상 금액의 9%가 되도록 해도 생산성은 별로 나아지지 않았습니다.

인센티브 프로그램이 실시되기 전에 측정한 보상 만족도는 26.10점이었는데, 인센티브가 주어진 후의 보상 만족도는 24.21점 밖에 안 됐습니다. 업무 만족도 역시 종전에 32.47점이었는데 30.37점 밖에 나오지     않았죠. 통계적으로 따져보니 만족도 상의 변화는 없었습니다. 인센티브를 도입하면 보상과 업무에 대한 만족도가 높아질 거라는 기대가 틀렸음을 일러주는 결과입니다.

요약하면, 기본급은 그대로 유지하고 인센티브가 전체 보상 금액에서 차지하는 금액을 0%, 3%, 6%, 9%로 증가시켰기에 전보다 돈을 더 받을 수있음에도 불구하고 생산성과 성과는 그에 비례하여 향상되지 않았습니다. 인센티브가 운전수들의 만족도를 제고하는 것도 아니었습니다. 처음 인센티브를 도입할 때는 생산성과 성과가 현저하게 높아지지만, 그 이후에 이루어지는 인센티브의 추가 확대는 별로 이로울 것이 없음을 거의 4년에 걸친 라메르의 관찰로부터 알 수 있습니다.

여전히 많은 기업들이 인센티브(성과급) 비중을 늘리면 개인의 성과가 향상되고 종국에 조직 전체의 성과에 긍정적인 영향을 미치치라 생각합니다. 초기에 인센티브를 작게 도입해서 성공적인 결과를 얻은 기업들은 회사가 위기에 빠지거나 직원들을 채근할 필요가 있을 때 인센티브의 비중 확대가 해결책이 되리라 생각하는 경향이 있습니다. 인센티브를 점점 확대해 나가기로 계획된 회사들이 꽤 많다는 것을 보고 듣는 중입니다. 하지만 인센티브 확대를 실행에 옮기기 전에 염두에 두어야 할 것이 있습니다. 라메르의 연구가 보여주듯이 소폭의 인센티브 도입은 직원들로 하여금 자신의 연봉이 성과가 연동된다는 신호를 주기에 어느 정도의 '당근 효과(혹은 반대로 채찍 효과)'가 있으나 그보다 더 큰 인센티브 비중은 의미가 별로 없을지 모른다는 점(노력 대비 효과가 떨어진다는 점)입니다.

라메르의 실험이 모든 산업과 모든 직무를 포괄하는 연구는 아니지만, 인사정책의 실행은 이론이나 기대가 아니라 엄정한 증거에 기반해야 함을 일깨워 줍니다. '인센티브를 확대하면 좋아지겠지'와 같은 통념과 기대에 근거하여 인사정책에 변화를 주는 것보다 진짜로 효과가 있다는 증거를 발견한 이후에 천천히 실시해야 합니다. 특히 보상과 관련된 정책은 한번 실행하면 되돌리기가 쉽지 않기 때문에 더욱 조심스럽게 증거를 찾아야 합니다. 인센티브 확대가 생산성과 성과를 향상시킬 거란 말은 뻥일 확률이 높습니다.

'우리 회사에서 과연 효과가 있을까?'란 질문과 고민 없이 다른 회사도 하니까, 트렌드가 그러하니까, 금년도에는 이거나 해볼까, 하면서 실행하는 제도가 참 많습니다. 여러분의 회사도 그렇지는 않습니까?


(*참고논문)
Effects of a Multicomponent Monetary Incentive Program on the Performance of Truck Drivers



  
,


'피터의 법칙'이란 말을 들어본 적이 있을 겁니다. 캐나다의 심리학자인 로렌스 피터(Laurence J. Peter)는 자신의 경험적 관찰을 통해 "조직의 서열 구조 속에서 모든 구성원들은 자신들의 무능력을 극대화할 수 있는 위치까지 승진한다"는 유명한 말을 남겼습니다. 이 말을 좀더 쉽게 서술하면 "구성원들은 자신의 무능이 완전히 드러날 때까지 승진하는 경향이 있다. 그래서 결국 조직 전체의 역량 수준은 떨어진다"는 것입니다. 

그가 이런 결론을 내린 까닭은 어떤 직급에서 요구되는 역량과 한 단계 위의 직급에서 필요한 역량이 서로 독립적이라고 보았기 때문입니다. 피터의 관점이 맞는다면, 어떤 사람이 현재의 직급에서 아무리 높은 수준의 역량을 보이더라도 그가 상위 직급에 오른 후에도 높은 역량 수준을 나타내리라 장담하지는 못합니다. 그래서 그는 구성원들이 상위 직급으로 올라갈수록 무능함이 드러난다고 생각한 겁니다. 



물론 하위 직급의 역량과 상위 직급의 역량이 독립적이라는 피터의 가정이 틀렸을 수도 있습니다. 조직의 특성상 피터의 가정처럼 직급의 역할이 설정된 곳도 있고, 하위 직급과 상위 직급 간의 요구역량이 서로 의존적인 조직도 있을 테니까요. 이탈리아의 알레산드로 플루치노(Alessandro Pluchino)와 동료들은 컴퓨터를 통해 피터의 가정 하에서 어떤 식으로 구성원을 승진시키는 것이 좋은지를 시뮬레이션한 결과, 직관과 반하는 결과를 얻었습니다. 그들은 이 공로(?)로 2010년에 '이그 노벨상'을 수상하기도 했습니다.

플루치노는 컴퓨터 상에 6단계 직급을 가진 피라미드형 조직을 만들어 놓고 160명의 가상직원을 배치했습니다. 가장 높은 레벨에 1명(사장을 의미), 두 번째로 높은 레벨에는 5명... 이런 식으로 가장 낮은 레벨에는 81명을 배치했죠. 플루치는 각 구성원에게 역량 수준과 연령이라는 두 개의 속성을 부여하고, 정규분포를 따르도록 무작위로 1에서 10까지의 역량 값을, 18세에서 60세까지의 연령을 지정했습니다. 윗 직급으로 승진시킬 포지션을 만들기 위해 구성원의 역량이 4보다 낮거나 60세를 넘어서면 퇴직시켰습니다. 또한 공석이 발생하면 바로 아랫직급에 있는 구성원들 중에 한 명을 승진시켜서 채우고, 제일 낮은 직급에 공석이 발생하면 새로운 구성원을 채용하기로 정했죠. 

플루치노는 아랫직급의 직원을 윗직급의 공석으로 승진시키는 방식을 세 가지 로직으로 다르게 설정했습니다. '베스트 승진'은 아랫직급에서 가장 높은 역량을 보이는 구성원을 승진시킨다는 것이고, 반대로 '워스트 승진'은 가장 역량 수준이 낮은 구성원을 승진시킨다는 것이었죠. '무작위 승진'은 아랫직급에서의 역량과 관계없이 무작위로 한 사람을 뽑아 올리는 로직이었습니다.

플루치노는 아랫직급의 역량과 윗직급의 역량이 서로 의존적('윗직급의 역량은 아랫직급 역량에서 10% 이내의 변동을 가진다')이라는 '상식적인 가정' 하에서 세 가지 승진 방식을 적용했습니다. 초기의 조직 전체의 역량 수준은 69.68%이었는데, 시뮬레이션을 돌려보니 '베스트 승진'은 9%가 높은 79%로 수렴된 반면, '워스트 승진'은 5%가 떨어져 65%로 수렴되었습니다. 아랫직급에서 일 잘하면 윗직급에서도 일 잘할 거라는 가정 하에서 출발한 시뮬레이션이었기에 이는 당연한 결과라고 볼 수 있습니다. 헌데 아무나 뽑아 올리는 '무작위 승진' 방식도 초기 역량 수준을 2%P 끌어올렸다는 것은 주목할 만한 결과였습니다.

이번엔 피터의 가정 하에서 시뮬레이션을 돌려보기로 했습니다. 즉, 아랫직급의 역량과 윗직급의 역량은 서로 독립적('아랫직급에서 일 잘한다는 것이 윗직급에서의 성공적 수행을 담보하지 못한다')이라는 조건 하에서 세 가지 승진 방식을 적용했습니다. 그랬더니 놀라운 결과가 나왔습니다. '베스트 승진'보다 '워스트 승진'이 조직 전체의 역량 수준을 높이는 데에 훨씬 좋았으니 말입니다. 아이러니하게도 '베스트 승진'은 조직의 역량을 10%P 까먹는 반면, '워스트 승진'은 12%P 향상시켰습니다. 피터의 가정 하에서는 아랫직급에서 제일 역량이 떨어지는 직원을 승진시킬 때 조직 전체의 역량 수준이 높아졌던 겁니다. 아랫직급에서 역량 수준이 가장 높은 직원을 뽑아 올리면 종국에 조직 전체의 역량이 떨어진다는 결과는 참으로 당혹스러웠습니다. 한편  '무작위 승진'은 1%P의 역량 향상 효과를 나타냈습니다.

직급의 역할과 요구역량이 '상식적인 가정'에 들어맞을지 '피터의 가정'에 들어맞을지 모르는 상태라면, 아랫직급에서 일 잘하는 사람을 윗직급으로 뽑아올리는 승진 방식('베스트 승진')이 항상 좋은 전략은 아니라고 결론 내릴 수 있습니다. 피터의 가정이 들어맞을 경우 '베스트 승진'은 오히려 독이 되기 때문입니다. 이럴 때는 차라리 무작위로 뽑아올리는 것이 조직 전체의 역량 수준을 보호하는 안전한 전략임을 플루치노의 시뮬레이션은 시사하고 있습니다. 

그렇다고 승진심사 없이 공석이 생기면 아무나 뽑아올려서는 안 되겠죠. 절차와 형식도 중요하니까 말입니다. 하지만 최소한 아랫직급에서 기록한 역량평가 결과에 높은 비중을 주어서는 안 되겠죠. 평가센터(Assessment Center) 운영 등을 통해 윗직급에서 얼마나 일을 잘할지 평가하여 승진을 결정하기도 하나, 여전히 아랫직급에서의 역량에 높은 비중을 주는 것이 사실입니다. 역량평가에서 '죽을 쑨' 직원에게는 승진심사 자격 자체가 박탈되거나 기회가 늦게 주어지니까 말입니다. 허나 아랫직급에서 죽을 쒀도 윗직급에서는 일을 훌륭히 수행할지 모릅니다. 반대로 아랫직급에서 뛰어난 역량을 보여도 윗직급에서 실망스러운 모습을 보일지 모르는 일이죠. 

물론 플루치노의 시뮬레이션은 현실을 단순화한 모델에 근거합니다. 그러나 윗직급에서 요구되는 역량이 무엇인지 정확히 파악하고 그것에 맞는 사람을 제로 베이스에서 뽑아올려야 하지, 아랫직급에서 일 잘한다고 그에게 높은 점수를 주거나 우선순위를 주어서는 안 된다는 점을 우리에게 일깨운다는 측면에서 충분한 의미를 갖습니다. 이것은 피터의 법칙이 강조하는 바이기도 합니다.

여러분의 조직은 피터의 법칙에서 얼마나 자유롭습니까? 만약 자유롭지 못하다면, 아랫직급에서 일 잘하는 사람을 뽑아올리는 일이 결국 조직의 역량을 떨어뜨리는 지름길일 수 있습니다. 그냥 무작위로 승진시키는 게 나을지 모릅니다. 직관에 반하는 일이지만, (현 직급에서) 일 잘하는 직원을 승진시키면 안 됩니다.


(*참고논문)
The Peter Principle Revisited- A Computational Study



  
,


집단 속에서 개인들은 각자 최대한 낼 수 있는 노력을 경감한다는 링겔만 효과에 대하여 이야기했습니다. 100의 능력이 있는데도 집단에 속하면 50이나 60 정도 밖에 기여하지 않는다는 것이죠. 개인의 기여가 구분되어 측정되지 않기에 설령 집단의 성과에 무임승차하더라도 자기 자신이 비난 받지 않을 거라는 심리 때문에 링겔만 효과가 발생합니다.

그렇다면 집단 속에서 개인의 기여가 구분되어 평가되거나 각 개인의 성과가 비교되는 조건이라면 링겔만 효과가 약화되리란 가설을 세울 수 있겠죠. 각자 무엇을 달성해야 하는지 정확하게 일러주고 그 결과를 각자 구분해 평가한다면 집단에 '묻어가려는' 사회적 태만을 줄일 수 있을지 모릅니다. 아마 여러분도 지난 번 글('집단에 속한 당신은 분명 게으르다')에서 이 가설을 떠올렸을 것 같네요.



스테판 하킨스(Stephen G. Harkins)와 제프리 잭슨(Jeffrey M. Jackson)은 이런 가설 하에 실험을 실시했습니다. 그들은 160명의 학생들을 모집하여 어떤 물건의 이름을 제시하고 그것을 어떤 용도로 쓸 수 있을지 가능한 한 많이 생각해 보라는 과제를 부여했습니다. 예를 들어 벽돌이라면 담을 쌓는 데 쓰는 일반적인 용도 이외에 못을 박는다든지, 변기 물통 속에 집어넣어 물을 절약한다든지 등의 용도로 사용할 수 있겠죠. 

하킨스와 잭슨은 두 가지 실험 조건을 설정했습니다. 하나는 용도의 개수를 개인별로 구분하느냐, 아니면 4명으로 이뤄진 팀 단위로 합산하느냐의 여부였습니다. 즉 개인의 기여가 구분되어 측정되느냐, 집단의 성과로 희석되느냐였죠. 나머지 하나의 조건은 팀 멤버들이 모두 동일한 물건의 용도를 생각하느냐, 아니면 각자 다른 물건의 용도를 생각하느냐의 여부였죠. 멤버들이 동일한 과제를 수행하면 서로 누가 더 많은 용도를 생각해냈는지 비교 가능한 반면, 사로 다른 물건의 용도를 고민하면 비교하기가 곤란할 겁니다. 하킨스와 잭슨은 학생들을 4개의 그룹으로 나눠 이 두 가지 실험 조건에 따라 과제를 수행하도록 했습니다.

어떤 조건의 학생들이 가장 성과가 좋았을까요? 여러분도 예상했겠지만, '개인별 측정 - 비교 가능' 팀이 평균 24.9개의 용도를 생각해냄으로써 가장 높은 성과를 보였습니다. 즉 개인별 기여가 측정되고 팀원들이 동일한 과제를 수행할 때 가장 성과가 높았다는 뜻이죠. '개인별 측정 - 비교 불가능' 팀은 19.7개, '집단 측정 - 비교 가능' 팀은 19.8개, '집단 측정 - 비교 불가능' 팀은 19.3개로 성과가 서로 고만고만했습니다. 여기서 주목할 만한 것은 성과가 비록 개인별로 측정된다 하더라도 각자 다른 과제를 부여 받을 때(즉 서로 비교하기 어려울 때)는 개인의 노력이 집단 속으로 뭉뚱그려질 때와 별 차이가 없다는 사실입니다. 집단에 속한 개인의 기여가 정확하게 구분되어 평가되고 동시에 집단의 멤버들이 모두 동일한 과제를 수행할 때 링겔만 효과가 약화된다는 것이죠.

하지만 이 실험의 결과를 기업에 반영할 때 유의할 점이 있습니다. 이 실험에서 설정된 상황과 기업 내의 팀이라는 단위조직의 상황이 그다지 비슷하지 않기 때문입니다. 하나의 팀으로 묶여 있다 해도 팀원들은 각자 서로 다른 내용의 업무를 담당하기에 성과를 비교하기 어렵고 비교해서도 안 됩니다. 위 실험의 결과를 문자 그대로 해석하여 서로 다른 내용의 성과들을 비교하여 줄을 세우는 상대평가 방식이 직원들의 사회적 태만을 줄인다고 믿어서는 곤란하다는 말입니다. 설령 링겔만 효과가 줄어든다고 해도 상대평가 방식은 직원들이 협력하려는 동기를 소멸시키고 마니까요. 이에 대해선 그동안 다른 포스팅에서 여러 번 언급한 바 있습니다.

이 실험의 결과를 유의해야 하는 또 하나의 이유는 일반 조직에서 팀원들의 성과를 개인 단위로 구분하여 측정하기가 대단히 어렵다는 점입니다. 비록 팀원들이 각자 다른 업무를 수행한다고 해도 어느 한 팀원의 업무가 다른 팀원의 인풋이나 아웃풋이 되고 하나의 업무를 둘 이상의 직원이 협업하여 진행하는 경우가 많습니다. 어디서부터 어디까지가 A의 성과이고 나머지가 B의 성과인지 구분하는 일은 매우 어렵습니다. 이 실험을 곧이곧대로 받아들여 개인별 성과를 정확하게 평가하는 지표를 만들어서 링겔만 효과를 없애겠다고 생각한다면 실패가 자명합니다. 개인별 지표의 강화 역시 직원들의 협력 동기를 크게 약화시키고 맙니다. 

더욱이 이 실험은 '누가 얼마나 많은 개수의 용도를 생각해냈느냐?'와 같이 누구나 인정하는 정량지표로 평가했다는 것에 또한 유의해야 할 점입니다. 직원들의 업무 내용이 정성적이며 그 성과 또한 정성적으로 평가 받을 수밖에 없는 조직에서는 이 실험의 의미를 제한적으로 수용해야 합니다. 업무가 분명 정성적인데 정량적으로 평가해야겠다며 우스꽝스러운 정량지표(예 : 전략 보고서 제출 건수)를 만들어내면 곤란하겠죠.

따라서 이 실험은 콜센터나 영업조직과 같이 구성원들이 모두 동일한 과제를 수행하고 그 결과가 동일한 지표로 정량적으로 측정되어 서로 비교 가능한 조직에서나 의미를 갖습니다. 물론 이런 조직은 이미 사회적 태만을 줄이기 위한 나름의 장치를 가동 중이기에 이 실험이 추가적인 방법을 시사하지는 못할 겁니다. 사실 지난 번의 글('집단에 속한 당신은 분명 게으르다')에서 설명한 실험의 조건도 조직 내의 상황과 다르기 때문에 한번은 걸러서 교훈을 얻어야 합니다. 

오늘 글에서 소개한 실험은 태만과 무임승차를 없애는 데에 개인별 성과 측정이라는 단도직입적인 방법이 과연 통할까, 라는 질문에 '그렇다'라는 대답을 하기가 어렵다는 점을 역설적으로 시사합니다. One-size-fits-all 솔루션은 없습니다. 어쨌든 집단이 어떤 특성을 가지느냐와 상관없이 일정 정도의 사회적 태만과 무임승차자가 존재하는 것은 피할 수 없는 사실입니다. 애석하지만, 어느 정도는 떠안고 가야 할 필요악일지 모릅니다.


(*참고논문)
The role of evaluation in eliminating social loafing.




  
,