본문 바로가기
심리학

도구적 조건형성의 주요현상들

by Eggmoneyna 2022. 5. 19.

조성

유기체가 어떤 반응을 어떻게 학습하는가는 손다이크의 효과의 법칙이 잘 설명해준다. 효과의 법칙이 작용하려면 학습시키고자 하는 목표 반응이 먼저 출현해야 그 반응이 강화를 받을 수 있다. 애초부터 나타나지도 않는 반응이 강화를 받을 수 없고 새로운 반응이 학습된다는 것은 불가능하다. 그래서 학습이란 유기체가 이미 할 수 있는 여러 반응들 중 어느 것이 더 빈번하게 수행되어지는가의 문제가 되고 만다. 효과의 법칙에 기반을 두면서 현재 유기체가 할 줄 모르는 새로운 반응을 학습시키는 방법이 조성 shaping 또는 계기적 근사법이다. 원하는 목표 반응을 단계적으로 조작해내는 과정이다. 예를 들어 스키너 상자에 넣은 쥐는 처음부터 레버 누르기를 하지 않는다. 쥐에게 이를 학습시키려면 먼저 쥐가 레버 근처로 가면 먹이를 주고 쥐가 레버 주변을 맴돌게 되면 레버를 향해 몸을 뻗었을 때 먹이를 준다. 그다음에는 쥐가 앞발로 레버를 건드려야 먹이를 주고, 마지막으로 레버를 눌러야 먹이를 준다. 쥐는 애초에는 하지 않았던 레버 누리기 반응을 하게 된다. 이것이 조성기법이다.

 

미신 행동

유기체는 좋은 결과를 초래한 반응을 계속하고 나쁜 결과를 초래한 반응은 감소시킨다. 자신의 반응이 그 결과의 원인인 것처럼 행동한다. 만약 어떤 반응에 강화가 우연히 뒤따르면 어떻게 될 것인가.

스키너 상자에 비둘기를 넣고 반응과는 상관없이 15초마다 먹이를 주면, 먹이가 주어지는 직전에 비둘기는 무슨 반응인가를 하고 있을 것이다. 먹이는 계속 15초마다 주어지기 때문에 비둘기의 반응과 강화 사이에는 아무런 인과관계가 없다. 그러나 효과의 법칙에 따르면 어떤 반응에 강화가 뒤따르기만 하면 그 반응이 증강되어야 한다. 실제 실험 결과도 먹이가 주어지기 직전에 우연히 오른쪽으로 돌고 있던 비둘기는 그 반응이 점차 늘어나 실험이 끝날 즘에도 계속 맴돌고 있다. 이같이 자신의 반응이 실제로 특정결과를 초래한 원이 아니어도 마치 그런 것처럼 그 반응을 계속하는 것을 미신 행동이라고 한다. 

인간 또한 미신 행동을 보인다. 예를 들어 도박꾼이 주사위를 던지기 전에 항상 주사위에 입으로 바람을 훅 불어넣는 행동을 한다고 했을때 원인을 살펴보니 이전에 그러한 행동을 하고 나서 주사위를 던졌더니 우연히 돈을 따게 되는 경험이 있었기 때문이었다. 그 행동은 돈을 딴 결과에 의하여 강화를 받았고 계속하여 던지기전 바람을 불어넣는 행동을 빈번하게 하게 된 것이다.

 

조건 강화물과 사회적 강화물

어떤 반응을 학습시키는데 필요한 강화물 중에 음식, 물, 전기충격의 종료 등은 유기체의 생물학적인 요구를 충족시켜주는 것이라서 1차 강화물이라고 한다. 그런데 학습은 항상 1차 강화물에만 의존하는 것은 아니고 어떤 자극들은 유기체의 생물학적 요구와 전혀 상관없지만 1차 강화물과 짝지어짐으로 강화력을 획득한다. 이를 조건 강화물이라고 한다. 대표적으로 돈이 있다. 돈은 그저 종이조각에 불과하지만 음식 등 우리가 원하는 무엇과 항상 짝지어져 왔기에 마치 1차 강화물과 같은 힘을 갖게 되었다.

조건 강화물과 달리 1차 강화물과 짝지어지지 않아도 강화력을 갖고 있는 다른 자극들도 있다. 예를 들어 교사가 단순히 고개를 끄덕여주는 것만으로 충분히 학생의 반응을 강화할 수 있다. 사람의 경우엔 타인에게 인정이나 칭찬, 관심을 받는 것이 강력한 강화물로 작용할 수 있고 이것을 사회적 강화물이라고 한다.

 

강화 계획

실생활에서는 반응이 나올 때마다 강화가 주어지는 연속 강화가 주어지는 경우는 드물다. 농구선수가 슛을 할 때마다 골인이 되는 것이 아니고 사자가 사냥을 할 때마다 성공하지 못한다. 행해진 반응들의 일부만이 강화를 받는 것을 부분 강화라고 하거나 간헐적 강화라고 한다. 부분 강화에서 어떤 강화 계획을 사용하는가에 따라 유기체의 행동이 달라진다.

강화가 각 강화 사이의 시간 간격을 기준으로 주어지는지 반응 비율을 기준으로 주어지는지에 따라서 강화 계획은 네 가지로 나누어진다. 고정 간격 계획은 강화를 한번 받은 후 일정 시간이 지나고 난 후에 행해지는 반응에 대하여 강화가 주어지는 것이고, 변동 간격 계획은 각각의 강화가 주어지는 시간 간격이 평균을 중심으로 변하는 경우이다. 일정한 수의 반응을 하고 나면 강화가 주어지는 경우를 고정비율 계획이라고 하고 강화를 받기 위하여 필요한 반응의 수가 평균을 중심으로 변하는 경우를 변동비율 계획이라고 한다. 스키너 상자에서의 동물반응은 이런 강화 계획에 따라 다른 패턴을 나타내고 인간의 행동도 어떤 강화 계획이 사용되는 가에 따라서 변화된다.

 

조건 형성을 통한 학습의 한계

조건 형성의 원리들이 동물과 인간의 모든 행동을 설명할 수 있다고 생각했지만 일반적인 학습원리에 들어맞지 않는 현상들이 발견되었다. 첫 번째는 학습에 있어서 생물학적인 준비성과 한계이고 두 번째는 인간과 원숭이 등의 고등동물이 보이는 인지학습이 조건 형성을 통한 학습의 한계이다.

 

 

 

참고하기-이전 포스트: 도구적 조건 형성

 

'심리학' 카테고리의 다른 글

기억의 종류와 기억 잘하는 법  (0) 2022.05.22
이상행동의 설명모델  (0) 2022.05.21
도구적 조건형성  (0) 2022.05.19
소비자 정보처리과정  (0) 2022.05.17
사회심리학  (0) 2022.05.17

댓글