ここから本文です

レスポンデント条件付けとオペラント条件付けの違いをわかりやすく説明して下さい...

rirakkumaitomeさん

2011/4/121:18:59

レスポンデント条件付けとオペラント条件付けの違いをわかりやすく説明して下さい。辞書を見たらレスポンデント条件付けの方はまだ理解できたのですが、オペラント条件付けの定義が今一つわからないのです。

心理学用語に詳しい方、よろしくお願いします。(ちなみに私は全く専門外で今少しずつ勉強しているところです。素人でも理解できるような説明をお願いします。)

補足報酬や罰の具体的な例を示して説明していただけるとありがたいです。

閲覧数:
123,592
回答数:
3

違反報告

ベストアンサーに選ばれた回答

orcamarronさん

編集あり2011/4/611:00:03

他の方の回答でほぼ尽くされていると思いますが,
私なりに解説を。

オペラント条件づけの身近な例は動物に芸を仕込む訓練です。
たとえば「お座り」という声かけに対して
犬がお座りの姿勢を取ったなら,直後に餌を与える。
これを繰り返すと「お座り」の声かけに対して
お座りの姿勢を取る確率が高くなっていきます。

このようにオペラント行動に後続する刺激変化によって
同じオペラント行動が生じやすくなる事態を「強化」と呼びます。
刺激が出現することで強化が生じる場合.
その刺激は「好子(こうし)」=「正の強化子」,
その事態は「好子出現の強化」=「正の強化」です。
好子は一般にいう報酬のことで,餌は代表的な好子です。

「お座り」の声かけに対して
犬がお座りの姿勢を取ったなら,直後に尻尾を踏む。
これを繰り返すと「お座り」の声かけに対して
お座りの姿勢を取る確率は低くなっていくでしょう
(やってみて確かめないといけないけど)。

オペラント行動に後続する刺激変化によって
同じオペラント行動が減るような事態を「弱化」あるいは「罰」と呼びます。
刺激が出現することで弱化が生じる場合,
その刺激は「嫌子(けんし)」=「負の強化子」,
その事態は「嫌子出現の弱化」=「正の罰」です。

鞭だとか罵声だとか電気ショックだとか,
嫌子を付与して行動を抑制する弱化=罰にもいろいろありますが,
緊急時を除いてはできるだけ使わないのが原則です。
罰にはいろいろと副作用が伴うことが知られており,
また罰で行動のレパートリーを広げることはできないからです。

では,望ましくない行動を減らすにはどうするか?
無視して刺激変化を生じないようにします。
行動は反動で一時的に増えることはあっても,
長い目で見れば着実に減少していきます。
このような事態を「消去」と呼びます。

なお,刺激が消失することによる強化や弱化もあります。
刺激が消失することで強化が生じる場合.
その刺激は「嫌子」=「負の強化子」で,
その事態は「嫌子消失の強化」=「負の強化」です。
(例:騒がしいので怒鳴る→静かになる→騒がしいとまた怒鳴る)。

刺激が消失することで弱化が生じる場合.
その刺激は「好子」=「正の強化子」で,
その事態は「好子消失の弱化」=「負の罰」ということになります。
(例:阪神が負けるとちゃぶ台をひっくり返す→ごはんが食べられない→
阪神が負けてもちゃぶ台をひっくり返さない)。

犬のしつけというテーマのもと,
オペラント条件づけをわかりやすく解説している
下記のサイトをお薦めします。

■犬のしつけをまじめに考える!
http://www.dogparty.net/index.cgi

下記のサイトのビデオライブラリーでは
セキセイインコ,ハト,トビ,ペンギンなど
鳥類のオペラント条件づけを動画を見ることができます。

■日本大学大学院 総合社会情報研究科 眞邉研究室
http://atlantic.gssc.nihon-u.ac.jp/%7Emanabe/index.htm


ここから先はもう一歩踏み込んだ補足。

レスポンデントとオペラントというのは行動の分類です。
レスポンデント行動は特定の刺激に誘発される行動で,
反射や本能行動(動物行動学的意味での)がこれに含まれます。

生まれつきの誘発刺激(無条件刺激)と
もともと無関係な刺激(中性刺激)を同時に与えることを繰り返すだけで,
もともと無関係な刺激が誘発刺激(条件刺激)に変化するのが
レスポンデント条件づけ(古典的条件づけ)です。

梅干を口に含むと唾液が出るのはレスポンデント。
梅干を見ただけで唾液が出るのは...レスポンデント(学習性の)です。

特定の誘発刺激を持たない行動がオペラント行動ということになります。
行動直後に生じる刺激の変化によって
オペラント行動の出現確率が変化するのがオペラント条件づけです。

オペラント行動とその後の刺激変化は
因果関係で結ばれている必要はありません。
たまたま続けざまに起きたのであっても条件づけは成立します。
この「続けざまに起きる」関係を「随伴性」と呼んでいます。

オペラント行動は自発的行動であるとの説明を見かけますが,
この「自発的」というのは「誘発刺激がない」というだけの意味で,
「意図的」という含意はありません。
行動分析の視点からすると「意図する」のはまた別の行動であり,
脳の活動から見ると意図は行動の後追いをしているとの報告もあります。

人の意図的行動は基本的にオペラント行動ですが,
意図なしに生じる,あるいは意図から外れたオペラント行動もありえます。
また意図の存在を判定できない巻貝のような動物でも
オペラント行動やオペラント条件づけを観察することはできます。

■捕食者検知ストレスによる記憶形成の強化
砂田寛司,堀越哲郎,榊原学
東海大学紀要. 開発工学部 18, 65-75, 2009-03-31
http://ci.nii.ac.jp/naid/110007554372

質問した人からのコメント

2011/4/6 14:05:51

降参 皆さま本当に詳しい解説有難うございました。一番具体的な例を下さった方をBAにさせていただきました。頑張って勉強します!

「レスポンデント条件付け」の検索結果

検索結果をもっと見る

ベストアンサー以外の回答

1〜2件/2件中

並び替え:回答日時の
新しい順
|古い順

fhufheufhweiさん

編集あり2011/4/222:21:10

レスポンデント条件付けは無条件刺激と条件刺激を反復して対呈示し続けることで反応を変容させる学習理論の一つです。生理学者パブロフが提唱し(パブロフの犬)後に行動主義の祖であるワトソン(恐怖条件付け)が使い始めました。たとえばパブロフの犬の場合は無条件刺激(餌を見ると唾液をだす)に条件刺激(ベルを鳴らす)を反復して繰り返すことで犬はベルを鳴らすだけで唾液を出すようになります。

オペラント条件付けは心理学者ソーンダイクが提唱しスキナーが広めた学習理論の一つです。こちらは報酬や罰といった刺激を与えることで反応を変容させます。たとえば何か課題を達成した際に報酬を与え失敗したときに罰を与えることで対象者の行動頻度を強化していきます。

<補足>
報酬→餌や水や金銭や賞賛といった社会的かかわりなどが該当します。 罰→体罰や叱責などが該当します。対象者が特定の行動を行ったときに統制者が報酬や罰を与え行動頻度を操作しようと試みるわけです。
たとえば児童がテストで良い成績をとった場合に物を与えるのが報酬で叱責するとしたら罰になると思われます。簡単に言えば飴と鞭ですね。

watamamannさん

編集あり2011/4/312:07:00

レスポンデント条件づけは、唾液分泌や瞬きなど、反射を利用した条件づけ。

オペラント条件づけはレバー押しやキーつつきなど、意図して行われる行動を利用した条件づけ。

一番大きな違いは以上の点だと思います。

補足を読んで…
まず、報酬や罰という概念はオペラント条件づけに特有のものであり、古典的(レスポンデント)条件づけにはこれらの概念を使いません。
なぜなら古典的条件づけ単には反射と刺激のつながりについての説明であり、報酬や罰などといった価値づけの概念が、それらの概念と関連性を持たない刺激とどうつながるかが問題なのですから。

そしてオペラントに関してですが、最近ネットでよく見かけるものに「罰とは嫌悪刺激を与えることで行動を抑制することである」というのがありますが、これは間違いです。東大出版会の「心理学」にもきちんと説明されていないことにはびっくりしましたが、ネット上で間違った知識を広めている人が多いことも一つの原因になっています。

「報酬」とは「強化子(エサや褒め言葉など、生体にとって生物学的に意義のある刺激)」のことですが、「罰」とは「生体を生物学的に望ましくない状況に置く手続き」のことを指します。つまり「報酬」と「罰」は対応する用語ではないのです。

「罰」に対応する用語は「強化」です。「強化」は「ターゲット行動の頻度を増加させる手続き」、「罰」は「ターゲット行動を減少させる手続き」です。

「強化」と「罰」にはそれぞれ「正」と「負」があります。「正」の手続きは刺激を与える手続き、「負」の手続きは刺激を取り除く手続きです。これらを組み合わせると以下の4つの手続きが可能です。
・正の強化:増加させたいターゲット行動(勉強をする、片付けをするなど)が示されたときに報酬(褒め言葉、ご褒美のおもちゃなど)を与える(→ターゲット行動が増加する)。わかりやすくするために人間の例をあげて説明します。
・負の強化:増加させたいターゲット行動が示されたときに嫌悪刺激(食事の中のきらいな野菜など)を取り除く(→ターゲット行動が増加する)。
・正の罰:減少させたいターゲット行動(わがままを言う、散らかす)が示されたときに嫌悪刺激(叱る、お手伝いをさせる)を与える(→ターゲット行動が減少する)。
・負の罰:ターゲット行動が示されたときに報酬(おもちゃ、お菓子など)を取り除く(→ターゲット行動が減少する)。

強化に関しては、連続強化(毎回強化を行う場合)では学習が早く進みますが、消去も早く進みます。部分強化(何回かに1回強化)するほうが消去しにくくなります。これを「部分強化効果」と言います。その中でも一定あるいは変動する割合や比率で行うか(強化スケジュール)によって学習速度や消去耐性が異なります。
・定時間隔強化 (FI):行為とは無関係に一定の時間感覚で強化を与える(月給)
・変時間隔強化 (VI):行為とは無関係に不定の時間感覚で強化を与える(釣り)
・定率強化 (FR):一定の反応数ごとに強化を与える(歩合制)
・変率強化 (VR):不定の反応数に対して強化を与える(パチンコ)
これらの強化スケジュールの効果の強さはVR, FR, VI, FIの順に大きいとされています。
パチンコがやめられないのは、最も効果的な強化スケジュールで儲けられるようになっているからなのです。

あわせて知りたい

みんなで作る知恵袋 悩みや疑問、なんでも気軽にきいちゃおう!

Q&Aをキーワードで検索:

Yahoo! JAPANは、回答に記載された内容の信ぴょう性、正確性を保証しておりません。
お客様自身の責任と判断で、ご利用ください。
本文はここまでです このページの先頭へ

「追加する」ボタンを押してください。

閉じる

※知恵コレクションに追加された質問は選択されたID/ニックネームのMy知恵袋で確認できます。