训练泰迪方法
1、连续强化法:比如你希望狗狗在一个盒子里大小便,狗狗一旦出现这样的行为就给食物作为强化,每次正确的行为都得到及时的强化。不像后面的强化方法,并不是所有的正确的行为都会得到强化。连续强化的方法优点在于容易操作,狗狗学习速度快,容易懂的主人的意思。
2、间断强化法(计件工资):假如我们要训练狗狗给我们叼东西,狗狗并不是每次做对了就得到食物,而是每作对n次才给食物,n可以是1、2、3、4……等。这样的方法叫做间断的强化。间断强化的优点是狗狗一旦学会了一种行为就记得比较深刻,不容易遗忘。
3、时间间隔强化法(计时工资):计时工资大家都知道是什么意思,就是你工作一段时间以后,才给报酬。对于训练泰迪来说,狗狗做出正确的行为不一定会得到食物作为强化,而是必须在正确的时间做出正确的事情才能的刀法强化。比如,训练狗狗踩踏跷跷板,每隔五分钟,我们给狗狗一次食物强化。如果狗狗不踩踏跷跷板了,我们就不给强化了。这样的方法训练的狗狗学习速度比较慢,对于非专业的人士来说,也是比较难的。
4、变比强化:这是上面提到的“间断强化法”的变种,狗狗每作n次行为会得到强化,但是这个n是变化的,也就是说狗狗作出一次行为可能得到强化,作出两次行为也可能得到强化。这种方式建立的行为持续时间长,狗狗不容易忘记该行为。不过狗狗学会这个行为时间比较长。
5、变时间间隔强化:这是上面提到的“时间间隔强化”的变种,也就是说有时候我们一个月发工资,有时候我们一周发一次工资,这个时间间隔是变化的。这样的方法使得狗狗很难学会一个行为,它也不太懂得主任的意思,所以在用该强化的时候可以先做时间间隔强化,以后再做变时间间隔强化。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。