Головна |
« Попередня | Наступна » | |
4. Описові моделі: аксіоматика та інтуїція |
||
Під описовими ми будемо розуміти моделі ітеративного навчання, в яких явно не проводяться аналогії з принципами пристрою і функціонування тих чи інших систем, а експонентний вигляд КН виходить в результаті введення досить абстрактних і не обгрунтовуємо припущень щодо законів і правил взаємодії елементів навченою системи (у аксіоматичних моделях іноді постулюється безпосередньо, що крива навчення описується експонентою - виразом (2.1)). У більшості випадків в описових моделях вводяться припущення спираються на інтуїцію і апелюють до здорового глузду, а висновки з аналізу динаміки КН часто лежать в основі моделей більш високого рівня [14, 31]. Модель 4.1. О. Зміна неузгодженості системи в часі. Г (В, Ф). Швидкість зміни неузгодженості пропорциональ-на його поточному значенню, причому коефіцієнт пропорційності не залежить від часу. Тобто (4.1) = _ гт dt Висновок очевидний - рішенням цього диференціального рівняння є експонента - вираз (2.1) . А. Значна частина аксіоматичних моделей так чи інакше передбачає пропорційність між зміною неузгодженості в одиницю часу і його поточним значенням. Зрозуміло, що при постійному коефіцієнті пропорційності таке припущення відразу призводить до експоненціального увазі КН, причому для збільшення швидкості научения необхідно збільшувати величину коефіцієнта g, який надалі в різних моделях буде інтерпретуватися як кількість інформації, що переробляється навченою системою в одиницю часу, пропускна здатність каналу зв'язку , об'єктивно існуюче обмеження на швидкість зміни параметрів елементів і т.д. Аналогічні побудови (правда, при трохи більше штучних вихідних гіпотезах) наведені в [75]. У моделі з дискретним часом, якщо: xn - xn1 = - a xn, то xn = (1 - a) n x0k n = 1, 2, ... , І швидкість навчення убуває з ростом a (а є (0; 1)). Якщо ж xn = Ь xn-1, то xn = bn x0h n = 1, 2, ... , І швидкість навчання зростає з ростом Ь (Ь є (0; 1)). - Модель 4.2. (Р. Буш, Ф. Мостеллер, У. Естес [23, 43, 99, 106]). О. Неузгодженість - ймовірність правильної реакції (наприклад, у відомому експерименті "пацюк в лабіринті") [13, 23, 79 та ін]. Досліджується залежність неузгодженості від числа повторень. Якщо ймовірність правильної реакції дорівнює p (ймовірність неправильної реакції дорівнює, відповідно, (1 - p)), то вона може збільшитися не більше, ніж на (1 - p), і стати рівною одиниці, і зменшитися не більше, ніж на p, і стати рівною нулю. Ф (В). При початковій точці x0 і постійних коефіцієнтах а (an = a), і b (bn = b) отримуємо xn = xo (1 - а - b) n + (1 - a - b) . К = 0 Безперервний "аналог" цього рішення має вигляд x (t) = x ~ + (x0 - x ~) e - (a + b) t, де x? = A / (a + b). А. У порівнянні з попередньою моделлю, у розглянутій тут моделі введено ускладнення - можливість як збільшення, так і зменшення неузгодженості (СР (4.1) і (4.2)), хоча, по суті, розглянута модель є "ймовірнісної" модифікацією моделі 4.1. Сталість коефіцієнтів призводить до експоненці-альности рішення, а швидкість навчення g = a + b, як і раніше, визначається величиною коефіцієнтів a і b. Статистичним моделям навчення присвячено значну кількість робіт, особливо зарубіжних авторів. У більшості з них ІН розуміється саме як "... систематичне зміна вероят- ності реакції" [99, с. 395]. Наведемо один з наборів вимог до статистичних моделям: "Динаміка усередненого показника навчення описується кривою, що має негативне прискорення у своїй кінцевій фазі і прагне до деякої постійної асимптоти" (відзначимо, що в цьому пункті потрібно уповільнена асимптотічность тільки в кінцевій фазі, тобто допускається, наприклад, наявність початкового плато - Д.Н.). "Гладка крива середнього є результатом усереднення ..., а асимптота спостережуваної КН представляє лише точку статистичного рівноваги" [99, с. 397]. Слід зазначити, що отриманому рішенням рівняння (4.2) цілком відповідають результати експериментів з багатьма тваринами (в більшості випадків - з пацюками) [23, 67], людьми [4, 100 та ін] і ймовірносними автоматами [24 та ін]. Експоненціальне вид КН обумовлений лінійністю залежностей (4.1) і (4.2) і постійністю (стаціонарністю) коефіцієнтів a і р. У наступній моделі ця залежність береться вже нелінійної. - Модель 4.3. (Р. Буш, Ф. Мостеллер та ін [23]). О. Зміна неузгодженості (наприклад, залежність ймовірності правильної реакції від числа повторень) системи в часі. Г. На кожному кроці зміна неузгодженості пропорційно поточному значенню неузгодженості і різниці між деяким кінцевим неузгодженістю a і поточним. Динаміка неузгодженості задовольняє диференціальному рівнянню Бернуллі (4.3) dx (t) = р x (t) (a-x (t)), dt Ф (В). При початковій точці x рішенням є логістична крива: x (t) = ax0 / (x0 + (a-x0) e "a рt). А. Наявність" гальмуючого довеска "в (4.3) в порівнянні з (4.1) і (4.2) призводить до того, що КН виходить не експоненційної, а логістичної - з'являється точка перегину. Швидкість научения, на відміну від попередніх моделей, залежить не тільки від коефіцієнта пропорційності між швидкістю зміни неузгодженості і поточним значенням неузгодженості, а й від величини кінцевого неузгодженості. - Модель 4.4. (К. Халл [36, 104, 105]). О. Класичною аксіоматичної моделлю ітеративного навчання є відома система постулатів К. Халла (C. Hull) для бихевиористской моделі SRS (основою навчання є зміцнення зв'язків стимул-реакція). Г (А, В). Закон формування навички (IV постулат) говорить, що, якщо підкріплення рівномірно (рівномірність проб - важлива характеристика ітеративного навчання) слідують одне за іншим, а все інше (зовнішні умови і цілі навчання) не змінюється, то в результаті міцність навику x (n) буде збільшуватися із зростанням числа випробувань згідно рівності: xn = 1 - 10-g n. А. Відзначимо, що крива забування згідно VIII постулату також є експоненційної кривої [105]. - Модель 4.5. (Ю.Г. Антомонов [9, 11]). О. "Узагальнена модель навчання" (наприклад , навчання людини-оператора). Перемінної є x - імовірність того, що у навченою системи сформувалася адекватна модель зовнішнього середовища. Г. З аналога принципу найменшої дії (див. також моделі розділу 5 цієї роботи) випливає, що зміна ймовірності задовольняє диференціальному рівнянню [11]: (4.4) ^ + ax (t) = b. dt Відзначимо, що іноді рівняння типу (4.4) називаються "законом підкріплення статистичної теорії навчання". В [92] цей закон записується у вигляді xn xn-1 + a (1 xn-1) що відповідає b = a (або (4.2) з b = 0, при цьому якщо x0 = 0, то x? = 1 [9]). Ф (В, А) - див модель 4.2. - Багато дослідників спочатку постулюють уповільнено-асимптотичний вид КН і використовують його в подальшому при кількісному аналізі, виробленні різних рекомендацій і т.д. [75 , 109, 115 та ін]. Практично у всіх моделях цього розділу передбачається, що неузгодженість системи задовольняє лінійних диференціальних рівнянь з постійними коефіцієнтами. При цьому лінійність і стаціонарність коефіцієнтів є достатніми (але не необхідними) умовами експоненціаль-ності рішення. |
||
« Попередня | Наступна » | |
|
||
Інформація, релевантна "4. Описові моделі: аксіоматика та інтуїція " |
||
|