Головна
Аксіологія / Аналітична філософія / Антична філософія / Антологія / Антропологія / Історія філософії / Історія філософії / Логіка / Метафізика / Світова філософія / Першоджерела з філософії / Проблеми філософії / Сучасна філософія / Соціальна філософія / Середньовічна філософія / Телеологія / Теорія еволюції / Філософія (підручник) / Філософія мистецтва / Філософія історії / Філософія кіно / Філософія науки / Філософія політики / Філософія різних країн і часів / Філософія самоорганізації / Філософи / Фундаментальна філософія / Хрестоматії з філософії / Езотерика
ГоловнаФілософіяФундаментальна філософія → 
« Попередня Наступна »
Новиков Д. А.. Закономірності ітеративного навчання. М.: Інститут проблем управління РАН, 1998. - 77 с., 1998 - перейти до змісту підручника

8. Моделі колективної поведінки


У справжньому розділі розглядаються моделі ітеративного навчання, що грунтуються або на результатах експериментальних спостережень взаємодії членів колективу, або на аналогіях з принципами, використовуваними у формальних моделях колективної поведінки.
Модель 8.1. (У.Р. Ешбі [94]).
Однією з перших моделей адаптаційного взаємодії елементів є гомеостат Ешбі, службовець гарною ілюстрацією можливостей використання ультрастабільних динамічних систем при моделюванні властивостей нервової системи. Слід визнати, що так як при вивченні гомеостата основний акцент робиться на адаптивність поведінки, його "криві научения" в ряді випадків не є уповільнено-асимптотичними. Ця модель настільки відома і детально досліджена, що ми обмежимося посиланням на першоджерело [94]. -
Модель 8.2. (М.А. Новіков [58]).
О. Модель гомеостата може бути використана для аналізу групової діяльності операторів. Фактично, відміну від попередньої моделі полягає в тому, що компенсація впливів (зовнішніх по відношенню до конкретного оператора) здійснюється не за рахунок фізичної зворотного зв'язку (пристрою приладу), а за рахунок цілеспрямованої діяльності кожного оператора, що враховує дії інших.
Г (Ф, В, А). Матричне рівняння "Гомеостат" має вигляд [58]:% = AU, U - матриця положень ручок управління,% - матриця положень стрілок приладів, A - матриця, що характеризує структуру "гомеостата" і величини коефіцієнтів взаємного зв'язку (показання кожного приладу є лінійною комбінацією положень ручок управління). Залежно від способу з'єднання операторів (використовувалися кільце, зірка, ланцюг та ін) і числа операторів визначається трудність вирішуваних завдань.
А. При різних структурах трудність розв'язуваної задачі істотно залежить від числа операторів. Припущення про лінійність взаємозв'язку істотно спрощує модель. При цьому, знову
ж в силу адаптивності, динаміка системи не завжди описується уповільнено-асимптотической кривої. -
Модель 8.3. (А. Раппопорт [71]).
О. Параметри самоорганізації в групі з трьох піддослідних.
Г. Позначимо Hmax - максимальне значення ентропії системи, H (t)? Hmax - поточне значення ентропії, h = Hmax - H - кількість накопиченої інформації. Припустимо, що швидкість накопичення інформації (прирощення інформації за одну ітерацію або за одну помилку) постійна (див. розділ 6) і, що залишкова ентропія рівномірно розподілена між упізнаваними об'єктами.
Ф (В). Відповідно до прийнятих припущеннями, якщо
позначити x (t) - повне число помилок за час t, то ймовірність
dt
dH dx
ність помилки в момент t, = g, H (t) = - M ln (1) (звідки
dt dt беруться ці вирази, як справедливо зауважив перекладач роботи [71], не дуже зрозуміло). Якщо x (0) = 0, то H = gx. У результаті виходить наступне рівняння теоретичної кривої сумарної помилок:
x = Hmax / g-M / g [eXp (Hmax / M - 1) exp (- gt / M) + 1].
А. Справедливість ряду припущень, прийнятих автором цієї моделі не очевидна, деякі твердження (особливо формальні) потребують пояснення. Проте [71] вважається однією з класичних робіт з експериментального і формальному дослідженню процесів самоорганізації в колективах. Відзначимо, що отриманий вираз визначає залежність накопиченої помилки від часу. Крива поточного значення неузгодженості буде логістичної. -
Достатньою спільністю, з нашої точки зору, володіють теоретико-ігрові моделі ітеративного навчання, точніше - моделі, що використовують результати теорії колективної поведінки.
Перш ніж розглядати конкретні моделі, проведемо опис загальних принципів. Нехай система складається з n елементів, кожен з яких може в момент часу t перебувати в со-
стоянні s7 (t) ? W = [s7; s +]. Припустимо, що стан всієї системи однозначно описується вектором станів елементів:
n
s (t) = (si (t), S2 (t), Sn (t)), s (t) ? W = nw7, "t> 0.
7 = 1
Величину h (t) = {s (t) ? W | t Розглянемо як будуть вести себе елементи. Припустимо, що існують деякі функції j () = {j7 (s)}, які ми будемо називати цільовими функціями елементів, що відображають інтереси елементів (кожен елемент прагне максимізувати значення звий цільової функції). Відзначимо, що цільова функція кожного елемента в загальному випадку залежить не тільки від його власного стану (обраній ним або призначається йому "керуючим пристроєм" стратегії), але і від станів інших елементів, тобто має місце гра елементів (наприклад, кожен елемент може прагнути мінімізувати функцію-індикатор [52, 53]). Ми будемо вважати, що ця гра некооперативних, тобто кожен елемент вибирає стратегію самостійно, не маючи можливості домовитися з іншими елементами.
Послідовно змінюючи свої стратегії, елементи прагнуть досягти деякої точки рівноваги. У теорії ігор існує кілька концепцій рівноваги. Якщо ми вважаємо гру елементів некооперативних, то, доцільно розглядати рівновагу Неша (як таку сукупність стратегій, одиночне відхилення від якої невигідно жодному з елементів). Для нашого аналізу первинним є не концепція рівноваги, а принципи поведінки елементів. Під принципом поведінки 7-го АЕ ми будемо розуміти правило, за яким він вибирає свою стратегію в момент часу t , знаючи свою цільову функцію і допустима безліч, знаючи (а іноді й не знаючи або знаючи тільки частково) цільові функції і допустимі безлічі інших елементів і знаючи (а іноді й не знаючи або знаючи тільки частково) історію гри h (t). Тобто
(8.1) s, 0.
Передбачаючи можливі заперечення проти наділення елементів навченою системи деякими "інтересами", відзначимо, що , дійсно, в активних системах (наприклад, група взаємодіючих операторів) функції {j, F,} відображають інтереси елементів системи, а в пасивних системах F, (-) - не що інше, як закон (іноді невідомий досліднику) зміни станів елементів, задовольняє фізичним, біологічним та іншим обмеженням.
Зрозуміло, що, прийнявши ту чи іншу гіпотезу про поведінку елементів і їх взаємодії, можна розрахувати траєкторії кожного з них. Із зростанням розмірності системи доцільність використання такого методу стає проблематичною і виникає бажання описати поведінку системи в цілому (може бути декілька усереднено і не зовсім точно), не вдаючись у докладний опис кожного з елементів.
Інтуїтивно, таке агреговане опис у ряді випадків буде надаватися із зростанням розмірності системи все більш точним.
В окремому випадку (8.1) перетворюється на динамічну систему
si = f (s (t)), i = їй, t> 0 ,
або, якщо час дискретно, систему різницевих рівнянь:
s (k + 1) = f (s (k)), i = 1, n, k = 0, 1, 2, ...
В останніх двох випадках завдання дослідження динаміки колективні поведінки зводиться до вивчення властивостей динамічної системи [65, 66]. Зокрема, необхідно визначити - чи існує точка рівноваги (іноді це еквівалентно дослідженню існування положення рівноваги динамічної системи) і стійко воно, чи сходяться траєкторії системи до цього положення рівноваги (якими є області тяжіння різних рівноважних точок), яка швидкість збіжності і т. д. На сьогоднішній день відповідей на ці питання в загальному випадку не існує, і більшість досліджень сконцентрувалося на вивченні тих чи інших приватних моделей.
Модель 8.4.
О (Г). Стани елементів системи задовольняють нормальній системі диференціальних рівнянь:
(8.4) st = f (s (t), t), 7 = 1, n, t> 0.
Нехай функції {f} безупинні і ліпшіцеви (задовольняють певного обмеження на швидкість росту) у всій допустимої області.
Ф (В). Для будь допустимої початкової точки рішення системи (8.4) існує і єдино. Більше того, якщо рішення (8.4) асимптотично стійко, то становище рівноваги досяжно за нескінченний час (групове властивість).
Якщо {/ 7} - лінійні функції і всі власні значення відповідної матриці мають негативні дійсні частини, то існують дві експонентні функції, що обмежують траєкторію системи (8.4) зверху і знизу. Введення додаткового припущення про монотонності правої частини системи (8.4) призводить до уповільнено-асимптотичному увазі траєкторій її вирішення.
А. Ліпшіцевость правої частини системи диференціальних рівнянь може інтерпретуватися як обмеженість швидкості можливих змін станів елементів (і, отже, неузгодженості), що приводить до недосяжності положення рівноваги (нульовий помилки) за кінцевий час. Для того, щоб виключити можливість появи точок перегину, слід ввести досить сильне припущення про монотонності правої частини. -
Одним з найбільш поширених і добре вивчених припущень про раціональне поведінці елементів активної системи є гіпотеза індикаторного поведінки. Відповідно до цієї гіпотези на кожній ітерації кожен елемент робить крок у напрямку тієї стратегії, яка була б оптимальною, якщо всі інші елементи вибрали б ті ж стратегії, що й на попередньому кроці. У цьому випадку визначимо положення цілі 7-го елемента:
wt (s_i) = arg max j (sv s_ )
siІ
де s_7 = (sj, s2, ..., s7_i, s7 +1, ..., sn) - обстановка для 7-го елементу.
Тоді гіпотезу індикаторного поведінки можна записати в
вигляді
s (k +1) = s (k) + gk (w (Si (k)) - s (k)), i = 1, n, k = 0, 1, 2, ..., де параметри 0? gk? 1 визначають "величини кроків". Детальне дослідження систем, в яких елементи поводяться відповідно з гіпотезою індикаторного поведінки проведено в [6163, 65].
З ростом числа елементів при "приблизно однаковому" їх вплив на систему в цілому, виявляється, що поведінка системи визначається деяким "усередненим" елементом. При цьому немає необхідності дослідження всіх елементів - значення показників, що характеризують всю систему виявляються стабільними на досить широкій області значень параметрів елементів [1, 60]. Можливість такого "усереднення" (без істотної втрати точності опису) представляється досить привабливою , так як число елементів в реальних итеративно научайтесь системах, як правило, надзвичайно велике (при цьому не принципово, що розуміти під "елементом" - нейрон мозку, ступінь свободи руки і т.д.) [64]. Прикладом використання методів Асім- птотіческого агрегування при дослідженні колективної поведінки (в рамках гіпотези індикаторного поведінки) є приводиться нижче модель (читач, не знайомий з використовуваним апаратом, може пропустити приводяться нижче формальні результати, межі яких відзначені "?").
Модель 8.5.
О. Розглянемо систему, що складається з n взаємопов'язаних елементів, що функціонують у дискретному часі. Стан
системи в момент часу k: sk = (s ^, s ^ k, ..., s'k) є W з Жn визна-виділяється станами елементів sk є О,, k = 1, 2, ..., де
Г. Припустимо, що поведінка системи задовольняє гіпотезі індикаторного поведінки - в кожен момент часу кожен з елементів змінює свій стан в напрямку поточного положення цілі, т. е. описується ітераційної процедурою типу
(8.5) sk +1 = sk + gk [w (s-) - sk], k = 1, 2, ..., i = \ n.
де wг (s-) - поточне положення цілі і-го елемента, залежне від станів інших елементів, а параметри
g = (ее 'ее' | | | 'gn X обирані елементами, визначають величини кроків (швидкість навчення) і мають довільні розподілу в одиничному кубі.
? Припустимо, що точка рівноваги системи c = (c1, c2' | | | 'cn ) 'сг є [s-; s + J, г = 1, П' існує, єдина і
траєкторії (8.5) сходяться до цієї точки (відповідні умови наведені, наприклад, в [52, 65 ]).
В якості запобіжного поточної "віддаленості" системи від положення рівноваги виберемо неузгодженість
1n
(8.6) А = | | c - / | | = -? | c, - ski,
n г = 1
тобто відстань між точками s і c в просторі Шn . Ф. Скориставшись (8.5), отримаємо:
1n
(8.7) A * +1 = - sk) (1 - ее) + ее (c - Wг (sk)) |
n г = 1
Очевидно: An 1 n 1
ее
) A +1 = - Zlc-- sf | (1 - ее) + - 2 ее I c - w, (sk) |.
n г = 1 n г = 1
 При досить великих n оцінка неузгодженості АП +1
 повинна слабо відрізнятися від "середнього значення"
 1 n
 (8.9) А +1 = (1 - їкп) At + їкп -2 | c,-w, (sk) |,
 n г = 1
 _ 1 n
 де їп = - 2 їі. Наведемо коректну формулювання і обос-
 n г = 1
 нованіе цього твердження. Визначимо, що розуміється під близькістю АїП1 і A +1. Відповідно до [60, 64], послідовність
 функцій Akn +1 (gk) стабілізується на одиничних кубах Kn = [0; 1] n,
 ~ Tk +1
 якщо існує така числова послідовність An, що
 Pr {| Akn +1 - Ak +1> e} - 0, n ® +?
 для будь-якого наперед заданого e> 0.
 Для того, щоб судити про стабілізацію, оцінимо різниця значень функції Akn +1 () в наступних точках: ^ є Kn і Sk = (Sk, Sk, ..., Sk) є Kn: ~ ~ 1 n
 | Akn (/) - Akn (S k) | = H? | C, - sk I (Si - gk) +
 n i = 1
 1n
 + - Z (gk - s k) i з - W, (sk) | |.
 n, = 1
 Позначивши a = max (s + - s-), отримаємо
i
 I Akn (7і) - Akn (S k) |? - Zz I gk - Sk |,
 n i = 1
 тобто An (-) є ліпшіцевой функцією з постійною Ліпшиця порядку 1 / n.
 В силу теореми 2 [64], для будь-яких розподілів gk на Kn дисперсія D {Ай} ® 0, n ® +?, Отже, за нерівністю Че-Бишева виконується (8.10).
 В. Стабілізація послідовності Akn дозволяє сформулювати наступний висновок. З ростом числа елементів системи оцінка (8.8) неузгодженості (8.6) сходиться по ймовірності до (8.9), тобто має місце:
 1n
 Pr {Akn +1> (1 - gk) Ak "+ gk-Z | С - w, (sk) |} - + 0.
 n n ® +?
 i = 1
 Деякі приватні випадки наведеного твердження розглянуті нижче:
 - Якщо система монотонно рухається до положення рівноваги (якщо sk:> с,, то sk> w, (sk)> С, і, відповідно, якщо sk? С ^, то
 sk? w, (sk)? С,, i = 1, n, k = 1, 2, ...), то (8.7) сходиться по ймовірності до (8.9);
 якщо елементи системи не взаємодіють або існує S> 0: | с, - w, (sk) | ~ o (nS), i = 1, n, к = 1, 2, ... , То (8.7) сходиться по ймовірності до (1 - 7к) Akn. ?
 А. Дослідження моделі дозволяє зробити наступний якісний висновок: якщо
 елементи не взаємодіють, або
 положення цілі не змінюються з часом (наприклад,
 wi = С,), або
 середня зміна положень мети щодо точок рівноваги для кожного елемента на кожному кроці досить мало:
 | З, - w, (sk) | <| З, - sk | "i =, к = 1, 2, ...,
 то середнє неузгодженість досить точно може бути аппрок-сіміровано експоненційної кривої.
 Істотним у цій моделі є припущення про справедливість гіпотези індикаторного поведінки і вибір рас-узгодження у вигляді (8.6). Більше того, припущення про стаціонарність положень мети, фактично, зводить розглянуту модель до моделі 4.1. -
 У моделях колективної поведінки уповільнено-асимптотичний характер КН є наслідком або великого числа елементів системи, або / та відсутності або обмеженості їх взаємодії, або / та сталості положень мети.
 « Попередня  Наступна »
 = Перейти до змісту підручника =
 Інформація, релевантна "8. Моделі колективної поведінки"
  1.  3. Класифікація моделей ітеративного навчання людини, тварин і штучних систем
      моделей ітеративного навчання будується на основі аналогій з явищами і процесами, що відбуваються в тих чи інших системах живої або неживої природи. Тому в основу класифікації природно покласти тип процесу або явища, аналогія з яким використовується. На малюнку 3.1 приведена пропонована система класифікацій моделей ітеративного навчання. Рис. 3.1. Класифікація моделей ІН В
  2.  Література
      моделі навченості. М.: Держ. вид-во фіз.-мат. літ., 1962. - 483 с. Варшавський В.І. Колективне поведінка автоматів. М.: Наука, 1973. - 408 с. Варшавський В.І., Воронцова І.П. Про поведінку стохастичних автоматів із змінною структурою / / Автоматика і Телемеханіка. 1963. том 24. N 3. С. 353 - 369. Варшавський В.І., Воронцова І.П., Цетлін М.Л. Навчання стохастичних автоматів / В сб. Біологічні
  3.  13. Правові норми - ознаки, структура - гіпотеза, диспозиція, санкція, види
      моделлю правової поведінки), встановлюють що можна, потрібно або не можна робити при настанні нормативно-визначених обставинах. Ознаки правових норм: Загальнообов'язковий характер - правові норми поширюються не на конкретних осіб, а на однорідні категорії учасників суспільних відносин. Правові норми регулюють соціальні взаємодії незалежно від волі і згоди учасників.
  4.  14. Соціальні норми
      моделі людської поведінки. Предмет регулювання - стандартні, типові відносини. Нормативне регулювання передбачає формування офіційних моделей правомірної поведінки - що можна, що потрібно і чого не можна робити при настанні певних, заздалегідь встановлених обставин. Об'єктивно-суб'єктивний характер - соціальні норми відображають економічний, політичний,
  5.  Введення
      моделі поведінки, організаторам виробництва З для виконання функції управління, підприємцям З для встановлення взаємовідносин з найманими працівниками, студентам, аспірантам, магістрам З для майбутньої професійної діяльності, профспілковим активістам. Сучасне законодавство про працю ще не повною мірою відповідає реаліям і потребам практики, і багато його інститути зазнають
  6.  Глава пя-тая. ПРИСТРІЙ ДЕРЖАВИ
      моделлю президентської республіки є такий пристрій форми правління, коли президент є главою держави, але не поєднує цей статус зі статусом глави уряду. Тоді, крім розподілу повноважень, закріплених конституцією, президент, як згадувалося вище, утворює систему органів - державних і громадських - при президенті, які сприяють йому у виконанні його
  7.  Глава восьма. ТЕОРЕТИЧНІ ПИТАННЯ РОСІЙСЬКОЇ ДЕРЖАВНОСТІ
      моделі. У зв'язку з цим у Російської держави відпали дві названі раніше функції: братерського співробітництва з «соціалістичними» країнами і підтримки національно-визвольних рухів. Ідеологія більш не затуляє національних (геополітичних і економічних) інтересів Росії, яким відповідає налагодження широкомасштабного партнерства з різними країнами. Але, зрозуміло, збереження і
  8.  Глава дев'ята. ТЕОРІЯ ПРАВА ЯК ЮРИДИЧНА НАУКА
      моделі динаміки, зводиться нині до властивості, проявляющемуся лише в окремих випадках »*. * Пригожий І. Перевідкриття часу / / Питання філософії. 1989. № 8. С. 4. Словом, мова, очевидно, йде - не більше і не менше - про зміну парадигми суспільних наук, про відмову від попереднього розуміння і визнання детермінізму і, можливо, про відкриття нових видів детермінізму, а у вітчизняній науці ще й про
  9.  Глава чотирнадцята. СИСТЕМА І СТРУКТУРА ПРАВА
      моделі в XX столітті народно-демократичні революції (Афганістан, Ємен та ін.) Іслам закріплює роль релігійного лідера - фаттіха, що стоїть на чолі народу, держави (Хомейні в Ірані). Але той же сам іслам містить і норми про джихад (священну війну) проти невірних, для завоювання їх земель. Для африканських правових систем характерним є поєднання статутного, колишнього колоніального
  10.  Розділ двадцять перший. ПРАВО І ОСОБИСТІСТЬ
      модель відносин держави і підданого. Втім, фігура підданого висловлювала відносини між персоніфікованим державою в особі імператора (монарха) і особистістю. Однак і підданий зберігав певний набір прав, втім, незрівняний з його обов'язками. Поняття громадянина використовується ще й для того, щоб відрізняти громадянина однієї держави від іноземного громадянина, оскільки у