Головна |
« Попередня | Наступна » | |
ВОЛЬФГАНГ ШТЕГМЮЛЛЕР РАЦІОНАЛЬНА ТЕОРІЯ РІШЕНЬ (ЛОГІКА РІШЕНЬ) * |
||
1. Завдання раціональної теорії рішень Дослідження законів раціональної людської діяльності спочатку з'явилося в сфері економічного аналізу, зокрема в австрійській школі вивчення потреб, і близьких до нього областях. Численні спроби математичного уточнення даної проблеми в кінцевому результаті привели до створення деякої абсолютно нової теорії, а саме теорії ігор, яка побачила світ у великому творі фон Неймана і Моргенштерна в 1943 р. У якості найважливішої складової частини цієї теорії ігор і виділилася з часом раціональна теорія рішень, звана також логікою рішень. У ході дискусій ставало все більш ясно, що численні питання, що включаються в комплекс проблем "Вірогідність та індукція", повністю або частково охоплюються цією теорією. Тому немає нічого дивного в тому, що поряд з економістами, представниками теорії ймовірності та статистиками інтерес до цієї області в зростаючій мірі стали проявляти також логіки і філософи науки. Безпосередньою причиною подальшого викладу є методологічне значення самої зазначеної області. Однак до цього приєднується ще одна обставина: дана перша частина одночасно служить для підготовки подальшої реконструкції теорії Карнапа, яка отримала від нього не зовсім правильна назва: 'індуктивна логіка ". Ми можемо виділити в історії два напрямки , які увійшли в сучасні дослідження за логікою рішень і певною мірою злилися в них. Ці напрями відповідають двом найважливішим поняттям теорії рішень: поняттю суб'єктивної користі, Вира- - Stegmiiller W. Entscheidungslogik (rationale Entschei- dungstheorie). Springer-Verlag, Berlin-Heidelberg-New York, 1973, S. 287-296. жаем деякою функцією корисності, і поняттю суб'єктивної, або особистої, ймовірності, що виражається деякою ймовірнісної функцією. Дослідження поняття суб'єктивної користі і суб'єктивної цінності виникли в області економічної науки, причому вирішальний крок у цьому напрямку був зроблений представниками згаданої австрійської школи вивчення потреб. Найважливішою проблемою у цій галузі є питання про вимірювання або, краще сказати, про метризації суб'єктивних міркувань про корисність у вигляді функцій корисності. Це завдання протягом тривалого часу є найважливішою метою теоретичної економічної науки, оскільки її рішення представляється передумовою створення адекватної теорії ціноутворення. Імовірнісний аспект з'являється на перший погляд набагато пізніше, лише в рамках теорії ігор. Правда, досить швидко з'ясувалося, що тут можна використовувати більш ранні теоретико-імовірнісні дослідження. У цьому зв'язку насамперед заслуговують згадки два імені - Ф. Рамсея і Б.де Фінетті. Незалежно один від одного ці вчені прийшли до оригінальної і цікавої думки про те , що поняття суб'єктивної, або особистої, ймовірності можна уточнити за допомогою вивчення раціонального укладення парі. Вперше цю ідею висловив Рамсей. Не знаючи про ці міркуваннях Рамсея, опублікованих лише посмертно, Фінетті розвинув близькі ідеї і навіть описав спосіб виправдання основних аксіом теорії ймовірності. Пізніше ці ідеї були підхоплені Карнапом і його колегами і сформульовані в мові карнаповскіх систем. Теорія, названа нами "Карнап II" (і излагаемая у другій частині), має справу зі спробою уточнення та розвитку імовірнісних аспектів логіки рішень. Теорія рішень має справу з рішеннями трьох видів (і розпадається відповідно на три області), а саме: рішення, прийняті з упевненістю; ризиковані рішення і безпідставні рішення. У разі надійного рішення суб'єкт діяльності прагне дізнатися ситуацію настільки точно, щоб мати можливість з упевненістю передбачити наслідки, своїх можливих дій. У разі безпідставних рішень він знайомий з ситуацією так погано, що навіть приблизно не здатний оцінити можливих наслідків своїх вчинків. У подальшому викладі ми не будемо розглядати ці випадки, а сконцентруємо увагу на найважливішому випадку: на ризикованих рішеннях . Мова буде йти про таких ситуаціях прийняття рішень, в яких діючі суб'єкти не можуть повністю контролювати всі важливі наслідки своїх дій і точно передбачати їх, проте в змозі дати вірогідну оцінку різних обставин і наслідкам своїх вчинків. Наступний розділ присвячений уточненню цієї швидкої й не цілком чіткої характеристики ризикованих рішень. 2. Дії та їх наслідки Три матриці: наслідків, корисності та ймовірності. Припустимо, деякий людина хотіла б перебратися з пункту у в пункт z. У нього є дві можливості: їхати поїздом або летіти літаком. Він повинен вибрати один з цих двох можливих способів дії. Якщо він вирішить поїхати поїздом, то витратить на поїздку 7 годин. Якщо ж він обере літак, то є дві можливості: буде туман над місцем посадки або буде ясна погода. При ясній погоді час польоту дорівнює 2 годинам. У разі ж туману літак може повернутися ^ час подорожі розтягнеться до 16 годин . Огляд усіх можливостей дає вміщена нижче таблиця. Кожному можливого способу дій, між якими індивід здійснює вибір, відповідає один рядок цієї таблиці. Кожному з двох релевантних обставин (є туман чи ні туману) відповідає одна колонка. Перетин строчки з колонкою виражає те наслідок, яке виходить для індивіда, якщо він обирає відповідний цьому рядку спосіб дій і реалізується обставина, що відповідає даній колонці. У розглянутому прикладі ці слідства полягають у величині часу, що витрачається на поїздку з пункту у й вимірюваного у годинах. В пункті прибуття У пункті прибуття ясно туман Поїзд 7:00. 7:00. Літак 2:00. 16 год. Слова "поїзд" і "літак" тут представляють два можливі способи дій, між якими потрібно вибрати: скористатися поїздом або літаком. Якщо опустити найменування рядків і стовпців і зберегти лише числові висловлювання наслідків, то ми отримаємо матрицю наслідків, яка в розглянутому прикладі виглядає наступним чином: О Для того щоб мати можливість правильно прочитати цю матрицю, потрібно знати, звичайно, згадані назви рядків і стовпців. Крім того, якщо слідства виражені в числах, потрібно знати відповідні заходи (в даному випадку міри часу). Той факт, що перший рядок двічі містить число 7, є, звичайно, чисто випадковим. У ньому висловлюється лише та обставина , що час поїздки на поїзді не залежить від того, чи є туман в пункті z чи ні. Навпаки, в інших випадках може виявитися так, що всі можливі результати отримають різні значення. Відштовхуючись від цього простого прикладу, ми можемо отримати загальну схему. Індивід, що знаходиться в певній ситуації, хотів би здійснити вибір ОДНОГО З m вчинків АБО дій Alt ... tAm. Нехай для цікавлять його можливих наслідків вибору мається п можливих станів світу чи природи, які ми для стислості позначимо обставинами UПусть наш індивід переконаний також у тому, що ці л обставин утворюють вичерпну диз'юнкцію усіх можливих обставин, am вчинків-вичерпну диз'юнкцію всіх можливих дій. Деякому вчинку Aj і обставині ЦГ відповідає результат Ftik> про якому ми тепер будемо говорити замість колишнього слідства. Якщо за аналогією з вищевикладеним спробувати побудувати таблицю, то вона прийме наступний вигляд: (/, и2 ... Un А \ Я.. Rn -? - R \ n At Rn Rx 2 ... Rin An ftni Rm2 - - - Hnn З цієї таблиці виходить матриця наслідків, яку ми скорочено називатимемо матрицею (Rik). Щодо цього скорочення слід пам'ятати, що перший індекс (індекс рядків) при "Д" говорить про пронумерованих в певній послідовності можливих вчинках, а другий індекс (індекс стовпців) - про пронумерованих можливих обставин. Примітка 1. Матриця наслідків (Rik) може вселити помилкове враження, нібито в ній йдеться про об'єктивні ситуаціях. Це невірно. Завдання даної матриці полягає в описі ситуацій в їх розумінні дійовою особою. Дії Ах, ..., Ат являють собою не ті дії, які взагалі можливі, а тільки ті дії, які бере до уваги чинний індивід. Точно так само і? / i, ...,? / "являють собою не об'єктивно можливі положення справ, а можливості, що розглядаються діючим суб'єктом. Цілком може виявитися, що суб'єкт упустить з уваги деякі об'єктивно можливі обставини і можливі дії, які він міг би вчинити. Примітка 2. Побудова матриці наслідків спирається на припущення про те, що кожен результат Rik однозначно визначено , якщо фіксовані дію Аі і обставина Uk. Можна було б навіть сказати, що ця матриця представляє деякий дискретний детерминистический закон природи. Говорячи мовою математики, мова тут йде про деякої функції ^ с / шумлячи аргументами: Rik = s? (A, ці) . Вираз "закон природи" випливає, звичайно, розуміти з застереженням, висловленої в попередньому примітці: важливо не те, чи існує насправді такий закон природи, а те, що в його існування вірить діючий суб'єкт. Наступні міркування зроблять ще більш ясним обставина, що в даному випадку мова йде не про об'єктивний стан справ, а тільки про суб'єктивні переконаннях діючого суб'єкта. Правда, тут з'являється одна складність, на яку ми повинні вказати вже зараз: обговорювана суб'єктивна оцінка ймовірності можливих обставин не зобов'язана автоматично переноситися на результат, навпаки, останнім можна приписувати суб'єктивні ймовірності, залежні від дій. Примітка 3. Читача не повинно бентежити та обставина, що різні автори обирають різні види формалізації, які тільки по видимості спираються на інтуїтивні уявлення, що відрізняються один від одного, але насправді говорять про одне й те ж і розрізняються лише несуттєвими технічними деталями. Для ілюстрації цього факту порівняємо введену вище матрицю наслідків з визначенням дії Л.Дж. Севідж. Згідно тому, що було сказано в примітці 2, матрицю наслідків можна представити у вигляді двомісної функції, аргументами якої є дії та обставини, а значеннями - результати R ^. На противагу цьому Севідж визначає дії як відображення безлічі обставин в безліч следствій.1 Таким чином, він користується одномісними функціями. Однак це лише інша формулювання тієї ж самої процедури. Якщо ми в нашому формальному вираженні фіксуємо перший індекс символу Rik для деякого певного І, а друга індексом k дозволимо змінюватися від 1 до п, то ми якраз отримаємо одномісну функцію, яка представляє дію А і фактично є відображенням класу обставин в клас результатів. Ми хочемо представити матрицю наслідків у вигляді єдиною двомісної функції, в той час як Севідж кожне з розглянутих дій воліє представляти деякої власної функцією, так що наша матриця (Rfc) може бути отримана з m різних одномісних функцій при i '= l, ..., m. Якому з двох видів представлення віддати перевагу, визначається тільки доцільністю. В одних контекстах можна рекомендувати перший, в інших - другий спосіб. Севідж викривлено трактує також суб'єктивний характер того, що ми назвали наслідком, або результатом. Коли він "слідство" ототожнює з "станом особистості", мені видається, що це здатне привести до непорозуміння. Використовуючи таку термінологію, мимоволі починають думати не про суб'єктивно оцінюваних наслідках дій, а про психофізичних станах або про чисто духовні переживання (відчуття болю, гарний настрій, стан депресії і т.п.). 'Savage LJ The Foundations of Statistics. New York-London, 1954. To, що ми називаємо обставиною, в точності відповідає "станом світу" у Севіджа у зазначеній роботі. Севідж абсолютно справедливо підкреслює, що мова завжди йде про індивіда в деякій певній ситуації. Для нашого дослідження це є очевидною передумовою . Оскільки ми завжди говоримо про одне й те ж індивіді в певній ситуації рішення, остільки нам не потрібно проводити ніякої особливої релятивизации. У теорії "Карнап II" справа йде інакше. Тут ми повинні, з одного боку, говорити про оцінки корисності та ймовірності різних індивідів, з іншого ж боку, змушені проводити розходження між такими оцінками одного і того ж індивіда для різних моментів часу. Тому в останньому формалізмі доводиться робити явну посилання на індивіда X і момент часу Т. У нашому контексті це буде зайвим. Тепер ми розглянемо матрицю корисності, іноді звану також матрицею бажаності. Для її побудови ми повинні припустити, що всі можливі результати R ^ отримали суб'єктивну оцінку. Наш індивід, який розмірковує про те, яку дію йому вибрати, відтепер іменуватиметься просто суб'єктом (і іноді позначатися символом "л"). Ми припускаємо також, що кожному з mXn можливих результатів Rn, ..., Rmn наш X приписує деяку суб'єктивну корисність. Ми підемо навіть трохи далі і припустимо, що цю суб'єктивну корисність можна охарактеризувати дійсним числом. (Питання про те, яким чином можна прийти до такої числової шкалою і якою мірою така шкала буде однозначною, ми на деякий час залишимо осторонь.) Встановивши для кожного можливого результату його суб'єктивну корисність, отримують матрицю корисності. Для наочності знову звернемося до прикладу, наведеному вище. Нехай наш суб'єкт буде досить відповідальним комерсантом, для якого час - гроші. Іншими словами це можна виразити так: втратити час для нього означає втратити гроші. Оскільки час, витрачений на поїздку, він повинен вважати втраченим, остільки перед кожним числом, що виражає такий час, він повинен поставити знак заперечення, що позначає суб'єктивну корисність цього часу. Тому матриця корисності прийме такий вигляд:
Тут одночасно стає зрозумілим, що під корисністю ми розуміємо не тільки те, що називають позитивною корисністю, бо суб'єктивна корисність може бути також збитком або суб'єктивної втратою. У випадках останнього роду суб'єктивні корисності будуть представлятися негативними числами. У загальному випадку має місце наступне: ми повинні допустити, що існує деяка функція пі, яка залежить від нашого суб'єкта X і називається функцією корисності. Аргументами цієї функції є можливі результати Rik, а значеннями - реальні числа, що представляють суб'єктивну цінність цих результатів. Якщо функцію пі пріметіть до всіх результатами, що входять в матрицю наслідків, то ми отримаємо матрицю корисності, яку скорочено можна записати у вигляді inu (Rjk)). (Внутрішні дужки ставляться до функтора 'пі ", зовнішні - є складовою частиною символічного запису матриці.) Значення функції пі для R ^ ми називаємо (суб'єктивної) корисністю чи користю результату Rik для суб'єкта. Полезности, тобто m X п значень nu (Ru), ..., nu (Rmn), можна впорядкувати за величиною. Одержаний таким чином порядок ми називаємо числовим порядком корисностей (результатів або наслідків). Звичайно, в цьому порядку ми можемо декільком можливим результатами приписати одне і те ж місце. Це можливо, зокрема, для найвищих і для найнижчих по своїй оцінці результатів. Якщо ми хочемо представити матрицю наслідків разом з матрицею корисності у вигляді однієї диаг Рамі, то для цього слід обрати тривимірне зображення. Треба взяти прямокутну систему координат і в одному з квадрантів побудувати сітку маленьких квадратів, кожен з яких відповідає деякого результату Rjk (на осі х відзначаються можливі дії, на осі у - можливі обставини, таким чином, даний квадрант буде зображенням матриці наслідків). Третім фундаментальним поняттям, яке нас тут цікавить, є поняття матриці ймовірностей. Оскільки ми маємо справу з ризикованими рішеннями, остільки ми можемо припустити, що наш суб'єкт здатний оцінити ймовірність настання кожного з п обставин. Імовірність настання обставини Ц при і - 1, ..., п ми записуємо у вигляді р (Ч) ("р" означає "ймовірність"). Тут також йдеться не про об'єктивну ймовірності появи обставин, навіть якщо і вірять, що такі ймовірності існують. Якби такі ймовірності й існували, вони були б або зовсім невідомі суб'єкту, або він міг би висловити про них тільки гіпотетичні припущення. Проте суб'єкт повинен мати можливість обчислювати ймовірності для того, щоб прийти до рішення щодо вибору можливого дії. Суб'єкт повинен знати можливі обставини, можливі дії, результати, що входять в матрицю наслідків, а також їх корисність. І точно так само ймовірності можливих обставин відносяться до тих даних, які йому повинні бути відомі і які служать основою раціональних міркувань про правильне рішення. Таким чином, мова може йти тільки про суб'єктивні ймовірності. Певні умови, яким повинна задовольняти суб'єктивна оцінка ймовірностей, обговорюватимуться нижче. В якості третьої матриці ми вводимо матрицю ймовірностей. На відміну від матриць наслідків і поліз-ностей тут потрібна деяка диференціація. Найпростішим випадком буде той, який ми називаємо матрицею верояностей, незалежних від дії. Він відноситься до ймовірності реалізації будь-якого обставини Uk незалежно від того, яку дію буде зроблено. Таким чином, досить знати п значень p {Ux) = pi, р (С4) = pj, ..., p (Un) = рь. Якщо ці значення Pi ... »Ai відомі, то ми можемо сказати, що задано розподіл ймовірностей для обставин. Тепер матриця ймовірностей утворюється просто за рахунок того, що рядки з цими п значеннями m раз підписуються одна під інший (кожному можливої дії буде відповідати одна рядок). Така матриця ймовірностей має наступний вигляд: P>. P2. -. Ai m рядків Pi »PJ." ЧАІ З такою матрицею ймовірностей, незалежних від дій, ми в нашому прикладі маємо справу в тому випадку, якщо мандрівник не є забобонною людиною, тобто якщо він переконаний у тому, що погода в тому місці, куди він прагне, не залежить від того, їде він поїздом або летить літаком. (Навпаки, якби він не в жарт, а серйозно сказав: Якщо я скористаюся літаком, то в місці прибуття z безсумнівно буде туман; якщо ж я поїду поїздом, то гам буде сонячно ", то ми мали б справу з другим випадком матриці ймовірностей , що залежать від дії.) Якщо р являє собою ймовірність того, що в місці призначення немає туману, то ймовірність туману в цьому місці буде дорівнює 1 - р, так як сума ймовірностей цих двох виключають один одного альтернатив повинна мати значення 1. Для використовуваного нами прикладу матриця ймовірностей прийме наступний вигляд: р 1-р Р 1-Р - Припустимо, що вірогідність наявності туману у місці призначення для суб'єкта дорівнює 5/14. Тоді наведена вище матриця буде виглядати так: 9/14 5/14 9/14 5/14. Іншим, більш складним випадком є матриця ймовірностей, залежних від дії. У першому випадку було досить знати розподіл ймовірностей для п обставин і відтворювати цей розподіл для кожного з m можливих дій. Тепер ми маємо справу з таким становищем, коли ймовірність здійснення деякого обставини залежить також від того, яку дію буде зроблено. Що розглядався нами приклад не підходить для ілюстрації цього положення, яке спирається на припущення про забобонності суб'єкта. Більш підходящим буде наступний прімер80. Тридцятип'ятирічний американець X щодня викурює по дві пачки сигарет. Він знайомиться зі статистичними даними Американського ракового суспільства і починає коливатися. У цих даних містяться відомості про те, які шанси 35-річного чоловіка прожити більше 65 років залежно від того, палить він чи не курить, а також курить він мало, багато або дуже багато. X констатує, що йому не вистачає сили волі змусити себе викурювати менше двох пачок сигарет на день, якщо він продовжує палити сигарети. Однак у нього є можливість почати курити трубку або сигарети, що буде доставляти йому набагато менше задоволення. У даному випадку нас цікавить не матриця корисності, а тільки його матриця ймовірностей, яку він склав на основі згаданих статистичних даних. (Внаслідок того, що він не сумнівається в цих даних, його суб'єктивні ймовірності будуть збігатися з об'єктивними відносними частотами, наведеними в статистичних даних.) Вмирають Доживають до 65 е двох пачок сигарет на до 65 років до 65 років Викурюють щонайменше двох пачок сигарет в день 0,41 0,59 Курять тільки трубку або сигари 0,25 0,75 Для побудови обший схеми нам потрібно використовувати поняття умовної ймовірності. Нехай р (ЦГ, А) являє суб'єктивну ймовірність здійснення Uk за тієї умови, що було здійснено дію Д. Якщо це значення ми коротко запишемо як, то схема матриці ймовірностей, залежних від дії, буде виглядати наступним чином: Г ~ Р1 ». . . Ан \ Рт \ - »- РТП У разі матриці ймовірностей, незалежних від дії, ми говорили про розподіл ймовірностей для обставин, який потім автоматично (будів- Перестановка індексів І і k порівняно з введенням вище виразом обумовлена тим, що ми хочемо зберегти ту послідовність індексів, яка була прийнята для позначення результату R ^. Це потрібно для того, щоб введений вище спосіб запису зберегти для позначення умовної ймовірності. ка за рядком) переносили на результати. Тепер ми змушені говорити лише про розподіл ймовірностей для результатів. Оскільки кожен результат Rik залежить від А і Uk, ми можемо визначити: p (Rik) ~ Rk-Р (ЦЛ). Отже, ми зібрали понятійний матеріал, який допоможе відповісти нам на деякі питання теорії рішень. Примітка. Зробимо короткий вказівку щодо того, яким чином окреслений вище апарат можна узагальнити так, що буде застосовна абстрактна теорія ймовірностей. Насамперед розглянемо розподіл ймовірностей, незалежних від дії, що дозволяє нам обмежитися тільки обставинами. Ці обставини можна представляти як елементи просторів можливостей (просторів вибірки) П. До цих пір ми завжди мали справу тільки з кінцевим безліччю обставин, однак можна розглянути випадок і з нескінченним безліччю обставин і навіть перейти до розгляду численної безлічі обставин. У дискретному випадку кожна підмножина безлічі П утворює деяка подія. У разі безперервності знову потрібно діяти так, щоб вибрати певний клас підмножин і розглядати утворену цим класом о-структуру. Тоді події стають елементами цих про-структур. Імовірність утворює неотрицательную, аддитивную і нормовану міру на цій о-струкгур. Аналогічне узагальнення може бути здійснено для дій: замість кінцевого безлічі можливих дій слід розглядати нескінченна безліч. Якщо ймовірності наслідків залежать від дій, то в якості елементів простору можливостей слід брати не обставини, а результати. В іншому все залишається так само. |
||
« Попередня | Наступна » | |
|
||
Інформація, релевантна "Вольфганг Штегмюллер РАЦІОНАЛЬНА ТЕОРІЯ РІШЕНЬ (логіка рішень) * " |
||
|