Головна |
« Попередня | Наступна » | |
Побудова формальної моделі (формалізація, зв'язка З схеми П3.1). Вимірювання в широкому сенсі |
||
Як ми вже говорили вище, ми не будемо докладно розглядати модельні припущення, закладені в методах аналізу даних. Відзначимо тільки те, що застосування алгоритму аналізу даних - це частина процесу відображення емпіричної системи в математичну. Цей процес ми розуміємо широко, відповідно до нашої широкої трактуванням емпіричної системи. Так, ми вважаємо, що при побудові математичної системи відбувається не лише відображення кожного об'єкта, скажімо, в числові вектора, набори чисел (як це робиться, наприклад, при традиційному анкетному опитуванні респондентів), але і відображення сформованих (в процесі побудови СМПО і КМГІО) уявлень про діючі в суспільстві закономірності у відповідні математичні моделі. Скажімо, формальною моделлю ми будемо вважати сукупність результатів опитування респондентів разом з коефіцієнтами кореляції, порахованими для якихось пар змінних; з системою розрахованих на основі отриманих змінних регресійних моделей; з результатом класифікації респондентів за допомогою одного з методів кластерного аналізу і т. д. (ми знову йдемо в сторону від розмови про тих найпотужніших совокупностях модельних припущень, які пов'язані з використанням математичного апарату). Такого роду «широку» математичну систему ми, у відповідності з нашим поглядом на соціологічне дослідження, вважаємо ре зультатом вимірювання. Звичайно, можна було б результати аналізу даних (сукупність коефіцієнтів кореляції, отриману систему регресійних рівнянь, результати кластерного аналізу) не включати в поняття вимірювання. Не будемо сперечатися на цю тему. Відзначимо, однак, що справа тут не в словах, не в виборі терміна. Нам видається, що наше розуміння виміру сприяє більш ретельному відстеженню модельних припущень соціолога і, як наслідок, більш серйозного розуміння сенсу і надійності одержуваних висновків. Зокрема, такому підвищенню якості дослідження може сприяти «переклад» модельних розглядів на «мову», пов'язаний з аналізом співвідношення між емпіричної і математичної системами (що, власне, і потрібно, якщо ми приймаємо теоретико-ізмеренческую «парадигму»). Покажемо це на прикладі. Припустимо, що, проводячи описане вище дослідження з соціальної напруженості, ми прийняли змістовні аксіоми, закладені в схемі на рис. П3.2, і хочемо проаналізувати, наприклад, вплив історико-біографічного типу респондента на ступінь втрати їм соціальної самоідентичності під впливом якого-то події. Звичайно, ми можемо вважати, що кінцевим результатом вимірювання буде служити сукупність отриманих для кожної людини значень відповідних змінних: якось оціненого типу (скажімо, номери класу, отриманого на основі кластеризації біографічних інтерв'ю) і ступеня втрати самоідентичності (оціненої, наприклад, за допомогою спеціального психологічного тесту). Згідно з таким поглядом, сукупність цих значень будемо вважати остаточним відображенням нашої емпіричної системи в математичну. А подальший аналіз - наприклад, розрахунок якого-або коефіцієнта зв'язку між названими ознаками - Не будемо вважати що належать до процесу вимірювання. Але ... вдумаємося, яким чином ми вимірювали наші змінні. Будь-яке чи вимір годиться нам для забезпечення змістовної значущості згаданого коефіцієнта зв'язку? Напевно, немає. Розглянемо процес вимірювання типу респондента. Ймовірно, ми заздалегідь знали, що нас цікавить у біографічному інтерв'ю саме те, що визначає можливу протестую реакцію на «розбурхують» суспільство події. Так, виділяючи у відповідному тексті смислові одиниці, ми звернемо увагу на ті фрагменти, де йдеться, скажімо, про політичні суперечки батьків респондента, але, дуже ймовірно, посч ітаем непотрібним врахувати те, що в дитинстві він часто хворів на ангіну (хіба що зв'яжемо цей аспекті що стала наслідком ангіни підвищеною нервозністю респондента). У свою чергу, втрата самоідентичності нас теж цікавить лише в тому випадку, якщо вона викликана не аби якими причинами, а тільки тими, які пов'язані з відсутністю солідарності між соціальними групами в сучасній Росії (про це говорить та ж схема на рис. ГІ3.2). І не всякий результат психологічного тесту нас задовольнить. Для прикладу зауважимо, що, напевно, до відчуття життя, пов'язаному з втратою самоідентичності, можна прийти в результаті складних, суперечливих впливів багатонаціонального сімейного оточення. Але якщо це - наслідок того, що у досліджуваного респондента мама - росіянка, атеїстка, а тато - мусульманин з Алжиру, то така втрата самоідентичності нас навряд чи буде цікавити. А от якщо досліджуване стан респондента виникло через те, що його родичі по материнській лінії - російська педагогічна інтелігенція в третьому поколінні, а по батьківській - полуспівшіеся представники сучасної російської села, то вивчення такій ситуації буде мати безпосереднє відношення до теми дослідження. Щоб врахувати подібні ситуації, ми, напевно, повинні при вимірюванні самоідентичності до психологічного тесту додати якісь характеристики тих подій, які привели до її втрати. Іншими словами, можна сказати, що включення нами в расширенно понимаемую ЕС (в блок-схему аналогічну тій, що зображена на рис. П3.2) зв'язку між історико-біографічним типом і втратою самоідентичності і бажання відобразити цей зв'язок в споруджувану математичну модель (тобто в математичну систему, МС) зумовило певний підхід до операціоналізації обох ознак (і біографічного типу, і втрати самоідентичності). При вивченні зв'язку того ж біографічного типу з іншим поняттям (скажімо, ставленням людини до старшого покоління), може бути, цей тип треба було б вимірювати по-іншому Виходить, що метод вимірювання ознаки визначається тим, яке завдання ми вирішуємо. Пропонована нами коректування вихідної інформації визначалася не тільки характером завдання (що зводиться до пошуку зв'язку між двома поняттями), але і вибором методу її решенія16, у розглянутому випадку - тим, що це рішення ми мали намір здійснювати на основі розрахунку деякого коефіцієнта зв'язку між двома скоригованими ознаками. Але що було б, якби в наведених міркуваннях замість коефіцієнта зв'язку (будь-якого, придатного для використовуваних шкал: коефіцієнта кореляції, критерію «Хі-квадрат» і т.д.) фігурували, скажімо, регресійний, дисперсійний аналіз та інші відмінні від парних коефіцієнтів методи, що дозволяють вимірювати зв'язок між двома змінними? Ясно, що будь-який метод, спрямований на аналіз значень названих ознак, потребують описаної вище переробки даних. Але, виявляється, що кожен метод поєднаний і з іншими коригуваннями способів вимірювання вихідних ознак. Покажемо, що вид вихідних даних повинен бути тісно пов'язаний з тим, який з названих (або неназваних) методів ми вибираємо. Для того щоб це зробити, будемо інтерпретувати аналіз даних як узагальнене вимір і розглянемо весь процес отримання змістовного виведення з точки зору відображення емпіричної системи в математичну. Для визначеності припустимо, що, вимірюючи тип респондента з точки зору специфіки його біографії, ми використовуємо щось на зразок шкали Гуттмана. Скажімо, ми перетворюємо цікаву для нас частину інтерв'ю в набір відповідей «так» чи «ні» на запитання про згоду або незгоду з твердженнями типу: «Моя бабуся по матері з презирством ставиться до братів батька за їх небажання вчитися», «Мій батько завжди ніяковіє у присутності тестя »і т. д. Нехай в результаті підсумовування таких оцінок кожному респонденту приписується число, скажімо, від 10 до 100 в залежності від його оцінки рівня сим патии між родичами з боку матері і з боку батька. Назвемо розглянутий ознака ознакою X. На перший погляд, ясно, яка емпірична система відбивається в значеннях цієї ознаки: її носій - сукупність опитаних, відносини між її елементами визначаються тим, як респонденти бачать взаємини між двома групами своїх родичів. Будемо вважати цю шкалу інтервального. Оцінки ступеня втрати самоідентичності теж будемо вважати отриманими але інтервального шкалою. Відповідний ознака позначимо через Y. Будемо вважати, що він змінюється від 0 до 1. Порівняємо два способи аналізу таких даних: розрахунок коефіцієнта кореляції і дисперсійний аналіз. Залишаючись в парадигмі теорії вимірювань, трохи змінимо погляд на використовувані прийоми збору і аналізу даних і введемо нові терміни. По-перше, ясно, що, не відкидаючи описаного уявлення про нашу узагальненої ЕС, можна всередині неї розглядати підсистеми, пов'язані з вимірюванням кожної ознаки. Назвемо ці системи первинними. Кожній такій первинної ЕС відповідає своя первинна числова система, яка використовується в процесі вимірювання ознаки. Первинні ЕС і МС - це системи такого роду, які були розглянуті нами в основній частині книги при описі методів одновимірного шкалювання. По-друге, зазначимо таке. Сукупність результатів вимірювань розглянутих ознак, службовців вихідними даними для якого методу, можна вважати своєрідною емпіричної системою, яка за допомогою цього методу переводиться в математичну. Назвемо такі ЕС і МС вторинними (підкреслимо, що вторинні ЕС - це не ті вторинні змістовні моделі, про які йшла мова на початку п. 2, на с. 254). Говорячи про такі системи, ми враховуємо, що в результаті застосування будь-якого методу аналізу даних виходить деякий набір чисел (кажучи строго - це вибіркові оцінки деяких параметрів генерального розподілу, але цей аспект дослідження нас тут не цікавить) , на підставі якого ми судимо про якісь властивості реальності (у нашому випадку - про те, чи можемо ми вважати розглянуті ознаки пов'язаними). Кожен такий набір ми вважаємо результатом вимірювання, що відповідає своїм емпіричної та математичної системам. Вони і є вторинними. Розгляд первинних і вторинних систем аж ніяк не виводить нас за рамки усього сказаного вище. Просто за допомогою введення цих поіятій ми маємо можливість більш конструктивно говорити про відображення нашої узагальненої ЕС в числову, розбиваючи цей складний процес на окремі кроки. Покажемо, який вид вторинні системи мають в який нас разі. Припустимо, що ми використовуємо коефіцієнт кореляції. У табл. 113.1 наведено гіпотетичний приклад вихідних даних (N - обсяг вибірки). Таблиця П3.1 Вихідні дані (результати первинного виміру) для розрахунку коефіцієнта кореляції (гіпотетичний приклад; N обсяг вибірки) Номер респондента 1 2 3 4 ... N Значення X 28 35 47 13 91 Значення Y 0,3 0,8 од 0,9 од Вторинна емпірична система тут складається з подібних пар послідовностей чисел, обчислених для будь-яких двох розглянутих ознак. У результаті вторинного вимірювання кожної такій парі ставиться у відповідність число - коефіцієнт кореляції. Це - результат вторинного вимірювання. Як відомо, згаданий коефіцієнт вимірює лінійну зв'язок. Іншими словами, він буде близьким до одиниці (мінус одиниці), якщо (і тільки якщо), зобразивши кожного респондента з табл. П3.1 у вигляді точки двовимірного простору з осями, що відповідають ознакам X і Y, ми отримаємо майже пряму лінію. Це і означатиме наявність зв'язку. Високий коефіцієнт кореляції буде говорити про те, що враховані нами моменти біографії респондентів дійсно пов'язані з втратою останніми самоідентичності. Обговоримо тепер, що відбувається при дисперсійному аналізі (з цим методом можна ознайомитися, наприклад, по книзі [Кремер, 2001J). Зі змістовної точки зору завдання тут ставиться по-іншому. Вторинною емпіричної системою тут є розбиття вихідної сукупності респондентів на кілька (2, 3, 5) груп за значеннями ознаки X і заданих для ввійшли в кожну групу респондентів значень ознак Y. За певними правилами ми ставимо в відповідність цьому разбиению деяке число (значення F-критерію), за величиною якого судимий, чи можна говорити про те, що обчислені для згаданих груп середні значення ознаки Y в генеральній сукупності (тобто математичні очікуванні) рівні один одному. Якщо є підстави заперечувати це обставина (тобто якщо генеральні середні не рівні), то ми говоримо, що наші ознаки (ступінь присутності цікавлять нас аспектів в біографії респондента і ступінь втрати ним самоідентичності) пов'язані один з одним, біографія визначає самоідентичність. Для застосування дисперсійного аналізу потрібно змінити вид первинної емпіричної системи, пов'язаної з ознакою X. Травні вже не задовольняє точне вимірювання цієї ознаки. Діапазон зміни його значень треба розділити на невелику кількість інтервалів і перекодувати всі значення. Приклади такої перекодування відображені в табл. П3.2а, б, в. Таблиця П3.2а Інтервал значенні ознаки X 10-20 20-30 90-100 Результат перекодування 2 січня 9 Таблиця П3.26 Інтервал значень ознаки X 10 - 25 25-40 85-100 Результат перекодування 2 січня 6 Таблиця П3.2в Інтервал значень ознаки X 10-15 15-40 40-100 Результат перекодування 1 2 3 Природно, можна запропонувати нескінченну кількість варіантів розбиття діапазону зміни ознаки X на інтервали. Який варіант вибрати? При одному розбитті може бути дана ствердна відповідь на питання про існування цікавить нас зв'язку, при іншому - негативний. Очевидно, непогано було б перебрати можливі варіанти розбиття і або прийти до висновку, що як не здійснюй требующееся розбиття, що цікавить нас зв'язку не буде, або знайти такі варіанти розбиття, при яких будуть підстави говорити про наявність зв'язку. Існують математичні методи, що дозволяють це робити. Різним розбиття фактично відповідають різні номінальні (порядкові) ознаки. Тому останнє слово - за дослідником. Гляньте [Толстова, 2000]. Вторинної емпіричної системою у разі використання дисперсійного аналізу буде служити сукупність різноманітних разбиений разом із заданими в кожній групі, що відповідає будь-якому з них, значеннями ознаки Y для потрапили в неї об'єктів (тобто сукупність різноманітних наборів осередків). Адже числа (значення критерію), як було сказано вище, приписуються саме розбиття. Ми бачимо, що це - не та система, яку ми мали при використанні коефіцієнта кореляції. І це не просто схоластика, за цим стоїть досить істотний момент: розраховуючи коефіцієнт кореляції, ми користувалися значеннями ознак, безпосередньо отриманими від респондентів; застосовуючи ж дисперсійний аналіз, ми перейшли від ознаки X до іншого ознакою, виходить за рахунок угруповання значень X. Все сказане, на наш погляд, підтверджує доцільність практичного використання пропонованого нами розширення поняття виміру: розмірковуючи в термінах емпіричної та математичної систем, ми глибше аналізуємо суть завдання, більш ефективно її вирішуємо. Гляньте [Толстова, 20006, в, 2004а; Толстова, Масленников, 2000]. Зауважимо, що для отримання вторинної ЕС з результатів первинного вимірювання можуть використовуватися досить складні методи аналізу даних (а не просто угруповання значень ознаки, як було вище), вибір яких теж визначається тим, що ми далі з нашою інформацією збираємося робити, який метод використовувати. Скажімо, ми хочемо здійснити типологію респондентів за допомогою якихось алгоритмів класифікації. Апріорне осмислення иско мій типології може нас. навести на думку про те, що більш «чисті» (у статистичному сенсі) типи ми отримаємо, якщо будемо застосовувати методи класифікації не до результатів первинного вимірювання, а до значень латентних факторів, які знайдемо, застосувавши до цих результатів факторний аналіз. Крім того, необхідно враховувати, що в якості результатів первинного вимірювання можуть виступати аж ніяк не значення яких-небудь ознак, що описують досліджувані об'єкти. Скажімо, методи багатовимірного шкалювання розраховані на аналіз матриць близькості. Однак ми вважаємо, що в кожному разі використання парадигми теорії вимірювань в будь-якому випадку може сприяти більш адекватному вирішенню соціологічної завдання. Ясно, що описувані процеси первинного і вторинного ного вимірювання можуть бути багатоступеневими, містити безліч зворотних зв'язків. Більш того, зги процеси нерозривно пов'язані з розглянутим вище процесом операционализации понять. Сподіваємося, що ми зуміли донести до читача головне: будь-яке застосування математичного методу має оцінюватися як узагальнене вимір, тобто аналізуватися як процес моделювання; така позиція вимагає чітких розглядів того, що ми моделюємо (яка ЕС), з чого ми будуємо модель (яка МС) і як ми здійснюємо відповідне відображення (яка наша узагальнена шкала). Без чітких формулювань цих понять навряд чи може бути ефективно вирішена соціологічна задача. 5.
|
||
« Попередня | Наступна » | |
|
||
Інформація, релевантна "Побудова формальної моделі (формалізація, зв'язка З схеми П3.1). Вимірювання в широкому сенсі" |
||
|