Головна |
« Попередня | Наступна » | |
Проблема вибору: дискретна або безперервна латентна змінна? |
||
Природа латентної змінної (або змінних, латентної структури) вимагає обговорення. Про що варто говорити в тому чи іншому практичному разі: про латентних класах або про латентних безперервних ознаках? Дослідник стоїть перед вибором однієї з двох моделей: латентної класової (latent class model або latent class analysis, LCM або LCA; російські варіанти - відповідно, ЛФМ та ЛКА), коли латентна переклейная передбачається дискретної (кожне її значення відповідає певному латентному класу) і т . н. моделлю латентних рис (latent trait model, LTM), коли латентна змінна передбачається безперервної (ця термінологія усталилася в літературі. Так, дві відомі книги про латентних структурах використовують терміни «клас» і «чорта» у своїх назвах [Heinen, 1996; Langeheine and Rost, 1988]). H. В, Генрі в названій вище интернетовской статті приділяє велику увагу відповідним модельним припущенням, відзначаючи при цьому, що аргументація того, з якою моделлю - дискретної або безперервної - ми маємо справу в кожному конкретному випадку, обговорення питання про те, чи можна емпірично дати відповідь на це питання, становить істотну частину 50-річної історії ЛСА. Введемо позначення, що говорять про те, як моделі ЛСА, що спираються на припущення, відповідно, про дискретності або безперервності латентної змінної, можна співвіднести один з одним. Нехай х - дійсне число, значення нашої латентної змінної; Ф (х) - щільність розподілу латентної змінної, що розглядається як випадкова величина (нагадаємо, що випадкова величина з визначення характеризується завданням функції розподілу або щільності розподілу) ; / {(х) - т. н. графік i-го питання, що показує ймовірність позитивної відповіді на це питання для респондента, що має значення х латентної змінної. Неважко зрозуміти, що між цими і введеними раніше позначеннями можна встановити наступне відповідність (про нього можна прочитати, наприклад, в [Моделювання соціальних ..., 1993]) (табл. П2.1). Коротко розглянемо історію суперечок про характер латентної зміною. Таблиця П2.1 Зв'язок між дискретним і безперервним варіантами ЛСА Позначення для дискретного випадку (два латентних класу) Позначення для безперервного випадку Vі, V2 4 -, І Ф (х) СІХ, де (dk. d) довільний dk відрізок числової осі Vі + V2 +-J, J Ф (х) (1х РЇ> Р! / XХ) Vі? + Vі-/? .2 \ Fi (x) - Ф (х) (іх Інтелект зазвичай асоціюється з безперервною числової змінної (це припущення першим висунув Спирмен), і тому майже всі псіхометрісти протягом довгого часу визначали свої концепти відповідно з цим припущенням і, відповідно, користувалися факторним аналізом. Метою вивчення устанрвок в 1940-х роках було їх вимір, і установки концептуалізувати як числові змінні. Дослідження середини століття були більш психологічними, ніж соціологічними. Вони характеризувалися як «шкальний аналіз», і згадана передумова приймалася без докази. Це видно з робіт Л. Гуттмана і К. Кумбса [Coombs, 1964]. Можлива й інша позиція, яка постулює існування відносно невеликих гомогенних груп людей, або латентних класів. Кожна людина характеризується своїм членством в деякому класі, і ймовірності тих чи інших відповідей зв'язуються з таким членством. Кожен набір відповідей має певну ймовірність бути породженим включенностью респондента в клас з певним номером, і номери класів можуть використовуватися для шкалювання наборів відповідей. Проте згадані імовірності не є внутрішніми властивостями людей . Вони просто висловлюють невизначені відчуття дослідника щодо справжньої приналежності респондента класу (значить, мова йде про модельних припущеннях). У багатьох роботах говориться про те, що зазначені моделі мають рознос походження: латентно-класовий аналіз розвивається в основному в соціальних і політичних науках, моделі ж латентних рис мають явну психометричне обгрунтування (див., наприклад, введення до роботи [Ileinen, 1996, p. ix]). Генрі заперечує проти такого категоричного , що спирається ні генезис моделей, ділення останніх на «дискретні» і «безперервні». Соратник Лазарсфельда говорить про те, що визначення виду моделі має виходити з поглядів дослідника, але ігри цьому треба уникати зашорений ниє та її свідомості. Так, популярність Л КА серед дослідників США він пояснює тим, що американські соціологи були «загіпнотизовані» з самого початку ідеєю соціальних класів. Лазарсфсльдовскій ЛКА розглядався прихильниками класів як метод, що дозволяє дати наукову оцінку того, в який клас входить людина. Дебати про те, чи визначається соціальний статус членством в деякому класі або ж він повинен бути концептуалізувати як безперервна змінна, тривали кілька десятиліть. Виступаючи проти категоричного сполучення вибору моделі з характером вирішуваних завдань, Генрі зазначив, зокрема, курйозність того факту, що дослідники, які дотримуються відповідного погляду, не відчувають того, чому в роботах Лазарсфельда 1940-х, 1950-х і 1960-х років обидві моделі зустрічаються одночасно. Перша модель Лазарсфельда, описана в [Lazarsfeld, 1950а], була моделлю з безперервною латентної змінної (latent trait model). Це припущення проявлялося в тому, що автор говорив про безперервному розподілі ймовірностей позитивної відповіді на кожне питання при тому чи іншому значенні латентної змінної. Це - так званий графік питання (traceline function, f. (x)) (наприклад, такий графік у Лазарсфельда задавав ймовірність позитивної відповіді на те чи інше питання для американських солдатів, які мають розглянуте значення етноцентризму, при цьому передбачалося, що це значення змінюється вздовж континууму). Але потім автор все ж передбачав можливість ситуації, коли допускалося, що зазначений розподіл концентрується в різних точках континууму [Lazarsfeld, 1950а, р. 376). Як зазначає Генрі, існування континууму приймалося Лазарсфельдом без доказів, що, на думку його співавтора, послужило причиною багатьох непорозумінь у майбутньому. І в той же час Генрі вважає, що таке припущення цілком природно для тих соціальних психологів, які є послідовниками ідей Терстоуна і Спірмена. Лазарсфельдовская амбівалентна позиція між соціологічними і психологічними дисциплінами проявилася і в його публікації [Lazarsfeld, 1959]. Там латентно-структурний підхід до аналізу дихотомічних даних знову пояснюється в термінах графіків питань і латентного континууму (можливо, многомерногої). Однак, коли виникає необхідність пояснити, що таке локальна незалежність, автор наводить приклад трьох латентних класів. І чинить так завжди при роз'ясненні суті відповідної аксіоми. Виявляється, легше показати, як три частотні таблиці розміром 2x2, що задовольняють властивості статистичної незалежності, будучи складеними разом, дають таблицю, в якій є зв'язок, ніж демонструвати аналогічні міркування для безперервних змінних (приклад з двома частотними таблицями докладно описаний в [Типологія і класифікація. .., 1982, с. 100-103]). Те, що Лазарсфельд по суті не вибирає твердо однієї позиції, проявляється також і в тому, що, говорячи про графіки питань для безперервної латентної змінної, він для пошуку виду цих графіків використовує поліноми. Поліноміальні графіки використовувалися саме через їх зв'язку з латентно-класової моделлю. Два моменти визначали це: якщо графік питання - поліном ступеня т, то т + 1 точка визначатимуть цей поліном. Він довів, що двухклассовая модель не відрізняється від лінійної моделі графіка питання. Трикласовій модель неотличима від квадратичного графіка питання і т. д. Пояснимо, якого роду модельні припущення лежать в основі такої точки зору. Припустимо, що наш графік - лінійний (тобто представляє з себе пряму лінію; див. рис. 112.1). Ми можемо вважати, що вся наша інформація відповідає двом точкам, позначеним нами на малюнку зірочками. Отримаємо картину, що відповідає ЛКА. Але можемо по цих двох точкам побудувати пряму лінію (як відомо, через дві різні точки можна провести одну і тільки одну пряму). Це означатиме, що ми вибрали безперервну (latent trace) модель і вважаємо, що на відрізку [А, В] нашого латентного континууму ймовірність поступово зростає від 0,2 до 0,4. Природно, це тільки наше модельне припущення, але таке, відповідно до якого дискретна змінна - це лише якесь огрубіння безперервною.
Рис. П2.1. Графік /-го питання f ([x) «Безперервні» (поліноміальні) графіки питань володіють ще однією неприємною властивістю: відповідає їм значення ймовірності може іноді бути більше 1 або менше 0. За зауваженням Генрі, перед 1959 роком вчені, які займаються моделюванням дискретних явищ, штучно вибирали такі функції, які були укладені строго між 0 і 1. Відзначимо в цьому зв'язку, що одним зі способів «вштовхування» ймовірності в інтервал від 0 до 1 був перехід до т. н. логит-моделям, в яких замість ймовірності відповіді брався логарифм відношення переважання для відповіді (визначення ставлення переважання можна знайти, наприклад, в [Rudas, 1998]; див. також [Толстова, 2000]). Остання обставина нам хотілося б підкреслити особливо, оскільки тут «світиться» зв'язок між ЛСА і логлінейнимі моделями. Ми не будемо про це говорити детально, відзначивши лише те, що сам Лазарсфельд нарікав з приводу відсутності у його сучасників інтересу до дискретним змінним і назвав тільки двох вчених, що займалися відповідними проблемами: Л. Отже, Лазарсфельд з однаковою увагою ставився і до дискретним, і до безперервним моделям латентної змінної. Для дискретної моделі алгоритми більш «прозорі». Найбільш відомий алгоритм Лазарсфельда (той, який ми описали в п. 7.6) відповідає саме такої моделі. Але безперервна модель більше відповідає уявленням психологів про характеристики свідомості людини. Історичні екскурси самого Лазарсфельда говорять про те, що він розумів, що соціологу все ж більше потрібні дискретні моделі. І це показала подальша історія: приблизно в той же час, як народжувалися моделі Гудмана, розроблялися та інші алгоритми пошуку поєднань значень ознак, що визначають ті чи інші цікаві для дослідника явища (ми маємо на увазі алгоритми пошуку взаємодій типу AID та інші; більш докладно ми говорили про це, запропонувавши класифікацію відповідних підходів у [Толстова, 2000]). Рішення відповідних завдань дозволяє вийти на таке подання про вимірювання, яке принципово «йде» від зв'язування цієї процедури з числовим континуумом (докладніше див там же). Розвивалися і ті моделі ЛСА, які пов'язувалися з припущенням про безперервність латентної змінної. Опис таких моделей можна знайти в російськомовних роботах [Типологія і класифікація ..., 1982, с. 109-110; Моделювання соціальних ..., 1993]. Велика увага приділялася увазі графіків питань (функціям /; (х)). Розглядалися різні випадки. Приклади різних графіків питань наведені в [Типологія і класифікація ..., 1982, с. 111]. Виділимо найбільш часто використовується в тестових опитуваннях функцію - т. н. функцію Реша: j. (x) = сх / (1 + сх). Специфіка цієї функції визначає специфіку пошуку значення латентної змінної для кожного респондента. Відповідна техніка стає дуже схожою на традиційну техніку ЛСА і ЛКА. При її застосуванні говорять про використання моделі Реша. 'Звернемо увагу читача на відмінність сенсу словосполучень * Analysis of qualitative data * і <* Qualitative data analysis *. Перший вираз означає аналіз т.зв. категоріальних даних, тобто таких, які отримані за номінальною або інтервального шкалою. А друге - якісний аналіз, який протиставляється кількісному. Опис моделі Реша можна знайти в роботах [Реском, 1973; Типологія і класифікація ..., 1982, с. 284-290]. У вітчизняній літературі в останні роки знайшли відображення роботи групи дослідників з використання моделі Реша для вдосконалення процесу тестування в педагогічній практиці, про що піде мова в п. «Зв'язок JICA з теорією тестів». Порівняння моделей ЛСА і факторного аналізу В роботі [Anderson, 1959] було показано, що факторний аналіз є окремим випадком загальної моделі латентно-структурного аналізу з декількома латентними безперервними змінними. Тут має сенс відзначити, що багато авторів вважають, що має місце протилежне співвідношення: ЛСА - метод, вирішальний для порядкових і номінальних даних ті ж завдання, що вирішує для інтервальних даних факторний аналіз; див., наприклад, [Dayton, 1998]. Більш топкий аналіз співвідношення між факторним і латентно-структурним аналізом здійснений, наприклад, в [Гібсон, 1973]. У цій роботі після короткого опису розвитку факторного аналізу та латентно-структурних моделей показується, як останні можуть бути узагальнені для дослідження співвідношень між кількісними вимірами таким способом, щоб уникнути деяких важких проблем факторного аналізу. Що виникає в результаті модель латентного профілю застосовується потім до емпіричним даним з метою демонстрації ефекту се використання. Нижче мова піде про міркування, запропонованих у роботах [Goodman, 1974а, 1974b, 1975] (коротко про відповідних моделях йдеться в [Дегтярьов, 1981]). Можна сказати, що саме в цих публікаціях Гудманом був закладений цілий ряд напрямків модифікації лазарсфельдовскіх уявлень.
|
||
« Попередня | Наступна » | |
|
||
Інформація, релевантна "Проблема вибору: дискретна або безперервна латентна змінна?" |
||
|