Головна
ГоловнаCоціологіяМетоди збору і аналізу соціологічних даних → 
« Попередня Наступна »
Толстова Ю. Н.. Вимірювання в соціології: навчальний посібник / Ю. Н. Толстова. - М.: КДУ. - 288 с., 2007 - перейти до змісту підручника

Проблема вибору: дискретна або безперервна латентна змінна?

Природа латентної змінної (або змінних, латентної структури) вимагає обговорення. Про що варто говорити в тому чи іншому практичному разі: про латентних класах або про латентних безперервних ознаках? Дослідник стоїть перед вибором однієї з двох моделей: латентної класової (latent class model або latent class analysis, LCM або LCA; російські варіанти - відповідно, ЛФМ та ЛКА), коли латентна переклейная передбачається дискретної (кожне її значення відповідає певному латентному класу) і т . н. моделлю латентних рис (latent trait model, LTM), коли латентна змінна передбачається безперервної (ця термінологія усталилася в літературі. Так, дві відомі книги про латентних структурах використовують терміни «клас» і «чорта» у своїх назвах [Heinen, 1996; Langeheine and Rost, 1988]). H. В, Генрі в названій вище интернетовской статті приділяє велику увагу відповідним модельним припущенням, відзначаючи при цьому, що аргументація того, з якою моделлю - дискретної або безперервної - ми маємо справу в кожному конкретному випадку, обговорення питання про те, чи можна емпірично дати відповідь на це питання, становить істотну частину 50-річної історії ЛСА.

Введемо позначення, що говорять про те, як моделі ЛСА, що спираються на припущення, відповідно, про дискретності або безперервності латентної змінної, можна співвіднести один з одним.

Нехай х - дійсне число, значення нашої латентної змінної; Ф (х) - щільність розподілу латентної змінної, що розглядається як випадкова величина (нагадаємо, що випадкова величина з визначення характеризується завданням функції розподілу або щільності розподілу) ; / {(х) - т. н. графік i-го питання, що показує ймовірність позитивної відповіді на це питання для респондента, що має значення х латентної змінної.

Неважко зрозуміти, що між цими і введеними раніше позначеннями можна встановити наступне відповідність (про нього можна прочитати, наприклад, в [Моделювання соціальних ..., 1993]) (табл. П2.1).

Коротко розглянемо історію суперечок про характер латентної зміною.

Таблиця П2.1

Зв'язок між дискретним і безперервним варіантами ЛСА Позначення для дискретного випадку (два латентних класу) Позначення для безперервного випадку Vі, V2 4 -,

І Ф (х) СІХ, де (dk. d) довільний dk

відрізок числової осі Vі + V2 +-J,

J Ф (х) (1х РЇ> Р! / XХ) Vі? + Vі-/? .2 \ Fi (x) - Ф (х) (іх Інтелект зазвичай асоціюється з безперервною числової змінної (це припущення першим висунув Спирмен), і тому майже всі псіхометрісти протягом довгого часу визначали свої концепти відповідно з цим припущенням і, відповідно, користувалися факторним аналізом. Метою вивчення устанрвок в 1940-х роках було їх вимір, і установки концептуалізувати як числові змінні. Дослідження середини століття були більш психологічними, ніж соціологічними. Вони характеризувалися як «шкальний аналіз», і згадана передумова приймалася без докази. Це видно з робіт Л. Гуттмана і К. Кумбса [Coombs, 1964].

Можлива й інша позиція, яка постулює існування відносно невеликих гомогенних груп людей, або латентних класів. Кожна людина характеризується своїм членством в деякому класі, і ймовірності тих чи інших відповідей зв'язуються з таким членством. Кожен набір відповідей має певну ймовірність бути породженим включенностью респондента в клас з певним номером, і номери класів можуть використовуватися для шкалювання наборів відповідей. Проте згадані імовірності не є внутрішніми властивостями людей . Вони просто висловлюють невизначені відчуття дослідника щодо справжньої приналежності респондента класу (значить, мова йде про модельних припущеннях).

У багатьох роботах говориться про те, що зазначені моделі мають рознос походження: латентно-класовий аналіз розвивається в основному в соціальних і політичних науках, моделі ж латентних рис мають явну психометричне обгрунтування (див., наприклад, введення до роботи [Ileinen, 1996, p. ix]).

Генрі заперечує проти такого категоричного , що спирається ні генезис моделей, ділення останніх на «дискретні» і «безперервні». Соратник Лазарсфельда говорить про те, що визначення виду моделі має виходити з поглядів дослідника, але ігри цьому треба уникати зашорений ниє та її свідомості. Так, популярність Л КА серед дослідників США він пояснює тим, що американські соціологи були «загіпнотизовані» з самого початку ідеєю соціальних класів. Лазарсфсльдовскій ЛКА розглядався прихильниками класів як метод, що дозволяє дати наукову оцінку того, в який клас входить людина. Дебати про те, чи визначається соціальний статус членством в деякому класі або ж він повинен бути концептуалізувати як безперервна змінна, тривали кілька десятиліть.

Виступаючи проти категоричного сполучення вибору моделі з характером вирішуваних завдань, Генрі зазначив, зокрема, курйозність того факту, що дослідники, які дотримуються відповідного погляду, не відчувають того, чому в роботах Лазарсфельда 1940-х, 1950-х і 1960-х років обидві моделі зустрічаються одночасно. Перша модель Лазарсфельда, описана в [Lazarsfeld, 1950а], була моделлю з безперервною латентної змінної (latent trait model ). Це припущення проявлялося в тому, що автор говорив про безперервному розподілі ймовірностей позитивної відповіді на кожне питання при тому чи іншому значенні латентної змінної. Це - так званий графік питання (traceline function, f. (x)) (наприклад, такий графік у Лазарсфельда задавав ймовірність позитивної відповіді на те чи інше питання для американських солдатів, які мають розглянуте значення етноцентризму, при цьому передбачалося, що це значення змінюється вздовж континууму). Але потім автор все ж передбачав можливість ситуації, коли допускалося, що зазначений розподіл концентрується в різних точках континууму [Lazarsfeld, 1950а, р. 376). Як зазначає Генрі, існування континууму приймалося Лазарсфельдом без доказів, що, на думку його співавтора, послужило причиною багатьох непорозумінь у майбутньому. І в той же час Генрі вважає, що таке припущення цілком природно для тих соціальних психологів, які є послідовниками ідей Терстоуна і Спірмена.

Лазарсфельдовская амбівалентна позиція між соціологічними і психологічними дисциплінами проявилася і в його публікації [Lazarsfeld, 1959]. Там латентно-структурний підхід до аналізу дихотомічних даних знову пояснюється в термінах графіків питань і латентного континууму (можливо, многомерногої). Однак, коли виникає необхідність пояснити, що таке локальна незалежність, автор наводить приклад трьох латентних класів. І чинить так завжди при роз'ясненні суті відповідної аксіоми. Виявляється, легше показати, як три частотні таблиці розміром 2x2, що задовольняють властивості статистичної незалежності, будучи складеними разом, дають таблицю, в якій є зв'язок, ніж демонструвати аналогічні міркування для безперервних змінних (приклад з двома частотними таблицями докладно описаний в [Типологія і класифікація. .., 1982, с. 100-103]).

Те, що Лазарсфельд по суті не вибирає твердо однієї позиції, проявляється також і в тому, що, говорячи про графіки питань для безперервної латентної змінної, він для пошуку виду цих графіків використовує поліноми. Поліноміальні графіки використовувалися саме через їх зв'язку з латентно-класової моделлю. Два моменти визначали це: якщо графік питання - поліном ступеня т, то т + 1 точка визначатимуть цей поліном. Він довів, що двухклассовая модель не відрізняється від лінійної моделі графіка питання. Трикласовій модель неотличима від квадратичного графіка питання і т. д. Пояснимо, якого роду модельні припущення лежать в основі такої точки зору. Припустимо, що наш графік - лінійний (тобто представляє з себе пряму лінію; див. рис. 112.1).

Ми можемо вважати, що вся наша інформація відповідає двом точкам, позначеним нами на малюнку зірочками. Отримаємо картину, що відповідає ЛКА. Але можемо по цих двох точкам побудувати пряму лінію (як відомо, через дві різні точки можна провести одну і тільки одну пряму). Це означатиме, що ми вибрали безперервну (latent trace) модель і вважаємо, що на відрізку [А, В] нашого латентного континууму ймовірність поступово зростає від 0,2 до 0,4. Природно, це тільки наше модельне припущення, але таке, відповідно до якого дискретна змінна - це лише якесь огрубіння безперервною.

Рис. П2.1. Графік /-го питання f ([x)

«Безперервні» (поліноміальні) графіки питань володіють ще однією неприємною властивістю: відповідає їм значення ймовірності може іноді бути більше 1 або менше 0. За зауваженням Генрі, перед 1959 роком вчені, які займаються моделюванням дискретних явищ, штучно вибирали такі функції, які були укладені строго між 0 і 1. Відзначимо в цьому зв'язку, що одним зі способів «вштовхування» ймовірності в інтервал від 0 до 1 був перехід до т. н. логит-моделям, в яких замість ймовірності відповіді брався логарифм відношення переважання для відповіді (визначення ставлення переважання можна знайти, наприклад, в [Rudas, 1998]; див. також [Толстова, 2000]).

Остання обставина нам хотілося б підкреслити особливо, оскільки тут «світиться» зв'язок між ЛСА і логлінейнимі моделями. Ми не будемо про це говорити детально, відзначивши лише те, що сам Лазарсфельд нарікав з приводу відсутності у його сучасників інтересу до дискретним змінним і назвав тільки двох вчених, що займалися відповідними проблемами: Л.

А. Ж . Кетле і Дж. Ю. Юла. Генрі ж спеціально підкреслює, що становище змінилося з появою в 1973-1975 роках серії статей Л. Гудмана (у тому числі [Goodman, 1974а, Ь; 1996]). У цих статтях Гудман показує, яким чином латентно-класові моделі можуть бути інтерпретовані як логлінейіие. З 1978 року, завдяки Гудману, термін «логлінейная модель» стає широко відомим як серед соціологів, так і серед математичних статистиків. Статті Гудмана, а також робота [Bishop, Fienberg, Holland, 1975] ставлять ЛСА в центр уваги математичних статистиків. Традиційні статистичні оцінки, розроблені для лої лінійних моделей, адаптуються для ЛСА [Haberman, 1978-1979] '.

Отже, Лазарсфельд з однаковою увагою ставився і до дискретним, і до безперервним моделям латентної змінної. Для дискретної моделі алгоритми більш «прозорі». Найбільш відомий алгоритм Лазарсфельда (той, який ми описали в п. 7.6) відповідає саме такої моделі. Але безперервна модель більше відповідає уявленням психологів про характеристики свідомості людини. Історичні екскурси самого Лазарсфельда говорять про те, що він розумів, що соціологу все ж більше потрібні дискретні моделі. І це показала подальша історія: приблизно в той же час, як народжувалися моделі Гудмана, розроблялися та інші алгоритми пошуку поєднань значень ознак, що визначають ті чи інші цікаві для дослідника явища (ми маємо на увазі алгоритми пошуку взаємодій типу AID та інші; більш докладно ми говорили про це, запропонувавши класифікацію відповідних підходів у [Толстова, 2000]). Рішення відповідних завдань дозволяє вийти на таке подання про вимірювання, яке принципово «йде» від зв'язування цієї процедури з числовим континуумом (докладніше див там же).

Розвивалися і ті моделі ЛСА, які пов'язувалися з припущенням про безперервність латентної змінної. Опис таких моделей можна знайти в російськомовних роботах [Типологія і класифікація ..., 1982, с. 109-110; Моделювання соціальних ..., 1993].

Велика увага приділялася увазі графіків питань (функціям /; (х)). Розглядалися різні випадки. Приклади різних графіків питань наведені в [Типологія і класифікація ..., 1982, с. 111]. Виділимо найбільш часто використовується в тестових опитуваннях функцію - т. н. функцію Реша:

j. (x) = сх / (1 + сх).

Специфіка цієї функції визначає специфіку пошуку значення латентної змінної для кожного респондента. Відповідна техніка стає дуже схожою на традиційну техніку ЛСА і ЛКА. При її застосуванні говорять про використання моделі Реша.

'Звернемо увагу читача на відмінність сенсу словосполучень * Analysis of qualitative data * і <* Qualitative data analysis *. Перший вираз означає аналіз т.зв. категоріальних даних, тобто таких, які отримані за номінальною або інтервального шкалою. А друге - якісний аналіз, який протиставляється кількісному.

Опис моделі Реша можна знайти в роботах [Реском, 1973; Типологія і класифікація ..., 1982, с. 284-290]. У вітчизняній літературі в останні роки знайшли відображення роботи групи дослідників з використання моделі Реша для вдосконалення процесу тестування в педагогічній практиці, про що піде мова в п. «Зв'язок JICA з теорією тестів».

Порівняння моделей ЛСА і факторного аналізу

В роботі [Anderson, 1959] було показано, що факторний аналіз є окремим випадком загальної моделі латентно-структурного аналізу з декількома латентними безперервними змінними. Тут має сенс відзначити, що багато авторів вважають, що має місце протилежне співвідношення: ЛСА - метод, вирішальний для порядкових і номінальних даних ті ж завдання, що вирішує для інтервальних даних факторний аналіз; див., наприклад, [Dayton, 1998]. Більш топкий аналіз співвідношення між факторним і латентно-структурним аналізом здійснений, наприклад, в [Гібсон, 1973]. У цій роботі після короткого опису розвитку факторного аналізу та латентно-структурних моделей показується, як останні можуть бути узагальнені для дослідження співвідношень між кількісними вимірами таким способом, щоб уникнути деяких важких проблем факторного аналізу. Що виникає в результаті модель латентного профілю застосовується потім до емпіричним даним з метою демонстрації ефекту се використання.

 Нижче мова піде про міркування, запропонованих у роботах [Goodman, 1974а, 1974b, 1975] (коротко про відповідних моделях йдеться в [Дегтярьов, 1981]). Можна сказати, що саме в цих публікаціях Гудманом був закладений цілий ряд напрямків модифікації лазарсфельдовскіх уявлень. 

 « Попередня  Наступна »
 = Перейти до змісту підручника =
 Інформація, релевантна "Проблема вибору: дискретна або безперервна латентна змінна?"
  1.  ФА як спосіб одновимірного шкалювання
      або, як кажуть у факторному аналізі, - про одного латентному факторі) визначається такими передумовами: - існує деяка (єдина) латентна змінна, детерминирующая поведінку респондентів; це та змінна, вимір якої є нашою метою: вона ж є єдиним латентним фактором; - поведінка кожного респондента - це сукупність його відповідей на питання анкети
  2.  Модельні припущення ЛСА
      проблеми побудови індексів (шукана за допомогою ЛСА латентна змінна - теж своєрідний індекс). Першу проблему ЛСА не вирішує: існування латентної змінної в ЛСА постулюється. Правда, уявлення про неї може бути скориговано за рахунок аналізу отриманих в процесі застосування. Методу описів кожного латентного класу (сукупності людей, що мають одне і те ж значення
  3.  Використання критерію «Хі-квадрат» при пошуку латентних параметрів моделі
      вибірковими даними (див. також [Anderson, 1954]). Припускаємо, що зовсім не обов'язково прагнути до точного дотримання рівностей виду (П2.1). Vі + V2-1. (П2.1) (П2.2) Будемо вважати, що ці рівності відповідають т. н. теоретичного (очікуваному) розподілу спостережуваних ознак того розподілу, яке справедливо для генеральної сукупності. Для емпіричного розподілу, т.
  4.  Короткий нагадування первинної ідеї Лазарсфельда. Чи потрібна аксіома локальної незалежності?
      чи іншим рівнем освіти ніяк не диференціює людей за іншими характеристиками їх життєдіяльності: групи різного рівня освіти мають однакову структуру трудової діяльності, дозвілля, побуту і т. п. ». Автор говорить про те, що уявлення, уточнюючі цей підхід до розуміння однорідності, сформульовані в роботі [Гаврілсц, 1974]. На жаль, в останні роки інтерес російських
  5.  Латентно-структурний аналіз (ЛСА) Лазарсфельда
      проблема інтерпретації осей одна з центральних). Видається, що це характеризує ЛСА як більш адекватний підхід, ніж інші методи одновимірного шкалювання. У процесі використання ніс * ледних ми фактично не вважаємо ту змінну, значення якої шукаємо, латентної - ми знаємо, що це за змінна, не вміємо тільки її вимірювати «в лоб». А в разі ЛСА ми допускаємо неадекватність наших
  6.  Поняття логічної форми
      або спосіб зв'язку елементів її змісту. Логічна форма виражається за допомогою логічних змінних і логічних констант. В якості логічної змінної може виступати будь-яка буква латинського алфавіту: А, В, С, р, q. Константи, або логічні постійні, виступають способом зв'язку логічних змінних і виражаються словами: «все», «деякі», «суть», «і», «або», «або, або», «якщо ..., то»
  7.  7.1. До питання про «взаємовідносини» соціології та психології
      проблем. Для практичного освоєння відповідних підходів необхідно ці проблеми глибоко проаналізувати. Почнемо з більш докладного розгляду того, що собою являє тестова традиція. 7.2. Принципи факторного аналізу (ФА) 7.2.1. Зміст тестової традиції Сукупність розроблених в психології тестів досить різноманітна. Вони відрізняються і по предмету дослідження,
  8.  XXIII. Відносини соприродна і Несопріродності
      або між станами, пов'язаними цими
  9.  Принцип відбору потрібних ступенів свободи
      змінних зменшується - "відключаються" несуттєві змінні (СР з явищами генералізації і концентрації нервових процесів - І.П. Павлов, А.А. Ухтомський, П.В. Симонов та ін) [16-18, 57,
  10.  Шкалограмма Гуттмана
      вибірковому дослідженні ймовірність якої-небудь події ототожнюється t відносною частотою його зустрічальності). Таблиця 7.3 Результат Шкалограммний аналізу Гуттмана: приведення матриці даних до східчасто-діагонального вигляду респон Судження Значення латентний дента 1 2 3 4 5 6 7 8 9 ної змінної 1 + + + + + + + + + 9 L 2 + + + + + + + + + 9 Таблиця 7,3 (продовження) респон дента
  11.  XX. Відносини Соінтенсівності і Несоінтенсівності
      або вторинними - простими станами або відносинами між простими станами. § 361. Не може існувати ніяких явищ свідомості, крім його послідовних станів і способів проходження його станів, тобто самих станів і змін від одного стану до іншого. А так як те, що ми відрізняємо як стосунки, не суть самі первинні стану, то вони не можуть бути нічим іншим, як
  12.  Формальний апарат ФА
      або близька до цього. Тоді фактори, що мають такі навантаження, перетворюються із загальних в групові. Саме в цьому сенсі ми вище говорили про те, що кожен латентний фактор «коштує» за своєю групою спостережуваних ознак (такими є ознаки, що мають високі навантаження, що відповідають цьому фактору і в силу цього пов'язані другу іншому). Відзначимо ще один момент, зв'язуючий паші розгляду з