Головна
ГоловнаCоціологіяМетоди збору та аналізу соціологічних даних → 
« Попередня Наступна »
Г. Г. Татарова. Методологія аналізу даних в соціології (введення), 1999 - перейти до змісту підручника

ЗАХОДИ ЗВ'ЯЗКУ, заснований на понятті «статистична залежність» І «ДЕТЕРМІНАЦІЯ»

Дві логічні схеми використання коефіцієнтів зв'язку. Локальні міри зв'язку для таблиць спряженості. Коефіцієнт Юла. Поняття детермінації. Інтенсивність і ємність детермінації. Оцінки ймовірності. Істинне - помилкове значення заходів зв'язку. Поняття про величину X (хі-квадрат). Коефіцієнт взаємної спряженості Е. Пірсона. Значимість значень коефіцієнтів зв'язку. Довірчий інтервал.

Розглянуті дихотомічні пари понять, складові контекст для емпіричної інтерпретації розуміння зв'язку, природним чином привели нас до висновку про необхідність існування великої кількості коефіцієнтів парної зв'язку. Кожна міра зв'язку (кожен коефіцієнт зв'язку) вводиться таким чином, щоб його значення змінювалися або від нуля до одиниці, або від мінус одиниці до одиниці. Це єдине, що об'єднує всі коефіцієнти. Перед соціологом завжди стоїть важке запитання, пов'язаний з тим, як розуміти зв'язок і який коефіцієнт вибрати для вивчення взаємозв'язку між ознаками. Іноді виникає ілюзія, що, отримавши значення всіляких коефіцієнтів і порівнявши ці значення між собою, можна зробити достовірний висновок про силу зв'язку між ознаками. Справа в тому, що порівнювати має сенс тільки коефіцієнти, засновані на одному і тому ж розумінні зв'язку.

Зазвичай роздратування соціолога-користувача викликає і те, що не можна порівнювати силу зв'язку в різних дослідженнях за значеннями коефіцієнтів. Якщо в одному дослідженні коефіцієнт дорівнює 0,5, а в іншому той же коефіцієнт для тих же ознак 0,6, не можна стверджувати, що друге більше першого. Адже соціолог, аналізуючи зв'язок, завжди шукає відповіді на питання: «Наскільки впливає / не впливає ...?», «Наскільки залежить / не залежить ...?». Коефіцієнти ж часто на ці питання не відповідають. У них своя мова розуміння зв'язку, який необхідно зрозуміти. Тільки тоді з'являється можливість використання їх для відповіді на подібні питання.

Для того щоб правильно користуватися яким-небудь коефіцієнтом, необхідно насамперед знати всі його можливості і не вимагати від нього того, чого він не може дати соціологу. У соціологічних дослідженнях самі значення коефіцієнтів, як правило, бувають маленькими. Спостерігається така дивна картина, коли всі аналізовані ознаки один з одним пов'язані, але дуже слабо (за значеннями заходів взаємозв'язку). Чому це відбувається - зрозуміло. Мис допомогою парних зв'язків розглядаємо безпосередні зв'язки між двома ознаками, а в соціології все опосередковано. Іншими словами, на нашу пару ознак впливають безліч інших. Що це за ознаки, не завжди відомо. Тому використання окремо взятого коефіцієнта ефективно тільки в порівняльному контексті і тільки в рамках одного дослідження. Наприклад, можливі дві логічні схеми використання парних коефіцієнтів зв'язку.

Перша полягає в наступному. З усієї сукупності ознак, зв'язки між якими цікавлять соціолога, виділяється якийсь важливий, головний, залежний, цільової ознака, і розглядаються його парні зв'язку з іншими. У самому простому випадку останні вважаються як би незалежними один від одного і впливають різною мірою на цільовий. Обчислюються значення коефіцієнта і по цих значень проводиться процедура ранжирування всіх незалежних ознак за ступенем їх впливу на цільовий. Потім на основі суто якісного аналізу відбираються з незалежних найбільш тісно пов'язані з цільовим. Цей прийом чисто практичний і теоретично може бути і необгрунтований. На жаль, соціологу на кожному кроці доводиться йти на подібні порушення. Така логічна схема аналізу може вивести соціолога до потреби формування нових гіпотез про причинно-наслідкових відносинах між ознаками.

Друга схема виникає в ситуації неможливості (змістовної безглуздості) виділення цільового з усієї сукупності аналізованих ознак. Тоді обчислюються значення коефіцієнта зв'язку для всіляких пар ознак. З допомогою завдання деякого порогу (значення коефіцієнта) відсікаються всі зв'язки зі значенням коефіцієнта, який менше цього порога. Будується граф структури взаємозв'язків, де вершини - ознаки, а ребра - зв'язок між ними. Нехай у нас з вами якихось шість ознак і обчислені значення якогось коефіцієнта. На рис. 3.4.1 і на рис. 3.4.2 наведено два графа.

Рис. 3.4.1 Граф зв'язку Рис. 3.4.2 Граф зв'язку

Перший з них вийшов з великою кількістю зв'язків, тому що задали маленьке значення порога. Другий граф вийшов з дуже маленьким числом зв'язків, тому що задали велике значення порога. Значення коефіцієнтів не має особливого сенсу наводити. Нам важливий тільки змістовний сенс цієї процедури. На першому графі можуть бути зображені і несуттєві зв'язку, а в другому навпаки - суттєві могли бути втрачені. Незалежно від змісту ознак, принцип вибору порога завжди носить ітеративний характер і критерії завжди якісні. Така логічна схема може вивести соціолога до формування гіпотез про соціальні чинники. Бо на другому графі спостерігаємо, наприклад, два факторних синдрому, тобто дві групи взаємозалежних ознак, що є основою для формування індексів.

Ці логічні схеми породжені двома найпростішими завданнями вивчення структури взаємозв'язку сукупності ознак. Вони спираються на парні коефіцієнти зв'язку, до розгляду яких ми і переходимо. При цьому перед нами стоїть важке завдання. З одного боку, навіть у соціологічній літературі існує безліч робіт з описом коефіцієнтів зв'язку [3, 8, 9, 11]. З іншого боку, студенти-соціологи з великими труднощами сприймають такого роду матеріал. З урахуванням цієї ситуації ми будемо розглядати тільки деякі коефіцієнти. Основна увага звернемо тільки на те, на якому розумінні зв'язку заснована та чи інша група коефіцієнтів, і на специфіку мови аналізу парних взаємозв'язків між ознаками. Математичних обгрунтувань торкатися не будемо, залишаючи їх для освоєння на наступних етапах вашої освіти.

Л-окальние міри зв'язку

Мова йде про аналіз даних, представлених у вигляді так званих таблиць спряженості виду (2x2). Припустимо, що необхідно проаналізувати зв'язок між першою професією (майбутня професія студента - політолог) і четвертої ступенем задоволеності навчанням (швидше задоволені, ніж ні). У цьому випадку зручно говорити мовою вивчення зв'язку двох властивостей. У нашому випадку перша властивість - бути політологом, друге - бути задоволеним навчанням на чотири бали. Окремо взятий студент (в інших завданнях це будь-який інший емпіричний об'єкт) або володіє одним з цих двох властивостей, або володіє одночасно двома властивостями, або не володіє ніяким з цих властивостей.

З нашої попередньої таблиці 3.3.1 бачимо, що майбутніх політологів, задоволеність навчанням яких дорівнює чотирьом балам, було 30 чоловік. Студентів, що володіють першим властивістю, всього 100 чоловік, а володіють другим властивістю - 250. Таблиця 3.4.1 являє собою таблицю виду (2x2) для наших двох властивостей. В осередках таблиці в дужках наведені умовні позначення абсолютних частот (а, b, с, d). У даному випадку можна обійтися без індексів. Маргінальні частоти позначені як суми цих чотирьох частот.

Таблиця 3,4,1

Таблиця спряженості для першої професії та четвертого ступеня задоволеності Задоволений!) Ис навчанням на "чотири" "Решта" Разом Майбутні

політологи 30 (a) 70 (d) ЮО (а-Кі) »не політологи" 220 (с) 680 (b) 900 (c + b) Разом 250 (а + с) 750 (d + b) 1000 (a + b + c + d) Одним з мов аналізу зв'язку між цими властивостями є пошук відповіді на питання: чи спостерігається статистична залежність між цими властивостями. Якщо спостерігається статистична незалежність У (вдоволені навчанням на «чотири») від П ( політологи), то 30/250 (частка задоволених навчанням політологів серед всіх задоволених навчанням на чотири бали) повинна дорівнювати 70/750 (частка «інших» політологів серед всіх «інших»). Те ж саме запишемо в загальному вигляді:

З цього випливає, що a (d + b) = (а + c) d -> ab = cd, Тоді різниця ab-cd можна використовувати як міру відхилення від статистичної незалежності. Таке ж співвідношення отримаємо, якщо будемо міркувати по-іншому. Якщо статистична незалежність П від У спостерігається, то, 30/100 (частка задоволених політологів серед політологів) повинна дорівнювати 220/900 (частка задоволених «Не політологів» серед всіх «не політологів »).

На цій різниці і заснований коефіцієнт Юла (G, Yule), який

має наступний вигляд:

Знаменник введений для того, щоб значення цього коефіцієнта змінювалися від -1 до +1. Якщо ви бачите коефіцієнти двоповерхові (із знаменниками), то дуже часто (але не завжди) наявність знаменника служить як би для нормування інтервалу зміни значень коефіцієнта. Змістовний сенс міри зв'язку , як правило, передає чисельник. Розглянемо властивості (поведінка) цього коефіцієнта: 1.

Він дорівнює одиниці або коли з = 0 / схема 3.4.1 а) /, або d = 0 / схема 3.4 .1

б) /. У першому випадку всі «НЕ політологи» відносяться до «іншим» щодо задоволеності. Протилежне твердження невірно. У другому випадку всі політологи задоволені навчанням на 4 бали. Знову ж зворотне твердження буде невірним. 2.

Він дорівнює мінус одиниці, якщо а = 0 / схема 3.4.1 в) / або b = 0 / схема

Схема 3.4.1

3.4.1 г) /. У першому випадку всі політологи ставляться до «іншим» щодо задоволеності. У другому випадку всі «Не політологи» задоволені навчанням на чотири бали. Зворотні твердження невірні. 3.

Коефіцієнт дорівнює нулю, якщо ab = cd, тобто в разі статистичної незалежності наших досліджуваних властивостей.

У нашому випадку коефіцієнт дорівнює 0,14. Природним чином, виникає питання, яким буде значення коефіцієнта для генеральної сукупності. Адже поки ми отримали тільки оцінку зв'язку по вибіркової сукупності. Значення коефіцієнта невелике, але відмінне від нуля, тому виникає інше питання. Значно Чи це відміну від нуля або ми отримали нульове значення випадково? Якщо це відхилення незначимо, то спостерігається статистична незалежність наших властивостей (бути політологом і бути задоволеним навчанням на чотири бали).

І навпаки, якщо це відхилення значимо, то маємо випадок статистичної залежності. Для визначення значимості і для визначення «істинного» значення (для генеральної сукупності) необхідний апарат математичної статистики, а саме апарат перевірки статистичних гіпотез. Їх не слід плутати з змістовними гіпотезами дослідження. До цього питання ми повернемося дещо пізніше після введення так званої статистики хі-квадрат.

Розглянемо використання заходи Юла в порівняльному контексті. Нехай цільове властивість - «бути задоволеним навчанням на чотири

бали». Спробуємо визначити, яка з майбутніх професій тісніше пов'язана з цією властивістю, сильніше впливає на подібну задоволеність. За даними, представленими в таблиці 3.3.1, сформуємо таблиці спряженості виду (2x2) для підрахунку шести значень для шести майбутніх професій. Так як для політологів значення коефіцієнта вже було отримано по таблиці 3.4.1, то нижче на схемі 3.4.2 наведені таблиці для решти п'яти майбутніх професій. У цих таблицях наведені тільки абсолютні частоти. Цільовий ознака позначений як (У). (+ У) і означає мати властивість «задоволеності навчанням чотири бали», а (-У) - не володіти , тобто інші варіанти задоволеності навчанням.

соціологи культурологи філологи психологи історики

Схема 3.4.2. Таблиці спряженості «задоволеність навчанням на 4 бали» з майбутніми професіями студентів Для політологів коефіцієнт Юла дорівнював Q, = 0,14. Для соціологів Q2 = 0, l6, так як

60-610-190-140 36600 - 26600 10000

Ql "60 - 610 +190? 140" 36600 + 26600 "63200 - *

Аналогічним чином обчислюються значення коефіцієнта для культурологів, філологів, психологів і істориків. Відповідно отримаємо такі значення:

Q3 = 0,40; Q4 = -0,33; Q, = 0,13; Q6 = -0,29.

Таким чином, якщо не враховувати, пряма (значення коефіцієнта позитивні) або зворотна (значення коефіцієнтів негативні) зв'язок, наші шість професій за ступенем впливу на задоволеність упорядковуються наступним чином:

IQ3l> IQ4l> IQ6l> IQ2l> IQ1l> IQ5l

Властивості «бути культурологом» і «бути філологом», швидше за все, пов'язані з властивістю «задоволеність навчанням на чотири бали» і впливають на нього. Властивості «бути психологом» і «бути політологом», найімовірніше, не впливають. Від них задоволеність навчанням не залежить. Ще раз хочеться нагадати, в якому сенсі «впливає», в якому сенсі «залежить». Поки тільки в сенсі статистичної залежності. Чому ми говоримо «швидше за все»? Тому що за формальними критеріями може виявитися , наприклад, що всі значення коефіцієнтів незначимо відрізняються від нуля. Отриманий результат ранжирування - лише контекст для формування нових змістовних гіпотез і ускладнення моделей вивчення зв'язку.

Поняття детермінації

Для аналізу локального зв'язку можна використовувати і мову детермінації [14]. Правило «якщо С, то У» називається детерминацией. Термін «determinatio» був введений в 1900 році в біології і позначає ситуацію, коли одна властивість ("бути майбутнім соціологом (С)» ) впливає на інше («бути задоволеним навчанням (У)»). Такий вплив позначається «С-» У ». Детермінація має дві основні характеристики: інтенсивність I (С-У) детермінації і ємність С (С-У) детермінації. Формально - це умовні частоти. В наших позначеннях ці характеристики рівні:

 Якщо значення цих характеристик висловити у відсотках (що дуже зручно для інтерпретації), то для нашого прикладу (див. таблицю 3.3.1 або першу табличку на схемі 3.4.2): 

 а = 60; a + d = 200; а + с = 250. 

 Тоді I (С - У) = 30%, а С (С-У) = 24%. З першого значення робимо висновок, що з числа студентів, що мають властивість С (бути соціологом), 30% мають властивість У (бути задоволеним). Інтенсивність висловлює хіба точність детермінації. Із значення ємності робимо висновок, що з числа студентів, що мають властивість У, 24% володіють властивістю С. Ємність висловлює на додаток до інтенсивності як би повноту детермінації. 

 Інтенсивність і ємність мають властивості, на основі яких досить легко інтерпретувати детермінацію. Нижче пропонується приблизна схема спільної інтерпретації значень цих характеристик детермінації. Інтенсивність I * 0 1 = 1 (* 0 1 * 1 Ємність С * 0 с * про С = 1 С »1 Детермінація Неповна і неточна Точна, але неповна Неточна, але повна Точна, повна Схема 3.4.3. Інтерпретація детермінації 

 Ще один спосіб аналізу таблиці (2 * 2) 

 Про статистичної залежності можна судити за таблицями, наведеними на схемі 3.4.2, і без використання коефіцієнтів. Адже відносні частоти в частках (частості) є оцінками ймовірності деяких подій. Наприклад, позначимо через Р (У, П) ймовірність події «бути в майбутньому політологом і одночасно бути задоволеним навчанням на чотири бали», через Р (У) - ймовірність події «бути задоволеним на чотири бали», через Р (П) - ймовірність події «бути в майбутньому політологом». Відомо, що якщо два останніх події незалежні, то Р (У, П) - = Р (У) * Р (П). Для нашого прикладу (див. таблицю 3.4.1) Р (У) = 250/1000 = 0,25; Р (П) = 100/1000 = 0,1; Р (У, П) = 30/1000 = 0, 3. Різниця невелика, тому події У і П, швидше за все, незалежні. 

 Для локального зв'язку придатні і будь-які інші заходи, що існують для таблиць спряженості будь-якого розміру (г * s), тобто коли число рядків у таблиці дорівнює г, а число стовпців одно s. Перш ніж перейти до них, наведемо приклад використання на практиці дихотомічних пар понять: справжнє - помилкове значення коефіцієнта зв'язку; безпосередній зв'язок-опосередкований зв'язок. 

 Безпосередня - опосередкований зв'язок 

 По таблиці 3.4.1 коефіцієнт Юла показує скоріше на статистичну незалежність, ніж на статистичну залежність, так як Q1 = 0,14. Соціологу може здатися сей статистичний факт дивним, оскільки не узгоджується з його змістовними гіпотезами. Наприклад, з попередніх досліджень могло бути відомо, що студенти-політологи в основному задоволені навчанням. Сумніви соціолога будуть цілком виправдані, бо відсутність безпосередньої кореляційної зв'язку ще не говорить про відсутність зв'язку взагалі. Зв'язок між двома властивостями може бути опосередкована третім властивістю. Маленьке значення коефіцієнта може бути обумовлено тим, що характер зв'язку між «бути політологом» і «бути задоволеним навчанням» різний, наприклад, для юнаків та дівчат. Таблиця 3.4.2 - таблиця спряженості між властивостями «бути політологом» і «мати четверту ступінь задоволеності навчанням» для дівчат, а таблиця 3.4.3 відповідно для юнаків. Перевірте: сума частот в осередках виду (i, j) в цих двох таблицях дорівнює частоті, відповідної аналогічної комірці таблиці 3.4.1. Таблиця спряженості для дівчат Задоволеність навчанням на чотири "Решта" Разом. Майбутні 

 політологи 20 - 20 40 "Не політологи'' 20 500 520 Разом 40 520 560 Таблиця 3.4.3 

 Таблиця спряженості для юнаків Задоволені навчанням на чотири "Решта" Разом Майбутні 

 політологи 10 50 60 "Не політологи" 200 1S0 380 Разом. . 210 230 440 Підрахуємо коефіцієнт Юла для дівчат (Qf) і для юнаків (Qm). Перший буде дорівнює приблизно 0,9, а другий дорівнює - 0,7. 

 = 20 * 500 - 20 * 20 _ 09 = 10 * 180 - 200 * 50 _ -0 7 

 Qf = 20 * 500 + 20 * 20 ", = 10 * 180 + 200 * 50 ~, 

 По-перше, неважко помітити, що в тому і іншому випадку скоріше спостерігається статистична залежність, ніж незалежність. По-друге, справді характер зв'язку для наших підвибірок дійсно різний. Для дівчат отримано наступний результат: або майже всі майбутні політологи задоволені, або не політологи по задоволеності відносяться до «іншим». Для юнаків зовсім інший результат, а саме: або майже всі політологи по задоволеності «решта», або «Не політологи» задоволені навчанням. 

 З цієї причини значення коефіцієнта Юла, отримане без урахування статі студента, і показало відсутність зв'язку. Така ситуація для соціолога може бути позначена як помилкове відсутність кореляційної зв'язку, що випливає з існування опосередкованої зв'язку, характер якої діаметрально протилежний на окремих групах об'єктів. Цей приклад показує, що конкретні значення коефіцієнтів 

 інтерпретувати необхідно дуже обережно. Графічно цей випадок ілюструє граф, зображений на ріс.3.4.2. Зв'язок між ознаками 1 і 6 не спостерігається. У той же час спостерігається зв'язок між ознаками 1 і 5,

 а також між ознаками 5 і 6. 

 Інша ситуація помилкових кореляційних зв'язків є більш очевидною. Це коли велике значення коефіцієнта обумовлено не сильним зв'язком між властивостями, а тим, що існування кожного з цих властивостей обумовлено однією і тією ж причиною. Підозру викликає трикутник на тому ж рис. 3.4.2. Інтерпретація великих і маленьких значень коефіцієнтів вимагає при аналізі особливої ??уваги. Цей висновок стосується однаковою мірою до всіх коефіцієнтам, з якими працює соціолог. Переходимо до розгляду коефіцієнтів для випадку таблиць спряженості виду (r * s). Повернемося до нашої таблиці 3.3.1, де r = 6, as = 5. Насамперед слід зазначити, що у відповідність кожному осередку можна поставити як пряму детермінацію (від професії до задоволеності) з інтенсивністю (відсоток по рядку) і ємністю (відсоток по стовпцю), так і зворотну (від задоволеності до професії). Подальший аналіз таблиці проводиться за сукупністю цих характеристик. Для виділення сильних локальних зв'язків звичайно задаються обмеження на значення інтенсивності та ємності. По суті, мова йде про ранжирування всіх локальних зв'язків. У цьому випадку не ставиться питання про взаємозв'язок феноменів «майбутня професія» і «задоволеність навчанням», а шукаються як би ланцюжка детермінації, що надалі може бути використано для формування гіпотез про факторних синдромах і причинно-наслідкових відносинах. Нагадаємо, що висхідна стратегія аналізу і служить для формування нових гіпотез в дослідженні. 

 Згаданий вище «мова» аналізу локальних зв'язків - мова детермінації - досить легко перекладається і на багатовимірний випадок.

 Однак до роботи [13] слід звертатися, маючи певний рівень математичної підготовки. 

 Заходи зв'язки, засновані на X (хі-квадрат) 

 Уявімо собі, як виглядатиме наша таблиця спряженості в ситуації статистичної незалежності між феноменами «майбутня професія» і «задоволеність навчанням». Неважко згадати, що при статистичної незалежності, наприклад, для частоти в осередку (1,4) виконується співвідношення: 

 Якщо тепер записати це в загальному вигляді, тобто для будь-якої комірки (ij), то у випадку статистичної незалежності буде вірно співвідношення: 

 По і Н; про 

 Woo 

 Цю частоту, для її відмінності від реальної, можна назвати теоретичної і позначити через nj. У таблиці 3.4.4 наведені наші реальні частоти, 

 взяті з таблиці 3.3.1, і теоретичні. Перші з них - у верхньому лівому кутку комірки, а другий - у нижньому правому куті комірки. 

 Таблиця 3.4.4 

 Таблиця спряженості: реальні та теоретичні частоти Вудушая професія студента. Ступені задоволеністю навчанням Маргі 

 нальні 

 частоти 1 2 3 4 5 1. Політолог 14 20 31 30 5 100 20 30 20 25 5 2.Соціологія 30 40 60 60 10 200 40 60 40 50 10 3. Культуролог пекло 90 60 45 15 300 60 90 60 75 15 4.Філолог 31 30 19 15 5 100 20 30 20 25 5 5, Психолог До 10 15 15 2 50 10 15 10 12.5 2.5 6. Історик 27 110 15 85 13 250 50 75 50 62.5 12.5 Маргінальні частоти 200 300 200 250 50 N = 1000 Є природним для визначення відхилення від статистичної незалежності скористатися різницею між реальними частотами і теоретичними (для випадку статистичної незалежності), тобто різницею виду nij - nj. Як і у випадку введення формули для обчислення дисперсії, 

 нам потрібні абсолютні значення цієї різниці, тому зводимо її в квадрат. Цей квадрат ділимо на теоретичну частоту, тобто як би нормуємо. Тим самим досягається незалежність від обсягу осередки. Всі осередки стають рівноправними незалежно від їх обсягу. Потім підсумовуємо всі ці відхилення по всіх 30-ти комірок таблиці і отримуємо величину звану хі-квадрат. Вона виглядає таким чином: 

 Для нашого прикладу ця величина обчислюється як сума тридцяти членів: 

 (14 - 20) 2 (20 - 30) J («5 -62.5) = (13-12.5) =,",, 

 -55 + Зо + +-віз-+-ТГІ-= | 25'6, 

 "?> 

 Ця величина, ця статистика знаменита тим, що має закон розподілу, який називається законом розподілу хі-квадрат. Тому з її допомогою вирішується багато різних завдань, перевіряються різні статистичні гіпотези. Нас поки цікавить тільки аспект використання величини хі-квадрат для конструювання заходів зв'язку. Самою цією величиною як мірою зв'язку незручно користуватися, бо її значення може бути яким завгодно великим і залежить від розміру таблиці спряженості. Різниця в коефіцієнтах, заснованих на хі-квадрат, полягає в певному нормуванні величини хі-квадрат. Одним з часто використовувані коефіцієнтів є коефіцієнт взаємної 

Г

 спряженості Пірсона. Він має наступний вигляд: 

X

 С = 

 , Z + * ' 

 де N - загальне число об'єктів. У нашому випадку об'єкти - студенти- 

 гуманітарії. Раніше їх число ми позначали через n00, що дорівнювало 1000. Для наших цілей так було зручніше, а в даному випадку немає ніякої необхідності ні в подвійних індексах, ні в індексах взагалі. 

 Якщо значення коефіцієнта вийде близьким до нуля або рівним нулю, то це означає статистичну незалежність ознак. Випадок близькості значення до одиниці буде говорити про статистичної залежності. Значення коефіцієнта ні за яких умов не досягає одиниці, але для соціолога це не має ніякого принципового значення. Для нашої таблиці спряженості X = 125,6, а значення С = 0,33. Знову-таки виникає питання про значущість відмінності такого значення від нуля. 

 Про значимість значень коефіцієнтів 

 Визначаються такого роду значущості на основі перевірки статистичних гіпотез. Ці гіпотези не слід плутати з так званими змістовними гіпотезами дослідження. Зрозуміло, в ряді випадків гіпотеза дослідження може бути сформульована й у вигляді статистичної гіпотези. Перевірка статистичної гіпотези про значущість відмінності значення коефіцієнта від нуля можлива за умови існування закону розподілу коефіцієнта. 

 Що це означає? Припустимо, кожен з вас для вивчення студентів-гуманітаріїв (це наша генеральна сукупність) сформував «відмінну» вибірку і підрахував значення, наприклад, коефіцієнта Юла. Якими б «х зрошуючи» не були вибірки, на кожній з них буде отримано своє власне значення цього коефіцієнта. Сукупність таких значень підпорядковується і може бути описана деяким законом розподілу. Для коефіцієнта Юла відомо, що він має цілком певний закон розподілу. Якщо для коефіцієнта теоретичний закон розподілу відомий, то такий коефіцієнт називається статистикою на відміну від евристики. Не треба плутати з тим, що статистикою називають і просто сукупність даних в тій галузі науки, яка називається статистикою. Ми зараз розмірковуємо в рамках іншої науки, яка називається математичною статистикою. 

 Кожен закон розподілу має параметри. Прикладом закону є рівняння прямої у - аХ + b, Це сімейство прямих. Тут параметрами є а, b. Аналогічно можна міркувати у всіх випадках законів, відомих вам зі шкільної програми (парабола, гіпербола, синусоїда і т. д.). Тільки тепер ви маєте справу з більш складними законами: нормальним, хі-квадрат і т. д. Більше того, для деяких законів, наприклад для хі-квадрат, навіть не можна в явній формі записати формулу. 

 Деякі закони табульовані, тобто існують математичні таблиці (вони є в багатьох книгах, де описуються методи математичної статистики), з яких можна визначити табличне значення деякої статистики при заданих параметрах розподілу. 

 Наприклад, табличне значення для величини «хі-квадрат» - це те значення, яке воно приймає при статистичній незалежності. 

 Крім параметрів для звернення до математичних таблиць необхідно обов'язково задати так званий рівень значущості (а), тобто рівень можливої ??помилки. У математичній статистиці на основі даних вибірки жоден висновок не робиться без деякої помилки. Значення а може бути рівним 0,10; 0,05; 0,01. Тоді наші висновки будуть вірні в 90 випадках зі ста, якщо соціолог задав перше з цих значень. Для другого рівня значущості висновки вірні в 95 випадках зі ста, а для третього -

 в 99 випадках зі ста, а для четвертого 999 випадків з тисячі. 

 Таким чином, якщо деяка величина табульована, то, задавшись рівнем значущості та параметрами закону розподілу, можна дізнатися її теоретичне значення. А у нас завжди є реальне значення. Порівняння цих значень і дозволяє перевіряти статистичні гіпотези. 

 Повертаючись до коефіцієнта Юла і статистики «хі-квадрат», слід сказати, що перший з них має нормальний закон розподілу, а другий -

 розподіл хі-квадрат. Параметром для нормального закону є дисперсія, а параметром для хі-квад-рат - число ступенів свободи, рівне (rl) (sl). По суті, число ступенів свободи - число осередків у таблиці спряженості, які можуть змінюватися вільно (звідси і назва число «ступенів свободи») при заданих маргінальних частотах. У нашому випадку реальне значення «хі-квадрат» одно X = 125,6, а табличне значення X2 = 10,85 при рівні значущості, рівний 0,05, і числі ступенів 

 свободи (r-l) (s-l) = 20. Таким чином, XІ 0X, тобто відхилення від нуля значимо. Ознаки «майбутня професія студента» і «задоволеність навчанням» статистично залежні. 

 Поняття значущості тісно пов'язане з поняттям «довірчий інтервал». Для кожної статистики це інтервал, в якому міститься «справжнє» (для генеральної сукупності) значення цієї статистики. Якщо істинне значення коефіцієнта Юла позначити через QQ, а реально обчислене через Q, то довірчий інтервал виглядає: 

 Q-Д  Для кожної статистики величина А визначається залежно від закону розподілу статистики і, природно, в допомогою математичних таблиць, де ці закони табульовані. Приводити формули для обчислення довірчих інтервалів ми не будемо. Наприклад, соціолога завжди цікавить значимість відсотків. В роботі [8, с. 191 - 195] ви можете знайти формулу для обчислення довірчого інтервалу в цьому випадку. 

 З такого спрощеного аналізу значимості і законів розподілу соціологу необхідно засвоїти, що розумні люди, що працюють в далекій від нього науці під назвою математична статистика, володіють великим апаратом для вирішення соціологічних завдань. Це не означає, що ви повинні цю науку вивчити досконально, але це означає, що Ви повинні навчитися ставити таким людям правильно поставлені питання, і не очікувати від математики того, чого вона не може дати. 

 Завдання на семінар або для самостійного виконання 

 Кожному студенту на основі своєї власної таблиці спряженості необхідно виконати наступні завдання: 1

 . Окреслити одну із градацій (будь-якого з дво ознак таблиці спряженості) як цільове властивість. Підрахувати значення коефіцієнта Юла між цим цільовим ознакою і декількома іншими. Провести ранжування отриманих значень за ступенем їх впливу на цільову ознаку. 

 1712. Обчислити інтенсивність і ємність детермінації для декількох властивостей і на основі порівняння зробити відповідні висновки. 3.

 Обчислити значення хі-квадрат і порівняти з табличним при різних рівнях значущості. Зробити відповідні висновки. 5.

 « Попередня

 Наступна »  = Перейти до змісту підручника =
 Інформація, релевантна "ЗАХОДИ ЗВ'ЯЗКУ, заснований на понятті« статистична залежність »І« ДЕТЕРМІНАЦІЯ »"
 68. Правове примус. Заходи правового примусу.
  1.   заходи легального примусу; - засновано на праві. Існують наступні види правового примусу: - кримінально - правове (державний примус, яке реалізується через діяльність спеціальних державних органів); - цивільно-правова (можливість добровільного виконання обов'язків); - дисциплінарно-правове; - адміністративно-правове (державний примус, яке
     6. Заходи впливу, що застосовуються НБУ до банків за порушення банківського законодавства
  2.   заходи впливу попереднього реагування; примусові заходи впливу. До заходів впливу попереднього реагування відносяться: письмове попередження; лист із зобов'язаннями; програма фінансового оздоровлення. До примусовим заходам впливу відносяться: призупинення (обмеження) дії ліцензії на здійснення окремих банківських
     2. Статистична і логічна ймовірність
  3.   грунтованих не на традиційному обчисленні ймовірності. Він відправляється від матеріалу чуттєвих спостережень або вимірювань, який він коротко називає даними емпіричним свідченням (е). Потім він робить припущення, що за допомогою уяви чи здогадки ми знайшли гіпотезу Л, з якої виведені твердження про спостереженнях. Якщо ми знаємо е і Л, то можемо поставити запитання: яка ймовірність, що Л
     АНАЛІЗ ВЗАЄМОЗВ'ЯЗКУ ОЗНАК
  4.   міри зв'язку. Безпосередня - опосередкований зв'язок. Істинне-помилкове значення міри зв'язку. Незалежно від обраної стратегії аналізу (висхідній або низхідній) і після вивчення, умовно кажучи, «поведінки» окремо взятих ознак, природним чином виникає необхідність аналізу взаємозв'язку, взаємодії між ознаками. Будемо розглядати тільки випадок двох ознак. Аналіз
     Заходи захисту і заходи відповідальності.
  5.   заходи захисту і заходи відповідальності, які різняться між собою за підставами застосування, соціальним призначенням і виконуваних функцій, принципам реалізації та деяким іншим моментам. Найбільшу практичну значимість при цьому має та обставина, що, за загальним правилом, заходи відповідальності, на відміну від заходів захисту, застосовуються лише до винного порушника суб'єктивного права і
     3. ЖИТТЯ: ДЕТЕРМІНАЦІЯ І Волен
  6.   В. В. Розанов писав: «двоякого роду може бути життя людини: несвідома і свідома. Під першою я розумію життя, яка управляється причинами ', під второю - життя, яка управляється цельюі »59. Ці ж думки висловлював Л. М. Толстой у романі «Неділя»: «У Нехлюдове, як і у всіх людях, було дві людини. Один - духовний, який шукає собі блага тільки такого, яке було б благом і
     § 1. Поняття захисту цивільних прав
  7.   заходи не тільки правового, але й економічного, політичного, організаційного та іншого характеру, спрямовані на створення необхідних умов для здійснення суб'єктивних прав. Що стосується власне правових заходів охорони, то до них відносяться всі заходи, за допомогою яких забезпечується як розвиток цивільних правовідносин у їх нормальному, непорушеному стані, наприклад, закріплення
     8. Догматичний (формально-логічний) метод в юр. теорії та практиці.
  8.   зв'язку з економікою, політикою, мораллю та ін соціальними явищами. Приклад: поняття «суб'єкт права», «нормативний акт», «гіпотеза»,
     Визначення і порівняння понять
  9.   зв'язку з цим порівняння понять складніший, ніж визначення понять, розумовий процес, що включає в себе аналіз і синтез, що вимагає дифференциров-ки істотних ознак на загальні та різні для декількох об'єктів. При порівнянні декількох понять виконання завдання йде в два етапи: спочатку виділяються істотні ознаки кожного з них, а потім з них вибираються збігаються для цих
     4. Заходи правоохоронного характеру, що застосовуються до правопорушників державою
  10.   заходи державно-примусового порядку, що не володіють ознаками цивільно-правової відповідальності. У науці цивільного права їх іменують заходами захисту у вузькому сенсі слова. Другий блок становлять заходи цивільно-правової ответственності1. У свою чергу, заходи державно-примусового порядку, що не володіють ознаками цивільно-правової відповідальності, можна розділити на наступні
     Завдання 37: Який метод наукової індукції застосований в міркуваннях.
  11.   зв'язку між явищами. Існує п'ять основних методів з'ясування причинного зв'язку між явищами: 1) метод єдиного подібності; 2) метод єдиної відмінності; 3) з'єднаний метод подібності та відмінності. 4) метод супутніх змін; 5) метод залишків. 1) Метод єдиної схожості. 2) Метод єдиного відмінності 3) Сполучений метод подібності та відмінності Обставини, предшествую-щие
     Проблема детермінізму в сучасній науці і філософії
  12.   зв'язку та взаємозумовлені ості всіх явищ. У філософії детерминистические концепції описуються за допомогою категорій причина і наслідок, необхідність і випадковість, можливість і дійсність. Ідеї ??детермінізму з'являються вже в античній філософії (Демокрит). Подальший розвиток та обгрунтування детермінізм отримує в природознавстві і філософії Нового часу (Бекон, Декарт, Ньютон,
     5.3. Емпірична перевірка однієї теорії вигляді інший
  13.   зв'язку зі статистичною меха-Ікойі). Оскільки в даний час ми ие знаємо екс-еріментально процедури, яка могла б дати відповідь; а це питання, слід подумати про способи заміни НЕ-осредственной емпіричної перевірки. Релятивістська татістіческая механіка в принципі таку можливість іам надає, правда, не повністю, а саме в тій тепенно, в якій з неї слід релятивістська
     4. Заходи охорони спадкового майна
  14.   заходи здійснює нотаріальна контора за місцем відкриття спадщини, а в місцевостях, де нотаріальних контор немає, - місцева адміністрація (ст. 555 ЦК України). Спадкове майно охороняється до прийняття спадщини всіма спадкоємцями, а якщо її не прийнято - до закінчення терміну, встановленого для прийняття спадщини. Заходи охорони полягають у опису спадкового майна і передачі його на
     80. Поняття і характерні риси конституційної держави. Гос-во конституційне та правове.
  15.   заходи, що вживаються парламентом в ході поточного законодавства, судові заходи і адміністративні заходи; - «стан необхідності» - виключення і непередбачені обставини, які роблять неминучим концентрацію влади в одних руках в цілях збереження держави. Основою конституційної держави є принцип поділу влади, що включає такі основні елементи: 1) відмінність
    меры, принимаемые парламентом в ходе текущего законодательства, судебные меры и административные меры; - «состояние необходимости» - исключения и непредвиденные обстоятельства, которые делают неизбежным концентрацию власти в одних руках в целях сохранения государства. Основой конституционного государства является принцип разделения властей, включающий следующие основные элементы: 1) различие