Головна
ГоловнаCоціологіяМетоди збору та аналізу соціологічних даних → 
« Попередня Наступна »
Г. Г. Татарова. Методологія аналізу даних в соціології (введення), 1999 - перейти до змісту підручника

1. З ЧОГО ПОЧИНАЄТЬСЯ АНАЛІЗ?

Висхідна стратегія аналізу і спадна стратегія аналізу. Різниця понять «аналіз даних» і «логіка аналізу» (логічна схема аналізу). Первинний аналіз як складова частина будь-якої стратегії. Ознака. Аналіз «поведінки» окремо взятого ознаки. Варіаційний ряд. Одномірне розподіл. Показники розподілу. Абсолютна, відносна та накопичена частоти. Поділ на інтервали. Цілі первинного аналізу даних. «Мова» аналізу розподілів.

Слід нагадати, що в якості третьої структурного елементу області емпіричної соціології, позначеної нами як методологія аналізу даних, виділена:

висхідна стратегія аналізу (перевірки описових гіпотез; пошук емпіричних закономірностей, починаючи з простих і закінчуючи складними для формування нових гіпотез).

Слід особливо зупинитися на використанні пари понять: висхідна стратегія аналізу - спадна стратегії аналізу. Що стосується просто пари понять «висхідна стратегія - спадна стратегія», то вона використовується в емпіричної соціології в різних контекстах. Наприклад, для позначення вибіркової стратегії в дослідженні. Якщо збір інформації здійснюється за так званим методом «снігової кулі», то це приклад висхідної вибіркової стратегії. Така стратегія використовується зазвичай для вивчення латентних соціальних груп (наркоманів, приховані алкоголіків і т. д.). З нис одящей вибіркової стратегією ми стикаємося при формуванні вибірки, виходячи зі структури генеральної сукупності. Це є типовим для вивчення громадської думки. Зрозуміло, в рамках одного і того ж дослідження одночасно можуть використовуватися як спадна, так і висхідна стратегії формування вибірки.

Таку пару термінів можна використовувати і для характеристики логіки дослідницького процесу в цілому, а саме для позначення двох підходів до вивчення соціальної реальності. Ми їх позначили як статистичну та гуманітарну традиції (підходи, парадигми) в емпіричної соціології. Відомо, що латентні соціальні групи, на відміну від інших, доцільніше вивчати по висхідній стратегії [6], тобто не тільки стратегія формування вибірки носить висхідний характер, але і всі дослідження в цілому побудовано по висхідній стратегії вивчення таких груп.

Ця пара термінів застосовується і в досить вузькому сенсі в так званих методах багатовимірної класифікації для позначення процедури розподілу емпіричних об'єктів на групи. Про поняття «класифікація» піде мова в останній частині книги. Це поки ремарка для «всезнайок». Пара «висхідна стратегія аналізу даних - низхідна стратегія аналізу даних» становить основу для формування в соціологічному дослідженні логіки аналізу даннигх, логічної схеми аналізу. Соціолог вибирає стратегію аналізу даних виходячи із специфіки свого дослідження (цілі, завдання, гіпотези). Розглянемо кілька дослідницьких ситуацій.

Перша ситуація

Припустимо, у соціолога немає чітко визначених гіпотез ні описового, ні пояснювального характеру. Зрозуміло, в розпливчатою формі вони завжди існують. Адже соціолог, бажаючи «поглянути» на соціальну реальність через призму якогось підходу, відповідає на питання «Що вивчати?» І «Навіщо і для досягнення яких цілей вивчати?». Відсутність чіткості в гіпотезах вимагає певної стратегії при роботі з емпіричним матеріалом. Спочатку соціолог в «мішку» з інформацією наводить «косметичний» порядок - шукає прості емпіричні закономірності. Їх можна назвати і регулярно. Насамперед він виділяє самі емпіричні індикатори, якщо їх немає. З цією ситуацією ми стикаємося при роботі з текстовою інформацією. Ми з вами виділяли елементарні обгрунтування та елементи в контексті застосування методу незакінчених пропозицій. Перші з них і були емпіричними індикаторами.

При роботі з біографіями людей, з текстами напівформалізоване і вільних інтерв'ю природним чином з'являється необхідність в аналізі, умовно кажучи, «поведінки» окремо взятого емпіричного індикатора. Потім виникає потреба в аналізі спільного «поведінки» двох емпіричних індикаторів, в аналізі їх взаємозв'язків. Таким чином, логіка аналізу емпірії будується по висхідній (від приватного до загального) стратегії. Початковий етап такої стратегії - первинний аналіз / первинна обробка даних.

Соціолог, виходячи з висхідній стратегії, послідовно шукає відповіді

на питання, такі як: чи не об'єднуються чи емпіричні індикатори в якісь групи, а об'єкти - в класи . Наприклад, схожі в певному сенсі об'єкти являють собою якийсь клас, а взаємозалежні між собою емпіричні індикатори можуть утворити якусь групу. Цілком можливо, що об'єкти, віднесені до одного і того ж формального класу, є однотипними. А група емпіричних індикаторів може інтерпретуватися як якийсь специфічний соціальний фактор. Про зміст понять «тип» і «фактор» піде мова в останній главі. Головне завдання в таких дослідницьких сюжетах - проблема інтерпретації різного роду емпіричних закономірностей, бо вони висловлюють якісь тенденції, синдроми.

Друга ситуація

У соціолога можуть бути чітко позначені гіпотези дослідження. У цьому випадку логіка аналізу може будуватися як у рамках висхідній, так і низхідній стратегій. Вибір стратегії залежить від характеру гіпотез і від того, якими апріорними знаннями (знання, що були до проведення дослідження) має дослідник. Припустимо, що джерелом емпіричної інформації є індивід; техніка збору даних жорстко структурована; в дослідженні перевіряються тільки описові гіпотези. Тоді також необхідні висхідні, від приватного до загального, стратегії аналізу. Згадаймо з попереднього матеріалу, що в процесі прямого ранжирування для прийняття рішення про присвоєння рангів нам неодмінно потрібно вивчити ступінь одностайності респондентів в оцінці об'єктів ранжирування. Для цих цілей у процесі аналізу знов-таки потрібно рух по висхідній стратегії.

Нехай гіпотеза звучить наступним чином: політичні пристрасті населення в основному визначаються віком і походженням. Для перевірки цієї гіпотези соціолог визначає всілякі зв'язки цих «пристрастей» з величезною сукупністю різні емпірично індикаторів. Якщо з все зв'язків виявляються найсильнішими зв'язок з віком і з походженням, то вважається, що гіпотеза підтвердилася. Наприклад, сформулюємо іншу гіпотезу: у Росії існують типи електоральної поведінки областей, що інтерпретуються як об'єкти соціального управління. У тому сенсі, що ме анізм впливу на окремі області однаковий, якщо вони віднесені до одного і того ж типу. Для перевірки такої складної гіпотези необхідну основу для логіки аналізу становить спадна стратегія аналізу (від загального до конкретного). Такий приклад буде приведений в останній главі.

Ясно одне: перевірка такого роду гіпотез припускає «продумування» всієї логіки аналізу апріорі (до збору емпіричної інформації). Це дуже не просто. Разом з тим таке «продумування» потрібно і важливо навіть в описових дослідженнях. А в серйозних аналітичних дослідженнях для перевірки складних гіпотез тим більше. Згадаймо, що ми з вами розглядали нескладні моделі вивчення окремих властивостей соціальних об'єктів для переходу з теоретичного рівня на емпіричний. При цьому абсолютно не торкалися питань зворотного переходу, для якого вкрай важливо поняття логічної схеми аналізу.

Якщо повернутися до моделі вивчення властивості соціального об'єкта, то в контексті наших міркувань, логіка аналізу дозволяє уточнити не тільки

саму таку модель, але й передбачає продумування заздалегідь логіки отримання емпірично закономірностей і, відповідно, пере од від ні до теоретичних узагальнень. Зрозуміло, мова йде вже про складні емпірічесі Закономірно, й виходила на основі всієї системи вивчаються в дослідженні властивостей. Залежно від логічної схеми аналізу соціолог визначає і те. Якого роду емпіричний матеріал йому потрібен, і те, які прийоми «обробки» інформації необ одим, і те, в якій послідовності буде будуватися логіка вивчення та пояснення того чи іншого соціального феномена. У таки исследовательски сюжету головним є концептуальна з ема, теорія «бачення» соціальної реальності, так як йде пошук відповіді на питання «Чому це?». Для такого випадку необ одим нис одящая (від загального до конкретного) стратегія аналізу. Пошук відповіді на питання «Чому це?», Перевірка пояснювальних гіпотез соціологічного дослідження можливі тільки в рамка нис одящей стратегії аналізу. Все, що з цим пов'язано, обговорюватиметься в останній частині книги.

В окремо взятому соціологічному дослідженні можливе поєднання вос одящей і нис одящей стратегій аналізу. Та й інша стратегії можуть бути реалізовані на практиці за допомогою одні й ті ж методів, прийомів, способів «обробки» інформації. Наприклад, до таких належать так звані методи математичної статистики (це така область математичної науки, яка в певній мірі як би обслуговує науки, що працюють з емпіричним матеріалом) та методи багатовимірного аналізу. Сюди включаються і такі методи, застосування яких теоретично може бути необгрунтовано. У тому сенсі, що закономірності, отримані для вибірки, не можна поширити (перенести) на всю генеральну сукупність. Однак ці методи «Гаразд» працюють на практиці і і прийнято називати евристичними на відміну від статистично. До відмінності понять «статистика» і «евристика» ми ще повернемося. Вся сукупність ті ническая прийомів (по суті, це використання математичного формалізму або математично методів у соціології) називається методами аналізу даних.

До цього розділу ми підійшли з розумінням того, що соціологу, що вивчає різні соціальні феномени, доводиться будувати моделі вивчення їх властивостей, користуватися різними типами інформації, застосовувати сукупність прийомів вимірювання латентних, безпосередньо не спостережуваних ознак, вибирати стратегію аналізу. Це і є початок початків аналізу даних.

Спостережувані ознаки ми називали емпіричними індикаторами. У попередніх розділах вони були нашими головними поняттями. Тут і далі такими будуть ознаки. Ознакою може бути і окремо взятий емпіричний індикатор, і похідний від них показник. Наприклад, ознакою будемо називати будь показники, індекси, коефіцієнти, що виникають в рамках роботи з даними типу «державна статистика», «бюджет часу». Ознака, як і будь емпіричний індикатор, має для нас ті ж три рівні виміру: номінальний, порядковий, «метричний». Як мінімум, ми повинні навчитися вивчати «поведінка» всіх трьох типів ознак, виміряних за трьома типами шкал. Представляється важливим ще раз повторити наступне. Незважаючи на різноманіття шкал (в даному випадку як лінійок для вимірювання чогось) в соціології, ми розглядаємо тільки три типи шкал і до «метричним» відносимо всі шкали, рівень вимірювання за якими вище порядкового, тобто те, що дуже схоже на числа, на «кількості».

З чого ж починається аналіз «поведінки» окремо взятого ознаки тоді, коли інформація «лежить» на столі соціолога? Такий аналіз необхідний практично завжди незалежно від дослідницьких завдань, типів інформації, вибору стратегії аналізу.

Мова йде як би про «соціальну бухгалтерії», ази якій ви повинні освоїти. Практично в будь-якій книзі, в назву якої входять слова «,,, статистичні методи в,,,», ви знайдете певний матеріал з освоєння цих азів [2, 3, 7, 8, 9,

11].

Незважаючи на те що нижче розглядається приклад, що має відношення до даних анкетування, всі висновки відносяться до аналізу будь-яких варіаційних і динамічних рядів. На жаль, обсяг книги не дозволяє навести інші приклади. Протягом всієї цієї глави в основному будемо приводити фрагменти з деякого дослідження на тему «Структура проведення часу студентів: порівняльний аналіз вузів», придуманого (модельного) нами як приклад. Збір даних здійснювався в ньому як з використання бюджету часу, так і по запитальника «складної структури»; генеральна сукупність - студенти вузів Росії. Нас в цьому дослідженні будуть цікавити тільки студенти-гуманітарії, тобто деяка підвибірка.

Розглянемо всього три ознаки з цього дослідження: майбутню професію студента-гуманітарія, його задоволеність навчанням і тривалість часу на навчання. Щодо третьої ознаки потрібно підкреслити наступне. Тривалість в даному випадку являє собою суму витрат часу на прослуховування лекцій, на участь у семінарських заняттях, на додаткові самостійні заняття, а також на перерви між аудиторними заняттями. Як приклад будемо розглядати середньодобову, наприклад за тиждень, тривалість. «Тривалість» має метричний рівень вимірювання. «Майбутня професія» як ознака має номінальний рівень вимірювання. «Задоволення ь навчанням» може бути виміряна

допомогою логічного квадрата за п'ятибальною порядковою шкалою. Тоді вона розуміється тільки як задоволеність навчанням в «рідному» вузі (поверніться до того розділу, де обговорюється логічний квадрат). Замість цих ознак можна було б вибрати і будь-які інші.

Що означає аналіз «поведінки» професії на сукупності об'єктів? Це означає, що ми повинні обробити емпіричні дані, щоб отримати розподіл досліджуваних об'єктів (у нашому випадку студентів-гуманітаріїв) за професійними групами і за характером цього розподілу судити про професійну структуру опитаних студентів. Для простоти викладу буду наводити цифри модельного характеру, тобто в реальному дослідженні вони не були отримані. Припустимо, що нас цікавить вісім професій, всі вони закодовані цифрами від 1 до 8, а число студентів-гуманітаріїв серед усіх опитаних одно 1000. Таким чином, початково ми маємо матрицю даних типу «об'єкт - ознака». З неї виділяємо для аналізу стовпець матриці відповідно з аналізованих ознакою. Підраховуємо в цьому ряду число респондентів, які в недалекому майбутньому будуть мати ту чи іншу професію. Тим самим отримуємо частоту народження у вибірці студента тієї чи іншої майбутньої професії.

 Розподіл опитаних за професіями представлено в таблиці 3.1.1.

 Це результати самого першого етапу систематизації емпіричних даних. Розподіл може бути представлене і описано на «мові» чотирьох показників. Перший - абсолютна частота, тобто число студентів з певною «майбутньої» професією. Серед опитаних студентів виявилося 100 майбутніх політологів (професія I), 200 

 соціологів (професія 2), 300 культурологів (професій 3), 100 філологів (професія 4), 50 психологів, (професія 7) і 250 істориків (професія 8). Студенти з майбутніми професіями, позначеними як 5 і 6, у вибірку не потрапили. У цьому немає нічого дивного, якщо при формуванні вибіркової сукупності не враховувалася майбутня професія студента. Ці шість позначених і зустрічаються у вибірці професій, будемо використовувати в процесі подальшого аналізу. 

 Таблиця 3. 1.1 

 Розподіл студентів за їх майбутньої професії ПОКАЗНИКИ МАЙБУТНЯ ПРОФЕСІЯ СТУДЕНТА Разом 1 2 3 4 5 6 7 Я 1. Абсолютна частота к » 200 300 too - - J0 250 1000 2. Відносна чистота в частках (частость) 0.1 0.2 0.3 0.1 0.05 0.2 S 1 Ї. Відносна частота у відсотках 10 20 30 10 * - 3 23 100 4. Накопичена частота у відсотках не має сенсу Другий показник в таблиці - відносна частота в долях або частость, тобто це частка респондентів певної професії серед усіх опитаних студентів-гуманітаріїв. Дуже часто в соціологічних дослідженнях поряд або замість числа опитаних використовується число відповіли. Для нашого прикладу не має значення, по відношенню до якого «числу» вважається частка, бо число відповіли збігається з числом опитаних. У масових опитуваннях розрізнення цих величин носить принциповий характер, так як число неответивших буває досить великим. Сама ж проблема неответивших є серйозною проблемою в масових опитуваннях. Ми торкалися цієї проблеми при обговоренні так званої (нами) проблеми соціологічного нуля. Відносна частота в долях - це важливий показник для наступних етапів роботи з даними. 

 Частка інтерпретується як оцінка ймовірності володіти певною професією. Остання фраза тільки для тих, хто випадково прослухав курс з теорії ймовірності. 

 Третій показник - відносна частота у відсотках - визначає, який відсоток респондентів матиме ту чи іншу професію. Це найулюбленіше показник соціолога, і ви в цьому могли переконатися, якщо вже встигли взяти участь в якому-небудь соціологічному дослідженні. Відсоток і частость - складові елементи мови аналізу соціолога. 

 І нарешті, четвертий показник - накопичена частота у відсотках. З такою частотою ми стикалися при побудові шкали Терстоуна. Для номінального рівня виміру вона майже ніколи не має сенсу. Чисто технічно її можна підрахувати для нашої таблиці. Це і буде маленьким прикладом неадекватності математики. Прямо кажучи - нісенітниця. Звідси й висновок, що, живучи в століття приголомшливих комп'ютерів, сліпо натискати на кнопки для запуску «модернових» математичних методів неприпустимо. Комп'ютер може підрахувати всі, тільки чи є в цьому сенс. Ось в чому питання. 

 Накопичена частота має «прозорий» змістовний сенс тільки для шкал починаючи з порядкових. Розглянемо розподіл студентів за ступенем їхньої задоволеності навчанням, отриманої за допомогою застосування логічного квадрата. У таблиці 3.1.2 представлено розподіл респондентів за ступенем «задоволеності» по тих же чотирма показниками (і в цьому випадку цифри не реальні, а модельні). Всі показники мають сенс. Число опитаних так само, як і у випадку першої ознаки, збігається з числом що відповіли. Ступеня задоволеності позначені цифрами від 1 до 5. При цьому 1 відповідає мінімальному рівню задоволеності, а 5 - максимального. 

 Таблиця 3.1.2 

 Розподіл студентів за ступенем задоволеністю навчанням ПОКАЗНИКИ Ступінь задоволеності НАВЧАННЯМ Разом 1 2 3 4 5 1. Абсолютна частота 200 300 200 250 50 1000 2. Відносна частота в частках (частость) 0.2 0.3 0.2 0,25 0.05 1 Е. Відносні частоти у відсотках 20 30 20 25 5 100 4. Накопичена частоти? 20 50 70 95 100 Нагадаємо, який сенс має накопичена частота. Наприклад, у таблиці 3.1.2 частота, рівна 70%, означає, що число студентів з рівнем задоволеності менше чотирьох складає 70% від числа опитаних, а менше трьох - 50%. Перейдемо до випадку метричної шкали. Для табличного представлення розподілу «тривалості» 

 необхідно розбити діапазон її зміни на окремі інтервали. Важливо 

 відзначити, що розподіл не завжди має сенс представляти в табличній формі, так як поділ на інтервали не завжди має сенс, наприклад, для динамічних рядів або для тривалості витрат часу в дослідженнях бюджету часу. Це відбувається тому, що можна відразу переходити до вивчення характеристик, що описують характер розподілу. Необхідно мати також на увазі, що ознака може носити дискретний характер (зустрічаються тільки цілі числа) або безперервний характер (зустрічаються числа, що мають цілу частину і дробову). З безперервністю зустрічаємося в основному при роботі з аналітичними індексами на етапі аналізу емпірію. 

 Наш третя ознака - тривалість витрат часу на навчання - може носити дискретний характер, якщо виражений в хвилинах, і безперервний характер - якщо виражений у годинах. Зупинимося на останньому випадку. Для кожного студента цей похідний показник дорівнює його середньодобовим (в годинах) витратам часу на навчання. Введемо інтервали і підрахуємо число студентів, внесених в кожен інтервал. У соціології на відміну від багатьох інших наук, що працюють з емпірією, розбиття на інтервали не може носити формального характеру. Таке розбиття завжди відбувається залежно від дослідницьких завдань, а точніше, від того, як і для чого буде використовуватися ознака в процесі подальшого аналізу. Тому соціолог користується при цьому поняттями «угруповання даних», «типологічна угруповання даних». 

 При виділенні інтервалів зміни тривалості витрат часу на навчання виходимо з значень максимальної і мінімальної тривалості, які зустрілися в нашій вибірці. Різниця між цими величинами називається варіаційним розмахом. Без знання мінімальної тривалості не можна визначити нижню межу першого інтервалу, а без знання максимальної - верхню межу останнього інтервалу. Припустимо, в нашому випадку максимум (max) дорівнює 9-ти годинах, а мінімум (min) - 0 годинах. Останній факт можна пояснити тим, що у вибірку потрапили студенти, які були хворі: ніяких занять, що входять в «тривалість навчання», в тижневому бюджеті часу у них не було. Щоб цей факт не викликав здивування, зауважимо, що збір інформації про бюджет часу студента відбувається за тиждень, що передує опитуванню. 

 Тоді наші інтервали (всього їх шість) можуть виглядати наступним чином: 1.

 0-1 годин; 2.

 1-2,5 годин; 3.

 2,5-4 годин; 4.

 4-7 годин; 5.

 7-8 годин; 6.

 8-9 годин. 

 Неважко здогадатися, з чого ми виходили при виборі саме таких інтервалів. Наприклад, в останній інтервал потраплять студенти - «трудяги», в першу - ті, хто з якоїсь причини був «вимкнений» з навчального процесу, а в четвертий - модальна (найпоширеніша) група студентів. До речі, це не факт, а гіпотеза, і, відповідно, вона може не підтвердитися в реальному дослідженні. Для наочності на рис 3.1.1

 зображені ці інтервали у вигляді поділів на лінійці. 

 О 1 2.5 4 7 8 9 

 ? «? , 1 I I L 

 Рис 3.1.1 

 При віднесенні респондента до конкретного інтервалу за тривалістю навчання виникає таке питання. Куди входять нижня і верхня межі інтервалу? Іншими словами, до якого інтервалу віднести, наприклад, студента, у якого тривалість навчання дорівнює чотирьом годинам. Адже його можна віднести і до першого, і до другого інтервалу. Ця проблема вирішується просто. Наприклад, соціолог приймає рішення, що всі верхні межі інтервалів відносяться до інтервалу. Тоді студент, у якого тривалість навчання дорівнює 4-м годинах, буде віднесений до третього інтервалу. Студент, у якого тривалість навчання дорівнює 8ми годинах, - до п'ятого і т. д. 

 Ці ж інтервали можуть бути задані і в іншій формі: 1.

 0-1 годин; 2.

 1,1-2,5 годин; 3.

 2,6-4 годин; 4.

 4,1-7 годин; 5.

 7,1-8 годин; 6.

 8,1-9 годин. 

 У цьому випадку при обчисленнях виникає інша проблема, якщо тривалість навчання деякого студента, наприклад, дорівнює 1,09 годин. Знову ж прийняття рішення в руках соціолога. Він може віднести до інтервалу не тільки верхню межу, але і те, що нижче нижньої межі наступного інтервалу, тобто респондент, у якого тривалість навчання дорівнює 1,09 годинах буде віднесений до першого інтервалу. 

 Використовуючи перші введені інтервали, підрахуємо по них розподіл респондентів (таблиця 3.1.3.) 

 Зверніть увагу, що кожна з наведених таблиць має заголовок, підсумковий стовпець. Ці таблиці - приклад оформлення як би первинних результатів соціологічного дослідження. Зрозуміло, за винятком того, що реальні таблиці містять тільки один показник з чотири наведені. Такого роду таблиці служать і для представлення результатів дослідження. Ця ситуація типова для досліджень громадської думки. 

 Соціолог називає розподіл ознаки «лінійкою», простим розподілом, лінійним розподілом, частотним розподілом, простий угрупованням, тому що мова справді йде про сами прості, одновимірних розподілах на відміну від умовні і багатомірні. Останні виходять тоді, коли одночасно будується розподіл за кількома ознаками. До нагоди двовимірні розподілів перейдемо трохи пізніше. 

 Таблиця 3.1.3 

 Розподіл студентів за тривалістю навчання ПОКАЗНИКИ 0-1 1-2,5 2,5-4 4-7 7-8 8-9 Разом 1. Абсолютна частота ' 57 75 150 34 Н 250 150 ) 000 2. Відносна частота в частках (частость) 0,027 0,075 0,15 0,348 0,25 0,15 1 3.Относітельная частота у відсотках 2,7 7,5 15 34,8 25 15 100 4. Накопичена частота у відсотках 2,7 10Д 25,2 60 85 100 Одномірне розподіл може бути отримано як для всієї вибіркової сукупності, так і для окремої підвибірки. У нашому випадку підвибірки є студенти-гуманітарії, виділені з усієї сукупності опитаних студентів. Тоді точніше називати розподілу, отримані нами за трьома ознаками, умовними, Такого роду умовні розподілу дозволяють вже на цьому першому етапі роботи з емпіричними даними вирішувати завдання порівняльного аналізу. Наприклад, можна порівнювати структуру задоволеністю навчанням студентів-гуманітаріїв та студентів-природничників, структуру тривалості навчання для соціологів та істориків і т. д. У будь-якому випадку ми порівнюємо структуру розподілів для різних груп обстежених / опитаним. 

 Крім такого порівняльного аналізу, одномірні розподілу необхідні соціологу заради досягнення наступних цілей, перше, для перевірки якості вибірки, якщо йдеться про масові опитуваннях. Навіть тоді, коли вибірка «добре» планується, в реальних даних можуть виникнути перекоси. Ознаки, за якими формується вибірка, включаються в інструментарії, і за їх розподіл здійснюється відповідний контроль. Це тільки один аспект. Інше пов'язане з тим, що число ознак, за якими планується вибірка, не може бути більшим. У цьому зв'язку ряд ознак, що цікавлять соціолога з точки зору репрезентативності вибірки, випадають з розгляду при її формуванні. Тоді соціолог може перевірити репрезентативність за цими ознаками на основі аналізу їх розподілів. 

 По-друге, по одновимірним розподілам визначається диференціюються сила ознак. Повертаючись до таблиці 3.1.1, бачимо, що дві професії не зустрічаються в наших даних. Відповідно, вони виключаються з подальшого аналізу. Деяка група (за рівнем задоволеності, професійна) респондентів може бути за чисельністю невеликий (що є «багато» і «мало», визначає соціолог, виходячи їх своїх дослідницьких завдань). Невелика група виключає можливість порівняння її з іншими, великими групами. У цьому випадку, спираючись на прості розподілу, приймається рішення і об. об'єднанні окремих груп. Тим самим можуть уточнюватися завдання і гіпотези дослідження. 

 По-третє, по простих розподілів визначаємо характер цього розподілу і встановлюємо емпіричні закономірності «поведінки» ознаки щодо ізучаема об'єктів (у нашому випадку студенти-гуманітарії). Термін «поведінку» будемо вживати виключно для наочності та образності. На наш погляд, він корисніший, ніж математичні терміни. 

 Насамперед за відділами виділяються модальні (часто зустрічаються) і антімодальние (рідко зустрічаються) тенденції. Не тільки перші, але й другі можуть бути соціально значущими. «Мало» для соціолога має два значення. Перше - вибірка була мала за обсягом, і представники якоїсь групи до неї не потрапили випадково. Друге - «рідкісна» група, але соціально значуща. Наприклад, випадок латентних соціальних груп. З цього висновок - не можна викидати з аналізу феномен «антімодальності» без достатнього обгрунтування. 

 І нарешті, представляється важливим наступне. Одномірне розподіл можна аналізувати на різних «мовах». Перший основний -

 мова математичної статистики, статистичного аналізу. Величезна кількість літератури описує саме цей аспект. Основний постулат статистичного підходу: одномірне розподіл - результат тільки одного спостереження генеральної сукупності і, відповідно, підтвердили впливу випадкових, неконтрольованих, факторів. Якщо вибірка була «хорошою», то по ній можна з певною точністю обчислити характеристики генеральної сукупності. Звідси і виникає поняття довірчого інтервалу, інтервалу, в якому знаходиться істинне (для генеральної сукупності) значення такого роду характеристики. Мовою статистичного аналізу можливі значення ознаки називають варіантами, а їх сукупність і відповідні їм частоти - варіаційним рядом. Цими термінами соціологи практично не користуються. 

 Другий «мова» спирається на інформаційний підхід або поняття теорії інформації. Існує поняття одиниці інформації. Такою є біт (від англійського binary digit - двійкова цифра). Будь потік інформації (числа, букви, фрази) можна закодувати нулями і одиницями. Число нулів і одиниць, необхідних для оптимального (найкоротшого) кодування цього потоку, називається кількістю інформації. 

 Уявімо тепер ситуацію, коли нам треба щось дізнатися. Наприклад, хто-то з вас загадав когось із присутніх. Яке число питань треба мені задати йому, щоб дізнатися, «кого» він загадав. При цьому тільки питання з варіантами відповіді «так» і «ні». Для цього я складу список з усіх, наприклад, 32 присутніх студентів. Потім поділю цей список на дві частини і запитаю, вказуючи на першу частину списку, «чи є задуманий в цій частині». Тим самим визначу 16 студентів, серед яких є і задуманий. Повторю процедуру розподілу на дві частини і отримаю список з 8ми студентів, серед яких є і задуманий. Продовження такої процедури розподілу призводить до результату. Мені треба було задати лише п'ять питань. П'ять і є кількість інформації. Це кількість можна було визначити і по-іншому. Кожному порядковому номеру студента поставлю у відповідність п'ятизначне двійковечисло від 00000 до 11111 і запитаю, чи вірно, що у задуманого студента першого, другого, третього, четверта та п'ята цифри дорівнюють одиниці? 

 Кількість інформації, необ одим для відгадування задуманого студента, дорівнює п'яти або tog232. Як вправа підрахуйте кількість інформації в номері паспорта. 

 Одномірне розподіл може інтерпретуватися як якесь повідомлення, що несе в собі певну кількість інформації. Це кількість можна оцінити деякою мірою, і значення її буде різним для різних розподілів. Такий захід називається також ентропією. Якщо когось із вас зацікавить ця проблематика, то загляньте в цікаву книгу (10) угорського математика, де є розділ «Записки студента з теорії інформації». 

 Третій «мова» - просто пошук регулярності, значимість яких може описуватися і без всякої математичної статистики. Існують «мови» аналізу розподілів, коли аналізуються впорядкованості і співвідношення між частотами, наприклад, для пошуку соціальних констант. Але ці проблеми вже для наступного етапу вивчення методології аналізу інформації. «Мов» аналізу розподілів може бути багато, тому це ще одна причина, по якій ми користуємося поняттям «поведінка» ознаки, а не терміном статистичний аналіз. 

 Завдання на семінар або для самостійного виконання 

 Кожному студенту необхідно придумати дані для модельної задачі. По можливості використовуйте фрагмент з реального дослідження. Мета завдання - підготовка до освоєння прийомів первинного аналізу, тобто вивчення «поведінки» окремо взятих ознак, у тому числі і емпіричних індикаторів. На цьому ж матеріалі будемо освоювати і аналіз взаємозв'язків між ознаками. 

 Вимоги до задачі, а значить до емпіричним даним, такі: 1.

 Число об'єктів 45-50. У ролі об'єктів можуть виступати: респонденти, сім'ї, студентські групи і т. д. Швидше за все, це будуть респонденти, бо об'єктів потрібно близько 50-ти. Попередження до «всезнайкам» - на даному етапі все робиться без комп'ютера. Рекомендується спочатку виконати вручну всі наведені в «Лекціях» завдання і тільки потім скористатися комп'ютером. 2.

 Число ознак як мінімум дорівнює трьом. Перший з них виміряно за номінальною шкалою з числом градацій, рівним 6-9. Другий - по порядкової шкалою з числом градацій, рівним 5-7. І нарешті, третя ознака виміряно по метричній шкалі (числа, кількості). При цьому для спрощення обчислень в якості значень ознаки рекомендується використовувати двозначні цілі числа. 3.

 Для цих трьох ознак повинен мати змістовний сенс 

 аналіз взаємозв'язків між ними. Наприклад, можна вивчити «поведінка» таких ознак, як «соціальне походження студента», «його 

 впевненість у працевлаштуванні за фахом після закінчення вузу »і« ставлення до навчання ». При цьому перший з них має номінальний рівень вимірювання і являє собою пряме запитання анкети про соціальне походження. Другий може бути виміряний за допомогою логічного квадрата за п'ятибальною порядковою шкалою. Третій виміряно за шкалою Терстоуна і тим самим має метричний рівень вимірювання. 4.

 Для обраних ознак повинні бути правомірні, наприклад, такі питання: «3авісіт Чи є впевненість у працевлаштуванні від соціального проис ожденія студента? »,« Чи залежить ставлення до навчання від упевненості у працевлаштуванні? ». 5.

 Після вибору вихідних для аналізу ознак слід скласти відповіді, якщо завдання модельна. Таким чином виходить матриця вихідних даних виду «об'єкт - ознака», на основі якої будуть виконуватися завдання до кількох наступним розділах цієї глави. 6.

 За всіма трьома ознаками необхідно обчислити абсолютні, відносні (у частках і відсотках) і накопичені частоти. Оформити результати у вигляді таблиць типу 3.1.1; 3.1.2; 3.1.3. 2.

« Попередня Наступна »
= Перейти до змісту підручника =
 Інформація, релевантна "1. З ЧОГО ПОЧИНАЄТЬСЯ АНАЛІЗ?"
  1. Виділення педагогічної проблеми, її вивчення і визначення мети рішення (бажаного результату)
      починає пильно аналізувати проблему, вдаючись до її аналізу. Не всі педагогічні рішення передує педагогічний аналіз, проведений у повному обсязі описаних вище прийомів і правил. Але він повинен бути таким для прийняття важливих, відповідальних, масштабних і розрахованих на довготривалу дію рішень. Більш того, найбільш важливі повинні грунтуватися на аналізі, що носить характер
  2. I. Обмеження предмета
      починатися з самих складні явищ аналізованого ряду. Розклавши їх на явища, непосредственні наступні за ними за своєю складністю, ми повинні перейти до подібному: же розкладанню цих складових частин; таким чином, завдяки після послідовним розкладанням ми повинні спускатися до все більш простому и більш загального, поки не досягнемо, нарешті, самого простого і самого загального Бути може, потрібно
  3. МЕТАФІЗИКА євразійства Рене Генона: НОРМАЛЬНИЙ СХІД І патологічності ЗАХІД
      чогось порівнянного з «традиційними науками» Сходу, означає бажати абсолютно неможливого; і якщо правда, що Захід теж,,, мав свої «традиційні науки», то все ж таки треба визнати, що вони майже повністю потсряни. Рене Генон У даній главі ми продовжимо виклад цілісно-Голог-рафіческой підходу до цивілізаційного процесу в аспекті євразійського компаративістському аналізу Сходу та
  4. Свічку
      чого можна було б зробити краще? - Створення атмосфери взаємної довіри, співпраці, співдружності: - відверта бесіда про хвилюючі питаннях по колу; - позитивне закінчення справи, дня, зборів; - спів під гітару («гітара по колу»). Умови реалізації: - Свіча (краще декілька). - Гітара. - Вільний простір, необхідне для розміщення всіх присутніх навколо свічки. -
  5. Правила стимулювання
      чого бажаємо ми, а й те, чого хоче учень. Не будемо намагатися його переробляти: він не винен у своїх бажаннях. Згадайте великий принцип природосообразности - все у відповідності з природою. Тому лише змінюйте спрямованість устремлінь, якщо вони не збігаються з педагогічними цілями. 149 Спирайтеся
  6. Методи юридичної психології
      чого здійснюється статистична обробка отриманих результатів.) У юридичній психології широко використовується і метод бесіди - метод довірчого спілкування з обстежуваним особою. При цьому використовується прийом непрямих питань і виключаються які б то не було навідні запитання. Допоміжний метод юридичної психології - метод вивчення цивільних і кримінальних справ, слідчих і
  7. XII. Еволюція і Розкладання
      чогось повинна починатися з появи його з невідчутного стану і тривати до переходу його в невідчутне стан. Наша теорія речей, розглянутих окремо або в їх сукупності, буде очевидно неповною, поки яка б то не було частину їх відчутного стану залишиться необьясненной. філософія повинна формулювати цей перехід від невідчутного до відчутного і назад - від відчутного до
  8. Література для самостійної роботи
      початківця вчителя. М, 1994. Поташник М.М. Управління сучасною школою. М., 1992. Керівництво навчальним процесом. М,
  9. Побудова вторинної змістовної моделі (інтерпретація, зв'язка D схеми П3.1)
      чого ми робити не будемо, відіславши читача до літератури [Толстова, 1991а, с. 83-94; вона ж, 19916, с. 58-60]. На закінчення відзначимо, що в схемі П3.1 є безліч зворотних зв'язків. Зокрема, після аналізу вторинної змістовної моделі може істотно змінитися уявлення дослідника і про первинної змістовної моделі, і про процеси абстрагування, концептуалізації,
  10. Теми та питання для обговорення на семінарських заняттях
      початківця вчителя-стажиста з іншими суб'єктами освітнього процесу як фактор його соціально-професійної адаптації до практичної діяльності. 3. Включеність студентів-майбутніх учителів у процес гуманістично-орієнтованого педагогічної взаємодії в умовах навчально-професійної діяльності у ВНЗ. 4. Порівняльний аналіз професійно-особистісної позиції
  11. Завдання курсу:
      аналізу теоретичних робіт найбільших представників політико-правової думки для професійної орієнтації в загальносвітових тенденціях і перспективах розвитку досліджень в галузі держави, політики, законодавства і права; навчити студентів системному підходу до аналізу розвитку будь-якої наукової
  12. Леві-Строса
      починали. Саме таким чином читач, дійшовши до п'ятої частини книги, зможе відзначити, що міф під № 428 пов'язаний з міфом № 10 книги «Сире і варене». Після цього він перевірить у шостій частині, що міф 3495 збігається з групою (Ml, М7-12, М24), яка служила одночасно відправною точкою і дороговказом до вступного того цієї «Міфології» [...] Для розвитку структурного аналізу
  13. V. Негативне виправдання реалізму
      аналізу, ми посунемо вперед наше дослідження на один щабель, зробивши найближчий
  14. ГЛАВА СЬОМА
      чогось, з чого-то1 і стає чимось (говорячи «чимось», я маю на увазі кожен рід сущого: щось is стає пли певним щось, або той величини, або таким-то, або десь). Природно виникнення того, що виникає від природи; те, з чого щось виникає, - це, як ми говоримо, матерія; то, внаслідок чого воно виникає, - це щось суще від природи, а чим воно стає -
  15. «Тектологія. Загальна організаційна наука »Олександра Олександровича Богданова
      чого подібного! Сінер-] Гетика - самостійне течія, що претендує на науковість, але ні-] чого спільного з самоорганізацією і творчістю Богданова поки не має. ^ О синергетики нижче ще буде сказано. и
© 2014-2022  ibib.ltd.ua