Головна
ГоловнаНавчальний процесЗагальна педагогіка → 
« Попередня Наступна »
Беспалько В.П.. Природосообразно педагогіка. М.: Народна освіта, 512 с., 2008 - перейти до змісту підручника

5. Структура тесту

Будь тест повинен складатися з двох відокремлених один від одного частин: Завдання та Еталону.

Завдання отримує випробуваний і, виконуючи його, формулює своє рішення, відповідь.

Еталон знаходиться в розпорядженні екзаменатора або закладений в деякий екзаменатор (комп'ютер).

Відповідь випробуваного порівнюється з еталоном і за прийнятою для даного тесту методикою виноситься судження про тестируемом якості. Символічно сказане можна записати у вигляді такої формули:

Тест (Т) = Завдання (З) + Еталон (Е).

124

ВеБра1ко1.дхсС 28.02.2008 16:15 Раді 12И5

125

_Лекція № 4. Інструменти діагностики якості знань учнів. Тести_

Процедуру тестування можна зобразити у вигляді такої схеми (див. рис. 11).

() Еталон

Завдання / \ Відповідь -? Ка = п / р; -? Оцінка

Рис. 11

Наведені формула і схема тестування виглядають тривіально, і це дійсно так. Нетривіальний, однак, їх дидактичний зміст, який складається, по-перше, у прагненні створити у читача міцне уявлення про те, що тест без еталона - це не тест, а звичайне контрольне завдання, схильне всім випадковостям глазомерной оцінки. По-друге, настільки ж міцно утвердити у свідомості читача думку про те, що в тестуванні порівняння відповіді учня з еталоном і підрахунок Ка обов'язкові.

Судження про якість виконання тесту без порівняння з еталоном перетворює об'єктивну процедуру контролю в суб'єктивну з усіма притаманними останньої недоліками. Звичайно, зіставлення з еталоном, якщо тестування здійснюється вручну, створює для екзаменатора додаткове навантаження в порівнянні з глазомерной оцінкою того ж відповіді учня, але зате робить тестування якості знань учня об'єктивним. Це незручність успішно знімається при застосуванні різних пристосувань для визначення Ка, найуспішнішим з яких є комп'ютер.

Завдання тесту створюється в повній відповідності з вимогами змістовної та функціональної валідності тестування при дотриманні вимоги однозначності і визначеності його формулювання. Це означає, що завдання тесту безумовно здійснимо на основі вивченого в класі змісту предмета і по конструкції відповідає визначенню диагностируемого рівня засвоєння. Звідси випливає, що тести повинні відрізнятися по чотирьох рівнях майстерності. Інші параметри якості знань характеризують їх різні особливості і враховуються при створенні тестів, але на конструкцію тесту не впливають. Так,

125

-е-

ВеБраІкоІ.дхсІ 28.02.2008 16:15 Раді Іії-б

26 грудня

В.П. Беспалько. Природосообразном ПЕДАГОГІКА

можна говорити про наборах тестів на різних щаблях абстракції або ступеня усвідомленості, різних по надійності або автоматизації, але це не змінить диференціювання тестів по чотирьох рівнях засвоєння.

Для зручності користування еталоном при його зіставленні з відповіддю випробуваного, у стандарті вказуються істотні операції тесту, тобто ті операції, виконання яких є повним і правильним рішенням завдання. Тільки істотні операції тесту враховуються при обчисленні коефіцієнта засвоєння Ка. Число «п» означає число правильно виконаних суттєвих операцій тесту; число «р» означає загальне число суттєвих операцій в тесті.

5.1. Надійність тестування

Виникає питання про вибір числа тестів в батареї тестів даного рівня для надійного тестування знань учнів. Під надійністю тестування розуміється стабільність його результату при повторних випробуваннях одного і того ж випробуваного. Надійність тестування позначимо грецькою буквою Ц (мю). Надійність батареї тестів виражається у відсотках. Наприклад, якщо надійність Ц = 40%, це означає, що в 40% повторних проб буде один і той же результат, а в 60% випадків інші результати. Звичайно, таке тестування є ненадійним і його можна застосовувати тільки для орієнтовних зрізів в поточній навчальній роботі. Ніяких підсумкових суджень по такій батареї тестів виносити не можна. Надійність батареї тестів залежить від числа істотних операцій у всьому тестовому наборі даного рівня і визначається за спеціально побудованим графікам - номограммам. Одна з таких номограм показана на малюнку 12.

Надійність (%)

100 75 50

10 20 30 40

80

100

Кількість

суттєвих операцій

-о-

Рис. 12

126

0

ВеБра1ко1.дхсС 28.02.2008 16:15 Раді

27 грудня

Лекція № 4. Інструменти діагностики якості знань учнів. Тести

Мінімальна надійність батареї тестів для підсумкової характеристики якості знань випробуваного може бути не нижче ц = 75% і залежить, як і у випадку з коефіцієнтом автоматизації, від характеру диагностируемой діяльності: для льотчика ц = 100% ; для лікаря мінімум ц = 75%; для вчителя ц = 75% і т.д.

З номограми видно, що для досягнення ц = 75% батарея тестів повинна містити не менше 80 суттєвих операцій. Таке число операцій складно мати в тестовій батареї для поточного контролю, але нескладно - для підсумкової оцінки.

У практиці американського тестування часто можна зустріти «слоноподобние» тестові батареї об'ємом в сотні і сотні істотних операцій і вимагають для їх виконання цілого робочого дня. Наприклад, кваліфікаційний іспит на медсестру містить понад тисячу операцій і триває шість годин. Такий об'єм батареї не має нічого спільного з прагненням екзаменаторів до підвищеної надійності суджень. Швидше за все, екзаменатори взагалі не думають про надійність. Їх завдання, очевидно, полягає в тому, щоб провалити випробуваного для повторного отримання оплати (і чималої) за переекзаменування.

Їх анітрохи не бентежить, що середнє число спроб здати цей жахливо перевантажений і безпардонно інвалідний за всіма статтями іспит для кандидатів у медсестри становить від 6 до 10 разів, і екзаменатори перетворюються на екзекуторів.

У той же час батарея тестів навіть першого рівня з 75-відсотковою надійністю виконується максимум за 1:00 навіть флегматиком і прекрасно диференціює підготовленого випробуваного від йде на іспит «на авось».

Анекдотичний випадок стався одного разу з автором на іспиті з педагогіки, і я завжди його розповідаю для науки ліберальним екзаменаторам.

Студент, явно не шкільного віку, був не підготовлений до іспиту, який проводився за тестами першого рівня. Отримавши черговий «незадовільно», студент щиро дивувався тому, що ніяк не може «вгадати» правильні відповіді, і щоразу просив повторити тест. Знаючи надійність тесту, це йому дозволялося. Після сьомої спроби студент щиросердно зізнався, що до іспиту не готувався і предмет протягом семестру не вивчав, що сподівався на російський "авось", і слізно молив поставити йому «трійку», щоб не залишитися без стипендії - єдиного ис-

127

-е-

Bespalko1.qxd 28.02.2008 16:15 Page 12 ^ 8

В . П. Беспалько. Природосообразном ПЕДАГОГІКА

точника існування його сім'ї. При цьому студент не скупився на «тверді» обіцянки вжити свій канікулярний час на вивчення предмета і після канікул повторно проекзаменувала. Автор ніколи не грав роль добренького, розсіяного, ліберального професора, а, навпаки, чітко формулював цілі навчання і настільки ж чітко екзаменував їх досягнення студентами. Цього разу автор піддався гіпнозу «щирості» студента і, на подив секретаря кафедри, вимовив: «Ну навіщо ж трійка з педагогіки майбутньому вчителю? Я вам авансом поставлю четвірку, а восени ви мені доведете, що я в вас не помилився ». Годі й говорити, що восени студент і носа не показав на кафедрі, але «великий ніс» показав своєму професорові. У «Літературній газеті», де в цей час обговорювалася стаття його професора про користь тестів, він описав свій досвід тестового іспиту таким чином: «Сім раз тести показували, що я не знаю предмета, але виявилося, що тести просто не розуміють творчих відповідей - коштувало професору поговорити зі мною, як у моїй заліковці з'явилася четвірка ». За наступні тридцять років викладання автор більше ні разу не був загіпнотизований студентськими вмовляннями.

« Попередня Наступна »
= Перейти до змісту підручника =
Інформація, релевантна " 5. Структура тесту "
  1. 6. Створення тестів різного рівня
    структури або таблиці навчальних елементів, а потім вже будувати тести, зіставляючи пропоновані в них завдання з наявністю у змісті навчання відповідної інформації про тестованих УЕ (властивості об'єктів, сутності явищ, алгоритмах і методах діяльності). Не можу тут не відзначити сущу вакханалію на ліцензійних іспитах в США (лікар, медична сестра, зварювальник, слюсар, інженер і сотні
  2. Оцінка інтелектуального розвитку.
    Структура розумових здібностей людини (інтелектуальні тести Г. Айзенка були опубліковані в нашій країні в 1972 р.). Тести Айзенка призначені для визначення загального рівня здібностей. У них ис-користується словесний, цифровий і графічний матеріал у поєднанні з різними способами формулювання і пред'явлення завдань. Від випробуваного потрібні елементарні знання, зацікавленість
  3. 6. Оцінка психофізіологічних якостей.
    тесту "для визначення сили нервової системи грунтується на динаміці максимального темпу руху рук і дозволяє отримати інформацію про стомлюваності випробуваного при подібної діяльності. Високі показники виконання "Теппінг-тесту" можуть свідчити про високої працездатності професіонала (спеціаліста), а також про здатність до виконання робіт, що вимагають тонких моторних рухів (професії
  4. 8. Автоматизація засвоєння
    тіста. Цей параметр позначається грецькою буквою Т (тау). При тестуванні знань і вмінь учнів для контролю автоматизації засвоєння задається час на виконання тесту. На відміну від довільного визначення часу на виконання деякого набору тестів, використовуваного під всіх випадках сучасного традиційного тестування, параметр автоматизації дає можливість призначати час
  5. 3.1 Резюме
    тіста.
  6. Вправи, практичні ситуації і тести до курсу «Управленіеперсоналом»
    тесту, що визначають моделі поведінки керівників: Керівництво та лідерство Тест (Адізас): Ефективне і неефективне керівництво. Тест: Ідеальна група з
  7. Принцип найпростіших конструкції
    структура чи конструкція живої системи, яку ми дійсно знаходимо в природі, є найпростішою з можливих структур або конструкцій, здатних виконувати цю функцію чи структуру функцій
  8. Методи відбору
    тесту Обговорення рекомендацій, занесених в кінцеві списки кандидатів Підготовка комісії до інтерв'ю, тестування Відбіркове інтерв'ю, тестування Проведення медичної перевірки Ухвалення рішення з відбору для призначення минулого кандидата Інформування пройшли і не пройшли кандидатів про рішення з відбору Підготовка колективу до зустрічі з новим службовцям Прийняття обов'язків посади
  9. 1. Проблема створення адекватного інструменту діагностики
    структурі особистості і можливості Диагностичность целеобразо-вання по окремих її властивостям, а також про параметри диагно -стичної мети. Під особистістю, в найзагальнішому вигляді, розуміють людину, овладевшего в певній мірі знаннями і уміннями життєдіяльності в сучасному світі людей і речей. У структурі особистості розрізняють властивості, притаманні їй від народження - генетичні властивості і властивості,
  10. Ділова активність
    структур (лінійна і функціональна структура). Ділова активність орієнтована на створення структури організації: структура визначається стратегією, цілями. Лідерство і ділова активність - дві сторони єдиного процесу керівництва. Лідерство складається з наступних компонентів: лідер, його послідовники, ситуація і завдання, група взаємодіючих людей. При цьому основою лідерства, яка
  11. 8. Тести, іспити і демократія
    тесту . Відоме прагнення екзаменаторів відхилятися від змістовної валідності тесту і включати на іспитах тести з раніше вивченим УЕ, виправдовуючись тим, що учень повинен вміти орієнтуватися в несподіваних ситуаціях шляхом перенесення засвоєних умінь в нові умови, нічим не виправдане. Якщо таке трапиться в майбутній практиці учня і йому зустрінеться завдання, не схожа на вивчені, то
  12. КОНТРОЛЬНІ ПИТАННЯ
    структуру слідчого апарату системи прокуратури РФ. 3. Назвіть структуру слідчого апарату системи МВС РФ. 4. Назвіть структуру слідчого апарату системи ФСБ РФ. 5. Назвіть структуру слідчого апарату системи ФСПП РФ. 6. Які установи, органи та посадові особи віднесені законом до органів дізнання? 7. У чому полягають повноваження органів