Головна |
« Попередня | Наступна » | |
5. Структура тесту |
||
Будь тест повинен складатися з двох відокремлених один від одного частин: Завдання та Еталону. Завдання отримує випробуваний і, виконуючи його, формулює своє рішення, відповідь. Еталон знаходиться в розпорядженні екзаменатора або закладений в деякий екзаменатор (комп'ютер). Відповідь випробуваного порівнюється з еталоном і за прийнятою для даного тесту методикою виноситься судження про тестируемом якості. Символічно сказане можна записати у вигляді такої формули: Тест (Т) = Завдання (З) + Еталон (Е). 124 ВеБра1ко1.дхсС 28.02.2008 16:15 Раді 12И5 125 _Лекція № 4. Інструменти діагностики якості знань учнів. Тести_ Процедуру тестування можна зобразити у вигляді такої схеми (див. рис. 11). () Еталон Завдання / \ Відповідь -? Ка = п / р; -? Оцінка Рис. 11 Наведені формула і схема тестування виглядають тривіально, і це дійсно так. Нетривіальний, однак, їх дидактичний зміст, який складається, по-перше, у прагненні створити у читача міцне уявлення про те, що тест без еталона - це не тест, а звичайне контрольне завдання, схильне всім випадковостям глазомерной оцінки. По-друге, настільки ж міцно утвердити у свідомості читача думку про те, що в тестуванні порівняння відповіді учня з еталоном і підрахунок Ка обов'язкові. Судження про якість виконання тесту без порівняння з еталоном перетворює об'єктивну процедуру контролю в суб'єктивну з усіма притаманними останньої недоліками. Звичайно, зіставлення з еталоном, якщо тестування здійснюється вручну, створює для екзаменатора додаткове навантаження в порівнянні з глазомерной оцінкою того ж відповіді учня, але зате робить тестування якості знань учня об'єктивним. Це незручність успішно знімається при застосуванні різних пристосувань для визначення Ка, найуспішнішим з яких є комп'ютер. Завдання тесту створюється в повній відповідності з вимогами змістовної та функціональної валідності тестування при дотриманні вимоги однозначності і визначеності його формулювання. Це означає, що завдання тесту безумовно здійснимо на основі вивченого в класі змісту предмета і по конструкції відповідає визначенню диагностируемого рівня засвоєння. Звідси випливає, що тести повинні відрізнятися по чотирьох рівнях майстерності. Інші параметри якості знань характеризують їх різні особливості і враховуються при створенні тестів, але на конструкцію тесту не впливають. Так, 125 -е- ВеБраІкоІ.дхсІ 28.02.2008 16:15 Раді Іії-б 26 грудня В.П. Беспалько. Природосообразном ПЕДАГОГІКА можна говорити про наборах тестів на різних щаблях абстракції або ступеня усвідомленості, різних по надійності або автоматизації, але це не змінить диференціювання тестів по чотирьох рівнях засвоєння. Для зручності користування еталоном при його зіставленні з відповіддю випробуваного, у стандарті вказуються істотні операції тесту, тобто ті операції, виконання яких є повним і правильним рішенням завдання. Тільки істотні операції тесту враховуються при обчисленні коефіцієнта засвоєння Ка. Число «п» означає число правильно виконаних суттєвих операцій тесту; число «р» означає загальне число суттєвих операцій в тесті. 5.1. Надійність тестування Виникає питання про вибір числа тестів в батареї тестів даного рівня для надійного тестування знань учнів. Під надійністю тестування розуміється стабільність його результату при повторних випробуваннях одного і того ж випробуваного. Надійність тестування позначимо грецькою буквою Ц (мю). Надійність батареї тестів виражається у відсотках. Наприклад, якщо надійність Ц = 40%, це означає, що в 40% повторних проб буде один і той же результат, а в 60% випадків інші результати. Звичайно, таке тестування є ненадійним і його можна застосовувати тільки для орієнтовних зрізів в поточній навчальній роботі. Ніяких підсумкових суджень по такій батареї тестів виносити не можна. Надійність батареї тестів залежить від числа істотних операцій у всьому тестовому наборі даного рівня і визначається за спеціально побудованим графікам - номограммам. Одна з таких номограм показана на малюнку 12. Надійність (%) 100 75 50
10 20 30 40 80 100 Кількість суттєвих операцій -о- Рис. 12 126 0 ВеБра1ко1.дхсС 28.02.2008 16:15 Раді 27 грудня Лекція № 4. Інструменти діагностики якості знань учнів. Тести Мінімальна надійність батареї тестів для підсумкової характеристики якості знань випробуваного може бути не нижче ц = 75% і залежить, як і у випадку з коефіцієнтом автоматизації, від характеру диагностируемой діяльності: для льотчика ц = 100% ; для лікаря мінімум ц = 75%; для вчителя ц = 75% і т.д. З номограми видно, що для досягнення ц = 75% батарея тестів повинна містити не менше 80 суттєвих операцій. Таке число операцій складно мати в тестовій батареї для поточного контролю, але нескладно - для підсумкової оцінки. У практиці американського тестування часто можна зустріти «слоноподобние» тестові батареї об'ємом в сотні і сотні істотних операцій і вимагають для їх виконання цілого робочого дня. Наприклад, кваліфікаційний іспит на медсестру містить понад тисячу операцій і триває шість годин. Такий об'єм батареї не має нічого спільного з прагненням екзаменаторів до підвищеної надійності суджень. Швидше за все, екзаменатори взагалі не думають про надійність. Їх завдання, очевидно, полягає в тому, щоб провалити випробуваного для повторного отримання оплати (і чималої) за переекзаменування. У той же час батарея тестів навіть першого рівня з 75-відсотковою надійністю виконується максимум за 1:00 навіть флегматиком і прекрасно диференціює підготовленого випробуваного від йде на іспит «на авось». Анекдотичний випадок стався одного разу з автором на іспиті з педагогіки, і я завжди його розповідаю для науки ліберальним екзаменаторам. Студент, явно не шкільного віку, був не підготовлений до іспиту, який проводився за тестами першого рівня. Отримавши черговий «незадовільно», студент щиро дивувався тому, що ніяк не може «вгадати» правильні відповіді, і щоразу просив повторити тест. Знаючи надійність тесту, це йому дозволялося. Після сьомої спроби студент щиросердно зізнався, що до іспиту не готувався і предмет протягом семестру не вивчав, що сподівався на російський "авось", і слізно молив поставити йому «трійку», щоб не залишитися без стипендії - єдиного ис- 127 -е- Bespalko1.qxd 28.02.2008 16:15 Page 12 ^ 8 В . П. Беспалько. Природосообразном ПЕДАГОГІКА точника існування його сім'ї. При цьому студент не скупився на «тверді» обіцянки вжити свій канікулярний час на вивчення предмета і після канікул повторно проекзаменувала. Автор ніколи не грав роль добренького, розсіяного, ліберального професора, а, навпаки, чітко формулював цілі навчання і настільки ж чітко екзаменував їх досягнення студентами. Цього разу автор піддався гіпнозу «щирості» студента і, на подив секретаря кафедри, вимовив: «Ну навіщо ж трійка з педагогіки майбутньому вчителю? Я вам авансом поставлю четвірку, а восени ви мені доведете, що я в вас не помилився ». Годі й говорити, що восени студент і носа не показав на кафедрі, але «великий ніс» показав своєму професорові. У «Літературній газеті», де в цей час обговорювалася стаття його професора про користь тестів, він описав свій досвід тестового іспиту таким чином: «Сім раз тести показували, що я не знаю предмета, але виявилося, що тести просто не розуміють творчих відповідей - коштувало професору поговорити зі мною, як у моїй заліковці з'явилася четвірка ». За наступні тридцять років викладання автор більше ні разу не був загіпнотизований студентськими вмовляннями.
|
||
« Попередня | Наступна » | |
|
||
Інформація, релевантна " 5. Структура тесту " |
||
|