Головна |
« Попередня | Наступна » | |
1. Чи можна довіряти тестам? |
||
Відповідь на поставлене питання - завдання цієї лекції. І короткою відповіддю на нього є наступний: «Дивлячись яким ...» Питання це далеко не простий. Так, в США він почав обговорюватися разом з появою тестів. Серед безлічі публікацій на цю тему виділяється книга відомого тестового експерта А.Д. Стре-нио (AJ Strenio, Jr.) Під страхітливим назвою «Тестова пастка» (The Testing Trap, NY, 1981). Основний пафос книги полягає в тому, що тестові оцінки стали в Сполучених Штатах, по суті, доленосним критерієм ставлення до людини, визначаючи його життєві можливості. На багатому матеріалі і ре- 157 -е- Bespalkol.qxd 28.02.2008 16:15 Page 1Іг8 В.П. Беспалько. Природосообразном ПЕДАГОГІКА альних прикладах А. стрении показує, що цілком компетентні люди дуже часто ставляться за результатами тесту до недостатньо підготовленим або навіть безграмотним індивідам. Причиною цьому, вважає автор, є інвалідність застосовуваних тестів. Майже двадцять років по тому вийшла ще одна подібна книга під тією ж назвою. Її автор Джордж Хіллокс (George Hillocks, Jr.) Зосередився на тому, щоб показати істотні розбіжності між тим, що являє собою вміння писати (Writing), і тим, що тестується як уміння писати. Двохсот-сторінковий аналіз тестування вміння писати в п'яти американських штатах привів автора до переконливого висновку про абсолютну змістовної та функціональної інвалідності застосовуваних з цією метою тестів. На жаль, ні та, ні інша книга не подіяли дієвого впливу на практикуються тестові випробування в США і в країнах, де також використовується подібне тестування. Причиною цьому є не шкідливе впертість авторів існуючої тестової пастки і небажання позбутися її, а неконструктивна критика обох авторів, які чудово викрили всі пороки тестової пастки, але не запропонували ніякого реального виходу з неї. Незважаючи на більш ніж столітню історію використання тестів у різних екзаменаційних процедурах в США, досі не стихають протести проти їх використання як для школярів, так і для цілей ліцензування різними професійними асоціаціями та комітетами («Бордо »- Boards). Ці протести особливо загострилися з введенням адміністрацією Президента США Дж. Бушем Фінального іспиту в 12-річній школі, нез'ясовним чином залишає без дипломів до 70% випускників, що дійшли до іспиту, і ведучого до відсіванню більше чверті учнів ще до іспиту. І знову та ж картина: протести без альтернативи. Повернення ж до суб'єктивного оцінювання - ще гірше. Крім того, корпорації заробляють на тестовій індустрії мільярди доларів, і оскільки застосування навіть очевидно непридатних тестів не загрожує життю випробовуваних, боротьба з неадекватною оцінкою якості знань учнів ведеться «ні добре ні погано». Схоже, нікому діла немає до особистих трагедій учнів та їх сімейних трагедій. 158 Bespalko1.qxd 28.02.2008 16:15 Page 15 * 9 Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем Критикам тестів протистоять їх захисники, зусилля яких, по всій ймовірності, непогано компенсуються зацікавленими фірмами: адже тести - це багатомільярдний і поновлюваний бізнес. Показовою в цьому відношенні книга тестового експерта Річарда П. Фелпса (Richard P. Phelps). У своїй книзі під промовистою назвою «На захист стандартизованого тестування» (Defending Standardized Testing, NY, 2005) Р. Фелпс, майже 25 років по тому після А. Представляється, що для такого висновку у Фелпса є достатньо підстав: відразу після появи в педагогічному світі тестів стали публікуватися короткі методики і «фундаментальні» праці, детальнейшим чином розглядають кожну операцію створення, застосування та інтерпретації результатів тесту . Тільки за останні півстоліття були видані чотири практично ідентичні 800-сторінкові «біблії» тестування під одним і тим же назвою «Educational Measurements. Кожна з цих «біблій», зберігаючи наступність з попередньою, була підготовлена окремим колективом з двох і більше десятків найбільш кваліфікованих авторів, очолюваних відомими вченими-психологами. Перша з цих «біблій» була підготовлена 20 авторами і видана між 1951 і 1966 роками шістьма виданнями під редакцією Е.Ф. Лінгквіста (E.F. Lingquist). Друга підготовлена 22 іншими авторами і видана в 1971 році другим виданням під редакцією Роберта Л. Торндайка (Robert L. Thorndike). Третя була видана в 1989 році під редакцією Р. Л. Лінна (RL Linn). Нарешті, четверта, тільки що опублікована (2006) об'ємиста аналітична робота представляє собою останнє слово зарубіжного досвіду тестування. Вона опублікована під редакцією Роберта Л. Бреннана (Robert L. Brennan). У створенні цієї узагальнюючої роботи взяли участь близько сорока відомих американських фахівців у галузі педагогічних вимірювань, професорів престижних університетів і співробітників провідних фірм, що спеціалізуються на педагогічних вимірювань 159 Bespalkol . qxd 28.02.2008 16:15 Page IHrO В.П. Беспалько. Природосообразном ПЕДАГОГІКА пах, таких, наприклад, як Educational Testing Services (ETS). У 22-х об'ємних статтях, присвячених вузловим проблемам створення та застосування тестів лише одна коротка стаття присвячена дослідженню когнітивних процесів у зв'язку з оцінкою знань учнів. Але й вона повисає в повітрі, оскільки прагнення автора проаналізувати психологічні підстави оцінки знань учнів «на кінчику його математичного пера» ні до чого, крім беззмістовних математичних вправ, побудованих на абстрактних припущеннях, не приводить. Чи не тому ні в одній з інших 21 статей їх автори не в змозі спертися на висновки Р. Д. Міслеві (автор статті - RJ Mislevy) в аргументації своїх розробок. Аналізуючи далі статті теоретичного розділу останньої «біблії» тестування, звертає на себе увагу загальна тенденція розглядати проблеми так званої «тринітарній» (trinitarian) моделі валідності тесту (змістовної, конструктивною і критеріальною) з такої гаданої глибиною і ретельністю, що отримана суперабстрактная модель повністю втрачає хоч якийсь прикладної сенс. Не можна не провести у зв'язку зі сказаним деякі паралелі з процесами діагностики з інших областей людської діяльності. Наприклад, в медицині велика кількість симптомів не забезпечує точності діагнозу, поки не формується синдром, побудований лише на суттєвих ознаках хвороби. У машинобудуванні точність вимірювання розміру і чистоти поверхні має природні технологічні обмеження. Вимагати від тестування тієї точності вимірювання, яка закладається захопленими математиками в їх «красиві» моделі, це означає ніколи не отримати працездатною і аргументованою методики оцінки знань учнів. Не можна також не згадати тут і п'ять видань Стандартів педагогічного та психологічного тестування (Standards 160 Bespalkol.qxd 28.02.2008 16 : 15 Page 1HKL 161 Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем for Educational and Psychological Testing, 1954 - 1999), підготовлених під егідою таких авторитетних організацій, як Американська асоціація педагогічних досліджень (AERA), Американська психологічна асоціація (APA) та Національна рада педагогічних вимірювань (NCME). У «Стандартах», відповідно їх назвою, містяться вимоги до розробників і користувачам тестів різного призначення: для школи, професійної атестації, професійного відбору та пр. Вимоги ці мають настільки формальний характер, що навіть американці, які обожнюють все ліцензувати (навіть забивання цвяха у стінку), поки не зважилися надати названим стандартам силу закону, і стандарти в основному існують самі по собі, а тести кояться, «як бог на душу поклав» їх автору Крім згаданих тестових «біблій» і « стандартів », є величезна література прикладного характеру за методикою написання конкретних тестів та їх використання у навчальному процесі. Вражаючим є наявність величезної прірви, що розділяє названі вище «біблії» і стандарти з усією іншою прикладної тестової літературою. Поки перші парять десь в позахмарному математичному піднебессі, створюючи формальні математичні моделі валідності, надійності, нормування та шкалювання, другі віддають перевагу повзучий емпіризм умоглядних і приземлених рекомендацій щодо створення та застосування тестів. І найбільш імовірною причиною цього розриву теорії і практики є той факт, що, захоплюючись математичним моделюванням процесів педагогічних вимірювань, автори досягли результатів, про які краще, ніж говориться у відповідній приказці, не скажеш: «Гладко було на папері, та забули про яри, а по них ходити! ». Мабуть, це невідповідність теорії і практики американського тестування і дало підставу Р. Фелпсу вважати, що негативне ставлення до тестів, як вчених, так і випробовуваних може бути пояснено некваліфікованим тестуванням. Але ще більш імовірно, що в самих підставах створення та застосування тестів в Америці щось суперечить людській природі, що викликає спонтанне і неусвідомлене їх неприйняття. І в даній лекції ми покажемо, що сучасне тестування, як воно утвердилося в США, - це найбільш виразний антипод відомому заклику великого Яна Амоса Коменського зробити школи «храмом радості, задоволення і успіху». До жалкую- 161 Bespalkol.qxd 28.02.2008 16:15 Page 1ІГ2 162 В.П. Беспалько. Природосообразном ПЕДАГОГІКА нию, російські творці ЄДІ перенесли всі пороки американського тестування в свої розробки та процедури, але про це попереду.
|
||
« Попередня | Наступна » | |
|
||
Інформація, релевантна " 1. Чи можна довіряти тестам? " |
||
|