Головна
ГоловнаНавчальний процесЗагальна педагогіка → 
« Попередня Наступна »
Беспалько В.П.. Природосообразно педагогіка. М.: Народна освіта, 512 с., 2008 - перейти до змісту підручника

3. Аналіз тестової системи SAT

Тестова система SAT - найпоширеніша в світі: її послугами користуються понад 200 країн, а тираж її тестів досягає 12 мільйонів. Крім того, багато країн, включаючи Росію, створюють (копіюють) свої тестові системи під великим впливом методики, розробленої для SAT.

Головною організацією, що розробляє і виробляє тести досягнень SAT, є приватна корпорація Educational Testing Service, відома з 1947 року по своїй абревіатурі ETS. Найбільш відомі продукти ETS - тести SAT I і SAT II.

3.1. Тест SAT I

Абревіатура SAT I розшифровується як Scholastic Aptitude Test, що у відносно вільному перекладі означає тест навчальних здібностей. Автори цього тесту припускають, що кожна людина в процесі навчання, в залежності від його вроджених здібностей, набуває деякі узагальнені

165

Bespalko1.qxd 28.02.2008 16:15 Page 166

166

В.П. Беспалько. Природосообразном ПЕДАГОГІКА

навички навчальної роботи (розуміти прочитане, знаходити рішення проблем, викладати свої думки і т.п.). При цьому прямо вказується, що ці навички не обов'язково засвоєні в процесі навчання в школі, вони можуть бути придбані самими різними шляхами, які надаються людині його реальної життєдіяльністю. Для виявлення таких узагальнених навичок і їх рівня створюється даний тригодинний тест. У нього включається матеріал з різних предметів, не обов'язково вивчаються в школі, але який, за твердженням авторів тесту, добре діагностує мовні і математичні здібності учнів і таким чином пророкує їхні майбутні успіхи у вузівському навчанні. Випробуваний в переважній числі пропонованих тестом завдань повинен здогадуватися, не спираючись на конкретні знання предмета, в чому полягає правильне рішення або відповідь.

Обгрунтуванням такого типу тестування його автори вважають той факт, що в США багато шкіл з низьким рівнем освіти. Талановиті діти з цих шкіл не можуть змагатися на прийомних іспитах до вузів за рівнем засвоєння конкретних знань з випускниками «хороших» міських шкіл. Але вони, володіючи хорошими навчальними здібностями, можуть стати гідними студентами. Завдання тесту SAT I - виявлення таких здібностей. Ніякої психолого-педагогічної теорії здібностей, на яку спирається побудова даного тесту, в літературі не наводиться. Таким чином, цей тест, хоча і називається тестом досягнень, але «підпільно» переводиться в категорію відомих тестів інтелекту, що відображають умоглядну позицію їх авторів.

Стверджується, що SAT I надійно пророкує майбутні успіхи студента вузу на першому, критичному році навчання. Це твердження авторів тесту входить в катастрофічне протиріччя з усією системою шкільної освіти: якщо можна успішно навчатися у вузі тільки за рахунок загальних здібностей, то для чого взагалі необхідно все 12-річне загальну середню освіту? Треба просто зосередитися на розвитку цих загальних здібностей, йти до вузу і отримувати вищу освіту. Широкомовні обіцянки тесту привернули увагу вузів, і тест один час вважався найпопулярнішим мірилом підготовленості студентів до навчання у вузі. Щороку більше мільйона абітурієнтів американських вузів змагалися за цим тестом за право навчатися у престижних вузах США.

166

Bespalkol.qxd 28.02.2008 16:15 Page 16 * 7

167

Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем

У той же час самі виші не отримували підтвердження пророкувань тесту, а навіть навпаки - успішність навчання прийнятих до вузу за цим тестом залишала бажати кращого. Найбільш точне дослідження цієї проблеми було зроблено в Каліфорнійському університеті, де було достовірно встановлено, що предсказательная сила тесту SAT I (21%) не перевищує такий по звичайному тісту досягнень SAT II, ??діагностують якість засвоєння школярами навчальних предметів. Каліфорнійський університет виступив з ініціативою відмовитися від тесту SAT I як вступного випробування до вступу в університет. За цим пішло значне скорочення його використання в США. На перше місце став висуватися предметний тест SAT II, ??який дається всього на одну годину і використовується вузами не стільки як приймальний критерій, а скоріше як матеріал для розподілу студентів за напрямами підготовки.

Педагогічний аналіз тестів SAT I і II спирається на утримання численних посібників (Ebel RL; Childs RA), викладають деякий набір правил і рекомендацій побудови цього типу тестів. Матеріал цих допомог з усією наочністю показує, що тести SAT є примітивними творіннями житейського емпіризму, так як не мають під собою ніякої психолого-педагогічної бази, якою б постулював якийсь процес засвоєння досвіду людиною, і наслідком якої була б сувора і однозначна методика тестування стану цього процесу. Так, тест SAT I спрямований в основному на лінгвістичні та математичні здібності піддослідних, але залишає осторонь багато інших їх здібності, важливі для навчання у вузі.

Якщо врахувати, крім того, що оцінювати одним і тим же тестом і «артистів», і «мислителів» не має ніякого сенсу, так як і ті, і інші по SAT I можуть бути зараховані в один і той же вуз, до якого у них діаметрально протилежні здібності. Чи не це обставина спричинила за собою невдоволення вузів прогностичними можливостями тесту. Зрозуміло, що при відсутності будь-якої членороздільної теорії загальних здібностей і уявлення про їх природу і процесі розвитку неможливо визначити ні змістовну, ні функціональну ва-інвалідність пропонованих SAT I тестів. Їх створення і застосування спирається на волюнтаристські «придумки» авторів, а результа-

167

-е-

Bespalkol.qxd 28.02 .2008 16:15 Page 16r-8

В.П. Беспалько. Природосообразном ПЕДАГОГІКА

ти не порівнянні ні з якими об'єктивними характеристиками людського досвіду, а тому нічого, крім як якість розгадки самого тесту людям, про тест сказати не можна. У цій же ролі могли б виступити будь-які набори загадок, якими багатий народний фольклор. Подібними загадками наповнені всі три частини тесту: його лексична, математична та аналітична частини.

У лексичної частини перевіряється володіння учням англійською мовою, але яким англійським? Чи не сучасним, загальновживаним літературною англійською, а спеціально підібраною сумішшю з рідковживаних, архаїчних і жаргонних слів, значення яких часто невідомо навіть дорослому і освіченій носію мови. У цьому нам вдалося переконатися в природному міні-експерименті. У посібнику для учнів, які готуються до тесту, опублікований список з 100 «важких слів» («dif-ficult words»), які можуть зустрітися учням у тесті. Ми показали ці слова півдюжині освічених американців. У середньому сенс 25% цих слів виявився для них неясним. Коли ж ми зробили невелику вибірку цих неясних американцям слів і стали показувати їх більш широкої американській публіці, то тільки «чемпіони» давали туманне пояснення сенсу не більш ніж половині цих слів. Ось ці слова:

Garrulous - Assuage - Buttress - Desiccate -

Diatribe - Guile - Aberrant - Prevaricate -

Propitiate - Aver - Culpability - Turpitude -

Obviate - Occlude - Abscond - Wheedle -

Harangue - Insipid - Inchoate - Rarefy -

Не дивно, що більше половини випускників американської старшої школи (high school) провалюють лексичний тест. Це пояснюється тим, що шкільні предмети не містять цю лексику, а отже, тест є змістовно інвалідним. Автори стверджують, що тест SAT I виявляє талановитих абітурієнтів, але не пояснюють, який талант виявляється при вгадуванні значень раніше незнайомих слів рідної мови. При півторамільйонному англійському словнику зовсім не складно знайти дві-три-чотири сотні рідко вживаних або зовсім вийшли з вживання слів, щоб поставити в глухий кут рядового громадянина країни. З таким же успіхом можна було б перед-

168

-е-

Bespalkol.qxd 28.02.2008 16:15 Page ІІг-0

Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем

ложить для вгадування і виявлення «лексичного таланту» мову племені Мумбо-Юмбо або мова інопланетян із зірки Тау - Кита.

Не випадково в посібнику «Cracking the NEW SAT» на майже 40 сторінках наводиться приблизний перелік слів англійської мови, які випробовуваний може зустріти в тесті, але які не зустрічались йому в процесі 12-річного навчання в школі ! Що це, якщо не безпардонне знущання над принципом змістовної валідності тесту?

А про що говорить таке попередження в посібнику з подолання тесту?

ETS has gone out of its way to make critical reading questions hard to understand. Therefore, before you go searching for answers to any question, put the question in «English» so you know what you are being asked.

Що в буквальному перекладі на російську означає:

«Фірма ETS зі шкіри геть лізла, щоб зробити питання по критичному читання важко розуміються. Тому, перш ніж шукати правильні відповіді на будь-яке питання, переведіть питання на «англійську», щоб ви зрозуміли, про що вас запитують ».

Якщо до цього ще додати багатозначність тесту, то не дивно, що за свідченнями такого тесту стверджується, що американські школярі не вміють читати. Насправді тест не відповідає вимозі однозначності і общепонятном.

Як, наприклад, відповісти на наступне завдання тесту?

Most of Rick's friends think his life is unbelievably__, but in

fact he spends most of his time on___activities.

Далі пропонуються наступні пари слів для заповнення пропусків (псевдо-тест підстановка):

(A) fruitful ... productive

(B) wasteful ... useless

(C) scintillating ... mundane

(D) varied ... sportive

(E) callow. simple

Який варіант ви оберете і чому? Я не випадково ставлю запитання «чому?»: Тому що у всій шкільній програмі навчання англійській мові немає правила, за яким можна було б зробити однозначний вибір відповіді в цьому тесті. Так, цілком доречний відповідь (A), як і відповідь (D) або (E). Але творці тесту наполягають на відповіді (C), оскільки він містить рідкісні слова.

169

Bespalkol.qxd 28.02.2008 16:15 Page 14

В.П. Беспалько. Природосообразном ПЕДАГОГІКА

Математична частина тесту також рясніє загадками, мабуть, для виявлення математичних талантів, але це робить математичну частину тіста також змістовно інвалідному. У посібнику з подолання тесту говориться: Always keep in mind that the math tested on the SAT is different from the math taught in school. Думаю, що переведення не потрібно навіть читачеві з мінімальним обсягом англійського, засвоєного в школі на першому рівні з К ~ 0,3. Таке чітке підтвердження змістовної інвалідності математичної частини тесту робить його звичайною пасткою для невдалих абітурієнтів.

У батарею SAT I включаються тести логічного мислення, які автори тесту також розцінюють як діагностичний інструмент для виявлення талановитих абітурієнтів. Не вдаючись у психологічні софізми і спекуляції про те, що таке логічне мислення, автори цього виду тестів формулюють багатоходові загадки, називаючи їх рішення ознакою розвиненого логічного мислення.

Ось типова загадка:

Сталося вісім подій: А, Б, В, Г, Д, Е, Ж, З. Вкажіть їх послідовність, якщо: Е є третій; Ж не було четвертим; Е і Ж є сусідніми в послідовності; дві події сталися перед А; А здійснилося перед Г.

Яке відношення ця і подібні завійливі загадки, пропоновані тестом, мають до нормального людського логічного мислення, необхідного для успішного навчання у вузі? Це ні компанією ETS, ні у виданих різними компаніями (Kaplan, Arco, Princeton Review та ін) посібниках з натаскиванию абітурієнтів на подолання тесту не пояснюється. Більше того, наявність таких посібників і рекламні твердження про ефективність викладаються в них тренінгів для подолання тесту начисто перекреслюють весь тест. Дійсно, якщо можна натискати будь-якого випускника школи на успішне подолання тесту, то твердження його творців про те, що він виявляє талановитих, а не знаючих, повністю спростовується, оскільки талант - вроджена якість, яке ні придушити, ні створити на порожньому місці неможливо.

І, нарешті, останнє. Якщо можна натискати на цей тест слабоуспевающих випускників провінційних, запущених шкіл, то тим успішніше на нього натискати успішні випускники зі шкіл великих і розвинених міст і в підсумку вихідна по-

170

Bespalko1.qxd 28.02.2008 16:15 Page 14L

Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем

розсилання цього тесту - зрівняти шанси і тих, і інших тестом, не залежних від шкільної освіти, зазнає нищівної поразки. Що і відбувається зараз на практиці, але тестовий бізнес не здається. Скомпрометований тест SAT I перевидається під іншими назвами-абревіатурами (CAT, GRE, GMAT), але педагогічна їх неспроможність від цього не змінюється. Не знижуються і багатомільйонні бариші таких компаній, як ETS, KAPLAN, BARONS і пр., які спекулюють на педагогічній некомпетентності як батьків, які платять за тестування, так і вузівських і шкільних адміністраторів, що піддають мільйони випускників шкіл непотрібним і єзуїтським випробуванням.

 Чи означає наша критика тесту SAT I, що оцінка загальних здібностей учня до навчання у вузі - це марна і надумана затія? Безумовно. Якщо звернутися до малюнка 7, то стане зрозумілим, що випробовувані з інтелектом А-М і М-А можуть отримати однакові бали по даному тесту, але як різні повинні бути рекомендації по спрямованості їх подальшої спеціалізації. Тест, однак, не розрізняє цієї спрямованості, чому його передбачення і не виправдали очікувань вузівських викладачів. 

 3.2. Тест SAT II 

 Перейдемо тепер до аналізу предметних тестів досягнення SAT II. 

 Ці тести, як стверджують їхні творці, будуються на базі шкільних навчальних програм і відповідають їх предметного змісту: математики, біології, хімії, англійської мови та інших навчальних предметів. Іншими словами, автори тестів гарантують їх змістовну валідність. Знайомлячись з цими тестами, про їх змістовної валідності можна говорити лише з великою обережністю і певною мірою. Чому «обережно і певною мірою»? Тому що їх змістовна валідність не доводяться творцями тестів, а тому велика ймовірність її порушення. 

 Що ж до їх функціональної валідності, то тут, поза всяких сумнівів, не було зроблено ніяких зусиль для її забезпечення. Через недіагностічності цілей навчання в американській 

 171 

 -Е- 

 Bespalko1.qxd 28.02.2008 16:15 Page 142 

 В.П. Беспалько. Природосообразном ПЕДАГОГІКА 

 загальноосвітній школі не представляється можливим дотримуватися вимога функціональної валідності тесту. 

 Що вимірює SAT II тест? Він вимірює ступінь засвоєння знань учнями, але як? 

 У тестовій системі SAT тести поділяються на «легкі», «середні» і «важкі», але ніяких психолого-педагогічних розпізнавальних ознак труднощі або легкості тестів не наводиться. Про труднощі-легкості судять за кількістю учнів, що подолали даний тест. Але це вже залежить не від тесту, а від якості навчання: при зміні якості навчання трансформується приналежність тестів до категорії «легкий - важкий». 

 До категорії легких тестів ставляться такі тести, на які більшість студентів відповідають правильно. До категорії тестів середньої труднощі відносять тести, на які тільки близько половини учнів відповідають правильно. І, нарешті, до важким відносять тести, на які більшість студентів відповідають неправильно. Така категоризація тестів не має нічого спільного з коректною методикою вимірювання та оцінки якості знань учнів, так як при дотриманні вимог змістовної та функціональної валідності тестів, при їх відповідності цілям навчання і при успішному навчальному процесі, всі тести повинні бути легкими і посильними для всіх учнів. У цьому полягає завдання розумного навчання. Якщо ж половина або більшість учнів не в змозі подолати тест, то це не означає, що тест занадто важкий і треба знижувати його трудність. Це абсолютно точно вказує, що мета навчання ще досягнуто, і треба продовжувати процес навчання. 

 Подивимося, як критерії легкості і труднощі тестів застосовуються в реальних тестах SAT. Ось два тести, що представляють собою приклади цих різновидів. Для більшої наочності і точності вони приводяться мовою оригіналу: 

 Easy (легкий): If 20% of p is 10, then 10% of p is: 

 А) 2; В) 4; C) 5; D) 8; E) 14. 

 Hard (важкий): If200% of 40% of X is equal to 40% of Y, then X is what percent of Y? 

 A) 10%; B) 20%; C) 30%; D) 50%; E) 80%. 

 У чому відмінність між цими тестами? Обидва вони - тести другого рівня, представлені у вигляді псевдо-тестів першого рівня. Обидва містять одне і те ж число суттєвих операцій (дві: 1) угледіти відмінність; 2) обчислити різницю) і навіть 

 172 

 Bespalkol.qxd 28.02.2008 16:15 Page l'-S 

 Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем 

 відносяться до одного і того ж УЕ - обчислення відсотків. Чому ж перший тест віднесений до категорії «легкий», а другий до категорії «важкий»? Відповідь на це питання очевидна: учні погано підготовлені в елементарній арифметиці, що до УЕ «відсотки» відношення не має. Отже, «важкий» тест змістовно інвалідом. Цей спосіб створення важких тестів (порушення валідності) часто-густо використовується авторами тестів SAT. Ось як створюється «дуже важкий» тест з математики (знову мовою оригіналу для більшої наочності): 

 Graham walks to school at an average speed of 3 miles an hour and jogged back along the same route at 5 miles an hour. If his total traveling time was 1 hour, what was the total number of miles in the round trip? 

 a) 3; b) 31/8; c) 3 березня / 4; d) 4; e) 5. 

 Знову тест другого рівня, представлений у вигляді псевдо-те-ста першого рівня. Тест змістовно інвалідам, оскільки відноситься до предмету «Фізика», а не «Математика». Щоб вирішити це тест, учні повинні знати формулу зв'язку шляху, швидкості і часу в рівномірному русі з курсу фізики, де ця формула вивчається. А якщо вони цю формулу що не вивчали або не засвоїли належним чином? Тоді виходить «дуже важкий» тест з ... математики, оскільки, за припущенням автора тесту, випробовуваний повинен «вгадати» правильну відповідь, а не обчислювати його. Ось як, за припущенням автора, повинен протікати цей процес «вгадування» (буквальний переклад з «Cracking the NEW SAT»): 

 Джо (мається на увазі середньо устигаючий американський школяр) обере відповідь «d» на це питання, тому що відповідь «4» здається йому правильною відповіддю. Джо думає (?), Що тест вимагає від нього обчислення середньої швидкості руху Грехама і 4 - це середнє між третім 5. Але Джо не здогадується (?), Що він повинен враховувати, що Гріхам переміщався з різною швидкістю в кожному напрямку. Його шлях до школи тривав довше, ніж шлях назад додому. Відповідь буде «4», тільки якщо Гріхам йшов півгодини до школи зі швидкістю 3 милі на годину і втік півгодини назад додому зі швидкістю 5 миль на годину, але це не так.

 Відповідь «d» - це пастка: автори тестів ETS включають їх серед відповідей, оскільки вони знають, що такі відповіді будуть здаватися правильними середньому студентові. Вони включають пастку серед відповідей, що- 

 173 

 Bespalko1.qxd 28.02.2008 16:15 Page 

 В.П. Беспалько. Природосообразном ПЕДАГОГІКА 

 б зробити тест важким, а не легким. (Правильна відповідь, між іншим, це «з».) Гріхам витрачає більше часу пішки при 3 милях на годину, ніж бігом, при 5 милях на годину, тому відповідь має бути дещо менше, ніж 4. 

 Значить, даний «важкий» тест є важким, оскільки учень повинен здогадуватися, а не обчислювати правильну відповідь. Що ж тоді перевіряється цим тестом: знання предмета або вправність розуму? Адже з цієї ж логікою міркувань, без обчислень, «Джо» міг би вибрати і відповідь «b», який несуттєво відрізняється від відповіді «с». 

 Таким чином, тести SAT не перевіряють ступінь засвоєння предмета, а ставлять пастки учням, з яких немає методу благополучного виходу на базі знання предмета. 

 Якщо показаний тест вважається важким, то як же виглядає легкий тест? У цитованому посібнику показується, як можна зробити цей тест легким. Ось як виглядає той же тест, але в «легкому» варіанті: 

 Graham walks to school at an average speed of 3 miles an hour and jogged back along the same route at 5 miles an hour. If his total traveling time was 1 hour, what was the total number of miles in the round trip? 

 a) 0,1; b) 1; c) 3 березня / 4; d) 1,000; e) 10,000. 

 І далі, цілком серйозно, стверджується, що тест із скрутного перетвориться в легкий «by writing different answer choices (шляхом зміни варіантів відповіді)». Ось і вся педагогічна теорія, що стоїть за тестами SAT! 

 Читач ще більше здивується, якщо дізнається, що в інструкції по оцінці знань учнів говориться: «Кожна правильна відповідь оцінюється одним балом, незалежно від того, легкий чи тест або важкий». Виникає комічне подив: до чого ж тоді взагалі «город городити» з понять «легкий - важкий», якщо подолання важких тестів не дає ніяких переваг випробуваному? 

 У США і ряді країн світу, включаючи Росію, тестування схожими тісто-подібними матеріалами прийняло величезний розмах і перетворилося на дуже прибутковий бізнес. Цілі корпорації виробляють тести типу SAT, TOEFL, GRE, ними затоплений тестовий ринок і споживачеві не залишається вибору в море цієї сумнівної продукції. Не відстають від своїх американських вчителів та російські підприємці - благо ні вчіть- 

 174 

 Bespalko1.qxd 28.02.2008 16:15 Page 145 

 175 

 Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем 

 ля, ні батьки не розуміють педагогічної неосвіченості та психологічної шкоди, супроводжуючих таке тестування. 

 Усі зарубіжні тестові системи в даний час мають один і той же монопольний джерело і побудовані по одному і тому ж принципу: заплутати учня, щоб він не міг вгадати правильну відповідь. Але що ж тоді учневі робити, якщо від нього вимагається вгадувати, а не знати предмет? І вихід залишається один: убік предмет, в сторону систематичне вивчення предмета, всі сили і засоби - на натаскування на можливі пастки і загадки одіозного запитальника під назвою SAT або будь-який інший важко розшифровували абревіатури. І виникає море корумпованих можливостей для спритників і кримінальних бізнесів, що харчуються педагогічним невіглаством діячів освіти. 

 У названих тестах також використовуються завдання різної конструкції, які, на перший погляд, можуть нагадувати тести-сходів. Насправді ж вони нічого спільного з тестами-драбинами (у нашому розумінні цього слова) не мають, так як ці тести створені без будь-якої орієнтації на обгрунтовану систему ієрархічно побудованих параметрів якості навчання. Якщо навіть за якоюсь випадковості, завдяки авторської інтуїції, пропонований набір тестів і містить деяку ілюзорну ієрархію тестів, типу «легкий - важкий», то все одно ця ієрархія не будується усвідомлено і не приймається в розрахунок при оцінці роботи випробуваного. Загальна сума балів, якої оцінюється якість виконання тесту, абсолютно некоректна через відсутність адитивності в наборі тестів і абсолютно неінформативна. 

 Така оцінка знань випробуваного не тільки не відображає чітко вираженого поняття «якість навчання», але й не дає достовірної інформації про направлення вдосконалення процесу навчання в разі незадовільних показань тестів. Так, власне, і йде справа сьогодні як в американській, так і в російській школі: підсумкові тести показують незадовільну якість знань учнів, але ніхто нічого путнього не може сказати, в якому напрямку вдосконалювати освіту, окрім як: «Того ж і побільше!» Отримані показники характеризують тільки тест, а не якість освіти. Педагоги не змогли зробити правильні висновки про напрямі вдосконалення процесу навчання і пішли второваним, 

 175 

 -Е- 

 Bespalkol.qxd 28.02.2008 16:15 Page l ^ S 

 В.П. Беспалько. Природосообразном ПЕДАГОГІКА 

 але свідомо бесперспективному шляхи: в США - доларовий уприскування, в Росії - «збільшити, посилити, навалитися!» Тобто все та ж «Ех, дубинушка, ухнем!» 

 Інформація, отримана за допомогою волюнтаристськи побудованих підсумкових тестів, виявилася настільки ж марною, як якби бюро прогнозів погоди оголосило, що на завтра очікується зміна погоди, але не пояснило, в чому це зміна полягає: буде дощ або посилиться спека чи мороз або настане відлига з ожеледицею. Також і тести показали, що учні незадовільно виконали підсумковий тест, але яке це має відношення до якості навчання, з'ясувати неможливо, так як тест і мета навчання між собою не пов'язані. Не випадково успіхи учня за тестами SAT характеризуються абстрактної сумою балів, яка не відбиває ніякої відомої шкали оцінки. Це бали за штучно створений тест, а не за реальну якість знань. 

 Підтверджує цей висновок і стаття в газеті «USA TODAY», в якій виражається загальне здивування різким падінням оцінок абітурієнтів по новому тесту SAT, введеному College Board в 2005 році. І це здивування зрозуміло: не може ж різко, протягом одного року змінитися якість знань учнів, що навчаються в тих же самих школах, у тих же самих вчителів і по тим же самим програмам! А тест показує різке погіршення, і всі дивуються, чому б це? Тут доречна стара російська приказка: «А скринька просто відкривався»! І його «відкривачкою» знову стають поняття змістовної та функціональної валідності тесту. 

 У новому тесті запопадливі його укладачі ще далі пішли від валідності тестування і отримали бажаний результат: учні, натискання на колишній тест, стали провалювати його новий варіант. Як дадуть відповідь вчителя на цю подію? Точно так само, як вони вже неодноразово відповідали на примхи колишніх SAT: вони почнуть «натаскувати» учнів на цей новий тест, залишивши осторонь систематичне навчання змісту навчальних предметів. Провал в успішності учнів показує, що вони (вчителі) просто ще не встигли перебудуватися під нього. Це для них єдиний вихід: коли мета навчання не поставлена ??діагностично, тоді метою навчання стає дивовижним чином складений тест. Наприклад, школярі Техасу поскаржилися, що у них проводиться до двадцяти тестових тренінгів 

 176 

 -Е- 

 Bespalko1.qxd 28.02.2008 16:15 Page 

 Лекція № 5. Педагогічний аналіз деяких зарубіжних тестових систем 

 на тиждень! Не відстають від Техасу й інші штати. Вони натаскувати на тест, не вивчаючи предмет. 

 Є в цих маніпуляціях валидностью тіста і добре замаскований «гангстерський» сенс: вводячи «новий» тест нібито підвищеної труднощі під слушним приводом «підвищення якості освіти», насправді створюються сприятливі умови для пожвавлення ринку масової літератури з методики подолання тесту, а це багатомільярдні дивіденди відомих компаній, керуючих тестуванням в країні і в багатьох зарубіжних країнах. На розум приходять стандартні методи гангстерів і бандитів всіх країн і народів, особливо чітко відточені в досвіді відомого чиказького мафіозі Аль-Капоне: бізнесменові пропонують «дах», він відмовляється, вважаючи, що його бізнесу нічого не загрожує. На наступну ж ніч приміщення його бізнесу нещадно громлять і спалюють. Йому нічого не залишається, як прийняти пропозицію бандитів і виплачувати призначену ними суму за «послуги». 

 І що ж у цьому випадку можна сказати про освіту в великій державі США? Воно знаходиться в перманентному кризовому тунелі, вихід з якого навіть не проглядається, незважаючи на реформаторські зусилля чергових президентів і доларовий дощ, що падає на дахи шкільних будівель. Тут не випадково зазначено «на даху», оскільки саме освітні «даху» (департаменти, борди, численні чиновники від освіти) поглинають левову частку цього дощу, залишаючи школі жалюгідні крихти щедрого фінансування і перманентний глухий кут. 

 На противагу цьому будь-який тест-сходи, побудований так само, як і мета навчання, на чіткій критеріальною основі і сполучена з нею 12-бальна шкала точно вкажуть, яка якість знань учнів, а також у чому полягають недоліки навчання. Звідси нескладно зробити дієві висновки про єдино ефективних шляхах вдосконалення навчального процесу і, якщо треба, точну адресу його фінансування. 

 « Попередня  Наступна »
 = Перейти до змісту підручника =
 Інформація, релевантна "3. Аналіз тестової системи SAT"
  1.  Оцінка інтелектуального розвитку.
      аналізу матеріалів; гнучкість мислення; інертність мислення (переключаемость); емоційні компоненти мислення (відволікання); швидкість і точність сприйняття, розподіл і концентрація уваги; грамотність; вибір оптимальної стратегії, орієнтування; просторова уява. КОТ використовується для швидкої і недиференційованої оцінки загального рівня навченості обстежуваних, що
  2.  2. Методика педагогічного аналізу тестових систем
      аналіз може перетворитися на дуже громіздке підприємство. Але якщо придивитися до вихідних посилок (згадані «біблії»), що лежить в основі створення та використання цих тестових систем, то виявляється, що всі вони побудовані за однією і тією ж методичної схемою, при незначних варіаціях у своїй емпіричної частини. Це особливо характерно для тестових систем, що використовуються в США і скопійованих
  3.  ПЕДАГОГІЧНИЙ АНАЛІЗ ДЕЯКИХ ЗАРУБІЖНИХ ТЕСТОВИХ СИСТЕМ
      аналізу тестових систем. 3. Аналіз тестової системи SAT. 3.1. Тест SAT I. 3.2. Тест SAT II. 4. Тестова система TOEFL. 4.1. Фактична довідка. 4.2. TOEFL як він є. 4.3. Конструкція тестів TOEFL. 4.4. Педагогічний аналіз TOEFL. 5. Загальні висновки і конкретні пропозиції. Деякі публікації за темою лекції. Синопсис Дуже часто при обговоренні педагогічних проблем
  4.  6. Створення тестів різного рівня
      тестів успішності навчання слід керуватися найбільш загальними вимогами до них: 1) бути змістовно валідними, 2) бути функціонально валідними; 3) завдання мають бути загальнозрозумілими і містити в явному вигляді питання; 4) бути простими. Вимога змістовної валідності тесту, як вище вже не раз підкреслювалося, полягає в тому, що можна контролювати тільки те знання, якому
  5.  ВІДПОВІДІ НА ЗАПИТАННЯ ТЕСТІВ
      Глава 1: 1.1 - 1В, 2Б, 3А, 4Б, 5В; 1.2 - 1Г, 2Г, 3Г. Глава 2: 2.1 - 1А, 2Г, 3В, 4В; 2.2 - 1В, 2Г, 3А. Глава 3: 3.1 - 1Б, 2А, 3А; 3.2 - 1Г, 2В, 3В. Глава 4: 4.1 - 1А, 2В, 3Г; 4.3 - 1Б, 2В, 3Б; 4.3 - 1Г, 2Г, 3Г; 4.4. - 1Г, 2Г, 3Г, 4В, 5Б; 4.6 - 1Г, 2Б; 4.7 - 1Г, 2В, 3В, 4А, 5А; 4.8 - 1В, 2Г, 3Г, 4А. Глава 5: 5.1 - 1В, 2Б, 3А; 5.2 - 1Б, 2Г, 3Б, 4Г, 5Г; 5.3 - 1Г, 2В, 3Г.
  6.  7. Методичні рекомендації ДЛЯ ВИКОНАННЯ контрольної РОБОТИ З АДМІНІСТРАТІВНОГО ПРАВА
      тестових завдань (з Нової сторінки), потім - практичне Завдання (з Нової сторінки). Контрольна робота оцінюється: "Зараховано", "незарахована". У разі незарахування контрольної роботи вказуються причини цього. Контрольна робота может буті незарахована у випадка: - Виконано не тієї вариант контрольної роботи; - теоретичне Завдання Виконання з порушеннях вимог до нього, в т.ч. Стосовно ОБСЯГИ; - НЕ
  7.  8. Тести, іспити і демократія
      тестів для перевірки якості засвоєння учнями навчальних предметів може якісно змінити один з важливих елементів навчального процесу - іспит. Іспити завжди створювали і створюють понині відомі емоційні напруги у випробовуваних через непередбачуваної поведінки екзаменатора, випадкового і несподіваного питання і загальної Секрет-ності всієї процедури підготовки та проведення випробування. При-
  8.  1. Чи можна довіряти тестам?
      аналіз тестування вміння писати в п'яти американських штатах привів автора до переконливого висновку про абсолютну змістовної та функціональної інвалідності застосовуваних з цією метою тестів. На жаль, ні та, ні інша книга не подіяли дієвого впливу на практикуються тестові випробування в США і в країнах, де також використовується подібне тестування. Причиною цьому є не шкідливе
  9.  5. Структура тесту
      тестів, але на конструкцію тесту не впливають. Так, 125-е-ВеБраІкоІ.дхсІ 28.02.2008 16:15 Раді Іії-б 26 грудня В.П. Беспалько. Природосообразном ПЕДАГОГІКА можна говорити про наборах тестів на різних щаблях абстракції або ступеня усвідомленості, різних по надійності або автоматизації, але це не змінить диференціювання тестів по чотирьох рівнях засвоєння. Для зручності
  10.  Проблемні питання 1.
      аналізу людського соціуму і його політичного буття? 3. «Система дії» Т. Парсонса: культура, особистість і місце соціальних систем у структурі світу. Який науковий потенціал цієї ідеї? 4. У чому полягають методологічні відмінності поняття політичної системи і основних категорій системного аналізу політики в роботах Д. Істона в їх зіставленні з концепцією Г. Алмонда і С. Верби? 5.