|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Короткі теоретичні відомості. Один і той же тест, який використовують до одних і тих же випробовуваних, повинен давати в однакових умовах співпадаючі результати (якщо тільки не змінилисяОдин і той же тест, який використовують до одних і тих же випробовуваних, повинен давати в однакових умовах співпадаючі результати (якщо тільки не змінилися самі випробовувані). Проте при навіть при найсуворішій стандартизації точної апаратури результати тестування завжди дещо варіюють. Наприклад, спортсмен, що стрибнув в довжину з місця на 260 см в наступному стрибку може показати результат лише 255 см. Надійністю тесту називається ступінь збігу результатів при повторному тестуванні одних і тих же людей (або об'єктів) в однакових умовах. Варіацію результатів при повторних вимірюваннях називають внутрішньоіндивідуальною або (використовуючи більш загальну термінологію математичної статистики) внутрішньогруповою. Цю варіацію викликають чотири основні причини: 1. зміна стану випробовуваних (стомлення, зміна мотивації, концентрації уваги і т.п.) 2. неконтрольовані зміни зовнішніх умов і апаратури (температура, вітер, вологість, напруга в електромережі, присутність сторонніх осіб і т.п.), тобто все те, що об'єднує термін «випадкова помилка вимірювання». 3. зміна стану людини, яка проводить або оцінює тест (заміна одного експериментатора іншим або заміна судді). 4. недосконалість тесту – існують малонадійні тести, наприклад, штрафні кидки в баскетбольну корзину до першого промаху (навіть баскетболіст, що має високий відсоток попадання, може випадково помилитися при перших кидках). Основна відмінність теорії надійності тестів від теорії помилок вимірювання полягає в тому, що в теорії помилок вимірювана величина вважається незмінною, а в теорії надійності тестів передбачається, що вона може змінюватися від вимірювання до вимірювання. Наприклад, при вимірюванні результату виконаної спроби в метанні списа, то він цілком визначений і з часом змінитися не може. Разом з тим якщо стоїть задача визначити підготовленість метальника в певному періоді тренування, то найточніше вимірювання показаних їм результатів мало чим допоможе: адже вони від спроби до спроби змінюватимуться. Теорію надійності засновано на тому, що результат любого вимірювання хt є сумою двох значень: , де х∞ - результат, що фіксується, хе – похибка, що викликана змінами стану випробовуваного та випадковими помилками вимірювання. В цьому випадку: , де - зареєстрована дисперсія результатів, - дисперсія реальних результатів, - дисперсія похибок. Коефіцієнтом надійності rtt називають відношення дисперсії реальних результатів, до дисперсії, яку зареєстровано при вимірюванні: . Тобто rtt є доля істиної варіації у тій варіації, що зареєстровано в експерименті. Крім коефіцієнту надійності також використовують індекс надійності, який розглядають як теоретичний коефіцієнт кореляції зареєстрованих значень тесту з отриманими при вимірюванні: . Надійність експериментальних даних знижує величину оцінок коефіцієнтів кореляції. Оскільки тест не може корелювати з іншим більше ніж із самим собою верхньою межею оцінки коефіцієнта кореляції є індекс надійності: . Для переходу до оцінок кореляції між реальними значеннями на практиці використовують формулу корекції на зменшення (або формулу Спірмена – Брауна): . Кажучи про надійність тестів, розрізняють їх стабільність (відтворюваність), узгодженість, еквівалентність. Під стабільністю тесту розуміють відтворюваність результатів при його повторенні через певний час в однакових умовах. Повторне тестування зазвичай називають ретестом.
ЧАСОВИЙ ТЕСТ РЕТЕСТ ІНТЕРВАЛ
Рисунок 1 – Схема оцінки стабільності тесту
Ступінь надійності тестів визначається за допомогою коефіцієнтів взаємозв'язку, отриманих з кореляційного або дисперсійного аналізу. Вибір коефіцієнта взаємозв'язку залежить від типу використаної шкали вимірювань, від числа виконаних спроб (спробою вважається, наприклад, початкове або повторне тестування) і кількості чинників, вплив яких треба досліджувати. Якщо вивчається вплив тільки одного чинника і при цьому кількість спроб не більше двох, то надійність тесту може бути приблизно оцінена за допомогою коефіцієнта кореляції між тестом і ретестом. В решті випадків рекомендується використовувати дисперсійний аналіз. Стабільність тесту залежить від: 1) виду тесту; 2) контингенту випробовуваних; 3) часового інтервалу між тестом і ретестом. Наприклад, морфологічні характеристики при невеликих часових інтервалах стабільні; найменшу стабільність мають тести на точність рухів (наприклад, кидання в ціль). У дорослих результати тестування більш стабільні, ніж у дітей; у спортсменів – більш стабільні, ніж у тих, що не займаються спортом. Із збільшенням часового інтервалу між тестом і ретестом стабільність тесту (коефіцієнт кореляції) знижується. Узгодженість характеризується незалежністю результатів тестування від особистих якостей особи, що проводить або оцінює тест. Узгодженість визначається за ступенем збігу результатів, отриманих на одних і тих же випробовуваних різними експериментаторами, суддями, експертами. При цьому можливі два варіанти: 1) особа, що проводить тест, тільки оцінює його результати, не впливаючи на них. Наприклад, одну і ту ж письмову роботу різні екзаменатори можуть оцінювати по-різному. Нерідко розрізняються оцінки суддів в гімнастиці, фігурному катанні на ковзанах, боксі, показники ручного хронометражу, оцінка електрокардіограми різними лікарями і т.п.; 2) особа, що проводить тест, впливає на його результати. Наприклад, деякі експериментатори більш настирні і вимогливі, ніж інші, краще мотивують випробовуваних. Це позначається на результатах (які самі по собі можуть вимірюватися цілком об'єктивно). Узгодженість тесту – це, по суті, надійність оцінки його результатів при проведенні тесту різними людьми. Особливо актуальна задача оцінки узгодженості при кількісному визначенні якісних показників. Для цього розроблені спеціальні методи. Нерідко тест вибирають з певного числа однотипних тестів. Наприклад, кидки в баскетбольну корзину можна виконувати з різних відстаней; біг спринту може проводитися на дистанції, 50, 60 або 100 м; підтягування можна виконувати на кільцях або щаблині, хватом зверху або знизу і т.п. В таких випадках може використовуватися так званий метод паралельних форм, коли випробовуваним пропонують виконати два різновиди одного і того ж тесту і потім оцінюють ступінь збігу результатів.
МІНІМАЛЬНИЙ ФОРМА А ФОРМА Б ЧАСОВИЙ ІНТЕРВАЛ
Рисунок 2 – Схема тестуванняметодом паралельних форм
Розрахований між результатами тестування коефіцієнт кореляції називають коефіцієнтом еквівалентності. Відношення до еквівалентності тестів залежить від конкретної ситуації. З одного боку, якщо два або більше тестів еквівалентні, їх сумісне використання підвищує надійність оцінок; з іншою – може виявитися корисним застосовувати тільки один еквівалентний тест: це спростить тестування і лише трохи понизить інформативність тестів. Рішення цього питання залежить від таких причин, як складність тестів, ступінь необхідної точності тестування і т.п. Якщо ж тести, що входять у певний комплекс тестів, еквівалентні, він називається гомогенним. Цей комплекс вимірює одну певну властивість моторики людини. Скажімо, комплекс, що складається зі стрибків з місця в довжину, вгору і потрійного, ймовірно, буде гомогенним. Навпаки, якщо в комплексі немає еквівалентних тестів, то всі тести, що входять в нього, вимірюють різні властивості. Такий комплекс називають гетерогенним. Приклад гетерогенного комплексу тестів: підтягання на щаблині, нахил вперед (для перевірки гнучкості), біг на 1500 м. Надійність тестів може бути підвищена до певного ступеня шляхом: а) більш строгої стандартизації тестування; б) збільшення числа спроб; в) збільшення числа оцінювачів (суддів, експертів) і підвищення узгодженості їх думок; г) збільшення числа еквівалентних тестів; д) кращої мотивації випробовуваних. Серед згаданих шляхів слід виділити відмінне високою ефективністю підвищення надійності шляхом збільшення тривалості тесту. Подовження тесту досягається збільшенням числа спроб, числа випробовуваних або того і іншого разом. При збільшенні тривалості тесту в m раз надійність тесту rtt зростає до величини r0tt, приблизно рівної: . З цієї формули можна визначити, в скільки разів потрібно збільшити тривалість тесту, щоб отримати бажану надійність r0tt : . Очевидно, що доцільно підвищувати тривалість тесту лише при не дуже великих величинах m. При значеннях m, які важко реалізувати практично, ненадійний тест краще замінити іншим більш надійним. Кожне випробування Т, розглядається у теорії ймовірності, таким, що закінчується однією з подій E1, E2..., ES (тим або іншим, залежно від випадку). Ці події називаються результатами випробування. З кожним результатом Ек пов'язується додатне число Рк – імовірність цього результату, які при цьому повинні в сумі давати одиницю. Розглядаючи подію А, визначають "настає або Ei, або Ej..., або Ек ". Результати Ei, Ej..., Ек називаються сприяючими А, і за визначенням уважають, що ймовірність Р(А) події А, дорівнює сумі ймовірностей сприяючих йому результатів: P(А) = pi + ps +... + pk. Окремий випадок, якщо pі = ps =... pk = 1/S призводить до формули: Р(А) = r/s, яка виражає так зване класичне визначення ймовірності, відповідно до якого ймовірність події А дорівнює відношенню кількості результатів r, що сприяють А, до кількості s усіх "рівноможливих результатів". Класичне визначення ймовірності лише зводить поняття "ймовірності" до поняття "рівноможливості", яке залишається без чіткого визначення. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.006 сек.) |