Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Короткі теоретичні відомості. Один і той же тест, який використовують до одних і тих же випробовуваних, повинен давати в однакових умовах співпадаючі результати (якщо тільки не змінилися

Читайте также:

Один і той же тест, який використовують до одних і тих же випробовуваних, повинен давати в однакових умовах співпадаючі результати (якщо тільки не змінилися самі випробовувані). Проте при навіть при найсуворішій стандартизації точної апаратури результати тестування завжди дещо варіюють. Наприклад, спортсмен, що стрибнув в довжину з місця на 260 см в наступному стрибку може показати результат лише 255 см.

Надійністю тесту називається ступінь збігу результатів при повторному тестуванні одних і тих же людей (або об'єктів) в однакових умовах. Варіацію результатів при повторних вимірюваннях називають внутрішньоіндивідуальною або (використовуючи більш загальну термінологію математичної статистики) внутрішньогруповою. Цю варіацію викликають чотири основні причини:

1. зміна стану випробовуваних (стомлення, зміна мотивації, концентрації уваги і т.п.)

2. неконтрольовані зміни зовнішніх умов і апаратури (температура, вітер, вологість, напруга в електромережі, присутність сторонніх осіб і т.п.), тобто все те, що об'єднує термін «випадкова помилка вимірювання».

3. зміна стану людини, яка проводить або оцінює тест (заміна одного експериментатора іншим або заміна судді).

4. недосконалість тесту – існують малонадійні тести, наприклад, штрафні кидки в баскетбольну корзину до першого промаху (навіть баскетболіст, що має високий відсоток попадання, може випадково помилитися при перших кидках).

Основна відмінність теорії надійності тестів від теорії помилок вимірювання полягає в тому, що в теорії помилок вимірювана величина вважається незмінною, а в теорії надійності тестів передбачається, що вона може змінюватися від вимірювання до вимірювання. Наприклад, при вимірюванні результату виконаної спроби в метанні списа, то він цілком визначений і з часом змінитися не може. Разом з тим якщо стоїть задача визначити підготовленість метальника в певному періоді тренування, то найточніше вимірювання показаних їм результатів мало чим допоможе: адже вони від спроби до спроби змінюватимуться.

Теорію надійності засновано на тому, що результат любого вимірювання х_t є сумою двох значень:

де х_∞ - результат, що фіксується, х_е – похибка, що викликана змінами стану випробовуваного та випадковими помилками вимірювання. В цьому випадку:

де - зареєстрована дисперсія результатів, - дисперсія реальних результатів, - дисперсія похибок.

Коефіцієнтом надійності r_tt називають відношення дисперсії реальних результатів, до дисперсії, яку зареєстровано при вимірюванні:

Тобто r_tt є доля істиної варіації у тій варіації, що зареєстровано в експерименті.

Крім коефіцієнту надійності також використовують індекс надійності, який розглядають як теоретичний коефіцієнт кореляції зареєстрованих значень тесту з отриманими при вимірюванні:

Надійність експериментальних даних знижує величину оцінок коефіцієнтів кореляції. Оскільки тест не може корелювати з іншим більше ніж із самим собою верхньою межею оцінки коефіцієнта кореляції є індекс надійності: . Для переходу до оцінок кореляції між реальними значеннями на практиці використовують формулу корекції на зменшення (або формулу Спірмена – Брауна):

Кажучи про надійність тестів, розрізняють їх стабільність (відтворюваність), узгодженість, еквівалентність.

Під стабільністю тесту розуміють відтворюваність результатів при його повторенні через певний час в однакових умовах. Повторне тестування зазвичай називають ретестом.

ЧАСОВИЙ

ТЕСТ РЕТЕСТ

ІНТЕРВАЛ

Рисунок 1 – Схема оцінки стабільності тесту

Ступінь надійності тестів визначається за допомогою коефіцієнтів взаємозв'язку, отриманих з кореляційного або дисперсійного аналізу.

Вибір коефіцієнта взаємозв'язку залежить від типу використаної шкали вимірювань, від числа виконаних спроб (спробою вважається, наприклад, початкове або повторне тестування) і кількості чинників, вплив яких треба досліджувати.

Якщо вивчається вплив тільки одного чинника і при цьому кількість спроб не більше двох, то надійність тесту може бути приблизно оцінена за допомогою коефіцієнта кореляції між тестом і ретестом. В решті випадків рекомендується використовувати дисперсійний аналіз.

Стабільність тесту залежить від:

1) виду тесту;

2) контингенту випробовуваних;

3) часового інтервалу між тестом і ретестом.

Наприклад, морфологічні характеристики при невеликих часових інтервалах стабільні; найменшу стабільність мають тести на точність рухів (наприклад, кидання в ціль).

У дорослих результати тестування більш стабільні, ніж у дітей; у спортсменів – більш стабільні, ніж у тих, що не займаються спортом.

Із збільшенням часового інтервалу між тестом і ретестом стабільність тесту (коефіцієнт кореляції) знижується.

Узгодженість характеризується незалежністю результатів тестування від особистих якостей особи, що проводить або оцінює тест. Узгодженість визначається за ступенем збігу результатів, отриманих на одних і тих же випробовуваних різними експериментаторами, суддями, експертами. При цьому можливі два варіанти:

1) особа, що проводить тест, тільки оцінює його результати, не впливаючи на них. Наприклад, одну і ту ж письмову роботу різні екзаменатори можуть оцінювати по-різному. Нерідко розрізняються оцінки суддів в гімнастиці, фігурному катанні на ковзанах, боксі, показники ручного хронометражу, оцінка електрокардіограми різними лікарями і т.п.;

2) особа, що проводить тест, впливає на його результати. Наприклад, деякі експериментатори більш настирні і вимогливі, ніж інші, краще мотивують випробовуваних. Це позначається на результатах (які самі по собі можуть вимірюватися цілком об'єктивно).

Узгодженість тесту – це, по суті, надійність оцінки його результатів при проведенні тесту різними людьми.

Особливо актуальна задача оцінки узгодженості при кількісному визначенні якісних показників. Для цього розроблені спеціальні методи.

Нерідко тест вибирають з певного числа однотипних тестів. Наприклад, кидки в баскетбольну корзину можна виконувати з різних відстаней; біг спринту може проводитися на дистанції, 50, 60 або 100 м; підтягування можна виконувати на кільцях або щаблині, хватом зверху або знизу і т.п. В таких випадках може використовуватися так званий метод паралельних форм, коли випробовуваним пропонують виконати два різновиди одного і того ж тесту і потім оцінюють ступінь збігу результатів.

МІНІМАЛЬНИЙ

ФОРМА А ФОРМА Б

ЧАСОВИЙ ІНТЕРВАЛ

Рисунок 2 – Схема тестуванняметодом паралельних форм

Розрахований між результатами тестування коефіцієнт кореляції називають коефіцієнтом еквівалентності. Відношення до еквівалентності тестів залежить від конкретної ситуації. З одного боку, якщо два або більше тестів еквівалентні, їх сумісне використання підвищує надійність оцінок; з іншою – може виявитися корисним застосовувати тільки один еквівалентний тест: це спростить тестування і лише трохи понизить інформативність тестів. Рішення цього питання залежить від таких причин, як складність тестів, ступінь необхідної точності тестування і т.п.

Якщо ж тести, що входять у певний комплекс тестів, еквівалентні, він називається гомогенним. Цей комплекс вимірює одну певну властивість моторики людини. Скажімо, комплекс, що складається зі стрибків з місця в довжину, вгору і потрійного, ймовірно, буде гомогенним. Навпаки, якщо в комплексі немає еквівалентних тестів, то всі тести, що входять в нього, вимірюють різні властивості. Такий комплекс називають гетерогенним. Приклад гетерогенного комплексу тестів: підтягання на щаблині, нахил вперед (для перевірки гнучкості), біг на 1500 м.

Надійність тестів може бути підвищена до певного ступеня шляхом:

а) більш строгої стандартизації тестування;

б) збільшення числа спроб;

в) збільшення числа оцінювачів (суддів, експертів) і підвищення узгодженості їх думок;

г) збільшення числа еквівалентних тестів;

д) кращої мотивації випробовуваних.

Серед згаданих шляхів слід виділити відмінне високою ефективністю підвищення надійності шляхом збільшення тривалості тесту. Подовження тесту досягається збільшенням числа спроб, числа випробовуваних або того і іншого разом.

При збільшенні тривалості тесту в m раз надійність тесту r_tt зростає до величини r⁰_tt, приблизно рівної:

З цієї формули можна визначити, в скільки разів потрібно збільшити тривалість тесту, щоб отримати бажану надійність r⁰_tt _:

Очевидно, що доцільно підвищувати тривалість тесту лише при не дуже великих величинах m. При значеннях m, які важко реалізувати практично, ненадійний тест краще замінити іншим більш надійним.

Кожне випробування Т, розглядається у теорії ймовірності, таким, що закінчується однією з подій E1, E2..., ES (тим або іншим, залежно від випадку). Ці події називаються результатами випробування. З кожним результатом Ек пов'язується додатне число Рк – імовірність цього результату, які при цьому повинні в сумі давати одиницю. Розглядаючи подію А, визначають "настає або Ei, або Ej..., або Ек ". Результати Ei, Ej..., Ек називаються сприяючими А, і за визначенням уважають, що ймовірність Р(А) події А, дорівнює сумі ймовірностей сприяючих йому результатів:

P(А) = pi + ps +... + pk.

Окремий випадок, якщо pі = ps =... pk = 1/S призводить до формули:

Р(А) = r/s,

яка виражає так зване класичне визначення ймовірності, відповідно до якого ймовірність події А дорівнює відношенню кількості результатів r, що сприяють А, до кількості s усіх "рівноможливих результатів". Класичне визначення ймовірності лише зводить поняття "ймовірності" до поняття "рівноможливості", яке залишається без чіткого визначення.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.495 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница