АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Короткі теоретичні відомості. Один і той же тест, який використовують до одних і тих же випробовуваних, повинен давати в однакових умовах співпадаючі результати (якщо тільки не змінилися

Читайте также:
  1. А). Теоретичні передумови.
  2. А). Теоретичні передумови.
  3. А). Теоретичні передумови.
  4. А). Теоретичні передумови.
  5. Арбітражному керуючому забороняється розголошувати відомості, що стали йому відомі у зв’язку з його діяльністю, і використовувати їх у своїх інтересах або в інтересах третіх осіб.
  6. Базові відомості
  7. ВИХОВАННЯ У ДІТЕЙ СТАТЕВОЇ САМОСВІДОМОСТІ
  8. Відомості про складову частину документа // Відомості про ідентифікуючий документ. – Відомості про місцезнаходження складової частини в документі. – Примітки.
  9. Відомості, що становлять державну таємницю
  10. Властивості свідомості та її структура.
  11. Втрата свідомості, травми
  12. Г) теоретичні знання та практичні навички певної роботи.

Один і той же тест, який використовують до одних і тих же випробовуваних, повинен давати в однакових умовах співпадаючі результати (якщо тільки не змінилися самі випробовувані). Проте при навіть при найсуворішій стандартизації точної апаратури результати тестування завжди дещо варіюють. Наприклад, спортсмен, що стрибнув в довжину з місця на 260 см в наступному стрибку може показати результат лише 255 см.

Надійністю тесту називається ступінь збігу результатів при повторному тестуванні одних і тих же людей (або об'єктів) в однакових умовах. Варіацію результатів при повторних вимірюваннях називають внутрішньоіндивідуальною або (використовуючи більш загальну термінологію математичної статистики) внутрішньогруповою. Цю варіацію викликають чотири основні причини:

1. зміна стану випробовуваних (стомлення, зміна мотивації, концентрації уваги і т.п.)

2. неконтрольовані зміни зовнішніх умов і апаратури (температура, вітер, вологість, напруга в електромережі, присутність сторонніх осіб і т.п.), тобто все те, що об'єднує термін «випадкова помилка вимірювання».

3. зміна стану людини, яка проводить або оцінює тест (заміна одного експериментатора іншим або заміна судді).

4. недосконалість тесту – існують малонадійні тести, наприклад, штрафні кидки в баскетбольну корзину до першого промаху (навіть баскетболіст, що має високий відсоток попадання, може випадково помилитися при перших кидках).

Основна відмінність теорії надійності тестів від теорії помилок вимірювання полягає в тому, що в теорії помилок вимірювана величина вважається незмінною, а в теорії надійності тестів передбачається, що вона може змінюватися від вимірювання до вимірювання. Наприклад, при вимірюванні результату виконаної спроби в метанні списа, то він цілком визначений і з часом змінитися не може. Разом з тим якщо стоїть задача визначити підготовленість метальника в певному періоді тренування, то найточніше вимірювання показаних їм результатів мало чим допоможе: адже вони від спроби до спроби змінюватимуться.

Теорію надійності засновано на тому, що результат любого вимірювання хt є сумою двох значень:

,

де х - результат, що фіксується, хе – похибка, що викликана змінами стану випробовуваного та випадковими помилками вимірювання. В цьому випадку:

,

де - зареєстрована дисперсія результатів, - дисперсія реальних результатів, - дисперсія похибок.

Коефіцієнтом надійності rtt називають відношення дисперсії реальних результатів, до дисперсії, яку зареєстровано при вимірюванні:

.

Тобто rtt є доля істиної варіації у тій варіації, що зареєстровано в експерименті.

Крім коефіцієнту надійності також використовують індекс надійності, який розглядають як теоретичний коефіцієнт кореляції зареєстрованих значень тесту з отриманими при вимірюванні:

.

Надійність експериментальних даних знижує величину оцінок коефіцієнтів кореляції. Оскільки тест не може корелювати з іншим більше ніж із самим собою верхньою межею оцінки коефіцієнта кореляції є індекс надійності: . Для переходу до оцінок кореляції між реальними значеннями на практиці використовують формулу корекції на зменшення (або формулу Спірмена – Брауна):

.

Кажучи про надійність тестів, розрізняють їх стабільність (відтворюваність), узгодженість, еквівалентність.

Під стабільністю тесту розуміють відтворюваність результатів при його повторенні через певний час в однакових умовах. Повторне тестування зазвичай називають ретестом.

 

ЧАСОВИЙ

ТЕСТ РЕТЕСТ

ІНТЕРВАЛ

 

Рисунок 1 – Схема оцінки стабільності тесту

 

Ступінь надійності тестів визначається за допомогою коефіцієнтів взаємозв'язку, отриманих з кореляційного або дисперсійного аналізу.

Вибір коефіцієнта взаємозв'язку залежить від типу використаної шкали вимірювань, від числа виконаних спроб (спробою вважається, наприклад, початкове або повторне тестування) і кількості чинників, вплив яких треба досліджувати.

Якщо вивчається вплив тільки одного чинника і при цьому кількість спроб не більше двох, то надійність тесту може бути приблизно оцінена за допомогою коефіцієнта кореляції між тестом і ретестом. В решті випадків рекомендується використовувати дисперсійний аналіз.

Стабільність тесту залежить від:

1) виду тесту;

2) контингенту випробовуваних;

3) часового інтервалу між тестом і ретестом.

Наприклад, морфологічні характеристики при невеликих часових інтервалах стабільні; найменшу стабільність мають тести на точність рухів (наприклад, кидання в ціль).

У дорослих результати тестування більш стабільні, ніж у дітей; у спортсменів – більш стабільні, ніж у тих, що не займаються спортом.

Із збільшенням часового інтервалу між тестом і ретестом стабільність тесту (коефіцієнт кореляції) знижується.

Узгодженість характеризується незалежністю результатів тестування від особистих якостей особи, що проводить або оцінює тест. Узгодженість визначається за ступенем збігу результатів, отриманих на одних і тих же випробовуваних різними експериментаторами, суддями, експертами. При цьому можливі два варіанти:

1) особа, що проводить тест, тільки оцінює його результати, не впливаючи на них. Наприклад, одну і ту ж письмову роботу різні екзаменатори можуть оцінювати по-різному. Нерідко розрізняються оцінки суддів в гімнастиці, фігурному катанні на ковзанах, боксі, показники ручного хронометражу, оцінка електрокардіограми різними лікарями і т.п.;

2) особа, що проводить тест, впливає на його результати. Наприклад, деякі експериментатори більш настирні і вимогливі, ніж інші, краще мотивують випробовуваних. Це позначається на результатах (які самі по собі можуть вимірюватися цілком об'єктивно).

Узгодженість тесту – це, по суті, надійність оцінки його результатів при проведенні тесту різними людьми.

Особливо актуальна задача оцінки узгодженості при кількісному визначенні якісних показників. Для цього розроблені спеціальні методи.

Нерідко тест вибирають з певного числа однотипних тестів. Наприклад, кидки в баскетбольну корзину можна виконувати з різних відстаней; біг спринту може проводитися на дистанції, 50, 60 або 100 м; підтягування можна виконувати на кільцях або щаблині, хватом зверху або знизу і т.п. В таких випадках може використовуватися так званий метод паралельних форм, коли випробовуваним пропонують виконати два різновиди одного і того ж тесту і потім оцінюють ступінь збігу результатів.

 

МІНІМАЛЬНИЙ

ФОРМА А ФОРМА Б

ЧАСОВИЙ ІНТЕРВАЛ

 

Рисунок 2 – Схема тестуванняметодом паралельних форм

 

Розрахований між результатами тестування коефіцієнт кореляції називають коефіцієнтом еквівалентності. Відношення до еквівалентності тестів залежить від конкретної ситуації. З одного боку, якщо два або більше тестів еквівалентні, їх сумісне використання підвищує надійність оцінок; з іншою – може виявитися корисним застосовувати тільки один еквівалентний тест: це спростить тестування і лише трохи понизить інформативність тестів. Рішення цього питання залежить від таких причин, як складність тестів, ступінь необхідної точності тестування і т.п.

Якщо ж тести, що входять у певний комплекс тестів, еквівалентні, він називається гомогенним. Цей комплекс вимірює одну певну властивість моторики людини. Скажімо, комплекс, що складається зі стрибків з місця в довжину, вгору і потрійного, ймовірно, буде гомогенним. Навпаки, якщо в комплексі немає еквівалентних тестів, то всі тести, що входять в нього, вимірюють різні властивості. Такий комплекс називають гетерогенним. Приклад гетерогенного комплексу тестів: підтягання на щаблині, нахил вперед (для перевірки гнучкості), біг на 1500 м.

Надійність тестів може бути підвищена до певного ступеня шляхом:

а) більш строгої стандартизації тестування;

б) збільшення числа спроб;

в) збільшення числа оцінювачів (суддів, експертів) і підвищення узгодженості їх думок;

г) збільшення числа еквівалентних тестів;

д) кращої мотивації випробовуваних.

Серед згаданих шляхів слід виділити відмінне високою ефективністю підвищення надійності шляхом збільшення тривалості тесту. Подовження тесту досягається збільшенням числа спроб, числа випробовуваних або того і іншого разом.

При збільшенні тривалості тесту в m раз надійність тесту rtt зростає до величини r0tt, приблизно рівної:

.

З цієї формули можна визначити, в скільки разів потрібно збільшити тривалість тесту, щоб отримати бажану надійність r0tt :

.

Очевидно, що доцільно підвищувати тривалість тесту лише при не дуже великих величинах m. При значеннях m, які важко реалізувати практично, ненадійний тест краще замінити іншим більш надійним.

Кожне випробування Т, розглядається у теорії ймовірності, таким, що закінчується однією з подій E1, E2..., ES (тим або іншим, залежно від випадку). Ці події називаються результатами випробування. З кожним результатом Ек пов'язується додатне число Рк – імовірність цього результату, які при цьому повинні в сумі давати одиницю. Розглядаючи подію А, визначають "настає або Ei, або Ej..., або Ек ". Результати Ei, Ej..., Ек називаються сприяючими А, і за визначенням уважають, що ймовірність Р(А) події А, дорівнює сумі ймовірностей сприяючих йому результатів:

P(А) = pi + ps +... + pk.

Окремий випадок, якщо pі = ps =... pk = 1/S призводить до формули:

Р(А) = r/s,

яка виражає так зване класичне визначення ймовірності, відповідно до якого ймовірність події А дорівнює відношенню кількості результатів r, що сприяють А, до кількості s усіх "рівноможливих результатів". Класичне визначення ймовірності лише зводить поняття "ймовірності" до поняття "рівноможливості", яке залишається без чіткого визначення.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.006 сек.)