|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
ЭКСПЕРТНОЕ ОЦЕНИВАНИЕI) сущность и специфические особенности экспертного оценивания 2 ) причины нарушение достоверности результатов экспертизы (на примере дидактического оценивания) Эксперт — (от лат. «опытный», «искушенный») - компетентное лицо, имеющее специальный опыт в конкретной области и участвующее в исследовании в качестве источника непосредственной информации. Его задачей является выражение своего мнения о качестве объекта или явления по определенной шкале в соответствии с пре-дусмотренными для этого правилами. Основное содержание метода экспертных оценок зак- лючается в рациональной организации работы одного или нескольких специалистов над поставленной проблемой с регистрацией и последующей обработкой полученных данных. В психологическом исследовании экспертное оценива-ние может рассматриваться как в качестве самостоятель-ного метода познания, так и в виде существенного компонента процедур наблюдения, опроса, эксперимента, анализа продуктов деятельности, словом, везде, где имеет место не-стандартизированный переход от признаков к выводам. Более того, те или иные разновидности экспертизы при-меняются на любом этапе исследования: в определении его целей и задач, в построении и проверке гипотез, привыявлении проблемных ситуаций, в ходе интерпретации понятийного аппарата, для обоснования адекватности используемого инструментария, в процессе выработки рекомендаций и т.д. Разумеется, экспертное оценивание не ограничено пределами психологической науки. Промышленность, образование, медицина, юриспруденция, спорт - поистине, трудно найти ту область знания или сферу деятельности, где оно не находило бы применений с давних пор и по настоящее время. Особый интерес к исследовательскому потенциалу данного метода появился после успешной реализации так называемого «Дельфийского проекта». Суть его, как известно, состояла в решении сугубо актуальной после Второй мировой войны задачи для правительства США: определении; количества ядерных зарядов, достаточных для обеспечения безопасности страны и ее союзников. В то время частная фирма «Ренд корпорейшн», предложив экспертное оцени вание в качестве способа решения проблемы, превзошла по ряду параметров (кратковременность процедур, их сравнительно малая трудоемкость и себестоимость) традиционные методики добывания информации Пентагона и ЦРУ Вместо сотен секретных агентов и десятков аналитиков, выявляющих потенциальные цели на территории против-ника, было задействовано семь экспертов (четыре эконо миста, специалист по атомным взрывам, специалист по си стемному анализу и инженер-электронщик). Еще несколь ко человек снабжали их разного рода информацией. Само название проекта возникло в кругах скептически настроенных чиновников, утверждавших, что достоверности его результатов вполне соответствует качеству предсказав ний древнегреческих прорицательниц в храме Аполлона и Дельфах. Однако независимая проверка сделанных экспер тами обоснований стала доказательством адекватности дан ного метода исследовательской задаче. Успех «Дельфийского проекта» был обусловлен тщатель ностью подбора экспертов, своевременным и всесторон ним их информированием, а также эффективностью орга низации всех этапов оценочной деятельности. Рассмотрим наиболее существенные особенности этой экспертизы. К основным чертам организации «Дельфийского проекта» следует отнести: 1) цикличность процедуры, повторяемость ее стадий. (Как известно, вначале каждый эксперт выдавал свою оценку и обосновывал ее. Затем составлялась итоговая сводка, отражающая мнения всех участников работы. Изучив эту информацию, эксперты корректировали свои прежние оценки и комментарии. Формулирование индивидуальных мнений повторялось четыре раза. При этом было отмечено значительное сближение экспертных суждений между собой); 2) отсутствие прямого контакта экспертов друг с другом, что гарантировало сведение к минимуму интерсубъек-гивных влияний общения на качество результатов; 3) анонимность участников работы, позволявшая им принимать во внимание оценки и обоснования других, но не их звания, регалии, общественное положение или научный авторитет; 4) оперирование не только количественными оценками, но и их аргументацией, что способствовало повышению уровня обдуманности индивидуальных суждений; 5) участие в работе специальной группы, обеспечивающей обработку и передачу экспертной информации. В последнем случае имеется в виду так называемая мо-ниторная группа, деятельность которой в экспертном оценивании обычно включает в себя формулирование исследовательской задачи, подбор компетентных специалистов, их инструктаж, разработку оценочных параметров, обеспечение работы экспертов (техническое, математико-статис-тическую обработку данных, логико-семантическое оформление суждений). Это своеобразные «эксперты по организации экспертиз». Недостатки в осуществлении мониторной деятельности самым пагубным образом сказываются на качестве оценочных процедур. Дело в том, что рассматриваемый нами метод относится к категории субъективных. Это, напомним, означает признание факта, что результаты экспертного оценивания в значительней мере зависят не только от объекта исследования, но и от характеристик тех лиц, которые это исследование выполняют. Иногда эксперта сравнивают с измерительным «устройством», к сожалению, не всегда способным к точной работе. С одной стороны, это может быть связано с теми или иными его качествами (некомпетентностью, предвзятостью, недобросовестностью, незаинтересованностью в успехе дела, неуверенностью в себе и т.д.), с другой стороны, быть следствием целого ряда просчетов мониторной группы (например, таких, как нечеткость в определении целей работы, осуществление экспертного опроса без специально разработанной программы, невнятность инструкций по оценке, недостаточный учет влияния факторов искажения достоверности результатов экспертизы, поверхностность в обработке суждений экспертов). Следует заметить, что основной задачей мониторной деятельности является максимальное приближение оценок экспертов к истине. Субъективность метода вовсе не означает его неэффективности. Экспертное оценивание становится способом получения недостоверной информации только в тех случаях, когда плохо подобраны специалисты и некачественно организована их работа. На данной схеме представлена классификация типов экспертиз (по П. Б. Шошину): Перейдем к анализу содержания оценочной деятельности экспертов. В целом, в ней можно выделить такие этапы: 1. Подготовка к экспертизе (изучение порядка и правил оценивания, ознакомление со способами регистрации суждений, актуализация знаний в данной конкретной области), 2. Исследование объекта экспертизы; 3. Возникновение имплицитной оценки - той, где субъективное впечатление, слабодифференцированное и неустойчивое, еще не получило выражения средствами внутренней речи, символами или словами; 4. Экспликация оценки - формулирование ее в уме, а затем и в вербальном или символическом виде; 5. Проверка правильности результата оценивания; 6. Аргументирование оценки; 7. Участие в информационном обмене между экспертами. Работа экспертов может происходить в условиях большей или меньшей стандартизации. Так, выражение их суждений в зависимости от особенностей исследования планируется в форме свободного интервью или анкетирования с полузакрытыми (или открытыми вопросами) или же, как стандартизированное интервью. Особо следует остановиться на статистической обработке материала. В практике научных исследований традиционно выде-ляют такие типы измерительных шкал: 1. Шкала наименований (или номинальная). Здесь устанавливается лишь факт подобия или различия объектов относительно какого-либо признака. Это деление на качественно однородные группы. Объекты в пределах каждой из групп располагаются в случайном порядке, в любой последовательности. При статистической обработке данных в такого рода шкале обычно лишь подсчитывается частотность отнесения объектов к категории. Примерами категориальных признаков являются «девушки - юноши», «экстраверты - интроверты», «сангвиники - флегматики - холерики - меланхолики», «дети - взрослые» и т.д. Главное, чтобы каждый объект входил всякий раз только в одну группу. 2. Шкала порядковая (или ранговая). Предполагает распределение объектов по интенсивности проявлений того или иного признака. С помощью нее устанавливается последовательность носителей признака и направление степени его выраженности в ряду объектов. Дело ограничивается определением отношений «больше - меньше», «выше -ниже» и т.п. Таким образом, каждый объект занимает свое место в ряду других. Однако это не означает, что интервалы между делениями такой шкалы равны друг другу. К примеру, если один школьник ответил на «2» балла, а другой - на «4», нельзя сказать, что кто-то из них знает учебный материал вдвое лучше, чем другой. Неправомерно складывать, вычитать, умножать, делить порядковые места (ранги) или с их помощью вычислять среднее арифметическое. При статистической обработке данных в пределах этой шкалы обычно ограничиваются установлением медианы (величины выраженности признака, соответствующей объекту со средним рангом). Примером использования шкалы порядка является, скажем, составление упорядоченного списка испытуемых, показавших те или иные результаты при выполнении определенной деятельности. 3. Шкала интервалов. К ней относят материалы, в которых дана количественная оценка изучаемого объекта в фиксированных единицах. Между делениями такой шкалы равные расстояния, одинаковая удаленность. К примеру, если один человек при тестировании интеллекта набрал 100 баллов, а другой — 90, это означает, что различия в показателях их интеллекта столь же велики, как если бы один получил 60 баллов за тот же тест, а другой -лишь 50. Однако это вовсе не подразумевает, что имеющие показатель 100 вдвое «интеллектуальнее», чем тот, у кого 50 баллов. Дело в том, что точка отсчета здесь установлена произвольно. Даже если при выполнении теста не будет решена ни одна задача, мы не решимся утверждать, что показатель интеллекта равен нулю. Основная проблема при ориентации оценивания на шкалу интервалов заключена в поиске такой единицы, которая во всех случаях была бы тождественна сама себе, то есть неизменна, одинакова. А это далеко не всегда возможно. С помощью данной шкалы можно выполнять обычные алгебраические операции типа сложения величин и вычисления среднего арифметического. 4. Шкала отношений (или пропорций). В отличие от предыдущей шкалы здесь не только равные интервалы между единицами измерения, но и имеется абсолютная точка, от которой и ведется отсчет. Тем самым становятся возможными выводы о пропорциях (типа «в два раза меньше», «в полтора раза выше», «в четыре раза тяжелее» и т.п.). В рамках этой шкалы могут производиться все статистические действия. Однако, изучая те или иные психологические признаки, практически невозможно исходить из некоего «абсолютного нуля». Шкала отношений используется, как правило, только если речь идет о физических особенностях испытуемых (типа веса, роста, размера и др.). Итак, мониторная группа, определив тип базовой измерительной шкалы, адекватный исследованию, разрабатывает для экспертов конкретные параметры, по которым будут ынесены индивидуальные суждения. Важно, чтобы в пос-ледующем, при статистической обработке и логическом сопоставлении результатов экспертизы не осуществлялось неправомерных выходов за пределы возможностей того или иного типа измерения. После вынесения оценок экспертами исследователь осуществляет обычно следующие операции: - проверку индивидуальных суждений и обоснований на непротиворечивость составляющих; - анализ совокупности мнений экспертов с целью установления степени согласованности их между собой; - выделение групп экспертов с близкими позициями в случае наличия существенных расхождений в оценках; - выявление причин разброса индивидуальных мнений; - определение влияния компетентности экспертов на содержание их оценок и обоснований. Теперь обратимся к рассмотрению причин нарушения достоверности результатов в ходе экспертного оценивания. В качестве примера используем дидактическое оценивание, осуществляемое педагогами для выявления качества знаний и степени сформированноти умений и навыков обучаемых. Известно, что иногда несколько педагогов, оценивая независимо друг от друга один и тот же устный ответ или письменную работу ученика, выставляют совершенно разные отметки по традиционной шкале успешности обучения. Бывает и так, что учитель, повторно оценивая письменную работу через некоторый промежуток времени, выставляет отметку, отличающуюся (подчас значительно) от собственной отметки, сделанной ранее. Почему это происходит? Можно выделить следующие причины оценочного субъективизма: 1. Полифункциональность отметки в учебном процессе иногда приводит к тому, что вступают в противоречие функции контроля и воспитания, ориентации учащегося в его достижениях и стимуляций к достижениям. Как писал по этому поводу Ш.А. Амонашвили: «Фемида-учитель, взвешивая знания, не может оставаться беспристрастной к ученику, порой сама того не сознавая. И на чашу с эквивалентами падают мелкие крупицы субъективизма: «Он лентяй, можно было бы поставить «3», но нет, лучше пусть подтянется... А этот...смотри как постарался... молодец! Давай порадую его, поощрю! Не может учитель поступить иначе: его опыт, знание им жизни, радостей и огорчений каждого ребенка обязательно влияют на оценку...» [1, с.15]. 2. Неисчисляемость оценочных процедур. Традиционная для современной образования шкала успешности обучекия является порядковой. Учитель не измеряет качества ответов или работ, а сравнивает их с неким идеальным об-азом, эталоном. Он пользуется цифрами, но не делает вычислений, применяя обозначения количества в качестве ярлыков. Естественно, что каждый из них делает это по-своему. 3. Разный уровень профессиональной подготовленности экспертов, в частности, степень владения учебным материалом, умение пользоваться данным средством контроля, коммуникативно-аудиальные умения. 4. Индивидуально-личностные особенности педагогов, в том числе: - степень автономности от социальных стереотипов; - уровень инертности сложившихся к моменту оценивания представлений о возможностях ученика (в силу этого «отличнику» так же трудно бывает получить «3», как «троечнику» - «5», даже если их ответы заслуживают такой отметки); - различия в умении абстрагироваться от имеющихся межличностных отношений с учащимся; - характерологические особенности: ответственность, добросовестность, собранность, заинтересованность и др.; - различия во влиянии на оценку несущественных аспектов ответа или работы ученика, таких как темп речи, дикция, громкость голоса, наличие пауз и количество ого-ворок, ораторские способности, особенности почерка, число исправлений или орфографических ошибок (если оценивается не грамотность) и т.д. Особо выделим здесь несколько т.н. «эффектов». Эффект ореола (в пед. оценивании) заключается во влиянии на отметку сложившихся представлений о возможностях ученика. Это влияние образа учащегося, который обычно «глобален», слабодифференцирован, стереотипен и статичен (к примеру, «умный студент», «интересуется моей дисциплиной» и т.д.). Эффект фасада (в пед. оценивании) обозначает зависимость отметки от впечатления, произведенного отвечающим в момент оценивания. Известно, что на восприятие эксперта влияют внешний вид, пол, манеры поведения, логичность ответа, уверенность отвечающего и др. 5. Ситуационные условия оценивания, такие как: - степень усталости проверяющего; - различия в оборудовании рабочего места и характеристиках условий труда (освещенность, температура помещения и т.д.); - фактор чередования различных по качеству ответов или работ; - воздействие на отметку общего уровня подготовлен- ности класса. Необходимо пояснить последние тезисы. Эффект контраста отражает зависимость отметки от нескольких предшествующих отметок других учащихся. Из-вестно, что хороший ответ часто оценивается выше, чем он заслуживает, если ему предшествовали плохие по качеству ответы. И, наоборот, слабый ответ может быть оценен еще хуже, если он выслушивается после серии отличных отве тов. Эффект фона обозначает влияние на отметку выявлен-ного педагогом к тому времени общего уровня подготов ленности класса. По сути, это внутригрупповая поправка в систему норм оценки. Так, в «слабом» классе бывает на много легче получить хорошую отметку, чем в «сильном», за счет выделения на общем фоне. Специфика той или иной сферы, естественно, определя-ет свой набор причин искажения достоверности результа тов экспертного оценивания. Однако многие из тех, что были названы выше, имеют весьма широкое распространение. До сих пор речь шла о субъективизме эксперта, работаю щего индивидуально, без непосредственного (очного) вза имодействия с другими. Следует заметить, что в работе груп пы специалистов, сообща оценивающих объект и дискути рующих о его характеристиках, влияние многих причин ис кажения качества экспертизы существенно ослабляется. Но при этом далеко не всегда можно гарантировать повыше ние достоверности результатов процедуры. Дело в том, что при этом возникают феномены интерсубъективного искажения результатов оценивания. К причинам нарушения достоверности данных при очном групповом оценивании следует отнести: - стремление к идентификации сообщения с его источником, в силу которого слушатель бывает склонен принять или опровергнуть чье-либо мнение в зависимости не от реального содержания, но от отношения к человеку, выска-;авшему его; - центростремительное давление, проявляющееся в виде смещения экспертных оценок в ходе обсуждения в сторону «безопасной середины»; - тенденцию защищать собственную позицию, высказанную публично, даже после того, как сам эксперт убедился в ее неверности; - стремление к доминированию как личностная особенность, возникающая, часто, улиц, не являющихся признанными лидерами, но претендующих на это; - влияние феномена «огруппления мышления», появляющееся в том случае, когда чувство принадлежности человека к группе подталкивает его к поддержке решений не столько правильных, сколько способных обеспечить единодушие; - неустойчивость имплицитной оценки, легко изменяющейся под воздействием уже высказанных мнений со стороны других экспертов. Большинство из этих факторов не оказывают особого влияния на итоги группового оценивания, осуществляющегося в заочной форме, без непосредственного взаимодействия экспертов между собой. Однако заочная форма экспертизы обычно требует нескольких туров, что увеличивает продолжительность и трудоемкость процедуры. ОСНОВНЫЕ ПОНЯТИЯ: экспертное оценивание; эксперт; мониторная группа; «Дельфийский проект»; имплицитная оценка; экспликация оценки; типы измерительных шкал: наименований (номинальная), порядковая (ран-ювая), интервалов, отношений (пропорций). Вопросы для обсуждения: 1. В чем состоит своеобразие экспертного оценивания в сравнении с другими методами опроса? Каковы его преимущества и недостатки? 2. Каких ошибок следует избегать при организации экспертизы? 3. По каким причинам возможно искажение достоверности результатов экспертного оценивания, производимого в психологическом исследовании? Упражнение 1: Опишите, как бы вы организовали экспертное оценивание влияния условий обучения студентов на динамику степени их утомления в течение рабочей недели. Упражнение 2: Разработайте программу осуществления экспертного оценивания эффективности мер по повышению качества организации учебного процесса у студентов психологического факультета. Упражнение 3: Проанализируйте и обсудите ошибки и недочеты, возникшие при выполнении упражнений 1 и 2. Упражнение 4: Понаблюдав в течение некоторого времени за жизнью класса (студенческой группы), произведите экспертное оце-', нивание качества психологической атмосферы в ней. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.01 сек.) |