ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ГЕНОТИП-СРЕДОВЫХ СООТНОШЕНИЙ ПО АКУСТИЧЕСКИМ ХАРАКТЕРИСТИКАМ РЕЧИ
Автор: Д. Н. ЧЕРНОВ, А. Ю. ПАРШУКОВ
Светлой памяти Инны Владимировны Равич-Щербо посвящается
ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ГЕНОТИП-СРЕДОВЫХ СООТНОШЕНИЙ ПО АКУСТИЧЕСКИМ ХАРАКТЕРИСТИКАМ РЕЧИ1
© 2006 г. Д. Н. Чернов*, А. Ю. Паршуков**
* Кандидат психологических наук, доцент кафедры общей психологии, Российский государственный медицинский университет, Москва
**Психолог, ассистент кафедры общей психологии, там же
Рассматриваются генотип-средовые соотношения по акустическим характеристикам речи. Результаты исследования демонстрируют, что индивидуальные показатели (30 показателей) частоты основного тона (F 0) и четырех формантных частот (F 1- F 4) обладают существенной внутрииндивидуальной стабильностью. Обнаружено, что межиндивидуальная вариативность по средним показателям F 0 имеет существенную генетическую обусловленность; различия испытуемых по внутрииндивидуальной вариативности F 0 объясняются влияниями факторов индивидуальной среды. Выявлены генетические воздействия и влияния факторов индивидуальной среды на межиндивидуальные различия по частотным показателям первых трех формант (F 1- F 3 ). Экспериментально показано, что умеренные общесредовые влияния на формирование индивидуальных различий по средним значениям F 2 и F 3 объясняются общими для всех испытуемых фонетическими особенностями произносимого языкового материала.
Ключевые слова: генотип-средовые соотношения, близнецовый метод, акустические параметры речи, частота основного тона, формантные частоты.
Речь играет исключительную роль в развитии психики человека и становлении его личности. Многоуровневый характер объекта изучения обуславливает возрастающий интерес к речи со стороны лингвистики и психологии. В рамках акустического подхода к речи изучаются голосовые корреляты эмоциональных и функциональных состояний, личностных характеристик и формально-динамических свойств индивидуальности [7, 8, 10, 11, 13]. Выявлению собственно индивидуальных особенностей акустических характеристик, равно как вопросу о роли наследственных и средовых факторов в формировании индивидуальных различий по голосовым параметрам, уделяется мало внимания. Решение этих вопросов может дать ценные сведения для ряда прикладных областей, например, для исследований по распознаванию индивидуально-личностной информации и идентификации говорящего по голосу. Для изучения природы любой континуально распределенной характеристики индивидуальности требуется решить три задачи: 1) выделить индивидуальные особенности; 2) выяснить их внутрииндивидуальную стабильность и 3) изучить вклад наследственных и средовых факторов в формирование этих индивидуальных особенностей [9].
Проблема выделения акустических характеристик голоса достаточно хорошо разработана в акустической теории речеобразования [15, 16] и прикладной фонетике [1, 2]. В звуковом континууме можно выделить три основных уровня - голосовой, сегментный и супрасегментный2. На голосовом уровне речь характеризуется частотой, интенсивностью и спектральным составом. При субъективном восприятии голоса эти характеристики обусловливают высоту, тембр и громкость звука. Частота основного тона (F 0) зависит от индивидуальных особенностей строения голосовых связок и от степени их натяжения в момент высказывания, которая может значительно изме-
1 Работа поддержана грантом РГНФ N03 - 06 - 00278а. 2 На сегментном уровне рассматриваются минимальные смыслоразличительные единицы речи - фонемы. Динамические изменения акустических параметров фонем в ходе речевой деятельности в целом укладываются в представления об акустических изменениях на супрасегментом уровне.
стр. 86
няться в процессе говорения в зависимости от языковых особенностей произносимого материала и функционального состояния говорящего. Простейшей характеристикой речевого сигнала является его интенсивность (I). Спектральный состав речи определяется характеристиками формантных областей. Форманты являются усиленными в спектральной картине звука собственными частотами резонаторов-надгортанных полостей (ротовая и носовая полости, полость глотки). Формантные частоты (Fn) в значительной степени характеризуют акустическую сторону различных звуков и могут существенно изменяться в зависимости от положения языка, губ, мягкого неба. Для характеристики специфического звучания звуков используются четыре формантные частоты (F 1 -F 4 ). Помимо частот, каждая формантная зона характеризуется шириной (Bп); она определяется диапазоном частот по обе стороны от Fn, однако в создании фонетических различий между звуками Bп играет второстепенную роль. Форма голосового импульса находит непосредственное отражение в огибающей спектра голосового источника - кривой, соединяющей амплитуды последовательных гармоник. Она дает представление о соотношении энергий низко- и высокочастотных областей спектра.
Супрасегментные (просодические) явления - это изменения в акустической картине звукового континуума, которые возникают при произнесении слов и фраз. В исследованиях голоса на супра-сегментном уровне распространенными интегральными акустическими параметрами являются средневзвешенный спектр и среднее значение F 0 на фиксированном временном отрезке речи. В зависимости от характера языкового материала, психоэмоционального состояния говорящего и коммуникативной ситуации речь характеризуется значительными изменениями формы и длительности сигнала от периода к периоду. Для их выявления используется метод сравнения мелодической кривой, получаемой путем последовательного нахождения периодов на интервале F 0 гласного звука (данные приводятся по [3, 15]). Во многих прикладных акустических исследованиях нашли свое применение темпоральные характеристики речи - длительность (t) произнесения звуков, слогов, слов и фраз [6, 7].
Изучению межиндивидуальной вариативности по акустическим характеристикам голоса уделялось значительно меньше внимания. Например, Г. Фант с соавторами обнаружили, что при произнесении фраз наибольшей межиндивидуальной изменчивостью обладают параметры F 0, I и t [18]. С. Холм указывает, что диапазон F 0 и I шире при спонтанной речи, чем при чтении. Автором выделяются типологические акустические изменения: 1) характеристики спонтанной речи одних испытуемых отличаются от акустических параметров речи при чтении (например, средняя F 0 выше); 2) у других испытуемых такой тенденции не наблюдается [22]. В исследовании С. Ли с соавторами, выполненном на нескольких возрастных группах (от 5 до 50 лет), указывается на значительную межиндивидуальную вариативность по темпоральным, мощностным и частотным характеристикам голосового сигнала. С возрастом отмечается плавное или резкое снижение средних величин и внутрииндивидуальной вариативности по F 0, Fn, t и огибающим спектра. Начиная с пубертатного периода, акустическая картина речи все более приближается к взрослой [23].
Вопрос о стабильности акустических характеристик речи оказался наименее разработанным. Одной из причин могло стать то, что экспериментальные данные указывают на существенную интраиндивидуальную вариативность акустических, интонационных и временных характеристик голоса в зависимости от самочувствия говорящего, его эмоционального и функционального состояния, языкового материала и контекста речепроизводства [7]. Имеются косвенные признаки существования стабильности голосовых параметров. В уже упоминавшейся работе С. Ли с соавторами показано, что внутрииндивидуальная вариативность по многим характеристикам голоса становится существенно ниже межиндивидуальной, начиная с подросткового возраста [23], что предполагает наличие индивидуальной устойчивости.
Только после решения вопроса о стабильности целесообразно переходить к изучению этиологии индивидуальных особенностей голоса. Считается, что акустические характеристики наследственно обусловлены в той мере, в какой генетические детерминанты влияют на формирование речевого тракта. В близнецовых исследованиях показано, что строение носа, носовой перегородки, губ и голосовых связок, форма и положение надгортанника [24], а также характер работы речевых мышц, обеспечивающих артикуляцию [4, 5], зависят от факторов наследственности. Но не учитывается факт, что акустические параметры обусловлены характером вовлеченности в процесс речеобразования отдельных анатомо-физиологических структур. Артикуляционная цель может быть достигнута за счет различных динамических перестроек артикуляционных движений в зависимости от текущего состояния речевого тракта и условий речепроизводства [3].
Генетические исследования акустических характеристик немногочисленны и проводятся в основном при помощи метода близнецов. Его модель предполагает анализ внутрипарного сходства монозиготных (МЗ) близнецов, имеющих 100% общих генов и сходный средовой опыт, с оценками сходства дизиготных (ДЗ) близнецов,
стр. 87
имеющих относительно общую историю средовых воздействий, но в среднем 50% общих генов. Авторами изучалась природа показателей F 0 [20, 21, 25, 28], Fn [29], I [20], средневзвешенного спектра [17, 21], особенностей коартикуляционных паттернов, возникающих при взаимодействии акустических характеристик расположенных рядом звуков [29]. Как правило, исследователи приходят к выводам о генетической детерминации индивидуальных различий по большинству акустических параметров. Например, Л. Гедда с соавторами показали, что внутрипарное сходство МЗ выше, чем ДЗ по показателям F 0 и средневзвешенного спектра [21]. Изучая спектральные характеристики голоса, М. Олперт с коллегами обнаружили большее внутрипарное сходство МЗ относительно ДЗ только в высокочастотных (>500 Гц) составляющих спектра [17]. Логика близнецового метода указывает на определенную генетическую обусловленность этих характеристик речи. Известен случай применения компьютерных методов идентификации говорящего по голосу для определения членов МЗ пар. Н. Шеффер и др. показали, что верная идентификация возможна с вероятностью 85% [27]. Есть данные о влиянии средовых условий на формирование голоса. Дж. Реялс с соавторами указывают, что длительное раздельное проживание МЗ в различных языковых зонах снижает их сходство по отдельным голосовым характеристикам [26]. Дж. Форрей и Дж. Гордое предлагают использовать параметры голоса для определения зиготности близнецов. По их мнению, акустический метод может обладать разрешающей силой метода биохимического анализа крови [19].
Эти исследования не дают убедительного ответа на вопрос о природе индивидуальных особенностей голоса. Помимо того, что авторами игнорируется вопрос о стабильности индивидуальных акустических параметров, большинство рассмотренных работ имеют методические недочеты. Во многих исследованиях выводы о решающей роли генетических факторов в формировании индивидуальных особенностей голоса делались только на основании значительного сходства МЗ [26, 28]. Показатели внутрипарного сходства МЗ сравнивались со сходством в парах МЗ со-близнец - его однополый сиблинг [29] или МЗ, взятых попарно в случайном порядке [4, 5, 17]. Необходимое в близнецовом методе сопоставление МЗ с показателями внутрипарного сходства ДЗ проводилось редко. Равным образом возможное сходство МЗ и ДЗ указывает на вклад средовых факторов в формирование индивидуальных характеристик. Выводы о природе межиндивидуальной вариативности можно делать только после применения генетического метода к большой близнецовой выборке одного возраста. К сожалению, многие работы выполнены на нескольких парах близнецов и/или на группах с широким возрастным диапазоном [17, 20, 21, 26, 29].
Итак, исследования природы межиндивидуальной изменчивости по голосовым параметрам находятся на начальном этапе становления. Изучение этиологии акустических характеристик на материале русского языка ранее не проводилось. Наше исследование посвящено выявлению роли наследственных и средовых факторов в формировании индивидуальных различий по частотным характеристикам голоса.
МЕТОДИКА
Выборка. Стабильность голосовых параметров изучалась на контрольной группе из 36 испытуемых-студентов РГМУ (18 юношей и 18 девушек) в возрасте 19 - 27 лет (Xср = 21 год). Данный возраст был выбран как "эталонный" на основании того, что пубертатные изменения голоса уже стабилизировались, а изменения эластичности связок с возрастом еще не выражены. Генотип-средовые соотношения (далее ГС-соотношения) по характеристикам голоса исследовались на выборке из 29 однополых пар близнецов, из которых 20 МЗ (12 женских и 8 мужских) и 9 ДЗ (5 женских и 4 мужских), и 2 однополых женских троен (одна из них МЗ, в другой два близнеца МЗ и ДЗ со-близнец). Тройни были организованы в 4 МЗ и 2 ДЗ пары. В итоге близнецовая выборка составила 24 МЗ и 11 ДЗ пар. Возраст испытуемых - 16 - 27 лет (Xср = 20 лет).
Процедура исследования. Тип близнецовости (МЗ или ДЗ) определялся при помощи опросника зиготности [14], который заполнялся каждым близнецом из пары. В некоторых случаях опросник дополнительно предлагался одному из родителей близнецов. Материалом для произнесения послужил стандартный набор из 38 звукосочетаний, используемый в фонетических исследованиях. Звукосочетания включали в себя 8 гласных фонем (а, о, у, и, ы, э, е, я), расположенных между согласными в пяти вариантах: 1) т -гласная- т, 2) т -гласная- ть, 3) п -гласная- п, 4) п -гласная- пь, 5) б -гласная- п [1]. Испытуемые произносили в микрофон звукосочетания, последовательно (каждые 3 секунды) предъявляемые на экран монитора, вынесенного в звукоизолированное помещение. На выборке одиночнорожденных голос регистрировался три раза каждые 1 - 14 дней, на выборке близнецов - однократно.
Аудиозапись проводилась на магнитофон "Tascam MD-350" с использованием выносного микрофона "Apex 190". Звуковой сигнал вводился в компьютер с 16-разрядной звуковой картой и оцифровывался с частотой дискретизации 22 КГц. Спектрографический анализ проводился с помощью программы Praat 4.3.10. В каждой гласной
стр. 88
Таблица 1. Дескриптивные статистики показателей голоса в трех пробах
----- Примечание. F 0 и F n дано в герцах (Гц); Xср - среднее арифметическое, σ - стандартное квадратическое отклонение. определялась частота основного тона (F 0 ) и частоты первых четырех формант (F 1- F 4) через каждые 0.001 с. Такое дробное измерение позволило провести процедуру устранения выбросов (выходящих за рамки диапазона X ср ± 3σ), значительно изменяющих средние значения по выбранным характеристикам. Процедура проводилась по каждой пробе и внутри каждой фонемы при помощи специально созданной компьютерной программы. В итоге все значения пробы укладывались в диапазон X ср±3σ). За по пробе в целом и каждой фонеме в отдельности. Средний процент выбросов от общего количества данных составил X ср = 5%. Статистический анализ проводился при помощи компьютерных пакетов SPSS 11.0.1 и Statistica 6.0. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ Было получено 30 показателей, характеризующих каждую голосовую пробу как 1) единое целое и 2) набор гласных фонем: 1) показатели средних значений по средним акустических характеристик (в Гц)3: X ср(F 0 X ср) - среднее значение по средним частотам основного тона; X ср(F 1 X ср), X ср(F 2 X ср) ...X ср(F n X ср) - средние значения по средним частотам четырех формант; 2) показатели стандартных отклонений от средних значений акустических характеристик (в Гц): а). Стандартные отклонения от средних значений по пробе в целом - отражают общую вариативность акустических характеристик при вокализации гласных: σ (F 0) - стандартное отклонение частот основного тона от средней величины по пробе в целом; σ(F 1), σ(F 2), ... σ(F n) - стандартные отклонения частот четырех формант от средних величин по пробе в целом; б). Стандартные отклонения по средним значениям - отражают степень различия гласных по средним для них значениям: σ(F 0 X ср) - стандартное отклонение по средним частотам основного тона; σ(F 1 X ср), σ(F 1 X ср), ... σ(F n X ср) - стандартное отклонение по средним частотам четырех формант; в). Средние значения по стандартным отклонениям - отражают среднюю внутрифонемную вариативность частотных характеристик голоса при вокализации гласных звуков: X ср(F 0σ) - среднее значение по стандартным отклонениям частот основного тона в гласных звуках; X ср(F 1σ), X ср(F 1σ), ... X ср(Fn σ) - средние значения по стандартным отклонениям частот четырех формант в гласных звуках; г). Стандартные отклонения по стандартным отклонениям в гласных звуках - отражают межфонемную изменчивость в вариативности частотных характеристик при вокализации гласных звуков: σ(F 0σ) - стандартное отклонение по стандартным отклонениям частот основного тона в гласных звуках; σ(F 1σ), σ(F 2σ),. .. σ(F nσ) - стандартное отклонение по стандартным отклонениям частот четырех формант в гласных звуках; В табл. 1 приводятся дескриптивные статистики по основным выделенным показателям мужских и женских голосов. Полученные результаты в целом соответствуют имеющимся сведениям о средних и вариативности F 0 и F n [3, 12]. Все 30 параметров имеют нормальное распределение (проверка проводилась по критерию согласия распределений λ-Колмогорова-Смирнова). Мужчины и женщины отличаются по строению голосовых связок и длине речевого тракта, что обусловливает более вы- 3 Средние значения по пробе в целом Xcp (Fn) оказались идентичны средним значениям по средним акустических характеристик Xcp (FnXcp), поэтому далее они не рассматриваются. стр. 89 сокие F 0 и F n у женщин [3, 15]. Поэтому перед совмещением их результатов было проведено z-преобразование показателей для групп юношей и девушек. Обнаруженная вариативность признака может быть обусловлена, как интраиндивидуальной, так и интериндивидуальной изменчивостью. Для оценки вклада внутри- и межиндивидуальной дисперсий в вариативность акустических параметров речи проводился корреляционный анализ r - Пирсона попарно между пробами по каждому показателю. Индивидуально-стабильным параметр считался в том случае, если все три попарные корреляции между пробами были значимыми (p ≤.05). В этом случае вариативность признака определяется его интериндивидуальной изменчивостью, что свидетельствует о наличии индивидуальных различий. Все параметры оказались стабильны (Xcpr =.70). Предполагалось, что выделенные показатели независимо друг от друга характеризуют разные стороны речевого сигнала. Кластерный анализ акустических параметров проводился по каждой пробе отдельно. Анализ дендрограмм позволил выделить единый воспроизводимый паттерн группировки в кластеры (см. рис.). Выделено 6 кластеров, в каждом из которых по 2 показателя. Кластеры включают в себя параметры, характеризующие F 0 или каждую F n отдельно. Ряд средних по фонемам Xcp (F 0 Xcp), Xcp (F 2 Xcp), Xcp (F 3 Xcp), Xcp (F 4 Xcp) показателей общей вариативности акустических характеристик σ(F 1), σ(F 3), σ(F 4), показателей вариативности гласных по средним для них значениям σ(F 1 Xcp), σ(F 3 Xcp), σ(F 4 Xcp), и показателей межфонемной изменчивости в вариативности частотных характеристик σ(F 1σ), σ(F 3σ), σ(F 4σ), не вошли ни в один из кластеров (всего 13 показателей). Предположение о независимости различных показателей одного акустического параметра подтвердилось частично. При изучении природы межиндивидуальной вариативности любой характеристики с помощью близнецового метода необходимо решить вопрос о репрезентативности выборки близнецов популяции одиночнорожденных людей. Если близнецы образуют по изучаемым параметрам особую группу, то результаты генетического анализа не могут быть перенесены на остальную популяцию [9]. При сравнении близнецовой выборки (как контрольной по критерию q' - Даннета) с результатами трех проб одиночнорожденных людей устойчивых различий (воспроизводимых трижды) ни по одному из акустических параметров обнаружено не было. По параметрам Xcp (F 0 Xcp), σ(F 0σ), σ(F 0), σ(F 3) и σ(F 4) были выявлены различия в одном или двух случаях (p <. 05), что не позволяет сделать достоверный вывод ни о принадлежности близнецовой и одиночнорожденных групп к одной генеральной совокупности, ни об их различии по данным голосовым характеристикам. Таким образом, во-первых, нет существенных оснований считать, что показатели акустических характеристик, полученные на близнецах, не обладают внутрииндивидуальной стабильностью; во-вторых результаты генетического анализа акустических характеристик в целом могут быть перенесены на популяцию одиночнорожденных. Для изучения ГС-соотношений на выборке близнецов4 подсчитывались коэффициенты внутриклассовой корреляции для МЗ и ДЗ. На их основе вычислялись коэффициенты наследуемости (h2), общесемейной (c2) и индивидуальной (e2) среды (см. [9]). В некоторых случаях показатели h2, c2 и e2 вычислить невозможно; предварительные представления о ГС-соотношениях можно было получить, учитывая уровень сходства у МЗ и ДЗ. Высокие и равные показатели их внутрипарного сходства указывают на общесредовые влияния; низкое внутрипарное сходство МЗ и ДЗ - на влияния e2. Генетико-математический анализ показал, что в целом индивидуальные различия по акустическим характеристикам обусловлены влияниями факторов наследственности и индивидуальной среды, хотя по отдельным показателям наблюдаются умеренные общесредовые влияния (см. рисунок). ГС-соотношения существенно различаются для разных показателей. Отчетливые генетические влияния на межиндивидуальную изменчивость по F 0 (h2 =. 45 и.58) обнаружены для средней частоты Xcp(XcpF0) и средней по внутрифо-немной вариативности Xcp(F0σ). Показатели общей вариативности речевого сигнала по σ(F 0) и межфонемной изменчивости в вариативности гласных σ(F 0σ) обусловлены, главным образом, влияниями e2. Коэффициенты МЗ и ДЗ по вариативности гласных по средним для них значениям σ(F 0Xcp) не поддаются интерпретации. Известно, что F 0 зависит от индивидуальных особенностей строения голосовых связок. Однако степень натяжения связок может значительно изменяться на протяжении высказывания. Таким образом, фенотипическая вариативность средней частоты колебания связок в существенной степени генетически детерминирована, а индивидуальный диапазон их колебания, вероятно, обусловлен особенностями произнесения материала и функциональным состоянием говорящего. Индивидуальные различия по средним и стандартным отклонениям параметров F n имеют различную природу. Параметры средней частоты 4 Результаты кластерного анализа акустических параметров по близнецовой выборке воспроизводят паттерн группировки в кластеры, полученный для контрольной выборки. стр. 90 Результаты иерархического кластерного анализа и ГС-соотношения по акустическим показателям ----- Примечания. Дендрограмма приведена по результатам второй пробы контрольной группы; коэффициенты внутрипарного сходства r мз - МЗ и r дз - ДЗ пар; показатели фенотипической дисперсии h2 - коэффициент наследуемости, c2 - показатель общей среды, e2 - показатель индивидуальной среды; уровни статистической значимости * -p ≤.05; ** -p ≤.01; *** -p ≤.005; **** -p ≤ 001; горизонтальная разделительная черта отсутствует между акустическими показателями, входящими в воспроизводимые кластеры. Xcp (F 1 Xcp), вариативности по средним фонем σ(F 1Xcp), вариативности по межфонемной изменчивости σ(F 1σ) обнаруживают определенную генетическую обусловленность (h2 =. 39-.51), но определяются и индивидуальными средовыми влияниями (e2 =. 39-.54). Средняя внутрифонемная вариативность Xcp (F 1σ) обусловлена в большей степени влияниями e2. ГС-соотношения по общей вариативности речевого сигнала σ(F 1) вычислить нельзя. F n образуются в результате прохождения глоттальной волны по речевому тракту, который, благодаря содержащемуся в нем воздуху, является сложной колебательной системой, имеющей резонансные свойства. Собственные частоты резонаторов (глотки, ротовой и носовой полостей) усиливаются и изменяются в зависимости от положения языка, губ, мягкого неба. Любые дополнительные ситуативно обусловленные изменения формы голосового тракта изменяют F -картину фонем. Таким образом, ГС-соотношения по параметрам F 1 могут быть объяснены 1) влияниями генетически обусловленных особенностей строения голосового тракта и 2) индивидуализированными особенностями динамических перестроек артикуляционных движений, изменениями текущего состояния речевого тракта и ситуативных условий речепроизводства. Это объяснение справедливо и для других F n в случае обнаружения влияний h2 и e2. Картина воздействия наследственных и средовых факторов на индивидуальные различия по показателям F 2 в целом соответствует ГС-соотношениям по F 1, однако есть и отличия. Выраженные генетические влияния наблюдаются по общей вариативности речевого сигнала σ(F 2) и изменчивости по средним частотам фонем σ(F 2 Xcp) (h2 =.56 и.64); индивидуальные средовые влияния относительно малы (e2 =.28 и.32). Одинаково низкие коэффициенты внутрипарного сходства МЗ и ДЗ по средней внутрифонемной стр. 91 Таблица 2. Результаты дисперсионного анализа (ANOVA) по выборке близнецов
----- Примечания. ОРД - основной результат действия факторов; факторы: Ф - тип фонемы; контекст мягкости (М) и согласности (С) фонем; * - взаимодействие факторов; F эмп - эмпирическое значение F-критерия, полужирным шрифтом отмечены статистически значимые F эмп; p - уровень значимости: для ОРД С и М факторов приведены уровни значимости Post Hoc анализа (критерий множественных парных сравнений q - Ньюмена-Кейлса). вариативности X ср(F 2σ) и межфонемной изменчивости в вариативности F 2 по каждой фонеме σ(F 2σ) указывают на выраженные влияния e 2. Интересен следующий факт: относительно высокое внутрипарное сходство МЗ и ДЗ по средним от усредненных по каждой фонеме частот Xср(F2Xср) указывает на влияние c 2. Можно полагать, что определяющими индивидуальные различия по средней F 2 средовыми факторами являются общие для испытуемых особенности произносимого материала. По-видимому, эти особенности находят свое отражение и в F 3. Умеренное влияние общесредовых факторов на индивидуальные особенности голоса наблюдается по средней от усредненных по фонемам частот X ср (F 3 X ср); определенный процент фенотипическои дисперсии по этому параметру объясняется генетическими влияниями и воздействиями факторов e 2(h 2 =.36, c 2 =. 37, e2 =.27). Вариативность гласных по средним для них значениям σ(F 3 X ср) обусловлена генетическими и индивидуальными средовыми влияниями (h 2 =.50, e 2 =.50). Средняя внутрифонемная вариативность X ср(F 3σ) обнаруживает отчетливые влияния факторов e 2(e 2 =.72). Внутрипарное сходство МЗ и ДЗ по общей вариативности формантной частоты σ(F 3) и вариативности по межфонемной изменчивости σ(F 3σ) не интерпретируемо. F 4 сравнительно редко используется при описании F -картины фонем [3] и в прикладных акустических исследованиях (см. [10, 11]). Это связно со сложностью ее выделения из спектра. Индивидуальные различия по изменчивости частоты речевого сигнала σ(F 4), вариативности средних значений частот фонем σ(F 4 X ср) и средней внутрифонемной вариативности X ср(F 4σ) обусловлены, главным образом, индивидуальными средовыми влияниями (e 2 -. 61-.83). Низкие корреляции МЗ и ДЗ по показателю межфонемной изменчивости в вариативности частот при вокализации гласных σ(F 4σ) указывают на значительные влияния факторов e 2. Соотношение коэффициентов внутрипарного сходства МЗ и ДЗ по средней частоте X ср(F 4 X ср) не поддается интерпретации. Таким образом, фенотипическая вариативность по показателям F 4 обусловлена индивидуальными средовыми влияниями. В оценку e 2 может включаться ошибка измерения, которая вероятна при регистрации такого сложного звукового сигнала, как человеческий голос. Однако при обнаруженной на выборке одиночнорожденных высокой стабильности изучаемых показателей и при соблюдении требований к регистрации и обработке речевого сигнала ошибка измерения маловероятна. Для проверки предположения о влиянии особенностей стимульного материала в качестве общесредовых воздействий на формирование индивидуальных различий по X ср(F 2 X ср) и X ср(F 3 X ср) был проведен дисперсионный анализ (ANOVA) по значениям каждой из формантных частот гласных в контрольной и близнецовой выборках. В качестве независимых факторов выступали: 1) тип гласной фонемы (7 условий - а, о, у, и, ы, э, ё), 2) мягкость согласной фонемы (2 условия - наличие/отсутствие мягкого знака в конце слога)5, 3) тип согласных в слоге (2 условия - фонемы т и п). Тип согласных и мягкость характеризуют контекст произнесения гласных, их артикуляционные особенности взаимодействуют с произносимыми гласными звуками и могут обусловливать спектральные характеристики гласных фонем 5 Слоги, содержащие фонему я и контекст б -гласная- п, были исключены из анализа в силу их представленности только при одном условии фактора мягкости. стр. 92 [3]. Результаты дисперсионного анализа по выборке близнецов приведены в табл. 26. Табл. 2 показывает, что факторы, выделенные в качестве независимых, оказывают различные воздействия на индивидуальные показатели Fn. Наибольшее количество значимых влияний факторов и их взаимодействий обнаружено на индивидуальные показатели по F 2 (7 влияний). Таким образом, в значениях F 2 по гласным отражается вся совокупность проанализированной акустической информации о произносимых звукосочетаниях. А значит, индивидуальные различия по средней частоте произнесения гласных X ср(F 2 X ср) действительно обусловлены особенностями используемого языкового материала. Похожая тенденция наблюдается и по F 3, хотя F эмп, как правило, ниже, чем по F 2, а контекст, связанный с фактором согласности, вообще не оказывает значимого влияния на индивидуальные значения по F 3. Иными словами, влияния языкового материала на F 3 выражены в меньшей степени по сравнению с F 2, что согласуется с результатами генетического анализа. В отличие от F 2 и F 3, для которых влияния практически всех фонетических особенностей языкового материала оказались значимыми, влияния большей части этих особенностей на F 1 и F 4 не обнаружены. Таким образом, дисперсионный анализ подтверждает предположение о том, что фонетические особенности стимульного материала выступают в качестве значимого компонента общесредовой составляющей фенотипической дисперсии акустических параметров, в частности, средних значений по F 2 и F 3. Отметим, что данные о стабильности и ГС-соотношениях по акустическим характеристикам получены при произнесении простейшего речевого материала в строгих экспериментальных условиях. Справедливость полученных результатов при изучении более свободно излагаемого языкового материала требует дополнительной экспериментальной проверки. ВЫВОДЫ 1. Частотные показатели основного тона (F 0) и четырех первых формант (F 1- F 4) обладают высокой внутрииндивидуальной стабильностью, что позволяет рассматривать их в качестве объекта изучения генетики количественных признаков. 2. Индивидуальные различия по средним показателям частоты основного тона (F 0), зависящей от особенностей строения голосовых связок, имеют существенную генетическую обусловленность; индивидуальные различия по внутрииндивидуальной вариативности частоты основного тона, определяемые колебаниями связок во время высказывания, объясняются индивидуальными средовыми влияниями, например, ситуативными особенностями произнесения и функциональным состоянием человека. 3. Межиндивидуальные различия по частотным показателям первых трех формант (F 1- F 3) обусловлены генетическими влияниями (особенностями строения голосового тракта) и воздействиями факторов индивидуальной среды (индивидуализированными особенностями динамических перестроек артикуляционных движений, изменениями текущего состояния речевого тракта, ситуативными условиями речепроизводства); фенотипическая вариативность по частотным показателям F 4 в значительной мере определяется влияниями индивидуальной среды. 4. Обнаружены умеренные общесредовые влияния на формирование индивидуальных различий по средним значениям второй и третьей формантных частот (F 2, F 3); они могут объясняться общими для всех испытуемых фонетическими особенностями произносимого языкового материала. СПИСОК ЛИТЕРАТУРЫ 1. Артемов В. А. Экспериментальная фонетика. М.: Изд-во литературы на иностранных языках, 1956. 2. Златоустова Л. В., Потапова Р. К., Потапов В. В., Трунин-Донской В. Н. Общая и прикладная фонетика. М., 1997. 3. Кодзасов С. В., Кривнова О. Ф. Общая фонетика. М.: Изд-во РГГУ, 2001. 4. Крышова Н. А., Штейнгардт К. М. Данные по изучению системной функции речи у близнецов // Вопросы клинической нейрогенетики. М., 1973. С. 28 - 38. 5. Крышова Н. А., Штейнгардт К. М. Сравнительная характеристика функции речевых мышц у однояйцевых близнецов // Журнал высшей нервной деятельности 1967. Т. 17. С. 643 - 649. 6. Методика оценки нервно-эмоционального напряжения членов экипажа по данным радиообмена // Составители А. Н. Онуфраш, Д. З. Генин. М.: МГА, НИИ гражданской авиации, 1978. 7. Никонов А. В. Психологические проблемы акустической диагностики функциональных состояний оператора / Психологические проблемы деятельности в особых условиях. М: Наука, 1985. С. 136 - 153. 8. Никонов А. В., Беловол Е. В. Соотношение формально-динамических свойств индивидуальности и акустических характеристик речи // Психол. журн. 2000. Т. 21. N 5. С. 65 - 69. 9. Равич-Щербо И. В., Марютина Т. М., Григоренко Е. Л. Психогенетика. М.: Аспект-Пресс, 1999. 10. Речь и эмоции. Материалы и сообщения. Всесоюз. симпоз. 11 - 14 нояб. 1974 г. Л.: АН СССР, 1975. 6 Результаты ANOVA по контрольной выборке совпадают по характеру обнаруженных значимых влияний, поэтому не приводятся стр. 93 11. Речь, эмоции и личность. Материалы и сообщения Всесоюз. симпоз. 27 - 28 февр. 1978 г. Л.: АН СССР, 1978. 12. Сорокин В. Н., Цыплихин А. И. Сегментация и распознавание гласных // Информационные процессы. 2004. Т. 4. N 2. С. 202 - 220. 13. Сунцов В. Г. Исследование индивидуальных особенностей личности по акустическим характеристикам речи // Индивидуальные различия и проблемы индивидуальности: Материалы Международной научно-практической конференции 16 - 18 окт. 2003 г. М.: Уникум-пресс, 2003. С. 239 - 241. 14. Талызина Н. Ф., Кривцова С. В., Мухаматулина Е. А. Природа индивидуальных различий: опыт исследования близнецовым методом. М.: Изд-во Моск. ун-та, 1991. 15. Фант Г. Акустическая теория речеобразования. М.: Наука, 1964. 16. Фланаган Дж. Анализ, синтез и восприятие речи. М.: Наука, 1968. 17. Alpert M., Kurtzberg R. L., Pilot M., Friedhoff A. J. Spectral characteristics of the voices of twins // Acta Genetica Medicae et Gemellologicae. V. 12. 1963. P. 335 - 341. 18. Fant G., Kruckenberg A., Liljencrants J., Botinis A. Individual variations in prominence correlates. Some observations from "lab-speech" // TMH-QPSR. 2002. V. 44. P. 177 - 180. 19. Forrai G., Gordos G. A new acoustic method for the discrimination of monozygotic and dizygotic twins // Acta Paediatr. Hung. V. 24. 1983. P. 315 - 322. 20. Fuchs M., Oeken J., Hotopp T., Taschner R., Hentschel B., Behrendt W. Die Ahnlichkeit monozygoter Zwillinge hinsichtlich Stimmleistungen und akustischer Merkmale und ihre mogliche klinicdhe Bedeurung // HNO. V. 48. 2000. P. 462 - 469. 21. Gedda L., Fiori-Ratti L., Bruno G. La voix chez les jumeauz monozygotiques // Folia Phoniat. V. 12. 1960. P. 81 - 94. 22. Holm S. Individual use of acoustic parameters in read and spontaneous speech // Phonum. 2003. V. 9. P. 157- 160. 23. Lee S., Potamianos A., Narayanan Sh. Acoustics of children's speech: Developmental changes of temporal and spectral parameters // J. Acoust. Soc. Am. 1999. V. 105. P. 1455 - 1468. 24. LuchsingerR. Die Vererbung von sprach- und stimmsto-rungen // Folia Phoniat. V. 11. 1959. P. 1 - 3. 25. Przybyla B. D., Horii Y., Crawford M. H. Vocal fundamental frequency in a twin sample: looking for a genetic effect // J. of Voice. V. 3. 1992. P. 261 - 266. 26. Ryalls J., Shaw H., Simon M. Voice onset time production in older and younger female monozygotic twins // Folia Phoniat. et Logopaedia. V. 56. 2004. P. 165 - 169. 27. Scheffer N., Bonastre J. -F., Ghio A., Teston B. Gemellite et reconnaissance automatique du locuteur. 2003 / http://www.nist.gov/speech. 28. Suzuki T., Nomura H. A Study of Pitch on Twins' Voice (Japanese) // Bulletin of the Phonetic Soc. of Japan. V. 172. 1983. P. 4 - 6. 29. Whiteside S., Rixon E. Speech characteristics of monozygotic twins and a same-sex sibling: an acoustic case study of coarticulation patterns in read speech // Phonetica. V. 60. 2003. P. 273 - 297. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.055 сек.) |