Статистический принцип усвоения детьми естественного языка

Автор обзора: Георгий Майоров

Оригинальное исследование: Hay, J. F., Pelucchi, B., Estes, K. G., & Saffran, J. R. (2011). Linking sounds to meanings: Infant statistical learning in a natural language. Cognitive psychology, 63(2), 93-106.

toddler lying on bed with comforter

Источник: Unsplash

При усвоении языка в естественных условиях дети должны решать проблему определения границ отдельных слов (словоформ), которые в норме не имеют четких однозначных маркеров в потоке звучащей речи. Изучение данной проблемы в предыдущих работах показало, что дети уже в раннем возрасте научаются определять границы слов по косвенным показателям. Однако во многих экспериментах в данной области исследователи использовали упрощенные, искусственно сконструированные языковые стимулы, сильно отличающиеся от слов естественного языка, и часто опирались на реакции детей на звучащую речь, т.е. пассивное восприятие речи, в то время как вопрос об использовании детьми вычлененных слов в собственной речи не затрагивался.

В противоположность этому, в данной работе в качестве стимульного материала использовались слова естественного языка, а одной из задач было установление связи между словом и его референтом. Авторы исходили из того наблюдения, что дети в сегментации потока звучащей речи на слова опираются на дистрибутивные характеристики звуков усваиваемого языка, включая фонотактику (возможные способы группировки последовательностей звуков), аллофоны (позиционные варианты фонем) и просодические (интонационные) конструкции, характерные для данного языка. В исследованиях по данной теме было показано, что знание этих характеристик проявляется у младенцев уже к девятимесячному возрасту, а возможно, и раньше.

Одним из основных показателей границы словоформы является вероятность совместного появления двух соседних слогов: на границе слов она значительно ниже, чем внутри слова. Вероятность совместного появления слогов является показателем статистической когерентности (внутренней предсказуемости) и носит название вероятности перехода (transitional probability) от одного слога к другому.

Как показала Дж. Саффран с коллегами в более раннем исследовании (Saffran, Aslin, Newport, 1996.), младенцы уже в восьмимесячном возрасте демонстрируют чувствительность к изменениям вероятности перехода между слогами и могут различать звуковые последовательности с высокой внутренней предсказуемостью (слова), последовательности с низкой внутренней предсказуемостью (части разных слов) и чужеродные для языка последовательности, имеющие нулевую внутреннюю предсказуемость (не-слова). Младенцы способны выделять эти типы последовательностей звуков в потоке речи на сконструированном языке даже после непродолжительного знакомства с ним.

В одной из своих работ Пелуччи с коллегами (Pelucchi, Hay, Saffran, 2009b) продемонстрировала способность восьмимесячных английских детей различать слова с высокой и низкой вероятностью перехода от слога к слогу на материале незнакомого им итальянского языка. Результаты данного исследования, с одной стороны продемонстрировали большую экологическую валидность использования материала естественных языков в экспериментах по сравнению со сконструированными стимулами, однако, с другой стороны, эксперимент Пелуччи с коллегами не давал ответа на вопрос о том, сформировалось ли у детей представление об отдельных словах, которое они могли бы использовать в дальнейшем, или же они просто научились распознавать регулярные и низкочастотные последовательности звуков в незнакомом языке. Таким образом, проблема взаимосвязи процессов вычленения слов/словоформ в потоке речи и усвоения значений слов (установления соотношения между словом и предметом, который оно называет) не была рассмотрена.

Метод изучения данной проблемы начала разрабатывать К. Граф Эстес в своем исследовании 2007 года (Graf Estes, et al., 2007) В ее эксперименте полуторагодовалым детям предъявлялся поток речи на искусственном языке, включавшем четыре двусложных квазислова, сконструированных таким образом, чтобы границы между ними можно было определить исключительно по параметру вероятности перехода от слога к слогу. Затем дети заучивали названия двух новых для них предметов, причем в разных группах в качестве названий выступали 1) слова из искусственного языка (вероятность перехода = 1.0), 2) сочетания слогов на границе слов из предъявленного ранее потока речи – части слов в терминологии авторов (вероятность перехода = 0.5) и 3) сочетания слогов, не встречавшиеся ранее (вероятность перехода = 0.0). После периода хабитуации дети в каждой группе проходили тест по модели Switch: в половине предъявлений использовавшиеся ранее пары название-объект сохранялись, а в другой половине названия были перепутаны (первый предмет предъявлялся с названием второго, а второй – с названием первого). Дети из первой группы, в которой названия предметов были словами из искусственного языка, значительно дольше рассматривали перепутанные пары по сравнению с нормальными парами, в то время как в двух других группах статистически значимых различий во времени между рассматриванием нормальных и перепутанных пар не наблюдалось. Из этого авторы сделали вывод, что прослушивание речи на искусственном языке подготовило детей к восприятию квазислов, выделяемых на основании регулярности повторения составляющих их последовательностей слогов, как названий объектов; в то время как сочетания слогов из искусственного языка, не составлявшие слов, дети не воспринимали как потенциальные названия предметов.

В данной работе метод Граф Эстес был применен в сочетании с использованием материала на естественном языке из работы Б. Пелуччи. Высказывания на итальянском языке были составлены таким образом, что среди стимулов присутствовали слова как с высокой, так и с низкой вероятностью перехода от слога к слогу внутри слова, причем слова обоих типов не различались по частотности в рамках всего использованного корпуса высказываний. Эти слова затем использовались в качестве названий предметов, как в исследовании Граф Эстес.

Эксперимент 1 был направлен на то, чтобы выяснить, как различия в степени вероятности перехода от слога к слогу внутри слова влияют на способность детей к усвоению новых названий. Все слова-стимулы в данном эксперименте были выровнены по частотности (внутри корпуса предъявляемых высказываний) и имели одинаковую слоговую структуру и ударение. Стимулы различались лишь по вероятности перехода от слога к слогу, которая составляла 1.0 для слов с высокой степенью вероятности и 0.33 для слов с низкой степенью вероятности. Изначальная гипотеза авторов состояла в том, что дети с трудом будут усваивать названия предметов, имеющие низкую степень вероятности перехода.

В эксперименте участвовало 40 англоговорящих детей-монолингвов в возрасте год и пять месяцев, которых произвольным образом разбили на две группы. Все дети были здоровы и совершенно незнакомы с итальянским или испанским языком.

Стимульные материалы были позаимствованы из эксперимента Пелуччи и коллег 2009 г. (Pelucchi et al., 2009a); запись высказываний была сделана диктором – носителем итальянского. В качестве целевых стимулов выступали четыре двусложных итальянских слова с ударением на первом слоге, произнесенные в составе двенадцати грамматически правильных, осмысленных предложений на итальянском языке. Каждое слово-стимул встречалось в корпусе высказываний шесть раз. Два слова-стимула обладали высокой степенью вероятности перехода между слогами, поскольку входящие в их состав слоги более не встречались в корпусе высказываний. Степень вероятности перехода для двух других слов-стимулов была дополнительно занижена до значения 0.33 за счет включения с корпус высказываний еще 12 случаев употребления первого слога каждого из этих слов. Средняя вероятность перехода от слога к слогу на границе слов для каждого типа стимулов была примерно одинаковой и составляла 0.26 для слов с высокой степенью вероятности перехода внутри слова и 0.27 для слов с низкой степенью вероятности перехода внутри слова.

На стадии членения потока речи дети прослушивали набор высказываний по три раза, так что каждое слово-стимул они слышали в целом 18 раз. Для контроля произвольных предпочтений ребенка при прослушивании было использовано два подкорпуса высказываний с разными последовательностями предъявления стимулов разных типов.

На стадии усвоения новых названий детям предъявлялись трехмерные компьютерные изображения, позаимствованные из исследования Граф Эстес 2007 г. (Graf Estes et al., 2007), в то время как диктор произносил без выражения названия изображенных объектов, относившиеся или к первой, или ко второй группе слов-стимулов. Сразу вслед за стадией хабитуации (заканчивавшейся либо после 25 предъявлений комбинаций предмет-название, либо по характерным признакам утраты интереса ребенком, которые отмечал наблюдатель) происходил тест по Switch-модели. Предполагалось, что если дети правильно усвоили названия предметов, то предъявления, в которых названия перепутаны, должны вызвать у них всплеск внимания, выражающийся в более длительном рассматривании изображения объекта.

Результаты первого эксперимента показали, как и предполагалось, увеличение времени разглядывания предъявлений с перепутанными названиями – как в случае со словами с высокой степенью вероятности перехода от слога к слогу внутри слова, так и с низкой. Эти результаты не зависели от того, какой из двух подкорпусов использовался, поэтому в дальнейшем различие между подкорпусами не учитывалось. Таким образом, дети смогли вычленить слова в потоке речи на незнакомом языке и затем использовать эти слова как названия предметов. Однако отсутствие различия между словами с высокой и низкой степенью вероятности перехода между словами внутри слова стало неожиданностью, поскольку оно не соответствует результатам исследования К. Граф Эстес и коллег 2007 г. Авторы предположили, что запоминание слов с низкой вероятностью перехода подкреплялось высокой частотностью первого слога каждого из этих слов в корпусе высказываний.

Однако альтернативной интерпретацией результатов первого эксперимента является то, что прослушивание высказываний на итальянском вообще не повлияло на усвоение детьми новых названий, поскольку этот навык к полуторагодовалому возрасту уже достаточно хорошо сформирован. В пользу этой интерпретации говорят все факты быстрого усвоения детьми указанного возраста новых слов родного языка при минимуме повторений или же вообще с первой попытки.

В свете этого авторы провели контрольный эксперимент 2, в котором фаза сегментирования потока итальянской речи отсутствовала. Дети такого же возраста, как в первом эксперименте, слушали вместо корпуса итальянских высказываний музыку, а затем проходили стадии хабитуации и Switch-теста аналогично эксперименту 1. Половине испытуемых были предъявлены в качестве названий слова с высокой вероятностью перехода между слогами внутри слова, другой половине – с низкой.

Результаты второго эксперимента, однако, показали отсутствие различий не только между словами-стимулами с разной вероятностью перехода, но и между предъявлениями правильных и перепутанных названий предметов. Из этого можно было сделать вывод, что дети не могли сопоставить итальянские слова и предъявляемые новые объекты. По мнению авторов, это произошло потому, что а) у детей не было предшествующего опыта слухового восприятия этих слов в потоке речи и б) согласно процедуре эксперимента, названия произносились диктором за кадром, в то время как при усвоении новых слов родного языка взрослый часто называет предмет, обращаясь непосредственно к ребенку.

Эти результаты, хотя и снимают альтернативную гипотезу о том, что прослушивание итальянской речи не повлияло на усвоение новых названий детьми, не объясняют расхождения результатов первого эксперимента с результатами, полученными К. Граф Эстес на материале искусственного языка. Поэтому авторы предположили, что, возможно, причина одинаково успешного опознания и затем использования детьми слов-стимулов с разными показателями вероятности межслогового перехода кроется в том, что они опирались на совершенно другой критерий сегментирования, а именно соотношение ударных и безударных слогов, поскольку все целевые стимулы представляли собой двусложные слова с ударением на первом слоге.

Другой возможной причиной неудачи в усвоении названий во втором эксперименте, по мнению авторов, является отсутствие опыта восприятия звуков итальянского языка детьми. Хотя сами звуки итальянского языка сопоставимы со звуками английского, их сочетания в речи для носителя английского являются непривычными, и дети в первом эксперименте могли иметь преимущество перед детьми во втором, так как они некоторое время слушали живую итальянскую речь, прежде чем усваивать итальянские слова в качестве названий предметов.

Наконец, авторы отмечают, что переход от слога к слогу может быть двунаправленным: недавние исследования в данной области показали, что и взрослые, и дети способны оценивать не только вероятность следования от предыдущего слога к следующему, но и обратно, от следующего к предыдущему. При составлении стимульного материала для первого эксперимента это обстоятельство не было учтено: с целью снижения вероятности межслогового перехода у слов-стимулов второй группы в корпус высказываний были включены другие слова, включающие первые слоги слов-стимулов, однако стимульный материал не был никак скорректирован с целью увеличения сочетаний, аналогичных этим словам целиком (на границах или внутри слов). В отличие от данного эксперимента, Граф Эстес и коллеги учли двунаправленный характер переходов между слогами в своем сконструированном материале.

В свете этих соображений авторы составили и провели эксперимент 3. Высказывания были составлены таким образом, чтобы слова-стимулы из второй группы имели низкой степенью вероятности как прямого, так и обратного межслогового перехода. В таком случае, если дети действительно ориентировались на чередование ударных и безударных слогов при членении потока речи на слова, можно было бы ожидать результаты, аналогичные эксперименту 1, т.е. отсутствие различий между словами с разной вероятностью межслогового перехода. Тех же результатов следовало бы ожидать, если основная причина в сколько-нибудь продолжительном знакомстве детей со звуковой формой итальянского языка. Однако если дети действительно опираются на параметр вероятности прямого и обратного межслогового перехода внутри слова, тогда должно наблюдаться ухудшение распознавания и последующего усвоения слов-стимулов, имеющих низкие вероятностные показатели.

Для этого эксперимента корпус высказываний был скорректирован, чтобы учесть обратный межслоговой переход для слов-стимулов из второй группы и снизить вероятность аналогично вероятности прямого перехода у этих слов. В остальном стимульный материал и процедура эксперимента остались те же, что и в эксперименте 1.

Результаты показали значимое различие между группами детей, усваивавших названия из числа слов с высокой и низкой вероятностью межслогового перехода: половина детей из второй группы очевидно не усвоила названий предметов, что выразилось в одинаковом времени разглядывания предъявлений правильных и перепутанных названий после хабитуации. Вместе с тем подавляющее большинство детей, усваивавших названия с высокой вероятностью межслогового перехода, дольше рассматривало предъявления, где названия были перепутаны. Эти результаты соответствовали результатам из исследования К. Граф Эстес.

В завершение авторы провели факторный анализ всей совокупности данных, полученных по трем экспериментам. Было выявлено влияние фактора «Тип предъявления» (правильное или перепутанное название), но не фактора «Выраженность маркера границы слова» (т.е. высокая или низкая вероятность межслогового перехода внутри слова), а также взаимодействие обоих факторов.

Таким образом, полученные экспериментальные данные говорят в пользу гипотезы о статистическом характере членения потока речи на слова детьми. Авторы, однако, признают, что вероятность межслогового перехода – не единственный возможный маркер границы слова при сегментировании речи.

Литература:

Estes, K. G., Evans, J. L., Alibali, M. W., & Saffran, J. R. (2007). Can infants map meaning to newly segmented words? Statistical segmentation and word learning. Psychological science, 18(3), 254-260.

Pelucchi, B., Hay, J. F., & Saffran, J. R. (2009). Statistical learning in a natural language by 8‐month‐old infants. Child development, 80(3), 674-685.

Pelucchi, B., Hay, J. F., & Saffran, J. R. (2009). Learning in reverse: Eight-month-old infants track backward transitional probabilities. Cognition, 113(2), 244-247.

Saffran, J. R., Aslin, R. N., & Newport, E. L. (1996). Statistical learning by 8-month-old infants. Science, 274(5294), 1926-1928.

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google photo

Для комментария используется ваша учётная запись Google. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s