Физический энциклопедический словарь
В акустике, последовательность звуков речи, произносимых, как правило, слитно, с паузами только после отд. слов или групп звуков. Слитность произношения звуков Р., вследствие непрерывности движений артикуляц. органов Р., вызывает взаимное влияние смежных звуков друг на друга. Артикуляц. органы имеют неодинаковые размеры у разных людей, и каждому человеку свойственна своя манера произнесения звуков Р., поэтому звуки Р. каждого человека имеют индивидуальный характер. Но при всём их многообразии они явл. физ. реализациями (произнесением) небольшого числа фонем (наименьшая звук. единица данного языка, существующая в Р. в целом ряде конкретных звуков). В русской Р. их насчитывается 41:6 гласных («а», «о», «у», «э», «и», «ы»), 3 твёрдых согласных («ш», «ж», «ц»), 2 мягких («ч», «и») и 15 в твёрдом и мягком видах; звуки Р. «я», «ю», «е», «ё» относятся к составным («йа», «йу», «йэ», «йо»).
Звуки Р. неодинаково информативны. Так, гласные звуки содержат малую информацию о смысле Р., а согласные наиболее информативны. Напр., в слове «посылка»: последовательность «о.ы.а» ничего не говорит, а — «п.с.лк.» даёт почти однозначный ответ о смысле слова. Точность передачи Р. (напр., в системах связи) оценивают с помощью артикуляц. метода: передают набор элементов Р. (напр., слов или слогов), отражающий состав звуков Р. данного языка, и определяют относит. кол-во принятых элементов. Разборчивость Р. при этом в значит. мере определяется разборчивостью глухих согласных.
Импульсы потока воздуха, создаваемые голосовыми связками при произнесении звонких звуков Р., с достаточной точностью могут считаться периодическими. Соответствующий период колебаний наз. периодом осн. тона голоса, а обратная величина — частотой осн. тона (она лежит обычно в пределах от 70 до 450 Гц). При произнесении звуков Р. частота осн. тона изменяется. Это изменение наз. интонацией. У каждого человека свой диапазон изменения осн. тона (обычно немного более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости голоса. Импульсы осн. тона имеют пилообразную форму, и поэтому при их периодич. повторении получается дискретный спектр с большим числом обертонов, или гармоник. При произнесении взрывных и щелевых звуков Р. поток воздуха проталкивается через узкие участки (щели) речевого тракта, поэтому образуются завихрения, создающие шумы с широкополосным сплошным спектром. Т. о., при произнесении Р. через речевой тракт проходит сигнал с тональным или шумовым, или с тем и др. спектром.
Речевой тракт представляет собой сложный акустич. фильтр с рядом резонансных полостей, создаваемых артикуляц. органами Р., поэтому выходной сигнал, т. е. произносимая Р., имеет спектр с огибающей сложной волнообразной формы (рис.).
Спектр. огибающая фонемы «з»: 1—4 — форманты, 5,6 — антиформанты.
Максимумы концентрации энергии в спектре звука Р. наз. формантами, а резкие провалы — антиформантами. В речевом тракте для каждого звука Р. есть свои резонансы и антирезонансы, поэтому спектр. огибающие этого звука имеют индивидуальную форму. Для большинства гласных звуков Р. характерно своё расположение формант и соотношение их уровней; для согласных важен также ход изменения формант во времени (формантные переходы).
Звонкие звуки Р., особенно гласные, имеют высокий уровень интенсивности, глухие — самый низкий. Поэтому при произнесении Р. громкость её непрерывно изменяется, особенно резко при произнесении взрывных звуков. Диапазон уровней Р. находится в пределах 35—45 дБ. Гласные звуки Р. имеют длительность в среднем ок. 0,15 с, согласные — ок. 0,08 с, звук «п» — ок. 0,03 с.
Образование звуков Р. происходит в результате подачи команд в виде электрич. биосигналов мышцам артикуляц. органов Р. от речевого центра мозга. Этих сигналов не более 10, при этом они изменяются медленно (в темпе смены звуков Р., т. е. от 5 до 20 звуков в с), поэтому общий поток этих сигналов составляет до 100 информац. единиц (бит/с), тогда как весь речевой сигнал имеет поток в 1000 раз больше. Объясняется это тем, что речевой сигнал представляет собой своего рода модулир. широкополосную несущую (см. МОДУЛЯЦИЯ КОЛЕБАНИЙ). Вся информация заключается в спектр. модуляции (в изменении формы огибающих спектра и уровня Р.), а в самой несущей информация о смысле Р. содержится только в интонации.
Осн. назначение Р.— передача информации от человека к человеку как при их непосредств. общении, так и с помощью средств связи. Т. к. для передачи натуральной Р. требуется пропускная способность тракта связи ок. 50000—70000 бит/с, то с целью её экономии и соответственно увеличения кол-ва возможных переговоров стремятся сжимать поток речевого сигнала на передающем конце тракта с последующим его расширением на приёмном конце. Напр., ослабляя уровень громких звуков Р., уменьшают разность уровней между громкими и слабыми звуками (сжимают динамич. диапазон). Также можно сжимать частотный диапазон речевого сигнала. Наконец, можно исключать из Р. участки сигнала, не несущие информации (средние участки длит. звуков), т. е. компрессировать Р. во времени. На приёмном конце соответственно восстанавливают диапазоны и заполняют исключённые участки звуков. Если отделить модулирующий сигнал от несущей, то потребуется ещё меньшая пропускная способность тракта связи для передачи Р. Подобную задачу в системах связи решают т. н. вокодеры.
В совр. исследованиях по общению человека с машиной решаются две проблемы: автоматич. управление машинами и процессами с помощью Р. (устный ввод в ЭВМ, автоматич. пишущая машинка и т. п.) и синтез Р. по разл. кодовым сигналам (устный вывод из ЭВМ, говорящие машины для чтения текста слепым и т. п.).
Исследования механизмов слухового и фонетич. анализа Р. относятся к акустике, психоакустике и фонетике.