Разборчивость речи и методы ее измерения. Основы электроакустики учебное пособие для студентов высших учебных заведений культуры и искусств

Мы разговариваем по телефону, мы слушаем выступления и речи в концертных залах. Некоторые из нас пытаются подслушать чужой разговор, иные – сделать прослушку невозможной. Однако для всех наведенных выше случаев бывали такие ситуации, когда посторонний шум настолько мешал услышать нужное, что слова становились попросту неразборчивыми. Чтобы таких проблем не возникало, перед эксплуатацией трактов проводится акустическая экспертиза каналов речевой коммуникации.

Канал, либо тракт речевой коммуникации (или канал передачи речевой информации) – это физическая среда, путь, который проходит звук от отправления к приему. Это может быть воздушный, электроакустический, вибрационный, параметрический, оптико-электронный канал, однако не будем останавливаться на их рассмотрении, так как наша цель – измерение важнейшего критерия качества тракта – разборчивость речи.

Методы измерения разборчивости речи можно коротко подать в виде списка:

  • Субъективные:
    • Чисто субъективный метод;
    • Объективизированный;
    • Тональный;
  • Объективные:
    • Формантные:
      • AI (Индекс артикуляции);
      • SII (Индекс разборчивости речи);
    • Модуляционные:
      • STI (Speech transmission index – Индекс передачи речи);
      • RASTI (Быстрый STI);
      • STIPA (STI для систем звукоусиления);
      • STITEL (STI для телекоммуникационных систем);
    • %ALcons (Оценка потерь артикуляции согласных);
Конечно, есть еще советские методы Покровского, Быкова, Сапожкова, однако трогать их не будем, по крайней мере пока, так как приведенные выше методы обеспечивают лучший результат.

Разумеется, охватить все и сразу мы не в силах, потому для начала рассмотрим отличия объективных методов от субъективных, а также поподробнее остановимся на последних.

Чистый субъективизм

В оценке разборчивости речи чистым субъективным методом участвует пара диктор-аудитор. Их работу удобно рассматривать на примере тестирования радиостанции по рекомендациям МККР (Международного Консультативного Комитета по Радиосвязи): на передающей стороне радиоканала диктор читает текст, в то время как аудитор на принимающей стороне выставляет оценку тракта по пятибалльной (или какой-либо другой) шкале. Тяжело не заметить очевидный большой недостаток такого подхода, а именно неизбежное влияние на результат особенностей речи и слуха тестирующих людей.

Решение этой проблемы такое же очевидное, как и сама проблема.

Объективизированность

Наиболее распространенным объективизированным методом является метод артикуляции. Он заключается в том, что перед началом измерений в испытуемом канале создаются нормальные акустические условия (уровни шумов). Участвуют несколько аудиторов, а диктор вместо обычного текста читает специально составленные таблицы слогов (артикуляционные таблицы). Аудиторы записывают услышанное и по окончанию сеанса передачи сверяют свои таблицы с дикторскими. Отношение правильно услышанных слогов к их общему числу и есть оценка разборчивости речи, которая выражается в процентах либо в долях единицы.

Отметим, что при большем числе продиктованных и соответственно принятых слогов влияние различных факторов усредняется. Влияние факторов еще более усредняется, если в испытаниях принимают участие различные группы дикторов и аудиторов. В этом и заключается объективизированность артикуляционного метода. Однако не только в этом. Получить объективные результаты помогает начитка именно звукосочетаний, не имеющих смысловой нагрузки, так как при приеме слов или фраз можно додумать и восстановить искаженный трактом элемент.

Что касается аудиторов, есть мнение, что это должны быть специально натренированные бригады, однако ГОСТ Р 50840-95 требует совершенно обратное. Лично я больше склоняюсь к последнему.

Достоинства:

  • Универсальность (метод применим к любому типу тракта);
  • Простота (метод не требует у операторов специальных технических знаний)
Недостатки:
  • Громоздкость процедуры измерений (требуются значительные затраты временных, материальных и человеческих ресурсов);
  • Создание артикуляционных таблиц (с каждым новым типом таблиц результаты измерений отличаются);
  • Зависимость результатов от степени тренерованости операторов;
  • Человеческий фактор (влияние на результат особенностей речи и слуха)

Объективизированность. Часть 2

Рассмотрим еще один объективизированный субъективный метод – тональный, согласно которому диктор заменяется генератором чистых тонов. Этот искусственный голос на деле – обычный громкоговоритель без диффузора, который генерирует сигналы таким образом, чтобы уровень звуковых давлений, создаваемый на различных частотах, соответствовал бы кривой спектра формант. Аудиторы никуда не деваются. Теперь их задача – это просто определить, слышен ли сигнал на данной частоте или нет.
Частоты, на которых проводятся измерения
250 500 650 800 990 1125 1300 1500 1700 1875
2050 2225 2425 2725 3100 3500 3850 4550 6150 8600

Уровень ощущения формант измеряется путем плавного ввода затухания до исчезновения слышимости звука, затем затухание следует убавлять до момента появления звука. Два значения затухания усредняются – это и есть результат измерения.

Формантная разборчивость речи определяется по таблице:

дБ % дБ % дБ % дБ % дБ % дБ %
1 0.04 10 0.65 19 1.92 28 3.22 37 4.28 46 4.75
2 0.09 11 0.76 20 2.07 29 3.37 38 4.37 47 4.78
3 0.14 12 0.89 21 2.2 30 3.51 39 4.46 48 4.8
4 0.19 13 1.03 22 2.36 31 3.64 40 4.52 49 4.82
5 0.24 14 1.18 23 2.5 32 3.75 41 4.57 50 4.85
6 0.3 15 1.32 24 2.65 33 3.87 42 4.62 51 4.88
7 0.37 16 1.47 25 2.79 34 3.97 43 4.66 52 4.95
8 0.46 17 1.62 26 2.93 35 4.08 44 4.69
9 0.55 18 1.77 27 3.08 36 4.18 45 4.72
дБ - уровень ощущения тона; % - формантная разборчивость речи

Общая формантная разборчивость определяется как сумма составляющих:
Для окончания измерения разборчивости речи достаточно определить слоговую разборчивость:

Достоинства:
  • Не нужна бригада дикторов;
  • Значительно сокращается время измерений;
  • Не нужны артикуляционные таблицы
Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала;
  • Невозможность автоматизации процесса;
  • Человеческий фактор

А как же…

… отличия объективных методов от субъективных? Думаю, вы уже догадались, что все дело в человеческом факторе, а точнее в его отсутствии, так как для измерений используют искусственный голос, рот и ухо.

Рассмотрим простейший объективный метод.

Прежде всего, на приемном конце испытуемого тракта создается уровень шума, соответствующий условиям работы. Далее измеряется уровень шума на выходе искусственного уха в критической полосе частот слуха, при этом средняя частота этой полосы равна частоте измерительного тона. Этот уровень шума обязательно нужно зафиксировать, он нам еще понадобится. После этого вместо шума на вход тракта подают тональный сигнал. Уровень интенсивности звука на микрофоне берется таким, чтобы при условном нуле на регулировщике затухания распределение звуковых давлений соответствовало кривой спектра формант. Далее с помощью регулирования затухания добиваются, чтобы уровень тонального сигнала на выходе тракта стал равен зафиксированному нами ранее уровню шума. Показания регулятора затухания – результат измерения.

Чтобы определить формантную и слоговую разборчивости, пользуются теми же способами, что и в тональном методе.

Достоинства:

  • Точность и быстрота;
  • Не требуются дикторы и аудиторы;
  • Возможность полной автоматизации процедуры измерений
Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала

The End

Обычно после этих слов и быть ничего не должно, ну разве что титры, потому буду предельно краток: это был «никнейм_внизу», смотрите нас в любое удобное для вас время. И спасибо за внимание!

Понятность и разборчивость речи

Понятность речи - основная характеристика, определяющая пригодность тракта для передачи речи. Непосредственное определение этой характеристики может быть осуществлено статистическим методом с привлечением большого числа слушателей и дикторов. Количественное определение понятности речи – разборчивость .

Разборчивостью речи называют относительное или процентное число правильно принятых элементов речи из общего числа переданных по тракту. Элементы речи – сложные звуки, слова, фразы, цифры. Соответственно различают слоговую , звуковую , словесную , смысловую и цифровую разборчивости . Между ними существует статистическая взаимосвязь. В практике преимущественно используют слоговую, словесную и смысловую разборчивости.

Для измерений разборчивости разработаны специальные таблицы слогов с учетом встречаемости их в русской речи. Эти таблицы называются артикуляционными . Разборчивость измеряют с помощью тренированной бригады слушателей без нарушений слуха и речи путем проведения субъективно-статистических экспертиз. При этом измерения могут проводиться различными методами, например, методом бальной оценки, методом определения процента правильно принятых слов и т.д.

Зависимость между разборчивостью речи и ее понятностью, приведена в табл. 16.1. В этой таблице понятность речи оценена четырьмя градациями:

1) отличная, если понятность полная, без переспросов;

2) хорошая, если у слушателей возникла необходимость в отдельных переспросах редко встречающихся слов или отдельных названий;

3) удовлетворительная, если слушатели сообщили, что им трудно понимать, имели место частые переспросы;

4) предельно допустимая, если требовались неоднократные переспросы одного и того же материала с передачей отдельных слов по буквам при полном напряжении слуха.

Таблица 16.1

Причинами снижения разборчивости являются акустические шумы в помещении, помехи от реверберации и диффузного звука, недостаточное усиление сигналов первичного источника звука.

Системы озвучения и звукоусиления должны обеспечивать требуемую понятность речи. При передаче информационных программ, проведении митингов и собраний необходима отличная понятность речи, которая обеспечивается при 80 % слоговой и 98 % словесной разборчивостях. Для диспетчерской связи полная разборчивость речи (удовлетворительная понятность) получается при 40...50 % слоговой и 87...93 % словесной разборчивостях. Поэтому при расчете диспетчерской связи ориентируются на меньшие величины разборчивости, чем при расчетах систем широкого применения.

Существует связь между разборчивостью речи, условиями приема и характеристиками трактов передачи, которую удалось установить при помощи формантной теории, разработанной Флетчером и Коллардом.

Области концентрации энергии в том или ином участке частотного диапазона называются формантами . Их расположение зависит как от положения звука в слове или фразе, так и от индивидуальных особенностей артикуляционного аппарата человека. Каждый звук имеет несколько формант. Форманты звуков речи заполняют частотный диапазон от 150 до 7000 Гц.

Этот диапазон частот условились поделить на 20 полос, в каждой из которых вероятность появления формант одинакова. Такие полосы частот назвали полосами равной разборчивости . Они определены для ряда языков, в том числе для русского. Установили, что вероятность появления фомант подчиняется правилу аддитивности. При достаточно большом количестве звукового материала вероятность появления формант в каждой полосе равна 0,05.

Форманты имеют различные уровни интенсивности: у звонких звуков они выше, чем у глухих. При увеличении уровня акустических шумов сначала маскируются форманты с низкими уровнями, а затем с более высокими. В результате маскировки уменьшается вероятность восприятия формант. Коэффициент, определяющий это уменьшение в к - й полосе, называют коэффициентом восприятия или разборчивости к ф . Иначе говоря, в к -ой полосе вероятность приема формант

где коэффициент восприятия формант к ф зависит от уровня ощущения, который в свою очередь определяется разностью между средним спектральным уровнем речи В р в полосе равной разборчивости и спектральным уровнем шумов и помех в той же полосе В ш :

Е ф = В р - В ш . (16.2)

Коэффициент восприятия (разбогрчивости) может быть определен по графику, представленному на рис. 16.1. На этом графике приведены уровни ощущения Е ф и соответствующие им коэффициенты восприятия к ф .

Для уровней ощущения 0-18 дБ к ф может быть определен приближенно по формуле k ф =(Е+ 6)/30.

Рисунок 16.1.Интегральное распределе­ние уровней речи.

В общем случае для каждой полосы равной разборчивости коэффициент восприятия будет разным. Общая формантная разборчивость в речевом диапазоне частот определяется из

(16.3)

Рисунок 16.2.Зависимость слоговой разборчивости от формантной.

Зависимость между формантной и другими видами разборчивости была найдена экспериментально. Такая зависимость для слоговой разборчивости показана на рис. 16.2. Из этого рисунка видно, что почти полная понятность речи (слоговая разборчивость равна 80 %) получается при приеме лишь половины всех формант (формантная разборчивость равна 0,5), что свидетельствует об избыточности речи и комбинационной способности мозга.

Определение разборчивости речи для озвучиваемых помещений прежде всего осуществляют для точек озвучиваемой поверхности с минимальным уровнем прямого звука и максимальным уровнем акустичеких шумов. Спектральный уровень прямого звука у слушателя, находящегося в такой точке,

, (16.4)

где В рм -спектральный уровень речи у микрофона (определяется из таблиц);

,

где r м - удаление микрофона от оратора; - спектральный уровень речи на расстоянии 1 м (определяется из справочных таблиц);
- индекс усиления (индекс тракта - разность между уровнями звука, создаваемыми громкоговорителем системы звукоусиления у уха слушателя и первичным источником звука на входе микрофона).

Эти данные определяют для каждой полосы равной разборчивости. Для этих же полос спектральные уровни шумов и помех в месте слушания

где В аш - спектральный уровень акустических шумов (определяется из справочных таблиц); В п - спектральный уровень помех от речи (самомаскировка речи),

где
- поправка на помехи от диффузного звука(R - акустическое отношение в расчетной точке); N д - дифракционная поправка, поправка на отражение от головы слушателя (определяется из справочных таблиц);
- поправка на реверберационные помехи (Т р - время реверберации).

Уровень акустических шумов не зависит от индекса тракта, в то время как уровень помех от речи растет с увеличением индекса тракта (16.4), (16.6). Поэтому для повышения уровня ощущения целесообразно увеличивать индекс тракта. После достижения условия

В п = В аш + 6 (16.7)

дальнейшее увеличение индекса тракта не рационально, так как уровень ощущения в пределе может повыситься лишь на 1 дБ. Это условие с учетом (16.4), (16.6), (16.7) определяет индекс тракта

Такой индекс тракта называют рациональным . Он в основном определяется максимальным значением акустического отношения
в расчетной точке и временем реверберации.

При рациональном усилении из (16.5) следует, что

В ш = В п + 1, (16.9)

т.е. вклад акустических шумов В аш в общий уровень шумов и помех незначителен.

Полученные выражения позволяют определить разборчивость и понятность речи. Для этого по формулам (16.4), (16.6), (16.9) находят уровни речи, шумов и помех и далее по формуле (16.2) определяют уровень ощущения формант Е ф для каждой полосы равной разборчивости. Графическая зависимость, представленная на рис. 16.1, позволяет найти коэффициенты разборчивости к ф , соответствующие полученным значениям Е ф . Общая формантная разборчивость А в речевом диапазоне частот находится из выражения (16.3), а соответствующая ей слоговая разборчивость определяется по рис. 16.2. Понятность речи определяется по табл. 16.1.

Методы повышения разборчивости речи

    Снижение уровней помех. (На практике этого достигнуть удается не всегда). Стараются увеличивать L p у слушателя(приближение микрофона, увеличение уровня голоса говорящего).

    Повышение уровня звукового давления у слушателя по прямому звуку, приближением микрофона к источнику звука, повышением уровня голоса говорящего, увеличением индекса тракта.

    Сжатие D речевого сигнала - повышение уровней звукового давления слабых звуков при сохранении максимальных уровней звукового давления.

Предельным случаем сжатия D является амплитудное ограничение - клиппирование . При этом речевой сигнал превращается в последовательность импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами (телеграфный режим работы). В результате все звуки речи будут иметь одинаковый (максимальный) уровень при приеме. Качество звучания в этом случае ухудшается, но разборчивость резко повышается, так как слабые звуки не клиппированной речи, маскирующиеся помехами, при таком способе передачи окажутся выше уровней помех.

    Применение вокодеров.

Вокодер представляет собой устройство, в передающей части которого из речевого сигнала выделяются параметры, определяющие информативность речи: спектральные огибающие звуков речи и параметры основного тона речи, т.е. медленно меняющиеся во времени признаки звуков речи.

В приемной части вокодера имеется сложный фильтр, имитирующий акустическую систему речевого тракта для звонких звуков речи и глухих. Уровнем синтезируемых звуков и параметрами фильтров управляют сигналы, выделенные на передающем конце вокодера, в результате чего восстанавливается спектральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются достаточно высокими.

    Увеличение средней мощности сигнала, а следовательно разборчивости, за счет разделения сигнала на огибающую и мгновенную фазы и их особая обработка.

Расчет разборчивости речи

    Вычисляем спектральные уровни речи с поправкой на расстояние от микрофона

, (16.10)

где В’ p – спектральный уровень речи на расстоянии 1 м (определяется из справочных таблиц).

2. По заданному спектру и уровню акустических шумов находим его спектральные уровни В а (определяется из справочных таблиц).

3. Определяем суммарную поправку ΣΔ L .

4. Определяем фактический индекс тракта Q мс .

5. Все данные заносятся в таблицу.

6. Вычисляем спектральные уровни речи у слушателя

(16.11)

7. Вычисляем спектральные уровни помех

. (16.12)

8. Суммируем спектральные уровни помех со спектральными уровнями акустических шумов

9. Вычитаем из спектрального уровня речи спектральный уровень суммарных помех и шумов и получаем уровень ощущения формант

. (16.14)

10. По найденному уровню ощущения находим коэффициент разборчивости k ф;

для 0. (16.15)

или находим его точные значения по таблице. Все вычисленные значения заносим в сводную таблицу.

11. Суммируем полученные величины коэффициентов разборчивости и находим формантную разбочивость

. (16.16)

По формантной разборчивости определяем слоговую S и словестную W разборчивсти и понятность речи.

Из анализа данных коэффициента разборчивости следует, что нижние частоты передаются намного хуже верхних. Так как есть запас по предельному индексу тракта на этих частотах, то можно спроектировать их примерно на 4 дБ. Разборчивость от этого практически не изменится, но повысится качество звучания.

Для ориентировочного определения разборчивости речи можно воспользоваться сокращенной методикой расчета. Если спектры речи и шумов изменяются по частоте не очень резко,то нет смысла вычислять их для всехполос равной разборчивости, а достаточно расчитать из на октавных частотах.

Октаве 173-350 Гц соотетствует одна полоса равной разборчивости (200-350 Гц).

Октава 350-700 Гц охватывает три полосы (330-465);

Октава 700-1400 Гц включает в себя 4 полосы (750-900);

Октава 1400-2800 Гц → 6 полос (1410-2840).

Октава 2800-5600 Гц → 5 полос (2840-5640).

Участок дапазона 5600-7000 Гц соответствует последней полосе равной разборчивости (5640-7000).

С учетом этого формантная разборчивость определяется по формуле

где k ф1 - k ф6 – коэффициенты разборчивости на октавных частотах.

Мы разговариваем по телефону, мы слушаем выступления и речи в концертных залах. Некоторые из нас пытаются подслушать чужой разговор, иные – сделать прослушку невозможной. Однако для всех наведенных выше случаев бывали такие ситуации, когда посторонний шум настолько мешал услышать нужное, что слова становились попросту неразборчивыми. Чтобы таких проблем не возникало, перед эксплуатацией трактов проводится акустическая экспертиза каналов речевой коммуникации.

Канал, либо тракт речевой коммуникации (или канал передачи речевой информации) – это физическая среда, путь, который проходит звук от отправления к приему. Это может быть воздушный, электроакустический, вибрационный, параметрический, оптико-электронный канал, однако не будем останавливаться на их рассмотрении, так как наша цель – измерение важнейшего критерия качества тракта – разборчивость речи.

Методы измерения разборчивости речи можно коротко подать в виде списка:

  • Субъективные:
    • Чисто субъективный метод;
    • Объективизированный;
    • Тональный;
  • Объективные:
    • Формантные:
      • AI (Индекс артикуляции);
      • SII (Индекс разборчивости речи);
    • Модуляционные:
      • STI (Speech transmission index – Индекс передачи речи);
      • RASTI (Быстрый STI);
      • STIPA (STI для систем звукоусиления);
      • STITEL (STI для телекоммуникационных систем);
    • %ALcons (Оценка потерь артикуляции согласных);
Конечно, есть еще советские методы Покровского, Быкова, Сапожкова, однако трогать их не будем, по крайней мере пока, так как приведенные выше методы обеспечивают лучший результат.

Разумеется, охватить все и сразу мы не в силах, потому для начала рассмотрим отличия объективных методов от субъективных, а также поподробнее остановимся на последних.

Чистый субъективизм

В оценке разборчивости речи чистым субъективным методом участвует пара диктор-аудитор. Их работу удобно рассматривать на примере тестирования радиостанции по рекомендациям МККР (Международного Консультативного Комитета по Радиосвязи): на передающей стороне радиоканала диктор читает текст, в то время как аудитор на принимающей стороне выставляет оценку тракта по пятибалльной (или какой-либо другой) шкале. Тяжело не заметить очевидный большой недостаток такого подхода, а именно неизбежное влияние на результат особенностей речи и слуха тестирующих людей.

Решение этой проблемы такое же очевидное, как и сама проблема.

Объективизированность

Наиболее распространенным объективизированным методом является метод артикуляции. Он заключается в том, что перед началом измерений в испытуемом канале создаются нормальные акустические условия (уровни шумов). Участвуют несколько аудиторов, а диктор вместо обычного текста читает специально составленные таблицы слогов (артикуляционные таблицы). Аудиторы записывают услышанное и по окончанию сеанса передачи сверяют свои таблицы с дикторскими. Отношение правильно услышанных слогов к их общему числу и есть оценка разборчивости речи, которая выражается в процентах либо в долях единицы.

Отметим, что при большем числе продиктованных и соответственно принятых слогов влияние различных факторов усредняется. Влияние факторов еще более усредняется, если в испытаниях принимают участие различные группы дикторов и аудиторов. В этом и заключается объективизированность артикуляционного метода. Однако не только в этом. Получить объективные результаты помогает начитка именно звукосочетаний, не имеющих смысловой нагрузки, так как при приеме слов или фраз можно додумать и восстановить искаженный трактом элемент.

Что касается аудиторов, есть мнение, что это должны быть специально натренированные бригады, однако ГОСТ Р 50840-95 требует совершенно обратное. Лично я больше склоняюсь к последнему.

Достоинства:

  • Универсальность (метод применим к любому типу тракта);
  • Простота (метод не требует у операторов специальных технических знаний)
Недостатки:
  • Громоздкость процедуры измерений (требуются значительные затраты временных, материальных и человеческих ресурсов);
  • Создание артикуляционных таблиц (с каждым новым типом таблиц результаты измерений отличаются);
  • Зависимость результатов от степени тренерованости операторов;
  • Человеческий фактор (влияние на результат особенностей речи и слуха)

Объективизированность. Часть 2

Рассмотрим еще один объективизированный субъективный метод – тональный, согласно которому диктор заменяется генератором чистых тонов. Этот искусственный голос на деле – обычный громкоговоритель без диффузора, который генерирует сигналы таким образом, чтобы уровень звуковых давлений, создаваемый на различных частотах, соответствовал бы кривой спектра формант. Аудиторы никуда не деваются. Теперь их задача – это просто определить, слышен ли сигнал на данной частоте или нет.
Частоты, на которых проводятся измерения
250 500 650 800 990 1125 1300 1500 1700 1875
2050 2225 2425 2725 3100 3500 3850 4550 6150 8600

Уровень ощущения формант измеряется путем плавного ввода затухания до исчезновения слышимости звука, затем затухание следует убавлять до момента появления звука. Два значения затухания усредняются – это и есть результат измерения.

Формантная разборчивость речи определяется по таблице:

дБ % дБ % дБ % дБ % дБ % дБ %
1 0.04 10 0.65 19 1.92 28 3.22 37 4.28 46 4.75
2 0.09 11 0.76 20 2.07 29 3.37 38 4.37 47 4.78
3 0.14 12 0.89 21 2.2 30 3.51 39 4.46 48 4.8
4 0.19 13 1.03 22 2.36 31 3.64 40 4.52 49 4.82
5 0.24 14 1.18 23 2.5 32 3.75 41 4.57 50 4.85
6 0.3 15 1.32 24 2.65 33 3.87 42 4.62 51 4.88
7 0.37 16 1.47 25 2.79 34 3.97 43 4.66 52 4.95
8 0.46 17 1.62 26 2.93 35 4.08 44 4.69
9 0.55 18 1.77 27 3.08 36 4.18 45 4.72
дБ - уровень ощущения тона; % - формантная разборчивость речи

Общая формантная разборчивость определяется как сумма составляющих:
Для окончания измерения разборчивости речи достаточно определить слоговую разборчивость:

Достоинства:
  • Не нужна бригада дикторов;
  • Значительно сокращается время измерений;
  • Не нужны артикуляционные таблицы
Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала;
  • Невозможность автоматизации процесса;
  • Человеческий фактор

А как же…

… отличия объективных методов от субъективных? Думаю, вы уже догадались, что все дело в человеческом факторе, а точнее в его отсутствии, так как для измерений используют искусственный голос, рот и ухо.

Рассмотрим простейший объективный метод.

Прежде всего, на приемном конце испытуемого тракта создается уровень шума, соответствующий условиям работы. Далее измеряется уровень шума на выходе искусственного уха в критической полосе частот слуха, при этом средняя частота этой полосы равна частоте измерительного тона. Этот уровень шума обязательно нужно зафиксировать, он нам еще понадобится. После этого вместо шума на вход тракта подают тональный сигнал. Уровень интенсивности звука на микрофоне берется таким, чтобы при условном нуле на регулировщике затухания распределение звуковых давлений соответствовало кривой спектра формант. Далее с помощью регулирования затухания добиваются, чтобы уровень тонального сигнала на выходе тракта стал равен зафиксированному нами ранее уровню шума. Показания регулятора затухания – результат измерения.

Чтобы определить формантную и слоговую разборчивости, пользуются теми же способами, что и в тональном методе.

Достоинства:

  • Точность и быстрота;
  • Не требуются дикторы и аудиторы;
  • Возможность полной автоматизации процедуры измерений
Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала

The End

Обычно после этих слов и быть ничего не должно, ну разве что титры, потому буду предельно краток: это был «никнейм_внизу», смотрите нас в любое удобное для вас время. И спасибо за внимание!

Понятность речи 1 является качественной характеристикой тракта. Для ее непосредственного определения есть только один метод: статистический с участием большого числа операторов (слушателей и дикторов). Разработан косвенный, количественный метод определения понятности речи через ее разборчивость.

Разборчивостью речи называют относительное или процентное количество принятых специально тренированными слушателями (артикулянтами) элементов речи из общего количества переданных по тракту (см. ). В качестве элементов речи применяют слоги, звуки, слова, фразы (команды), цифры. Соответственно этому есть слоговая, звуковая, словесная, смысловая и цифровая разборчивость. В практике используют преимущественно слоговую, звуковую и словесную разборчивость. На рис. 10.5 приведены статистические зависимости между слоговой словесной и звуковой разборчивостью для обычных телефонных переговоров на русском языке. В табл. 10.2 приведены градации понятности речи и соответствующие им значения разборчивости, измеренные артикулянтами.

Таблица 10.2. (см. скан) Разборчивость речи для различных градаций понятности передачи

Рис. 10.5. Зависимости: а - между словесной и слоговой разборчивостью речи; между звуковой и слоговой разборчивостью речи

Таблица 10.3. (см. скан) Нормы на допустимые искажения трактов речевых информационных передач

Понятность речи была определена для обычных абонентов в процессе обычных телефонных переговоров. При этом понятность считалась отличной, если переговоры велись без переспросов; хорошей, если были отдельные переспросы редко встречающихся слов или неизвестных фамилий, названий и т.п., о которых нельзя догадаться по смыслу; удовлетворительной, если требовались частые переспросы и слушатели сообщали, что трудно разговаривать; предельно допустимой, если требовались неоднократные переспросы одного и того же материала в передаче отдельных слов по буквам и с полным йапряжением слушателей. В табл. 10.3 даны допустимые искажения для трактов речевой связи и информационных трактов.

ФОРМАНТНЫЙ МЕТОД РАСЧЕТА РАЗБОРЧИВОСТИ РЕЧИ

Форманты звуков речи заполняют весь частотный диапазон Гц. Этот частотный диапазон делят на 20 полос равной разборчивости. В табл. 10.4 приведены границы таких полос для русского языка. Там же приведены и средние значения частоты для этих полос. Вероятность появления формант в каждой полосе равной разборчивости равна 0,05. При слушании речи в условиях шумов и помех разборчивость получается меньшей, чем в их отсутствие. Коэффициент, определяющий это уменьшение, называют коэффициентом восприятия или коэффициентом разборчивости до, т. е. в каждой полосе равной разборчивости вероятность приема формант .

Рис. 10.6. Зависимость коэффициента разборчивости речи от уровня ощущения ее формант: 1 - для обычной речи; 2 - для предельно ограниченной по амплитуде

Коэффициент разборчивости до определяется уровнем ощущения формант где средний спектральный уровень речи; спектральный уровень шумов.

На рис. 10.6 показано распределение спектральных уровней речи, т. е. интегральная вероятность появления уровня не менее заданного уровня речи, определенного за длительный интервал времени, и заданного уровня (кривая У). Эта вероятность практически совпадает с вероятностью распределения формант. Заметим, что это распределение почти не зависит от частоты. Кривая 2 соответствует предельно ограниченной речи (по амплитуде).

Коэффициент разборчивости до для гладких шумов 1 может быть определен с помощью рис. 10.6 и табл. 10.5. Для примера на этом рисунке показаны уровень ощущения (равным разности спектральных уровней речи и шумов и соответствующий ему коэффициент разборчивости дол. Он также может быть определен по приближенным формулам (см. § 10.7).

Для каждой полосы равной разборчивости коэффициент разборчивости в общем случае будет разный

Поэтому суммарная вероятность приема формант, называемая разборчивостью формант.

Понятность речи - определяющая характеристика тракта передачи речи, так как если тракт не обеспечивает полной понятности ее, то никакие другие преимущества его не имеют значения - он не пригоден к эксплуатации.

Для непосредственного определения этой качественной характеристики есть только один метод: статистический с участием большого количества операторов (слушателей и дикторов). Разработан косвенный, количественный метод определения понятности речи через ее разборчивость.

Разборчивостью речи называют относительное или процентное количество принятых элементов речи из общего числа переданных по тракту. Элементы речи - это слоги, звуки, слова, фразы (команды), цифры. Соответственно этому есть слоговая, звуковая, словеснаяг смысловая и цифровая разборчивость. В практике используют преимущественно слоговую, звуковую и словесную разборчивость. Для измерений разборчивости разработаны специальные таблицы слогов,

звукосочетаний и слов с учетом их встречаемости в русской речи (аналогичные таблицы есть и для других языков). Звуковых таблиц нет, так как звуки, кроме гласных, отдельно не произносятся, а для измерений звуковой разборчивости пользуются слоговыми таблицами или таблицами звукосочетаний. Все эти таблицы называют артикуляционными.

Измеряют разборчивость с помощью группы тренированных слушателей и дикторов, называемой артикуляционной бригадой, поэтому метод измерений называют артикуляционным. Тренировка бригады необходима, так как иначе результаты измерений некоторое время будут расти при неизменных условиях, по мере натренированности артикулянтов. Тренировку проводят до тех пор, пока артикулянты не будут давать стабильные результаты при заданных условиях измерений. Дольше всего артикулянты тренируются на слоговых таблицах. Бригаду составляют из молодых людей без нарушений слуха и речи.

Артикулянты дают наибольшие возможные значения разборчивости речи в заданных условиях работы тракта. Поэтому для определения связи между разборчивостью, измеренной артикулянтами, и понятностью речи для обычных абонентов в тех же условиях были проведены массовые испытания. В этих испытаниях участвовали самые разнообразные люди из числа потенциальных абонентов общим числом более 2000 человек. Были взяты самые разнообразные тракты с различными условиями их работы. Разговор велся по специальным разговорникам в обе стороны, как при телефонных переговорах. При этом контролировалось понимание абонентами друг друга. Оценка ставилась по пятибалльной системе: отлично, если понятность была полная, без каких-либо переспросов; хорошо, если были отдельные переспросы редко встречающихся слов или неизвестных названий, фамилий и т. п., о которых нельзя догадаться по смыслу; удовлетворительно, если требовались частые переспросы и слушатели сообщали, что трудно разговаривать; предельно допустимо, если требовались неоднократные переспросы одного и того же материала с передачей отдельных слов по буквам с полным напряжением слуха; срыв связи, если абоненты не могли понять друг друга и отказывались от разговора. Одновременно для каждого из условий испытаний и каждого тракта были измерены величины

Таблица 10.1 (см. скан)

разборчивости речи с помощью тренированной бригады. В табл. 10.1 приведены градации понятности речи и соответствующие им величины разборчивости. Одновременно с указанными испытаниями были измерены статистические зависимости между слоговой, словесной, звуковой и смысловой разборчивостью для русской речи.

Кроме этого, был разработан ускоренный метод измерения разборчивости речи - метод выбора. Он основан на следующем. Каждая таблица составлена из нескольких групп слов. В каждой группе подобраны слова, по звучанию сходные между собой. Диктор передает из каждой группы только одно слово. Слушатели имеют перед собой таблицу и должны отметить то слово, которое, по их мнению, было передано. Чередование слов изменяется в случайном порядке. Определяется процент правильно принятых слов. Между количеством принятых слов по этому и артикуляционному методам установлена статистическая связь. Этот метод не требует длительной тренировки слушателей, но точность его ниже артикуляционного.

Зависимость между понятностью речи и ее разборчивостью, приведенная в табл. 10.1, справедлива, когда идет прием самой разнообразной информации. В тех же случаях, когда идет обмен информацией с гораздо меньшим объемом (т. е. при ограниченном словаре), понятность речи будет выше, чем в общем случае при той же разборчивости речи. Например, для диспетчерской связи полная понятность речи получается при слоговой разборчивости речи около 40%, что соответствует удовлетворительной понятности в общем случае. Поэтому при расчете устройств, подобных диспетчерской связи, ориентируются на меньшие величины разборчивости речи, чем при расчетах систем широкого

применения. Но в каждом случае необходимо предварительно знать величину разборчивости, при которой будет полная понятность передаваемой информации.

Loading...Loading...