Msspeech sr ru ru tele msi

Msspeech sr ru ru tele msi

В этой статье я расскажу вам, как можно быстро и безболезненно установить на свой компьютер или ноутбук русский голосовой пакет, а проще говоря, установить на вашу операционную систему русскоязычный пакет файлов, чтобы ваш девайс мог разговаривать томным грудным голосом (ну или низким хриплым басом, кому как больше нравится:)).

Дело в том, что по умолчанию, после установки операционной системы на компьютер (ноутбук), у вас будет стоять только англоязычный пакет файлов. То есть некая мисс или миссис Анна может без труда прочитать вам какой-либо текст на английском языке, но вот русского языка она, увы, не знает.

Чтобы убедиться в этом, откройте в Виндоус 7 Панель управления — Распознавание речи – Преобразование текста в речь. Там у вас будет только одна строка голосового пакета — Microsoft Anna — English (United States).

Чтобы увеличить изображение, нажмите на картинку.

Как видно из рисунка, так оно и есть.

Для чего же нужно устанавливать на ноутбук русский голос? Собственно говоря, если вам только сейчас пришла в голову подобная мысль, то скорей всего, русский голос вам не нужен. По крайней мере, в настоящее время. Но в целом, это довольно полезная вещь. Например, вы хотите, чтобы перед сном вам почитали сказку (можно для взрослых ). Но самому читать лень или просто за целый день устали и болят глаза. В таком случае можно просто открыть необходимый текст в специальной программе (читалке) и дальше … просто наслаждаться чтением. Можно с закрытыми глазами. Голосовые файлы используют множество программ – читалки, говорилки, синтезаторы речи и т. п. программы.

Итак, где же скачать русский голос для Windows 7?

Допустим, мы установили на компьютер программу для чтения «Балаболка». Но вот не хочет она зараза читать совершенно русский текст, хоть ты тресни. Английский понимает, а с русским языком у неё проблемы.

Что делать в таком случае? Ответ прост – установить языковый голосовой пакет файлов для Виндоуз 7 (подойдут они, кстати, и для Windows XP, и для Виндоус Виста и т.д.).

Для работы синтезатора речи установим следующие компоненты от корпорации Майкрософт.

Сначала со страницы http://www.microsoft.com/en-us/download/details.aspx?id=27225 установим компонент API, то есть набор функций для программ.

На странице представлены два вида файлов — для 32-битных и 64-битных версий Windows. (Чтобы их увидеть, нажмите красную кнопку Download). Я выбрал файл x86_SpeechPlatformRuntimeSpeechPlatformRuntime.msi размером 2.2 MB, поскольку у меня установлена именно 32-разрядная версия ОС.

Закачка файла начнется автоматически. Далее идем на страницу Microsoft Speech Platform Runtime Languages – набор языков для серверной части http://www.microsoft.com/en-us/download/details.aspx?id=27224 и скачиваем там два файла – модуль распознавания речи (начинается с «MSSpeech_SR_») и компьютерный голос (начинается с «MSSpeech_TTS_»).

Среди множества различных языков выбираем русский. Русским голосом у нас говорит Елена. Вот эти два файла:

Читайте также:  Как узнать версию битрикс

— MSSpeech_SR_ru-RU_TELE.msi размером 17.2 MB и

— MSSpeech_TTS_ru-RU_Elena.msi размером 6.2 MB.

Total Size: 23.4 MB

После их загрузки запускаем и устанавливаем все три свежескачанных компонента системы. Перезагрузку системы можно и не делать.

Как проверить установился ли новый языковый пакет? Для этого открываем, например, программу «Балаболка». У меня есть версия Balabolka Portable 2.8.0.557.

Смотрим в ней Настройки – Голос, там должен появиться наш новый русский голос.

Как видно на скриншоте, у нас появился новый голос Microsoft Server Speech Text to Speech Voice (ru-RU, Elena).

Ну и традиционный анекдот напоследок.

В переполненное маршрутное такси залазят парень с девушкой. Парень отсчитал кучу мелочи и передал людям, чтобы те передали водителю. В это же время в маршрутке кто-то громко спустил воздух.

Водила в голос говорит: Ё-маё! Кто это так ДАЛ?!

Парень, который платил за проезд, кричит в ответ: Это я так ДАЛ, за себя и за девушку!

Всем удачи! Не забываем нажимать на кнопочки социальных сетей слева – вам нетрудно, а мне приятно;).

  • Kinect for Windows SDK. Часть 1. Сенсор
  • Kinect for Windows SDK. Часть 2. Потоки данных
  • Kinect for Windows SDK. Часть 3. Функциональные возможности
  • Играем в кубики с Kinect
  • [Программа, апорт!]

В прошлой статье я затронул тему работы с Microsoft Kinect for Windows и продемонстрировал возможности сенсора на примере игры в кубики. Напомню, что трекинг человеческой фигуры (skeleton tracking) не единственная возможность сенсора, и сегодня мне бы хотелось рассказать о распознавании речи.

Для знакомства с Microsoft Speech Platform мы напишем простое приложение, в котором произвольный объект (например, танчик) будет перемещаться по плоскости. Я не стал добавлять голосовые команды в предыдущий пример по двум причинам. Во-первых, хронологически этот пример появился раньше. А, во-вторых, хотелось сконцентрироваться в каждом примере на отдельной функциональности (такой код проще изучать).

Определим, какие пакеты пригодятся нам:

  • Microsoft Speech Platform — SDK. Необходимый пакет. Это платформа и инструментарий для начала работы с распознаванием речи.
  • Microsoft Speech Platform — Runtime Languages. Опциональный пакет. По умолчанию, в SDK входит только библиотека для распознавания английской речи. Вы можете скачать дополнительные библиотеки для работы с другими языками.
  • Microsoft Kinect for Windows — SDK. Опциональный пакет.

Открою страшную тайну, наличие сенсора не является обязательным условием для возможности распознавания речи. Speech Platform развивается независимо от Kinect, но в тоже время в Kinect SDK вы обязательно найдете примеры с реализацией распознавания речи. Наш пример будет работать как с сенсором, так и с обычным микрофоном.

В первую очередь необходимо понимать, что же собственно программировать. Последовательность действий чрезвычайно проста:

  1. выбрать обработчик (engine) распознавания из доступных в системе для требуемого языка;
  2. создать словарь команд и передать его в полученный обработчик;
  3. установить для обработчика источник аудиосигнала. Это могут быть Kinect, микрофон, аудиофайл;
  4. дать команду обработчику для начала распознавания.
Читайте также:  Как в кореле сделать черно белое изображение

Теперь в Visual Studio создадим новый проект WPF Application. Я буду писать на C#.

Начнем с того, что попытаемся найти подключенный сенсор. Класс KinectSensor предоставляет такую возможность с помощью свойства KinectSensors:

Обработчик распознавания речи – класс SpeechRecognitionEngine, его статический метод InstalledRecognizers() помогает получить информацию обо всех установленных в системе обработчиках.

Нетрудно догадаться, что таким образом мы получаем информацию об обработчике распознавания английской речи (RecognizerInfo), если такой обработчик есть. Метод InstalledRecognizers не возвращает экземпляров обработчиков, а лишь информацию о них. Поэтому следующим шагом будет создание экземпляра обработчика. Просто передаем в конструктор идентификатор обработчика:

Теперь подумаем вот о чем. Нам нужно управлять объектом на плоскости. Какие команды подойду для этого? Думаю, что 4 команд достаточно: UP (вверх), DOWN (вниз), LEFT (влево), RIGHT (вправо). И для разнообразия можно добавить пятую команду EXIT (выход). Замечу, что я писал код для распознавания команд на английском языке, но вы можете выбрать любой другой из 54х доступных. Создаем словарь команд и загружаем его в обработчик распознавания.

В объекте типа Choices создается список слов (команд) для распознавания. Следующим шагом создается объект грамматики, связанный с культурой команд, и далее грамматика загружается в обработчика распознавания.

Каждое сказанное вами слово, обработчик сравнивает с шаблонами слов в грамматике, чтобы определить, не произнесли ли вы какую-нибудь команду. Но помните, что каждая попытка распознавания сопровождается некоторой вероятностью ошибки, чуть дальше вы увидите это на примере.

Теперь можно определить обработчики для событий распознавания речи. Для нас важно обработать событие SpeechRecognized возникающее, когда обработчик распознавания находит в словаре соответствие произнесенной команде. В объекте SpeechRecognizedEventArgs нам доступно свойство Result в котором можно найти: распознанное слово, величину вероятности того, что слово распознано правильно и многое другое. Два других события SpeechHypothesized и SpeechRecognitionRejected представляют интерес скорее для отладки, нежели для реального использования. Первое событие возникает, когда обработчик распознавания делает предположение распознавания. Второе,- когда обработчик распознавания может определить слово лишь с малой долей вероятности.

Нам осталось только установить источник аудиосигнала и начать распознавание. Здесь хочется отметить особенность Kinect. Аудиопоток готов для работы примерно через 4 секунды после инициализации. Это стоит учитывать и, например, создавать таймер, чтобы запускать распознавание с 4-х секундной задержкой.

Помните, я в начале говорил, что наш код будет работать как с Kinect так и с обычным микрофоном? Для того, чтобы это реализовать достаточно правильно установить источник аудиосигнала.

Что касается UI, то здесь все просто. Рисуем объект любой формы (это может быть даже картинка), я нарисовал танк.

И добавляем анимацию для перемещения. Конечно, чтобы не создавать комичных ситуаций, когда танк движется «боком», я добавил еще и анимацию для разворота в нужную сторону. Пример анимации для выполнения команды LEFT (налево):

Читайте также:  Как сделать кроссворд в ворде 2010

Распознавание в действии:

Файлы исходного кода и скомпилированную версию вы найдете в конце статьи. Обратите внимание, что если вы запускаете скомпилированный пример без установленного Speech SDK, вам необходимо установить Microsoft Speech Platform Runtime и обработчик распознавания английского языка MSSpeech_SR_en-US_TELE.msi

Подводя итог скажу, что Microsoft Speech Platform действительно большой и интересный продукт, я коснулся лишь его малой части. Интересующимся я бы посоветовал посмотреть примеры работы с этой платформой в Kinect SDK, мне кажется это хорошая отправная точка.

В заключение хочется поблагодарить компанию VIAcode за предоставленный для экспериментов сенсор.

Здесь я привожу пример обработки, в которой доступно показано, как можно сделать озвучку любого текста из 1С с минимальными знаниями в программировании и сильно урезанным бюджетом.

В Windows уже есть встроенный синтезатор речи SAPI 5, но он говорит только на английском, а русскую версию я сразу не нашел, поэтому устанавливаем от того же Microsoft другую версию синтезатора речи.

Microsoft Speech Platform — набор инструментов, позволяющих разработчикам строить решения с распознаванием голоса и перевода голоса в текст. Текущая версия 11.0 платформы предлагает голоса для 26 языков, включая русский.

Для работы синтезатора речи необходимо загрузить и установить следующие компоненты Microsoft Speech Platform:

  • Microsoft Speech Platform — Runtime – серверная часть платформы, предоставляющая API (набор функций) для программ (файл с именем "SpeechPlatformRuntime.msi" для 32-битных и 64-битных версий Windows).
  • Microsoft Speech Platform — Runtime Languages – набор языков для серверной части. Для каждого языка доступны для скачивания модули для распознавания речи (файлы, чьи имена начинаются с "MSSpeech_SR_") и компьютерные голоса (файлы, чьи имена начинаются с "MSSpeech_TTS_").

В списке голосов присутствует и русский голос Elena (файл с именем "MSSpeech_TTS_ru-RU_Elena.msi", размер 6 МБ).

Платформа поддерживает Windows XP , Windows Vista, Windows Server 2008 и Windows 7. На остальных не проверял.

Устанавливаем все эти компоненты из приложенного архива. Открываем 1С, запускаем обработку либо для управляемых, либо для обычных форм. Пишем текст, слушаем звук. Наличие звуковой карты и колонок или наушников обязательно.

UPD:

Нашел для SAPI5 отличный движок, который умеет говорить на русском и английском, с интонацией и женским голосом, а зовут это чудо Милена. Файл движка очень большой, поэтому выложен отдельно. По качеству гораздо лучше, чем предлагаемый выше Elena.

Прямая ссылка на движок Милена: https://dl.dropboxusercontent.com/u/94504750/Russian_Milena.rar

Переработан интерфейс обработки для возможности выбора типа синтезатора и голоса.

Подключение компоненты синтезатора речи осуществляется через COM объект.

КомпонентаСинтезатораРечи = Новый COMОбъект("SPEECH.SpVoice");

КомпонентаСинтезатораРечи .Speak("Привет, как дела?");

Дополнение от Kashemir:

Для асинхронного (фонового) выполнения второй параметр нужно установить в 1.

Пример: КомпонентаСинтезатораРечи.Speak("Привет, как дела?", 1 )

Ссылка на основную публикацию
Hp com go techcenter pcdiags что делать
You may not be able to visit this page because of: an out-of-date bookmark/favourite a search engine that has an...
Bright starts хохотунчики как поменять батарейку
Данный товар недоступен для доставки в Ваш регион Мы всегда стремимся к лучшему, чтобы радовать своих покупателей самыми выгодными ценами....
Cdfs как открыть на windows 7
0 расширения(ы) и 1 псевдоним(ы) в нашей базе данных Ниже вы можете найти ответы на следующие вопросы: Что такое .cdfs...
Ibridge 3 не видит компьютер
Leef iBridge 32GB (LIB000KK032R6) При подключении Leef iBRIDGE iPAD не видит это устройство. ЧТО ДЕЛАТЬ? Ответы 1 Пробуйте разные компьютеры,...
Adblock detector