Распознавание речи windows 8. Включение и выключение автоматического распознавания речи. Перевод аудио в текст

Друзья, на днях мы рассматривали одно из новшеств, привнесённых в Windows 10 обновлением Fall Creators Update – . Поддержку голосового ввода на русском языке компания Microsoft обещает в будущем, но не уточняет, близко или далеко это будущее обозримо. Возможно, это будет тогда, когда и Кортана сможет говорить, а главное, понимать по-русски. Ждать, пока Microsoft научит Windows 10 понимать наших не стоит. Если чего-то нет в среде самой системы, это практически всегда можно реализовать за счёт сторонних программных средств. Собственно, о них мы и будем говорить в этой статье. Ниже рассмотрим различные способы, как можно с помощью встроенного в ноутбук или подключённого к ПК микрофона вводить голосом поисковые запросы и надиктовывать текст документов.

1. «Ок, Алиса» и голосовой поиск Google для поисковых запросов

Непонятно, почему компания Google до сих пор не интегрировала эту технологию в интерфейс YouTube. Но в любом случае видеоролики можно искать в самом поисковике, проговаривая ключевые запросы. Просто затем нужно будет в результатах выдачи переключаться на вкладку «Видео». Львиная доля поисковых выдач по известным причинам всё равно будет с YouTube.

Успевшим уже познакомиться с – и вовсе не нужно отправляться на сайт поисковика в окне браузера. После установки программы поисковое поле Яндекса с возможностью голосового ввода запросов появится прямо на панели задач Windows. А на редкие несложные вопросы Алиса сможет ответить и без поисковика, не выходя за пределы своего диалогового окошка.

2. Веб-сервис Web Speech API от Google

У технологии Web Speech API, посредством которой в поисковике Google реализован голосовой ввод запросов, есть свой веб-интерфейс по адресу:

https://www.google.com/intl/ja/chrome/demos/speech.html

Функционал сервиса миинималистичен: в нём присутствует кнопка включения микрофона и результирующее поле, где затем будет отображаться распознанный текст.

Но в этом результирующем поле нельзя вносить правки. По итогу получим результаты распознавания как есть. И сможем отредактировать их только в каком-то текстовом редакторе или форме ввода данных. Кнопка ниже результирующего поля «Copy and Paste» завершает текущую сессию ввода и на весь распознанный текст автоматически ставит блок выделения. Так сделано для удобства копирования в буфер.

Для распознанного текста доступна ещё одна возможность, реализованная кнопкой создания электронного письма. Она запускает почтовый клиент, установленный в среде Windows таковым по умолчанию, создаёт новое письмо и переносит в него распознанный текст.

Примечательно, что Web Speech API может распознавать некоторые знаки препинания, как минимум точку и запятую. Так что во время диктовок в местах вставки точек и запятых их можно просто проговаривать.

Отсутствие возможности редактирования текста внутри результирующего поля делает использование интерфейса Web Speech API не совсем удобным для больших объёмов набора текста. Для длительных диктовок лучше использовать веб-интерфейс сервиса «Google Документы», в который технология Web Speech API встроена. В «Google Документах» можно и вводить текст голосом, и тут же править его, и ещё попутно форматировать документ.

3. «Голосовой блокнот» на Speechpad.Ru

На базе технологии Web Speech API работает ещё сайт - самый популярный и самый функциональный в Рунете сервис голосового ввода данных «Голосовой блокнот». В числе основных его функций:

  • Поддержка нескольких языков, включая русский и украинский;
  • Результирующее поле распознавания голоса с возможностью правки текста, его перевода на другие языки, выгрузки результатов в TXT-файл;
  • Вывод распознанных фраз в буфер обмена;
  • Транскрибация;
  • Интеграция в веб-формы Chromium-браузеров;
  • Интеграция в среду Windows и Linux.

Плюс к этому всему, в «Голосовом блокноте» опция ввода голоса включается и отключается только по нажатию соответствующей кнопки. Эта опция не деактивируется сама по себе, как только мы на время призадумаемся в поисках точной формулировки мысли, как это происходит в прочих сервисах на базе Web Speech API.

И отслеживаем в результирующем поле распознанный текст.

4. Интеграция Speechpad в веб-формы браузера

После внедрения этого расширения в контекстном меню веб-форм ввода текста появится пункт «Speechpad». Жмём эту кнопку и говорим в микрофон. Таким образом можем, например, надиктовывать заметки в Google Keep.

5. Интеграция Speechpad в среду Windows

Возможности веб-сервиса «Голосовой блокнот» можно интегрировать в среду Windows. И осуществлять набор текста голосом в любой программе операционной системы – штатном блокноте, Microsoft Word, прочих текстовых редакторах. Распознанная речь без посредничества веб-сервисов или буфера обмена будет вставляться прямо в редактируемые документы. Однако такая функция Speechpad.Ru не бесплатна, и стоит она 100 руб. в месяц. Предусматриваются варианты экономии: при оплате услуг сразу за квартал стоимость будет составлять 250 руб., а предоплата за год обойдётся в 800 руб. Каждый зарегистрированный пользователь может прежде протестировать интегрированный в среду своей операционной системы функционал сервиса. Создатели Speechpad.Ru предлагают двухдневный тестовый период бесплатно. Как непосредственно осуществляется интеграция «Голосового блокнота» в операционные системы, в частности, в Windows, подробно описывается на сайте самого Speechpad.Ru. Кликаем знак вопроса возле опции интеграции.

И проходим все описываемые в инструкции шаги:

  • Устанавливаем вышеупомянутое расширение сервиса;
  • Скачиваем пакет файлов интеграции;
  • Распаковываем архив и запускаем файл install_host.bat;
  • На сайте Speechpad.Ru заходим в кабинет пользователя;

Жмём кнопку «Включить тестовый период».

И так каждый раз, когда нужно активировать голосовой ввод. Вот, собственно, и всё. Теперь можно открывать Microsoft Word, LibreOffice Writer, прочие текстовые редакторы и начинать диктовку. Распознанный текст будет появляться в окне любого активного приложения, поддерживающего ввод данных.

Важно: чтобы использовать интегрированный в систему Speechpad, нельзя закрывать вкладку его сайта в окне браузера. Закрытие последней деактивирует голосовой ввод.

5. Бесплатные альтернативы интеграции голосового ввода в среду Windows

Какие могут быть бесплатные альтернативы интеграции в среду Windows русскоязычного голосового ввода данных?

Вариант №1

Совершенно бесплатно на сайте Speechpad.Ru можно использовать опцию вывода распознанной речи в буфер обмена. Жмём на сайте кнопку «Включить запись» и перемещаемся в любое приложение Windows.

Теперь можем проговаривать отдельные фразы и вставлять их из буфера клавишами Ctrl+V. Как только сделаем паузу в речи, услышим писк Speechpad, свидетельствующий о том, что фраза распознана и скопирована в буфер обмена. Такой способ работы с голосовым вводом имеет свои преимущества: при вставке отдельных фраз можно попутно редактировать текст начисто.

Вариант №2

Работающим с приложениями офисного пакета компания Microsoft может предложить свою наработку по внедрению голосового ввода – надстройку Dictate, интегрирующую в Word, Outlook и PowerPoint дополнительную вкладку меню с инструментом распознавания речи. Надстройка может распознавать речь на 20 языках, включая русский, и позволяет попутно переводить текст на 60 языков.

Ещё один бесплатный способ голосового ввода текста – запись речи в аудиофайл с дальнейшей автоматической транскрибацией (расшифровкой в текст). Далеко на каждый может сразу изложить свои мысли структурированным литературным языком, да ещё и попутно править ошибки распознавания, проставлять знаки препинания. При записи же речи на диктофон можно полностью сконцентрироваться на сути излагаемого материала, а в процессе транскрибации уже всю концентрацию внимания направить на красноречие и грамотность подачи этого материала. Но, друзья, автоматизация транскрибации аудиозаписей – это тема уже другой, отдельной статьи.

Продолжение в статьях:

Что вы будете делать, если вы устали от ручного ввода данных, запускать программы, написать по электронной почте и делать другие вещи в вашей Windows 8/8 .1 на компьютере?Возможно, вам нужно будет сделать перерыв и начать делать задания снова.Почему Вы не включите распознавание речи Windows,чтобы помочь вам реализовать все эти операции?Распознавание речи в Windows позволяет вам делать всё,что можно сделать с помощью мыши и клавиатуры,голосом. И если вы беспокоитесь о том,где вы можете найти распознавание речи в Windows в компьютере,этот пост покажет вам 3 способа, чтобы включить распознавание речи в Windows , и расскажет,как его отключить.

1.Три способа включения распознавания речи в Windows 8/8 .1:

Способ 1 : Включите распознавание речи в панели управления.

Шаг 1: Откройте меню быстрого доступа с помощью сочетания клавиш Windows key+X и затем выберите Панель Управления .

Шаг 2: в панели управления выберите Легкость доступа чтобы войти в него.

Шаг 3: Как только вы щёлните на легкость доступа, откроется окно, выберите Запуск распознавания речи под вариантом распознавание речи.

Способ 2 : Откройте распознавания речи в » Приложения» на экране.

Шаг 1. на начальном экране (или интерфейс Metro), правой кнопкой нажмите на значок или в любой пустой области и в нижнем правом углу выберите Все приложения .

Шаг 2: на экране приложений, найдите Распознавание Речи Windows и откройте его с помощью мыши.

Способ 3 : Включите его через панель поиска.

Шаг 1: Откройте панель поиска с помощью клавиш ключей Windows+F ивведите в пустое поле распознавание речи и выберите в списке поиска Приложения .

Шаг 2: слева от панели поиска, когда появятся результаты поиска, можно выбрать Распознавание речи Windows .

2.Два способа, чтобы выключить распознавание речи в Windows 8/8 .1

Метод 1 : Выбрать кнопка закрытия в окне распознавание речи, чтобы выключить его.

Способ 2 : Использование ключ Alt+F4 чтобы закрыть его.

Теперь вы можете чувствовать себя свободно исследуя функцию распознавания речи в Windows 8/8 .1.

Управление с помощью сенсорного экрана — это уже стандарт. Новейшие системы, такие как Windows 8 «понимают» голосовые команды.Распознавание речи должно привести к тому, что наша связь с компьютером будет еще проще, интуитивнее и… естественнее. Я расскажу как это выглядит на сегодняшний момент.

Немного истории — как развивалось общение с машиной

Способы общения с компьютером развивались на протяжении многих лет. Первым интерфейсом, через который человек мог давать команды были перфокарты, которые восходят к 1832 году. Они использовались в машинах для производства ткани. Клавиатуру же начали использовать в 1960 году. Два десятилетия спустя присоединилась стандартная мышь и используется по сей день. Хотя мышь поделилась полномочиями с трекпадом, но она все еще самый популярный вид управления. Благодаря смарфонам и планшетам стал очень популярным сенсорный интерфейс и жесты, которые используются, в частности,для управление Xbox 360 Kinect. После сенсорных экранов и жестов, идет голосовое управление, но это решение до сих пор было так слаборазвито, что порой о ней и не услышишь.

Настройка распознавания речи в Windows 8

К сожалению, голосовое управление пока не доступно на русском языке. Поддерживаются пока английский, французский, немецкий, японский, корейский, китайсий и испанский языки. Microsoft решила сосредоточиться на крупнейших и наиболее развитых странах, но не исключено, что в течение некоторого времени он добавит эту функции и для нашей страны. Если попробовать запустить, вот так ругается

Если вы все еще хотите протестировать это решение, необходимо настроить систему(изменить язык) и выучить пару слов на английском. Чтобы сделать это, необходимо перейти в панель управления, и выбрать пункт Язык. Если у вас нет другого языка, кроме русского, необходимо нажать кнопку «Добавить язык», а затем выбрать один из поддерживаемых языков. В нашем случае это «Английский (США)». Видим, что доступна только раскладка на этом языке, два раза кликаем, пойдет проверка доступности языка для интерфейса, после проверки нажимаем «Загрузить и установить языковой пакет», и пойдет процесс, терпеливо ждем когда загрузится. Как только этот процесс завершится, установите английский языком по умолчанию

Теперь нужно перейти на начальный экран Windows 8 (плиточный), в поиск ввести «Windows Speech Recognition» и нажать Enter.

Таким образом, вы можете запустить инструмент распознавания голоса. При первом запуске он предложит настроить микрофон, после выбора, что нибудь скажите, чтобы проверить.

Далее предложить пройти обучающие уроки. Они длятся до 15-20 минут, но очень полезны и содержат основные сведения об использовании функций. Но если вы в английском не сильны, я думаю не стоит тратить время, трудно будет что-либо разобрать, сразу в бой

Как работать

Для того чтобы компьютер начал распознавать вашу речь необходимо сказать «start listening» (что означает начать слушать), или нажмите кнопку микрофона для запуска режима прослушивания. Теперь можно открыть приложение или просто диктовать слова в текстовый редактор, строку браузера или поиска

Что мы можем делать

В принципе возможности огромны, кроме стандартных слов можно создавать свои команды. Основные возможности приведены в таблице

Действие Что сказать
Выберите любой элемент по его имени Click File,Start,View
Выберите любой элемент или значок Click Recycle Bin,Click Computer,Click(название файла)
Дважды нажмите или дважды щелкните любой элемент Double-clickRecycle Bin,Double-click Computer
Переключение между открытыми приложениями Switch to Paint,Switch to WordPad

Прокрутка

Scroll up; Scroll down;
Scroll left; Scroll right

Включить новый пункт или новую строку в документе

New paragraph; New line

Выберите слово в документе

Корректировка слова

Correct word

Выберите и удалите определенные слова

Показать перечень применимых команд

Refresh speech commands

Включите режим прослушивания

Отключите режим прослушивания

Свернуть микрофон

Minimize speech recognition

Посмотреть Windows, справки и поддержку

How do I do something?
Например:How do I install a printer?

Если вы не знаете, как произносится фраза, я предлагаю вам использовать Google Translate или http://училочка.рф (этого сайта он лучше понимал)

Было у меня желание записать свои команды состоящих из простых буржуйских слов. Которые я могу выговорить. Так он мне и не дал этого сделать, не сумел запустить редактор команд. В итоге он отлично понимал мое произношение слов One, Two и Open. Этим набором можно запустить приложение по номеру в начальном экране. Сначала сказать номер, потом сказать OPEN. Не густо конечно, но я считаю эксперимент удавшимся. Было бы не плохо, если бы Microsoft ввел русский язык, хорошая замена пульту дистанционного управления.

Благодаря распознаванию речи в Windows использование клавиатуры и мыши не является обязательным. Вместо этого, вы можете управлять компьютером с помощью голоса и диктовать текст.

Примечание : распознавание речи доступно только на следующих языках: английский (США и Великобритания), французский, испанский, китайский, мандаринский (упрощенный и традиционный китайский) и немецкий.

Настройка распознавания речи в Windows 8.1

Прежде чем можно будет использовать распознавание речи, вы должны выполнить несколько действий. Сначала нужно настроить микрофон . Затем можно обучить компьютер распознавать этот голос.

Чтобы настроить микрофон

Перед настройкой распознавания речи, убедитесь, что микрофон подключен к компьютеру.

  1. В поле поиска введите текст Настройка микрофона Настройка микрофона .
  2. Следуйте инструкциям, появляющимся на экране.

Примечание : Если это возможно, используйте микрофон гарнитуры из-за меньше вероятность перехвата фоновых шумов.

Как обучить компьютер распознаванию речи

Функция распознавания речи используется специальный профиль, чтобы распознать Ваш голос и голосовые команды . Чем чаще вы используете распознавания речи, тем более детальным становится Ваш профиль голосовых команд, благодаря чему компьютер лучше Вас понимает.

  1. Панель Поиск также можно открыть при помощи клавиатуры, нажав клавиши Win + Q .
  2. В поле поиска введите текст Распознавание речи , а затем нажмите клавишу или выберите пункт Распознавание речи .
  3. Нажмите кнопку Научить компьютер .
  4. Следуйте инструкциям, появляющимся в процессе обучения распознаванию голоса.

Использование распознавания речи

С помощью голоса можно выполнять несколько задач, например, заполнять формы в режиме онлайн или вводить буквы. Когда вы говорите в микрофон, распознавание речи меняет произносимые слова в текст, отображаемый на экране.

Для того, чтобы диктовать текст с помощью распознавания речи Windows 8.1

  1. Быстро сдвиньте палец внутрь от правого края экрана, а затем нажмите панель Поиск. (Если вы используете мышь, выберите в верхний правый угол экрана, переместите указатель мыши вниз, а затем выберите панель Поиск).
  2. Панель Поиск также можно открыть при помощи клавиатуры, нажав клавиши Win + Q .
  3. В поле поиска введите текст распознавание речи , а затем нажмите клавишу или выберите пункт Распознавание речи Windows .
  4. Скажите «начать слушать» или нажмите кнопку на микрофоне, чтобы активировать режим прослушивания.
  5. Откройте приложение, которое вы хотите использовать или выделите текстовое поле, для которого вы хотите диктовать текст.
  6. Произнесите текст, который вы хотите диктовать.

Чтобы исправить ошибки

  • Ошибки можно исправлять тремя разными способами.
    • Чтобы исправить последнюю произнесенную фразу, скажите – «пожалуйста, исправьте это».
    • Чтобы улучшить одно слово, скажите «Исправить», а затем произнесите слово, которое необходимо исправить. Если слово повторяется несколько раз, все его экземпляры будут выделены, и вы сможете выбрать экземпляр, который вы хотите улучшить.
    • В диалоговом окне Панель альтернатив произнесите номер соответствующего элемента, а затем произнесите ОК .

Чтобы добавить или изменить слова в Словаре

С помощью Словаря речи Windows 8.1 можно добавлять свои собственные слова, заблокировать возможность диктовать определенное слово, улучшить слово в словаре или удалить его.

  1. Быстро сдвиньте палец внутрь от правого края экрана, а затем нажмите панель Поиск. (Если вы используете мышь, выберите верхний правый угол экрана, переместите указатель мыши вниз, а затем выберите панель Поиск).
  2. Панель Поиск также можно открыть при помощи клавиатуры, нажав клавиши Win + Q .
  3. В поле поиска введите текст распознавание речи , а затем нажмите клавишу или выберите пункт Распознавание речи Windows .
  4. Скажите «начать слушать» или нажмите на кнопку микрофона, чтобы активировать режим прослушивания.
  5. Скажите «Открыть Словарь речи» и выполните одно из следующих действий:
    • Чтобы добавить слово в словарь, скажите «Добавить новое слово», а затем следуйте инструкциям на экране.
    • Чтобы предотвратить диктовку определенного слова, скажите «Запретить диктовку слова», а затем следуйте инструкциям на экране.

Управление компьютером с помощью распознавания речи

Примечание : Каждый раз, когда нужно проверить, какие команды можно использовать, скажите: «Что я могу сказать?»

Чтобы... Скажите это...

Открыть экран запуска

Открыть панель панель функций

Открыть панель Поиск

Показать все приложения

Приложения

Начать работу с приложением

Щелкните правой кнопкой мыши и скажите Windows С

Использовать приложения

Скажите, что вы хотите сделать. Например, измените на градус по Цельсию в приложении Погода.

Выбрать любой элемент, используя его имя

Скажите Файл; Пуск; Вид

Выбрать любой элемент или значок

Скажите Корзина; Скажите Компьютер; Скажите имя файла

Дважды щелкнуть на элементе

Дважды щелкните Корзину; Дважды щелкните Компьютер; Дважды щелкните имя файла

Перейти к открытому приложению

Отсылка к Paint; Перейти к WordPad; Перейти к название программы; Перейти к приложению

Прокрутить в нужном направлении

Выполните прокрутку вверх; Прокрутите вниз; выполните Прокрутку влево; выполните Прокрутку вправо

Вставить новый абзац или строку в документе

Новый абзац; новая строка

Выделить слово в документе

Установите выражение

Выделить слово и начать его исправлять

Исправьте выражение

Выделить и удалить конкретные слова

Удалить выражение

Показать список команд, которые можно выполнить

Что я могу сказать?

Обновление списка доступных команд речи

Обновить речевые команды

Включить режим прослушивания

Начните слушать

Отключить режим прослушивания

Перестать слушать

Переместить панель микрофона, функции распознавания речи

Переместите распознавание речи

Свести к минимуму панель микрофона

Свернуть распознавание речи

Просмотреть содержимое Справки и поддержки Windows, касающуюся конкретных задач

Как что-то сделать?

Скажите, например, «Как установить принтер?»

Обратите внимание, что эта команда доступна только в случае использования распознавания речи на английском языке (США).

Операционная система Windows 7 оснащена многими опциями, которые дают все больше возможностей пользователям данной системы. В нее смогли внедрить весьма интересную функцию, которая носит название «распознование речи». Но что представляет собой данная система? Об этом и пойдет разговор.

Опция, о которой идет речь, позволяет применять в приложениях всей системы абсолютно новый способ взаимодействия пользователя с компьютером. Именно система «Распознавание речи Windows 7» допускает возможность управления компьютером, не используя при этом клавиатуру, мышь и другие средства.

Хочется отметить, что данная инновация будет доступна и в других продуктах Microsoft. Эта функция была замечена немного ранее, то есть ее попытались внедрить в Windows Vista, но в седьмой версии операционной системы компании Microsoft голосовое управление выполнено на более высоком уровне по сравнению с предшественником. Если сказать проще, такая опция, как распознавание речи Windows 7 стала еще более функциональной.

Кроме всего сказанного, хочется отметить, что она имеет довольно широкий спектр применения. Пользователи Windows 7 с функцией распознания речи имеют возможность запускать программы и конвертировать все звуковые фрагменты в текст, выполнять всевозможные команды на компьютере, используя всего лишь свой голос и необходимые приспособления. Но что же нужно для того, чтобы распознавание речи Windows 7 стало реальным?

В первую очередь, вам понадобится микрофон, который следует подключить к компьютеру. Кроме этого, необходимо приобрести специальное приложение или программу, которая издается самим производителем, то есть компанией Microsoft. После того как все необходимые компоненты будут установлены, а микрофон подключен к компьютеру, следует осуществить еще определенный план работы:

  • Необходимо выполнить тестовые голосовые команды и конвертировать их в текст.
  • После того как вы проведете обучение программы распознания, нужно будет создать шаблоны разных команд своим голосом. Именно на основе данной работы компьютер сможет принимать и выполнять все заданные вами команды.

Функция распознавание речи Windows 7 используется в текстовом редакторе компании Microsoft - WordPad. Она безотказно функционирует при заполнении различных форм, а также хорошо себя проявляет в работе в Internet Explorer и при

Кроме этого, данная опция без труда отредактирует записанный ранее текст, определив специальные голосовые команды. Конечно, в процессе распознавания той или иной задачи случаются типичные ошибки (когда происходит ошибочное распознавание некоторых звуков). На этот случай в программе предусмотрен список соответствий тех или иных слов.

Функция, конечно, феноменальная, но все же здесь есть одно «но». Все дело в том, что распознавание русской речи сейчас, в принципе, недоступно. Имеются отличные версии программы для английского, французского, немецкого и японского языка. Существуют также версии для китайской, испанской и итальянской речи.

Но вот данная новинка не совсем адаптирована для русской речи. Ваш компьютер не сможет воспринимать поставленные перед ним задачи, а значит, вам будет проще написать что-то при помощи клавиатуры или же выполнить определенные задачи с помощью мыши.

Конечно, вы можете попробовать поработать с подобными русскоязычными программами или же отдать свое предпочтение английскому языку, но все же остается надеяться, что в скором времени распознавание речи на русском языке тоже будет доступно в качественном режиме. И именно тогда вы сможете опробовать на практике такую уникальную функцию. Ведь она, без сомнения, явно упрощает работу на персональном компьютере и является огромным прорывом в сфере программирования. Так что остается лишь ждать.