Распознавание речи - технология, позволяющая значительно повысить продуктивность как на работе, так и дома. Надиктовать документ можно в три раза быстрее, чем напечатать его.

Распознавание речи онлайн

Чтобы преобразовать речь в текст, можно воспользоваться соответствующим онлайн-сервисом в браузере. Сайты по распознаванию речи, как правило, не требуют регистрации и оплаты, они очень удобны в использовании. В первую очередь, потребуется установить браузер Google Chrome. Это связано с тем, что все сервисы работают на одном и том же движке распознавания речи от Гугл. Качество распознавания зависит от микрофона, а также ритма и четкости речи.

Читайте также: Включение микрофона на Windows 8

Способ 1: Speechnotes

Спичноутс - самый популярный сервис по распознаванию речи онлайн, предоставляющий большой выбор языков, расширенные возможности постановки знаков препинания и отправки надиктованного текста в сторонние приложения.

Онлайн-сервис Speechnotes

Порядок действий:

    1. Нажмите на иконку микрофона справа.
    2. Выберите «Разрешить» во всплывающем окне браузера. Слева над иконкой микрофона появится мигающий красный кружок - это означает, что запись включена.


    1. Выберите русский язык из выпадающего меню.


    1. Начните диктовать.
    2. Чтобы остановить запись, снова нажмите на иконку микрофона.
    3. Скопируйте текст в буфер обмена (А) или отправьте в сторонние сервисы, используя панель инструментов слева (B).


Для расстановки знаков препинания есть три способа:

    1. Диктовка: справа есть перечень знаков с соответствующим произношением;


    1. Набор на клавиатуре - самый быстрый способ, так как добавляет знак еще до того, как заканчивается речь. Здесь главное дождаться, пока надиктованная речь появится в буфере (см. скриншот) и только после этого нажимать кнопку, иначе знак препинания появится перед надиктованной речью, а не после;


  1. Кнопка на сайте - достаточно нажать соответствующий знак препинания в панели справа (см. пункт 1).

Результаты распознавания во многом будут зависеть от качества микрофона и диктовки. Для наилучшего результата говорить нужно медленно и четко. Это относится ко всем сервисам по распознаванию речи.

Способ 2: Speechlogger

Спичлоггер - многофункциональный сервис по распознаванию речи, с помощью которого можно не только диктовать тексты, но и переводить их на другие языки в режиме реального времени с Google Translate, а также транскрибировать аудиофайлы.

Онлайн-сервис Speechlogger

Чтобы начать запись на сайте Speechlogger, выполните следующие действия:

    1. Зайдите на сайт, прокрутите немного вниз до блока с голубым фоном и нажмите на иконку микрофона.
    2. Выберите «Разрешить» .
    3. Найдите в списке русский язык, если это необходимо.
    4. Нажмите на кнопку справа вверху, чтобы блок распознавания речи занимал весь экран (это не обязательно, но так удобнее работать).


    1. Начинайте диктовать.
    2. Текст, в котором может быть ошибка, выделяется красным цветом. Это позволяет быстрее находить неточности и исправлять их.


    1. После того, как работа закончена, снова нажмите на иконку микрофона.
    2. Выделите весь текст с помощью кнопки All (A) и скопируйте, нажав правой кнопкой мыши и выбрав «Копировать» (сочетание клавиш Ctrl+C не работает), либо воспользуйтесь панелью инструментов (B), чтобы отправить текст по электронной почте, сохранить в формате.txt, .doc, загрузить на Google Drive или распечатать.


Способы постановки знаков препинания:

    1. Диктовка: чтобы узнать, как произносить тот или иной знак препинания, наведите на него курсор - во всплывающем окне появится подсказка.
    2. Просто нажмите на знак препинания в панели, расположенной над областью для текста.


    1. Автопунктуация: на сайте можно задать настройки для автоматической постановки знаков препинания. Не очень удобный вариант, так как при каждой паузе система ставит точку, при этом русский язык слишком гибкий и многообразный - задать четкие условия для постановки определенных знаков препинания невозможно. Поэтому рекомендуется отключить эту функцию, убрав соответствующую галочку.


Дополнительные настройки расположены в верхнем левом углу.


С их помощью можно включить или отключить следующие функции:

    • Автосохранение текста: если функция включена, доступ ко всем сессиям можно получить, нажав на иконку папки в панели инструментов;


  • Выделение слов красным шрифтом;
  • Отметки времени в тексте (включены по умолчанию).

Кроме того, можно задать настройки для автопунктуации и изменить цвет фона.

Способ 3: Online Dictation

Online Dictation - удобный сервис с лаконичным интерфейсом. Основное преимущество - простота в использовании.

Онлайн-сервис Dictation

    1. Сервис автоматически определяет язык по умолчанию, настроенный в браузере. Если язык не установлен либо используется гостевая учетная запись Chrome, необходимо установить русский: выпадающий список языков расположен внизу под областью для текста.


    1. Нажмите кнопку «Start Dictation» .


    1. Разрешите использование микрофона на сайте.


    1. Начинайте диктовать. Для постановки знаков препинания используйте голосовые команды: «точка», «запятая», «вопросительный знак», «восклицательный знак», остальные знаки ставятся при помощи клавиатуры. Для начала нового абзаца действует голосовая команда «новый параграф», для перехода на новую строку - «новая строка».
    2. Закончив диктовать, нажмите «Stop Listening» .


  1. После того как текст готов, его можно:
    • Скопировать, нажав кнопку «Copy» (1);
    • Сохранить в формате.txt, нажав кнопку «Save» (2);
    • Стереть, нажав кнопку «Clear» (3).


Способ 4: SpeechTexter

Сервис по распознаванию речи СпичТекстер отличается красивым компактным дизайном и позволяет редактировать текст прямо на сайте. Форматирование сохраняется при переносе текста в сторонний редактор.«Voice Punctuation is ON» , и затем расставлять знаки препинания вручную.


    1. Для прекращения записи нажмите «Stop» .


    1. После того, как текст записан, его можно отформатировать, используя инструменты на панели, расположенной над текстом.


    1. Готовый текст можно скопировать (1), сохранить в формате.txt (2) или распечатать (3).


Код для вставки на сайт.

Совет: можно изменить свойство recognition.lang и подставить ‘ru-RU’ вместо ‘en-US’, тогда по умолчанию устанавливается русский язык.

У каждого из сервисов есть свои преимущества и недостатки. Рекомендуется попробовать поработать на каждом из них и выбрать наиболее подходящий, исходя из своих целей и предпочтений.

Появилась возможность в браузере Chrome производить голосовой ввод текста используя только ваш голос и микрофон. Эту возможность даёт сервис на сайте speechpad.ru и называется он блокнот speechpad. На этом сайте также можно переводить аудио записи и речь с видео в обычный текст.

Расширение

Имеется специальное расширение голосовой блокнот speechpad, которое устанавливается в браузер и которое работает только в браузере Google Chrome. Блокнот голосового ввода Speechpad поможет вам вводить текст используя не клавиатуру, а микрофон.

Установка

Чтобы speechpad скачать и установить на ваш браузер нужно открыть настройки в браузере хром и перейти в расширения. В самом низу нажимаем на ссылку «Ещё расширения». Откроется в браузере новое окно интернет магазин Chrome.

Speechpad.ru скачать бесплатно на браузер

В поле поиск по магазину нужно вписать «Speechpad» и нажать на клавиатуре «Enter». Находим расширение голосовой ввод текста — Speechpad.ru и нажимаем на кнопке «Бесплатно». Расширение установится и в правом верхнем углу появится соответствующий значок.

Инструкция

Нажав правой кнопкой по этому значку появится контекстное меню в котором нужно выбрать «Speechpad» и сразу после этого у вас откроется новая страница в браузере.


Запускаем голосовой ввод Chrome

На этой странице иногда нужно будет делать подтверждение на запрос разрешить использовать микрофон нужно нажать «Разрешить».


Разрешаем голосовой ввод хром

В верхней строчке будут появляться сказанные вами слова в микрофон, а вместо слов запятая, точка, вопросительный знак и восклицательный знак будут ставится знаки, . ? ! Нажав кнопку «Copy» вся строчка будет скопирована в буфер обмена и её можно будет вставит в блокнот, Word или ещё куда и там отредактировать.

Видеоуроки по использованию сервиса и расширения

На странице speechpad.ru/help.php имеются видеоуроки которые помогут вам пользоваться этим сервисом. Вы можете посмотреть такие уроки в которых рассказано и показано:

  1. Показаны основные возможности и как вводить текст используя сервис.
  2. Показаны основные элементы блокнота при работе с микрофоном.
  3. Показано как можно набранный текст перенести в другие редакторы и документы.
  4. Настройка микрофона для работы на сервисе используя функцию транскрипцию и показан пример как с ролика ютуб переделать аудио речь в текстовый документ.
  5. Объясняется как с ролика ютуб переделать аудио речь в текст если имеются звуковые помехи.
  6. Показан пример использования меток времени при переделывании аудио речи в текст.
  7. Показан пример создания титров для роликов из ютуб.
  8. Показано как зарегистрироваться и настроить сервис.
  9. Показано как вводить текст с помощью расширения.
  10. Показано как вводить текст в текстовые поля на сайтах используя расширение.
  11. Показано как произвести проверку произношения.

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

2 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

3 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, в 2018-ом году такой возможности нет. Сильно смущает тот момент, что транскрибированный файл доступен всем пользователям для скачивания, возможно это будет доработано.

Контакты разработчика (ВКонтакте, Facebook, Youtube, Твиттер, электронная почта, телефон) программы можно найти на странице его сайта (точнее, в подвале сайта):

4 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели , например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

Перевод голоса в текст позволяет создавать новые тексты за несколько минут. Если у Вас нет возможности писать статьи (книги) в большом количестве, то голосовой набор текста Вам в этом поможет. В данной статье, будет рассмотрен сервис Speechpad, который позволит Вам с помощью голоса, набирать быстро текст, и сохранять его в текстовый документ.

Зачем нужна функция перевода голоса в текст

Здравствуйте друзья! Для чего нужна функция перевода голоса в текст? Этот инструмент необходим, чтобы перевести голос в текстовый формат и сохранить готовый материал на компьютере или телефоне. Данная функция будет полезна для студентов, блоггеров, копирайтеров и так далее. Например, Вы ведёте свой блог в Интернете и хотите написать книгу (статью), для своих подписчиков. Книга пишется долго, на это может уйти много времени.

Но, голосовой сервис, поможет Вам в несколько раз упростить работу, и тем самым сэкономить Ваше время в написании текстов на клавиатуре. Перевод голоса в текст, может осуществлять сервис Speechpad. Далее мы рассмотрим его возможности более подробно.

Голосовой блокнот Speechpad онлайн

  1. Перевод голоса в текст. Эта возможность сервиса, позволяет говорить пользователю в микрофон и выводить текст на экран компьютера.
  2. Выполнение различных команд. Сервис может не только генерировать текст, но и выполнять такие команды с текстом, как ставить двоеточие, тире, скобки, восклицательные знаки и другие символы.
  3. Перевод текста. В данном случае, говоря в микрофон, Вы можете перевести текст на этом сервисе с русского на английский язык, украинский, азербайджанский и наоборот. Всего у него в распоряжении имеется одиннадцать иностранных языков для перевода.
  4. . Эта функция, помогает переводить автоматически видео (аудио) в текст. Такой инструмент, может помочь пользователям, которые зарабатывают через Интернет на транскрибации.

Перечисленные выше возможности сервиса Speechpad, помогут Вам написать текст за короткий промежуток времени.

Голосовой блокнот скачать на компьютер

Голосовой блокнот Speechpad Вы можете скачать на компьютер. Перед тем как его скачивать, нужно открыть браузер Гугл Хром и перейти на главную страницу этого сервиса. В других браузерах данный сервис работать не будет. Итак, как скачать голосовой блокнот?

Первым делом, нам нужно установить расширение голосового блокнота в Гугле. Это необходимо сделать, чтобы впоследствии успешно скачалась программа голосового ввода на компьютер.

После этого, Вам нужно скачать специальный архив, и распаковать его на компьютере. Найти этот архив Вы сможете на сайте разработчика (https://speechpad.ru/blog/windows-integration/). Когда распакуете архив с приложением голосового ввода, нажмите на файл «install host bat» и для продолжения любую клавишу на компьютере. Тогда эта программа скачается и на компьютер.

А теперь, давайте сделаем перевод голоса в текст с помощью сервиса – Speechpad. Для начала, зайдём на его официальный ресурс — speechpad.ru. Прокрутите главную страницу немного вниз, и для перевода голоса в текста «включите запись» далее разрешите использовать браузеру Ваш микрофон. (Рисунок 2).

Затем установите галочку перед словом «интеграция с OC». (Рисунок 3).

Если всё нормально, значит голосовой блокнот работает. Но, если у Вас эта опция не доступна, зарегистрируйтесь на этом сервисе, и включите тестовый период использования. В этом случае, он будет работать и взаимодействовать с Вашей операционной системой.

Чтобы перевести голос в текст, запустите одновременно текстовый редактор Ворд и указанный выше сервис. Скажите в микрофон несколько предложений для проверки. Через несколько минут у Вас в текстовом документе автоматически появится новый текст.

Или же используйте бесплатный вариант сервиса. Говорите в режиме онлайн и потом скачивайте на компьютер файл с готовым текстом.

Перевод голоса в текст блокнотом Speechpad в других ОС

Speechpad возможно использовать не только онлайн, но и можно скачать на компьютер. Есть и другие голосовые блокноты, которые скачиваются и устанавливаются на телефоны, планшеты, компьютеры и другие гаджеты. Программа перевод аудио в текст, поддерживает все операционные системы. У неё нет особых ограничений, которые помешают в работе этой программы.

Заключение

Перевод голоса в текст, это действительно лучший инструмент, который сократит Ваше время написания любой текстовой информации. В Интернете, Вы найдёте не только сервис Speechpad, который переводит звук в тексты, но и другие сервисы подобные ему.

Конечно, после сохранения, готовой информации на компьютер Вам придётся её немного редактировать. Но, эта работа занимает не так много времени, как писать от руки статьи или книгу. Поэтому, пользуйтесь вышеуказанным инструментом, и тогда у Вас получиться набирать тексты достаточно быстро!

Получайте новые статьи блога прямо себе на почту. Заполните форму, нажмите кнопку "Подписаться"

Сейчас без компьютера просто нереально обойтись в современном мире. От вас не требуется быть мастером фотошопа или профессионально монтировать видео (если это не связано с работой, конечно). Но суметь набрать какой-нибудь текст – это необходимый минимум.

№2. Web Speech API

Онлайн-программа Web Speech API по функционалу абсолютно идентична предыдущим.

Этот сервис, как и перечисленные выше, также был создан компанией Google.

Главная страница выглядит так:


В простом интерфейсе сразу очевидно, что для начала записи необходимо выбрать язык, а после нажать на микрофон.

После того как вы нажмете на значок справа, система обязательно сделает запрос на доступ.


После того как вы «дадите добро», можно сразу приступать к работе. Набирайте текст голосом, а его печатная версия будет появляться в окошке.

После окончания работы текст можно скопировать туда, куда вам необходимо (опять же таки – ctrl+C, ctrl+V).

№3. Talktyper


Не менее простая программа – это Talktyper.

Для начала работы перейдите на сайт: https://talktyper.com/ru/index.html.


Для начала работы достаточно нажать на значок микрофона справа.

В отличие от описанных выше, данный наборщик текста можно открывать с помощью любого браузера. Хотя сайт создан в США, приложение легко распознает самые популярные языки мира, в том числе и русский.

Talktyper многофункциональный: он не только набирает текст, но и ставит знаки препинания, исправляет самостоятельно ошибки. Если какое-то начитанное вами слово система не может распознать, как правильное, то оно обязательно высветится.

Кроме того, Talktyper имеет функцию перевода, а также его озвучивания.

Обратите внимание! После того как вы закончите голосовой набор текста, обязательно нажмите на стрелочку, чтобы набранный документ был перенесен в другое поле. После этого его можно будет отправить по электронной почте или скопировать в нужный файл.

Возможные проблемы при работе с программами голосового набора

Когда вы начнете использовать эти программы, то обязательно задумаетесь, как же компьютер распознает наш голос, а после еще переводит в живой текст.

Схема распознавания речи устройством выглядит так:

Весь процесс можно разделить на 3 главных этапа:

    Акустический распознаватель.

    Важно говорить четко, громко, микрофон должен передавать голос без перебоев.

    Лингвистическая обработка.

    Чем больше в словаре программы есть слов, тем качественнее будет набранный текст. То есть, все вами сказанное будет опознаваться и передаваться в текстовом виде без искажения.

    Распознанный орфографический текст.

    Программа в автоматическом режиме выводит на экран орфографическую версию надиктованной речи, опираясь на паузы, четкость слов, найденные лексемы в словаре и т.д.

При работе с компьютерными наборщиками текста чаще всего возникает 2 проблемы:

  1. Акустический распознаватель «улавливает» вашу речь с перебоями.
  2. В словаре системы недостаточно слов, чтобы распознать всё, сказанное вами.

Чтобы решить первую проблему, необходимо четко и громко говорить. А вот для второй проблемы решения практически не существует, по крайней мере, бесплатного.

Версии программ распознавания речи, которые распространяются свободно, имеют очень скупой словарный запас.

Чтобы обеспечить программе обширный запас слов разработчикам требуется вложить немало денег, поэтому многие распознаватели демонстрируют низкий уровень перевода речи в текст.

Дальше всех в этом деле продвинулась компания Google, т.к. имеет достаточно средств для инвестиций. Эта компания, кроме прочего, создала самый большой онлайн-словарь, который помогает распознавать голос и переводить его в графическую версию.

Смотрите подробное руководство в этом ролике:

  1. Когда вы произносите речь, в комнате должно быть тихо. Звуки природы, музыка, плач ребенка воспринимаются системой, как шум. Из-за этого текст будет набран с большими ошибками.
  2. Не говорите, если что-то едите. Это не только скажется на качестве набора, но и опасно для жизни к тому же.
  3. Перед началом работы нужно подобрать правильную громкость вашего голоса, а также понять какая чувствительность у вашего микрофона.

    Для этого попробуйте записать несколько предложений привычным тоном. Если в записи будут перебои, обратитесь к настройкам микрофона.

  4. Делайте небольшие паузы между словами.
  5. Избегайте длинных фраз.

Кто-то скажет, что программа для голосового набора – это прекрасный помощник, который освободил им руки и облегчил жизнь в целом. Другие решат, что «овчинка выделки не стоит». Потому выбрать, стоить ли их использовать, вам предстоит самостоятельно.

А уж из каких сервисов выбирать, вы уже знаете…