Приложение которое записывает под диктовку. Голосовой набор на Андроид: как включить. Знакомимся с голосовым блокнотом

Осуществляется через микрофон. Произнесённые слова - это источник акустических волн, которые представляют собой периодически чередующиеся разряжения и уплотнения окружающего воздуха.

Волна, попадая на микрофон, вызывает на его выходе электрический сигнал определённой амплитуды и частоты. Данный сигнал преобразуется в последовательность прямоугольных импульсов, кодируемых в виде «единиц» и «нулей», и затем может обработан компьютером.

С появлением компьютеров, обладающих достаточной вычислительной мощностью, набор текста голосом в компьютер стал реальностью, благодаря чему удаётся существенно снизить нагрузку на клавиатуру.

Компьютерная технология ввода информации с голоса предусматривает настройку на голоса различных людей. Этот метод называется настройкой компьютера на конкретный голос. Состоит он в следующем. Все слова, которые человек произносит первый раз, компьютер обрабатывает и заносит в свою базу данных в качестве образцов. Когда в дальнейшем человек произносит речь, компьютер мгновенно пытается найти каждое слово в своей базе данных. Сейчас уже существуют современные компьютерные системы, которые без тренировки могут работать с любым голосом.

Применение такой технологии позволяет не только вводить текстовую информацию, но и управлять компьютером с помощью произношение команд.

Когда полезен набор текста голосом ? Он удобен при вводе в компьютер писем, текстов отчётов, сложных научных или деловых документов. Такое средство общение с компьютером будет очень удобно врачам, юристам, журналистам, секретарям, администраторам различного уровня, переводчикам, писателям и многим другим.

Голосовой ввод информации незаменим в тех случаях, когда у пользователя руки оказываются занятыми другой работой, а надо срочно дать компьютеру команду для управления определённых задач. Это может понадобиться операторам на технологических линиях, учёным, медицинским работникам и т. п. Данный метод может оказаться единственно возможным также в том случае, когда основная работа выполняется в затемнённом помещении и ввод данных с клавиатуры затруднён, или человек должен находиться на достаточном удалении от компьютера. Кстати, в этой ситуации возможен ввод данных через радиоуправляемый микрофон. Существует также возможность ввести данные или команды на удалённый компьютер по компьютерной сети.

Как начать пользоваться голосовым набором текста на домашнем компьютере?

Для этого нужно подключить микрофон к компьютеру и перейти на сайт http://speechpad.ru/ Данный онлайн-сервис позволяет набирать текст голосом в голосовом блокноте.

Процесс голосового ввода довольно прост. Выставляем настройки для записи, и можно диктовать текст голосом. Кнопку «Включить запись» используйте для непрерывного ввода текста. Для ввода отдельных фраз или предложений используется значок микрофона.

Приветствую вас, уважаемые читатели блога сайт! Давно собирался подготовить заметку о программах и онлайн сервисах, при помощи которых можно переводить свой голос прямо в текст. Как рассказчик (мне кажется), я неплохой, но вот излагать свои мысли в виде печатного текста мне дается с большим усилием. Вот я и задался целью найти «чудо-сервис», который смог бы мою речь преобразовать в текст.

Актуальность набора текста голосом на сегодняшний день очевидна. Ведь не зря разработчики Google «вкрутили» в свой браузер Google Chrome голосовой поиск. И уже на основе этого открытого кода некоторые программисты и Web мастера сделали разные блокноты и сервисы для преобразования речи в текст в онлайн режиме. Для многих пользователей и особенно пользователей с ограниченными возможностями это просто незаменимые сервисы.

Попробовав в работе один из сервисов, которые я приведу ниже, возможно, не каждый получит желаемый результат. Особенно те, кто постоянно набирают тексты на компьютере, и для кого с текстами является основным источником дохода. И многие хотели бы как-то облегчить этот нелегкий труд. Но, если немного потренироваться, перевод голоса в текст в этих онлайн сервисах может получаться вполне качественный.

Чтобы приступить к преобразованию голоса в текст, понадобится микрофон (в ноутбуках он встроенный), желательно хорошая скорость интернет соединения и браузер Google Chrome не ниже 25 версии. В других браузерах функция голосового набора текстов, к сожалению, не работает. Как я уже говорил, код голосового распознавания в текст от разработчиков Google является открытым, и его можно использовать на своем сайте. Вот и я немного его русифицировал и установил на свой блог.

Голосовой ввод текста с помощью Web Speech API

Запустите страницу для ввода текста голосом в браузере Chrome. Внизу окна выберите язык, на котором вы планируете диктовать текст. Нажмите на иконку микрофона в верхнем правом углу. И в всплывшей строке нажмите кнопку «разрешить» использование браузером микрофона.

Теперь вы можете неспеша и четко наговаривать недлинные фразы. После завершения надиктовки текста голосом его можно выделить и при помощи комбинации клавиш на клавиатуре Ctrl+C скопировать в буфер обмена, а затем вставить в любой редактор для обработки. При желании текст можно сразу отправить по электронной почте.

Пожалуй, Web Speech API – самый простой и довольно качественный способ преобразовать свою речь в текст. Так как не надо отвлекаться на какие-то дополнительные манипуляции с клавиатурой. Просто включил микрофон и говори текст. В любом случае придется использовать какой-нибудь дополнительный текстовый редактор для дальнейшей корректировки надиктованного текста.

Преобразование речи в текст на странице сайта Online Dictation

Простой «буржуйский» блокнот, расположенный на странице Dictation , имеет всего три кнопки. Включить микрофон для записи, очисть поле для ввода текста и экспортировать надиктованный текст на свой компьютер, Google Диск, хранилище Dropbox или отправить электронной почтой в текстовом формате TXT. Все очень просто. Пробуйте, тестируйте и наслаждайтесь полученным результатом.

Набор текста голосом - онлайн сервис Talk Typer

Этот «буржуйский» онлайн блокнот распознавания голоса имеет несколько дополнительных встроенных функций. Возможность заменять продиктованные слова на другие предложенные варианты. Вставлять знаки пунктуации. Прослушать надиктованный текст, нажав на иконку динамик. Сделать перевод на выбранный иностранный язык. При желании можно изменить отображение внешнего вида и размер шрифта, нажав на иконку «шестеренка». Единственное неудобство: после каждой произнесенной фразы ее надо сбрасывать в нижнюю часть блокнота, нажимая на стрелку, и затем снова включать микрофон. В целом, это полноценный сервис, в котором можно преобразовать речь в текст и отредактировать его по своему усмотрению. Готовый текст можно распечатать, Твитнуть или отправить на электронную почту.

Распознавание голоса в блокноте VoiceNote

Этот сервис распознавание голоса в текст можно установить как приложение в браузер Chrome, или просто добавить в закладки сайт , который находится . Войснот по функционалу практически ничем не отличается от предыдущего сервиса-блокнота распознавания речи Talk Typer. Такой же основной минус, после каждой произнесенной фразы надо снова включать микрофон. Но зато не надо перемещать надиктованный текст, как в Talk Typer. Простой и очень удобный интерфейс сервиса для преобразования текста. Думаю, что он многим придется по душе. Тестируйте и делайте выводы.

При работе в интернете часто требуется печатать тексты. Этим занимаются не только блоггеры и копирайтеры, необходимость написания текстов появляется у маркетологов, вебмастеров, оптимизаторов и профессионалов из других областей.


Даже составление ТЗ для копирайтера вынуждает нажимать клавиши на клавиатуре.

Программы для голосового набора текста облегчают эту задачу. Кто-то скажет, что созданы они для ленивых и неопытных и отчасти это будет верно. Дело в том, что софт недостаточно хорошо распознает отдельные слова и приходится четко проговаривать всё, а это снижает скорость набора текста.

Набор текста на компьютере голосом

Не зря же был запущен . Пользователям не нужно нажимать кнопки, они могут просто произнести нужный запрос.

Четко проговорить несколько слов не сложно, поэтому для данной цели это подходит. Что касается написания статей, то придется потренироваться. Также, стоит попробовать несколько программ, чтобы выбрать подходящий вариант.

Заходите на , выбираете язык и жмете на значок с микрофоном:

После этого, запрашивается разрешение на использование микрофона. Он может быть отдельным или встроенным в вебкамеру:

Разрешаете браузеру использовать микрофон и начинаете произносить слова. Они сразу же появляются в основной части страницы, откуда их можно легко скопировать и перенести, например, в Word.

2. Голосовой набор онлайн на . Этот сервис отличается наличием дополнительных кнопок. С их помощью можно быстро очистить поле ввода текста, а также перенести готовый текст на Google Диск, скачать в формате txt или отправить по электронной почте:

В целом, система ничем не отличается. Заходишь на сайт, выбираешь START DICTATION (после выбора языка) и появляется уведомление, где требуется дать разрешение на использование микрофона:

Интерфейс простой, а дизайн приятный. Именно с этим сервисом удается добиться хорошего распознавания, но отзывы двоякие.

3. Набор текста голосом с . Русский язык в этом иностранном сервисе распознается без проблем. Функционала в нем намного больше. Полученный текст проверяется на знаки препинания и ошибки. Очень удобно, что слова, которые программа не смогла распознать точно, подсвечиваются.

При нажатии на них, можно выбрать другие предложенные варианты:

Также здесь есть инструмент для быстрого перевода текса на любой язык или его воспроизведение. Отправлять документ можно разными способами. Единственное неудобство, это после ввода текста голосом, требуется нажимать на стрелку, чтобы перенести его во второе поле.

4. Программа голосового набора . Несмотря на скромный дизайн, этот сервис идеально справляется со своей задачей и предлагает самый продвинутый функционал. На сайте есть видео уроки по использованию системы, а также предлагается скачать плагин для браузера.

Если Вы слишком медленно печатаете на клавиатуре, а учиться десятипальцевому методу набора лень, можете попробовать воспользоваться современными программами и сервисами голосового ввода текста.

Клавиатура, бесспорно, достаточно удобный инструмент управления компьютером. Однако, когда дело доходит до наборки длинного текста, мы понимаем всё её (а, если быть честными, то наше:)) несовершенство... На ней ещё нужно уметь быстро печатать!

Пару лет назад я, желая упростить себе работу по написанию статей, решил найти такую программу, которая бы позволяла преобразовать голос в текст. Я думал, как было бы хорошо, если бы я просто говорил всё что нужно в микрофон, а компьютер печатал вместо меня:)

Каково же было моё разочарование, когда я понял, что на тот момент никаких реально работающих (а тем более бесплатных) решений для этого дела не существовало. Были, правда, отечественные разработки, вроде "Горыныча" и "Диктографа". Они понимали русский язык, но, увы, качество распознавания речи имели довольно низкое, требовали долгой настройки с созданием словаря под свой голос, да ещё и стоили довольно недёшево...

Потом на свет появился Android и ситуация немного сдвинулась с мёртвой точки. В этой системе голосовой ввод появился в качестве встроенной (и довольно удобной) альтернативы ввода с виртуальной экранной клавиатуры. И вот недавно в одном из комментариев меня спросили, есть ли возможность голосового ввода для Windows? Я ответил, что пока нет, но решил поискать и оказалось, что, может и не совсем полноценная, но такая возможность существует! О результатах моих изысканий и будет сегодняшняя статья.

Проблема распознавания речи

Перед тем как начать разбор существующих на сегодняшний день решений для голосового ввода в Windows, хотелось бы немного осветить суть проблемы распознавания речи компьютером. Для более точного понимания процесса предлагаю взглянуть на следующую схему:

Как видим, преобразование речи в текст происходит в несколько этапов:

  1. Оцифровка голоса . На этом этапе качество зависит от чёткости дикции, качества микрофона и звуковой карты.
  2. Сравнение записи с записями в словаре . Здесь работает принцип "чем больше - тем лучше": чем больше записанных слов содержит словарь, тем выше шансы того, что Ваши слова будут распознаны правильно.
  3. Вывод текста . Система автоматически, ориентируясь по паузам, пытается выделить из потока речи отдельные лексемы, соответствующие шаблонным лексемам из словаря, а затем выводит найденные соответствия в виде текста.

Главная проблема, как нетрудно догадаться, кроется в двух основных нюансах: качестве оцифрованного отрезка речи и объёме словаря с шаблонами. Первую проблему реально минимизировать даже при наличии дешёвого микрофона и стандартной звуковой карты. Достаточно просто говорить не спеша и внятно.

Со второй проблемой, увы, не всё так просто... Компьютер, в отличие от человека, не может корректно распознать одну и ту же фразу, сказанную, например, женщиной и мужчиной. Для этого в его базе должны существовать оба варианта озвучки разными голосами!

В этом и кроется основной подвох. Создать словарь для одного человека, в принципе, не так сложно, однако, учитывая, что каждое слово должно быть записано в нескольких вариантах, это получается очень долго и трудозатратно. Поэтому, большинство из существующих на сегодняшний день программ для распознавания речи либо стоят слишком дорого, либо не имеют собственных словарей, предоставляя пользователю возможность создать их самостоятельно.

Я не зря упомянул про Андроид чуть выше. Дело в том, что Гугл, который его разрабатывает, создал и единственный на сегодня общедоступный глобальный онлайн-словарь для распознавания речи (причём многоязычный!) под названием Google Voice API . Подобный словарь для русского языка также создаёт Яндекс, но пока он, увы, ещё непригоден для использования в реальных условиях. Поэтому практически все бесплатные решения, которые мы рассмотрим ниже, работают именно со словарями Google. Соответственно, все они имеют одинаковое качество распознавания и нюансы заключаются лишь в дополнительных возможностях...

Программы голосового ввода

Полноценных программ для голосового ввода под Windows не так уж много. Да и те, которые есть и понимают русский язык, в основном являются платными... Например, стоимость популярной пользовательской системы преобразования голоса в текст RealSpeaker стартует с отметки 2 587 руб, а профессионального комплекса Цезарь-Р аж с 35 900 руб!

Но среди всего этого дорогого софта имеется одна программка, которая не стоит и копейки, но при этом предоставляет функционал, более чем достаточний для большинства пользователей. Называется она MSpeech :

Основное окно программы имеет максимально простой интерфейс - индикатор уровня звука и всего три кнопки: включить запись, остановить запись и открыть окно настроек. Работает MSpeech также весьма просто. Вам нужно нажать кнопку записи, установить курсор в окно, в которое должен выводиться текст и начать диктовать. Для большего удобства запись и её остановку лучше производить горячими клавишами, которые можно задать в Настройках:

Кроме горячих клавиш Вам может потребоваться изменить тип передачи текста в окна нужных программ. По умолчанию установлен вывод в активное окно, однако, можно задать передачу в неактивные поля или в поля конкретной программы. Из дополнительных возможностей стоит отметить группу настроек "Команды", которая позволяет реализовать голосовое управление компьютером при помощи заданных Вами фраз.

Вообще же MSpeech - довольно удобная программа, которая позволяет набирать текст голосом в любом окне Windows. Единственный нюанс в её использовании - компьютер должен быть подключён к Интернету для доступа к словарям Гугла.

Голосовой ввод онлайн

Если Вам не хочется устанавливать на свой компьютер никаких программ, но есть желание попробовать вводить текст голосом, можете воспользоваться одним из многочисленных онлайн-сервисов, которые работают на базе всё тех же словарей Гугла.

Ну и, естественно, первым делом стоит упомянуть о "родном" сервисе Google под названием Web Speech API :

Этот сервис позволяет переводить в текст неограниченные отрезки речи на более чем 50 языках! Вам достаточно просто выбрать язык, на котором Вы говорите, нажать на иконку микрофона в правом верхнем углу формы, при необходимости подтвердить разрешение на доступ сайта к микрофону и начать говорить.

Если Вы не используете какую-либо узкоспециализированную терминологию и говорите внятно, то сможете получить весьма неплохой результат. Кроме слов сервис "понимает" ещё и знаки препинания: если Вы скажете "точка" или "запятая", необходимый знак появится в форме вывода.

По окончании записи распознанный текст будет автоматически выделен и Вы сможете скопировать его в буфер обмена или отправить по почте.

Из недостатков стоит отметить лишь возможность работы сервиса только в браузере Google Chrome старше 25-й версии, а также отсутствие возможности мультиязычного распознавания.

Кстати, на нашем сайте вверху Вы найдёте полностью русифицированную версию этой же формы распознавания речи. Пользуйтесь на здоровье;)

На базе сервиса Гугла существует достаточно аналогичных онлайн-ресурсов распознавания речи. Одним из представляющих для нас интерес можно назвать сайт Dictation.io :

В отличие от Web Speech API, Dictation.io имеет более стильное оформление в виде блокнота. Основным его преимуществом перед сервисом Гугла является то, что он позволяет остановить запись, а затем снова запустить и при этом введённый ранее текст сохранится пока Вы сами не нажмёте кнопку "Clear".

Как и сервис Google Dictation.io "умеет" ставить точки, запятые, а также восклицательный знак и знак вопроса, но не всегда начинает новое предложение с большой буквы.

Если же Вы ищете сервис с максимальным функционалом, то, наверное, одним из лучших в этом плане будет :

Главные преимущества сервиса:

  • наличие русскоязычного интерфейса;
  • возможность просмотра и выбора вариантов распознавания;
  • наличие голосовых подсказок;
  • автоотключение записи после длительной паузы;
  • встроенный текстовый редактор с функциями копирования текста в буфер обмена, распечатки его на принтере, отправки по почте или в Твиттер и перевода на другие языки.

Единственным недостатком сервиса (кроме уже описанных общих недостатков Web Speech API) является не совсем привычный для подобных сервисов алгоритм работы. После нажатия кнопки записи и надиктовки текста, его нужно проверить, выбрать вариант, наиболее соответствующий тому, что Вы хотели сказать, а затем перенести в текстовый редактор внизу. После чего процедуру можно повторить.

Плагины для Хрома

Кроме полноценных программ и онлайн-сервисов, существует ещё один способ распознать речь в текст. Этот способ реализовывается за счёт плагинов для браузера Google Chrome.

Главным преимуществом использования плагинов является то, что с их помощью Вы можете вводить текст голосом не только в специальной форме на сайте сервиса, но и в любом поле ввода на любом веб-ресурсе! Фактически плагины занимают промежуточную нишу между сервисами и полноценными программами для голосового ввода.

Одним из лучших расширений для перевода речи в текст является SpeechPad :

Не совру, если скажу, что SpeechPad - один из лучших русскоязычных сервисов перевода речи в текст. На официальном сайте Вы найдёте довольно мощный (хоть и немного староватый дизайном) онлайн-блокнот со множеством продвинутых функций, среди которых есть:

  • поддержка голосовых команд управления компьютером;
  • улучшенная поддержка расстановки знаков препинания;
  • функция отключения звуков на ПК;
  • интеграция с Windows (правда, на платной основе);
  • возможность распознавания текста с видео или аудиозаписи (функция "Транскрибация");
  • перевод распознанного текста на любой язык;
  • сохранение текста в текстовый файл, доступный для скачивания.

Что же касается плагина, то он предоставляет нам максимально упрощённый функционал сервиса. Установите курсор в нужное Вам поле ввода, вызовите контекстное меню и нажмите на пункт "SpeechPad". Теперь подтвердите доступ к микрофону и, когда поле ввода станет розовым, надиктуйте нужный текст.

После того, как Вы прекратите говорить (пауза более чем в 2 секунды), плагин сам остановит запись и выведет в поле всё, что Вы сказали. При желании Вы можете зайти в настройки плагина (правый клик на иконке плагина вверху) и изменить параметры по умолчанию:

Как ни странно, но во всём Интернет-магазине расширений Гугла мне больше не попалось ни одного стоящего плагина, который бы позволял реализовать голосовой ввод в любом текстовом поле. Единственным похожим расширением было англоязычное . Оно добавляет иконку микрофона ко всем полям ввода на веб-странице, но не всегда правильно располагает её, поэтому она может оказаться вне экрана...

Сейчас без компьютера просто нереально обойтись в современном мире. От вас не требуется быть мастером фотошопа или профессионально монтировать видео (если это не связано с работой, конечно). Но суметь набрать какой-нибудь текст – это необходимый минимум.

№2. Web Speech API


Онлайн-программа Web Speech API по функционалу абсолютно идентична предыдущим.

Этот сервис, как и перечисленные выше, также был создан компанией Google.

Главная страница выглядит так:


В простом интерфейсе сразу очевидно, что для начала записи необходимо выбрать язык, а после нажать на микрофон.

После того как вы нажмете на значок справа, система обязательно сделает запрос на доступ.


После того как вы «дадите добро», можно сразу приступать к работе. Набирайте текст голосом, а его печатная версия будет появляться в окошке.

После окончания работы текст можно скопировать туда, куда вам необходимо (опять же таки – ctrl+C, ctrl+V).

№3. Talktyper

Не менее простая программа – это Talktyper.

Для начала работы перейдите на сайт: https://talktyper.com/ru/index.html.


Для начала работы достаточно нажать на значок микрофона справа.

В отличие от описанных выше, данный наборщик текста можно открывать с помощью любого браузера. Хотя сайт создан в США, приложение легко распознает самые популярные языки мира, в том числе и русский.

Talktyper многофункциональный: он не только набирает текст, но и ставит знаки препинания, исправляет самостоятельно ошибки. Если какое-то начитанное вами слово система не может распознать, как правильное, то оно обязательно высветится.

Кроме того, Talktyper имеет функцию перевода, а также его озвучивания.

Обратите внимание! После того как вы закончите голосовой набор текста, обязательно нажмите на стрелочку, чтобы набранный документ был перенесен в другое поле. После этого его можно будет отправить по электронной почте или скопировать в нужный файл.

Возможные проблемы при работе с программами голосового набора

Когда вы начнете использовать эти программы, то обязательно задумаетесь, как же компьютер распознает наш голос, а после еще переводит в живой текст.

Схема распознавания речи устройством выглядит так:

Весь процесс можно разделить на 3 главных этапа:

    Акустический распознаватель.

    Важно говорить четко, громко, микрофон должен передавать голос без перебоев.

    Лингвистическая обработка.

    Чем больше в словаре программы есть слов, тем качественнее будет набранный текст. То есть, все вами сказанное будет опознаваться и передаваться в текстовом виде без искажения.

    Распознанный орфографический текст.

    Программа в автоматическом режиме выводит на экран орфографическую версию надиктованной речи, опираясь на паузы, четкость слов, найденные лексемы в словаре и т.д.

При работе с компьютерными наборщиками текста чаще всего возникает 2 проблемы:

  1. Акустический распознаватель «улавливает» вашу речь с перебоями.
  2. В словаре системы недостаточно слов, чтобы распознать всё, сказанное вами.

Чтобы решить первую проблему, необходимо четко и громко говорить. А вот для второй проблемы решения практически не существует, по крайней мере, бесплатного.

Версии программ распознавания речи, которые распространяются свободно, имеют очень скупой словарный запас.

Чтобы обеспечить программе обширный запас слов разработчикам требуется вложить немало денег, поэтому многие распознаватели демонстрируют низкий уровень перевода речи в текст.

Дальше всех в этом деле продвинулась компания Google, т.к. имеет достаточно средств для инвестиций. Эта компания, кроме прочего, создала самый большой онлайн-словарь, который помогает распознавать голос и переводить его в графическую версию.

Смотрите подробное руководство в этом ролике:

  1. Когда вы произносите речь, в комнате должно быть тихо. Звуки природы, музыка, плач ребенка воспринимаются системой, как шум. Из-за этого текст будет набран с большими ошибками.
  2. Не говорите, если что-то едите. Это не только скажется на качестве набора, но и опасно для жизни к тому же.
  3. Перед началом работы нужно подобрать правильную громкость вашего голоса, а также понять какая чувствительность у вашего микрофона.

    Для этого попробуйте записать несколько предложений привычным тоном. Если в записи будут перебои, обратитесь к настройкам микрофона.

  4. Делайте небольшие паузы между словами.
  5. Избегайте длинных фраз.

Кто-то скажет, что программа для голосового набора – это прекрасный помощник, который освободил им руки и облегчил жизнь в целом. Другие решат, что «овчинка выделки не стоит». Потому выбрать, стоить ли их использовать, вам предстоит самостоятельно.

А уж из каких сервисов выбирать, вы уже знаете…