Лучшие сервисы для голосового ввода текста
Функция голосового ввода текста, или Speech-to-Text — полезный инструмент для решения самых разнообразных задач. К примеру, работа в сфере информационных технологий предполагает взаимодействие с текстовой информацией на постоянной основе, и в большинстве ситуаций маркетологу или программисту будет быстрее проговорить пришедшую в голову идею или концепцию и сразу перевести ее в текстовое представление.
Сервисы и мобильные приложения с функцией Speech-to-Text конвертируют звуковые файлы или речь с микрофона в текст «на лету», после чего результат можно быстро сохранить на ПК или поделиться им в социальных сетях.
Для повышения качества распознавания аудио необходимо соблюдать ряд правил:
- При работе с подобными сервисами важно диктовать текст с умеренной скоростью и расстановкой, четко проговаривая слова и фразы. Это поможет повысить эффективность конвертации даже при наличии посредственного микрофона.
- Пользователю желательно использовать внешний микрофон с функцией подавления шумов или гарнитуру премиального ценового сегмента. При работе со встроенными моделями микрофонов на ноутбуке или ПК рекомендуется не отдаляться от аксессуара для более качественного распознавания аудио.
- Диктовку с использованием микрофона желательно проводить при минимальном уровне посторонних шумов, не включать громкую музыку.
1. Speechpad
- Сайт программы: speechpad.ru
- Цена: бесплатно
- Платформа: веб, Android и iOS, Windows, Linux и MacOS
SpeechPad — кроссплатформенное программное обеспечение с версиями для ПК и мобильных. Главное предназначение сервиса — преобразование аудиосообщений в текст, активация распознавания голоса в сторонних цифровых продуктах. Разработчики именуют свой продукт «голосовым блокнотом».
Набор опций сервиса зависит от среды использования. Редакция ПО для мобильных устройств выполняет функцию стандартного блокнота, официальный портал speechpad.ru вместе с надстройкой для Google Chrome позволяют быстро конвертировать голосовые сообщения в текстовую форму.
Версия SpeechPad, установленная под Microsoft Windows, Linux или на устройствах под управлением MacOS, активирует функцию голосового ввода напрямую из оболочки операционной системы в любом приложении, например, Word или Opera.
На портале представлены разделы, главные из которых — голосовой блокнот, озвучка субтитров, проверка произношения на иностранных языках и извлечение субтитров из аудиозаписей. На сервисе можно работать с пятнадцатью языками, выполнять транскрибацию аудиотекстов из видеороликов на Youtube, форматов аудио и видео html5.
При взаимодействии со SpeechPad на официальном сайте пользователь может настроить ряд опций, например, локацию для сохранения текста (буфер обмена или файл), качество распознавания текста или скорректировать управление заглавными буквами при работе с Google.
Зарегистрированным пользователям доступны дополнительные функции: настройка интерфейса блокнота для речевого ввода, создание списков обработанных текстов, и многое другое.
Основной недостаток сервиса — интегрируемый в среду операционной системы модуль для прямого голосового ввода платный, стоимость подписки варьируется от 100 до 800 рублей в зависимости от срока (на месяц или год). Дополнительный минус — поддержка исключительно браузера Google Chrome, в других веб-обозревателях сервис может работать некорректно.
2. VoiceNote
- Сайт программы: voicenote.in
- Цена: бесплатно
- Платформа: сервис для работы в среде Microsoft Windows
VoiceNote — онлайн-сервис «2 в 1», предоставляющий пользователю возможность набора текста голосом онлайн в сочетании с мультифункциональным блокнотом для сохранения заметок. На платформе можно работать как онлайн, так и автономно, однако в этом случае распознавание речи будет невозможно — из числа функций будут доступны только редактирование словаря и создание текста в блокноте.
Для работы с сервисом пользователю понадобится устойчивое сетевое подключение и корректно настроенный микрофон. Интерфейс VoiceNote минималистичный без лишних наворотов, предусматривает 3 раздела: блокнот, редактирование персонального словаря и блок установки параметров.
Набранный в основном поле текст можно сохранить как заметку или загрузить в виде файла на жесткий диск. Словарь дает возможность добавлять варианты автозамены на русском и английском языке. Меню параметров предназначено для настройки размера шрифта и рабочего пространства, цвета текста и фона интерфейса. Дополнительно пользователь может добавить дату в заголовок созданной заметки или разместить ее в тексте, настроить микрофон и сменить тему оформления.
Онлайн-сервис распознавания речи поддерживает одно сочетание горячих клавиш для старта и остановки распознавания голоса — Ctrl + пробел. Пользователям также доступна установка расширения для браузера Google Chrome.
VoiceNote поддерживает более 20 языков, включая экзотические африкаанс, китайский, японский и хинди.
Главные недостатки сервиса — рекламные баннеры сверху и снизу рабочего пространства с тенденцией к повторному появлению после каждой перезагрузки страницы.
3. Dictation
- Сайт программы: dictation.io
- Цена: бесплатно
- Платформа: веб
Dictation — бесплатный мультиплатформенный сервис для преобразования аудио в текст онлайн от индийских разработчиков Digital Inspiration. Для взаимодействия с ним достаточно иметь стабильное интернет-соединение и браузер Google Chrome.
Сервис конвертации аудио в текст поддерживает более 50 языков со всего мира, включая русский, украинский, различные модификации испанского и английского.
Интерфейс платформы минималистичный, включает функции, аналогичные большинству подобных сервисов. Пользователь может менять цвет рабочего пространства и размер шрифта, создавать маркированные и нумерованные списки, подчеркивать текст и оформлять буквы заливкой.
Доступно как преобразование голосовых сообщений в текстовую информацию, так и обратная операция — в нижней части страницы присутствует опция «Text-to-Speech». Результат конвертации можно загрузить в социальную сеть Twitter, сохранить в виде текстового или PDF-файла на жесткий диск ПК, распечатать или отправить по электронной почте.
Единственный недостаток сервиса — наличие рекламного блока рядом с рабочим пространством, что может отвлекать от работы.
4. SpeechTexter
- Сайт программы: speechtexter.com
- Цена: бесплатно
- Платформа: онлайн-сервис для работы в среде Microsoft Windows, мобильное приложение для Android
SpeechTexter позволяет бесплатно преобразовывать аудио с микрофонного входа в текст. Сервис поддерживает диктовку текста онлайн на 60 языках, включая русский.
Платформа дает возможность составления маркированных и нумерованных списков, сохранения результата в файлы *. doc и *. txt, печати напрямую из рабочего пространства сервиса. В настройках SpeechTexter присутствуют инструменты форматирования текста, включая опции изменения размера и типа шрифта.
Пользователь может применить для оформления сайта ночную тему. В правой части сервиса находится блок с командами для добавления абзаца и знаков препинания. Используя вкладку Custom, пользователь может создавать свои команды.
Среди недостатков сайта стоит отметить небольшой рекламный блок слева от рабочего пространства.
5. Talk Typer
- Сайт программы: talktyper.com
- Цена: бесплатно
- Платформа: веб
Talk Typer — бесплатный интернет-сервис для онлайн записи текста голосом с помощью микрофона. Он выступает в качестве альтернативы ввода символов с клавиатуры.
Платформа умеет работать с 20 языками со всего мира. Минимальный функционал сервиса позволяет обрабатывать голос с помощью микрофона и сохранять его в текстовые файлы на жесткий диск персонального компьютера. Пользователю также доступны размещение результата в социальной сети Twitter, отсылка по электронной почте или копирование в буфер обмена.
Дополнительных функций, аналогичных другим сервисам, например, работы с заметками, Talk Typer не предоставляет. Исключение составляет опция перевода набранного текста, однако она реализована через сторонний сервис — Google Translate.
В главном окне интернет-сервиса можно настроить размер и тип шрифта, опцию исправления простых ошибок «на лету» и возможность автоматического сохранения пользовательских результатов.
Несмотря на англоязычное оформление в принципе работы Talk Typer сможет разобраться любой пользователь с минимальными знаниями иностранного языка.
Основные недостатки сервиса — навязчивые рекламные блоки и отсутствие подписей к кнопкам основных действий для рабочего пространства.
6. Текстовый редактор «Google Документы»
- Сайт программы: Google Docs
- Цена: бесплатно
- Платформа: веб
Google Docs является аналогом офисного пакета Word от корпорации Microsoft. В дополнение к возможностям для набора и редактирования текстов, популярный онлайн-сервис располагает функцией голосового ввода текста.
Для начала работы с сервисом потребуется корректно настроенный микрофон и персональный аккаунт Google. При отсутствии такового у пользователя его нужно будет зарегистрировать, получив уникальный адрес электронной почты вида @gmail.com. Дополнительно потребуется установка браузера Google Chrome — в других веб-обозревателях голосовой ввод работать не будет.
Использовать функцию голосового ввода можно из меню «Инструменты» или по нажатию комбинации горячих клавиш Ctrl+Shift+S, голос пользователя после конвертации будет записываться напрямую в пустой текстовый файл. Обработчик звука поддерживает расстановку точек и создание разбиение текста на абзацы с помощью аудиокоманд «Новая строка» и «Точка», что позволяет уменьшить время ручной обработки.
Сервис Google Документы поддерживает автосохранение набранного текста, поэтому пользователь может не переживать за потерю нужной информации.
Главный недостаток онлайн-сервиса — возможность конвертации аудио исключительно через браузер Chrome.
7. August4u
- Сайт программы: august4u.net
- Цена: бесплатно
- Платформа: веб
Онлайн-сервис August4u позволяет создавать персональные чаты, опросы, календари и мини-игры. В числе функций портала также представлен голосовой блокнот для преобразования аудио с микрофонного хода в текст.
Сервис для распознавания речи поддерживает работу на языках стран постсоветского пространства — русском, украинском и казахском, а также на английском, французском и немецком. Минималистичный интерфейс не перегружен функциями, поэтому разобраться в основах работы с сервисом смогут даже новички.
Пользователь может применять голосовые команды для расстановки знаков препинания, менять кодировку при сложностях в распознавании, копировать результат в буфер обмена, сохранять на диск или отправлять по электронной почте.
При взаимодействии с ресурсом не удалось выявить значимых минусов, за исключением поддержки небольшого числа иностранных языков и старомодного интерфейса, который может быть непривычен для современных пользователей.
8. Speechnotes
- Сайт программы: speechnotes.co
- Цена: бесплатно
- Платформа: веб, Android
Speechnotes — платформа для конвертации аудио в текст, созданная 2015 году программистами TTS Reader и Speechlogger. По утверждению разработчиков, онлайн-сервис рассматривается пользователями как достойная альтернатива программному продукту Dragon Naturally Speaking и имеет наиболее высокую оценку в магазине дополнений браузера Google Chrome.
Несмотря на это, основатели сайта отмечают, что функционал Speechnotes не предусматривает возможность управления сторонними приложениями на ПК или набора текста в них с помощью голосовых команд.
Аналогично прочим сервисам распознавания аудио, интерфейс Speechnotes содержит минимальный набор опций для работы. Пользователям доступны функции масштабирования текста, ввода знаков препинания голосом, пересылка результатов конвертации по e-mail, сохранение в файл или публикация в популярных социальных сетях — Facebook, Twitter, Instagram и других.
Опция сохранения сеанса позволяет быстро вернуться к работе без потери отконвертированного текста. Результат также можно выгрузить в Google Drive и скачать мобильное приложение Speechnotes для работы на смартфонах и планшетах в официальном магазине Google Play Market.
Недостатком сервиса голосовой конвертации является поддержка только браузера Google Chrome, однако его можно бесплатно установить на ПК в любой момент.
9. Rrabota-vo
- Сайт программы: rabota-vo.ru
- Цена: бесплатно
- Платформа: веб
На этом сайте пользователи могут бесплатно преобразовать голосовые сообщения с микрофона в текст. Сервис конвертации дает возможность обработки текста на 30 языках, включая английский, русский, голландский, турецкий, арабский, и прочие.
Для ряда языков Rabota-vo предлагает выбрать отдельную разновидность. К примеру, при распознании португальского доступны местный и бразильский диалект, для английского — австралийский, американский, канадский или индийский варианты.
Результат обработки текста можно переслать по электронной почте или опубликовать на популярных социальных порталах — Mail.ru, Facebook, LinkedIn, в списке также представлены менее востребованные сервисы — Instapaper, Delicious или БобрДобр.
К недостаткам сервиса стоит отнести отсутствие возможности прямого вывода текста в файл на жесткий диск, однако в этом случае всегда как альтернативный вариант всегда доступен буфер обмена Windows.
10. Web Speech API от Google
- Сайт программы: Web Speech API
- Цена: бесплатно
- Платформа: веб
На странице сайта пользователи могут протестировать возможности движка распознавания речи Web Speech API от корпорации Google. Сервис не является полноценным онлайн-приложением, а выступает в качестве демонстрационного средства для определения качества конвертации аудио с микрофона в текстовое представление.
Главное достоинство платформы — поддержка работы с 40 международными языками: русским, диалектами английского, болгарским, тайским и другими.
К недостаткам сервиса относится посредственное качество распознавания речи, что обусловлено обработкой аудио непосредственно на серверах Google вместо компьютера пользователя.
Стоит добавить, что инструмент Google Web Speech API используется как основа для многих онлайн-приложений конвертации голоса в текст — первый сервис в рейтинге SpeechPad работает именно на этом движке.