Полуавтоматическая транскрибация аудио в текст

Транскрибация позволяет немного ускорить процесс генерации контента: так можно обрабатывать аудио записи интервью, видео ролики, музыкальные клипы, фильмы и т.д. Сейчас в сети можно найти разные программы для превращения звука в текст, но в основе каждой из них лежит простой принцип: нужно прослушать запись и перепечатать этот текст. Долго, муторно, дорого и быстро надоедает.

В своей практике я использую более универсальный подход, позволяющий проделать всю рутину за счет базовых функций ПК и остается лишь внести правки в конечном варианте текста. Как наладить производство текста на основе аудио-дорожек, сейчас разберем.

Как это работает


Что-то править все-равно придется, если в итоге нужен грамотный текст со знаками препинания.

Явный минус: каждые 5000 знаков потребуется ставить на паузу, очищая поле ввода в переводчике для дальнейшей работы.

Что потребуется

Список необходимого:

  • встроенный (или внешний) стереомикшер;
  • браузер Google Chrome.

Подготовка к транскрибации

Чтобы запустить конвейер, нужно сделать ряд действий:

Включаем микшер

Чтобы  активировать микшер, идем в правый нижний угол экрана. Находим иконку динамика и щелкаем на неё правой кнопкой мыши.

В появившемся меню выбираем «Записывающие устройства».

Появится окно настроек «Звук», в котором нужно выбрать микшер и нажать на кнопку «По умолчанию».

Если в списке никаких микшеров нет, не стоит сразу расстраиваться. Щелкните на белом фоне под имеющимися устройствами правой кнопкой мыши и в появившемся меню выберите оба вариант: «Показать отсоединенные и отключенные устройства». Вот если и там ничего подходящего нет, тогда печалька.

Ищем подходящий браузер

Я использую Google Chrome. Можно взять любой другой, где на странице переводчика гугла есть кнопка включения микрофона и возможность надиктовать текст. К примеру, в FireFox 60.0.1 этого нет.

Google Переводчик в браузере Firefox (микрофона нет) — с таким работать не получится.

Браузер гугл хром для транскрибации в самый раз

Начало работы

Всё, больше никаких настроек и телодвижений не требуется. Открываем переводчик гугла с в хроме, открываем исходник с аудио. Сначала включаем запись в переводчике, затем запускаем аудиодорожку.

Если исходный файл длинный, стоит последить за ходом работы, чтобы процесс дошел до конца, т.к. ограничение на ввод — 5000 знаков.

Понравилась статья? Расскажи о ней друзьям!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *