Транскрибация аудио или видео в текст: полуавтоматический режим
Транскрибация - это перевод аудио или видео в текст, что позволяет немного ускорить процесс генерации контента: так можно обрабатывать аудио записи интервью, видео ролики, музыкальные клипы, фильмы и т.д. В Интернете можно найти разные программы для превращения звука в текст, но в основе каждой из них лежит простой принцип: нужно прослушать запись и перепечатать её вручную. Долго, муторно, дорого и быстро надоедает.
В своей практике я использую более универсальный подход, позволяющий проделать всю рутину за счет базовых функций ПК и остается лишь внести правки в конечном варианте текста. Как наладить производство контента на основе аудио-дорожек, сейчас разберем.
Содержание
Как это работает
Для экономии времени записал короткое видео о том, как работает автоматизация в расшифровке на примере случайного ролика из Youtube.
Что-то править все-равно придется, если в итоге нужен грамотный текст со знаками препинания.
Явный минус: каждые 5000 знаков потребуется ставить на паузу, очищая поле ввода в Google Переводчике для дальнейшей работы.
Внимание! Лимиты при расшифровке могут мешать продуктивной работе, поэтому для масштабных проектов используем Google Документы.
Что потребуется
Список необходимого:
- встроенный (или внешний) стереомикшер;
- браузер Google Chrome.
Подготовка к расшифровке
Чтобы запустить конвейер, нужно сделать ряд действий.
1. Включаем микшер
Для активации микшера идем в правый нижний угол экрана Windows. Находим иконку динамика и щелкаем на неё правой кнопкой мыши.
В появившемся меню выбираем "Записывающие устройства".
Появится окно настроек "Звук", в котором нужно выбрать микшер и нажать на кнопку "По умолчанию".
Если в списке никаких микшеров нет, не стоит сразу расстраиваться. Щелкните на белом фоне под имеющимися устройствами правой кнопкой мыши и в появившемся меню выберите оба варианта: "Показать отсоединенные и отключенные устройства".
Вот если и там ничего подходящего нет, тогда печаль.
2. Запускаем Google Chrome
Можно взять любой другой браузер, где на странице Переводчика Гугла есть кнопка включения микрофона и возможность надиктовать текст. К примеру, в FireFox 60.0.1 этого нет.

Google Переводчик в браузере Firefox (микрофона нет) - с таким работать не получится.

Браузер Google Chrome для транскрибации в самый раз
Начало работы
Всё, больше никаких настроек и телодвижений не требуется. Открываем переводчик гугла в хроме и исходник с аудио. Сначала включаем запись в переводчике нажатием на микрофон, затем запускаем аудиодорожку.
Если исходный файл длинный, стоит проследить за ходом работы, чтобы процесс дошел до конца, т.к. ограничение на ввод - 5000 знаков.
Расшифровка больших файлов без лимитов
В случае, когда надо расшифровать аудио или видео файл большой длительности, можно использовать Google Документы. Для этого заходим в сервис и создаём новый текстовый файл, по виду аналогичный тем, что в MS Word.
Сверху в панели меню ищем "Инструменты" и там в выпадающем списке выбираем "Голосовой ввод" (расположен ближе к концу списка, с иконкой микрофона). Также его можно активировать сочетанием горячих клавиш Ctrl+Shift+S.
Если всё сделано верно, слева от документа на экране появится изображение микрофона на сером фоне.
Щелкаем на него левой кнопкой мыши, запускаем видео или аудио трек и начинаем работу. Звук начнёт автоматически записываться в текст.
При необходимости над изображением микрофона можно выбрать язык ввода.

Вебмастер. Интернет-предприниматель. Первый сайт создал в конце 90-х, еще в школе. Сертифицированный специалист. Участник ежегодных конференций по продажам, SEO, маркетингу, разработке сайтов, арбитражу трафика.
спасибо огромное! обалдеть, какой способ класс!