Audiogrep — интересный питоновский скрипт, который осуществляет распознавание речи из аудиофайлов, а потом ищет текст по заданному запросу, извлекает каждый найденный фрагмент и склеивает их все в общий звуковой файл.

Получается эдакая мега-подборка на заданную тему. Сам автор говорит, что использует её для обработки аудиокниг.

Скрипт использует программу CMU Pocketsphinx для распознавания речи, а также pydub для склеивания звуковых кусочков.

Опять же, автор упоминает другой скрипт videogrep, который вышел раньше. Он делает совершенно то же самое, только с видеороликами. Анализ происходит по звуковой дорожке, но вместе с ней можно брать и сопровождающее видео.

В общем, идея вполне здравая. Мало ли что понадобится найти в больших архивах аудио- и видеоматериалов. Особенно прикольно издеваться над политиками, которые любят повторять одни и те же фразы.



1 комментарий

  1. 16.05.2015 at 05:41

    Ух ты! Расчленёнка)))

Оставить мнение