Питон-разработка, нарезка фрагментов аудио из имеющегося файла по предлагаемому алгоритму
Бюджет
83$
/ 5000
руб
в месяц
Создан: 2 года назад
На модерации
- Описание
- Имеется некоторый абзац в тексте (книга, интервью, лекция, подкаст, стендап и проч). Необходимо с большой точностью вырезать этот абзац из файла аудио, в котором звучит начитанный текст.
Предлагается закодировать следующий алгоритм:
1. находим время начала (а потом так же и конца) нужного абзаца, разделив индекс первой буквы Х на общую длину текста и умножив результат на продолжительность всего аудио.. это расчетное время, оно обычно максимум на полминуты не попадает в нужную точку аудио.
2. отмеряем от найденного времени по минуте назад и вперед, распознаем двухминутный фрагмент с помощью библиотеки питона или API, там почти точно содержится наш Х.
3. находим индекс (У) ближайшей совпадающей пары слов (порядковый номер первой буквы этой пары от начала двухминутки), но совпадающую пару ищем по оригинальному тексту от Х.. после нахождения определяем смещение У от Х по оригинальному тексту, вводим поправку на разницу количества знаков (в распознанной двухминутке и средней двухминутке оригинала), находим скорректированный Х1 (внутренний индекс начала нужного фрагмента по отношению к началу двухминутки).. во избежание ошибки, связанной с возможным нахождением совпадающей пары в других участках франмента, ищим еще и влево от Х, добавляем условие, чтобы учитывалась только пара, стоящая в распознанном фрагменте после этой.
3. делим Х1 на число знаков в двухминутном распознанном фрагменте, потом результат умножаем на 120 (секунд в нем)..
4. полученное время в секундах прибавляем ко времени начала двухминутки (это, как мы помним, самое первое расчетное время минус минута)
5. с полученным уточненным временем производим почти ту же операцию, но отложив уже не по минуте, а по пять секунд вперед и назад..
6. то же проделываем с концом фрагмента
нюанс возможно, хоть и маловероятно, что Х не попадет в двухминутный, а потом в десятисекундный кусок..
на этот случай предлагаю в момент определения расстояния от Х до первой совпавшей пары прописать условие, по которому если это расстояние больше например 100 знаков или совпадение вообще не обнаруживается, то перейти к другому циклу, где диапазон первого поиска будет уже например 4 минуты, а второго 20 сек.. такое понадобится редко, но вдруг..
Прошу обращаться только в случае, если алгоритм полностью понятен.
Сумма окончательная, обсуждению не подлежит.
Предоплата не обсуждается.
Предпочтительна готовность к дальнейшей работе с фрагментами текстов (nltk, sql и проч).
- Категория
Источник: fl.ru
Похожие проекты
$21
0
1
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы ....
1 неделя назад
0
0
Разработать впн сервис ( Приложения на ios и android + сайт для оплаты подписки). Настройка Серверов. Оплата по договоренности. Работаем черед безопасную сделку....
2 недели назад
$357
0
0
$21
0
3
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы ....
1 месяц назад
$214
0
1
Здравствуйте, у кого есть проект по продвижению chaturbate? Или кто-то делает?...
1 месяц назад
$21
0
0
Заказные доработки функционирующих учётно-управленческих систем на производственных предприятиях. Навыки программирования в MS SQL, VBScript, 1С, знание принципов ООП....
1 месяц назад
$36
0
2
Нужно опубликовать мобильное приложение для Android в Гугл маркет с аккаунта разработчика Гугл плей консоль, созданного ДО Ноября 2023. В рамках проекта, необходимо прислать приглашение мне на почту, чтобы я загрузила приложение и отправила его на модерацию, с сохранением безвременного доступа к моему......
1 месяц назад
$71
0
3
Сделать игру для яндекс игр, настроить рекламу в игре и помочь с публикацией игры в платформе яндекс игры. Игра - карточная игра Пасьянс Паук (косынка) Игровой процесс: Тип игры: Пасьянс Паук. Количество мастей: Игрок может выбирать количество мастей: 1, 2, 3 или 4. Подсказки: Автоматические подсказки,......
2 месяца назад
$14
0
3
Без акцента на идею, необходимо создать мобильное приложение iOs и Android, с возможностью трансляции основной информации в миниапп Tg. Интеграция с платежной системой, внутренний кошелек, две валюты. В зависимости от гео, возможность конвертации валют ч/з сервер. На старте, сервер скорее облачный. Двухфакторная......
2 месяца назад
$1200
0
0
Необходимо перевести действующую БД с версии 77 на 8 (переписать конфигурацию, настроить обработки для переноса данных). Не типовая конфигурация по учету пенсионеров в ГУ РК....
2 месяца назад
$22
9
3
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
2 месяца назад
$714
0
2
Описание задачи: Необходимо разработать serverless функцию на базе NestJS и TypeScript для автоматизированной обработки видеофайлов, загружаемых в Yandex Cloud Storage. Функция должна выполнять конвертацию видео в формат, поддерживаемый основными веб-браузерами, с последующим сжатием до оптимального......
2 месяца назад
$44
49
1
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
2 месяца назад
28
1
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
2 месяца назад
44
8
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
2 месяца назад
$1111
23
0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
2 месяца назад
$33
31
2
$22
55
0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
2 месяца назад
36
0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
2 месяца назад
83
4
37
0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
2 месяца назад
Похожая удалённая работа
- Удаленная работа для веб-программиста
- Удаленная работа для разработчика баз данных
- Удаленная работа для прикладного программиста
- Удаленная работа для системного программиста
- Удаленная работа для разработчика игр
- Удаленная работа для разработчика мобильных приложений
- Удаленная работа для тестировщика ПО
- Удаленная работа для 1С программиста
- Удаленная работа для разработчика встраиваемых систем
- Удаленная работа для разработчика CRM и ERP