Парсинг веб-камер с YouTube, фильтрация результатов – с сохранением в Эксель

Бюджет 83$ / 5000
руб
в месяц
Создан: 3 года назад
На модерации
Описание
Добрый день, коллеги. Работа для специалиста с опытом работы по парсингу ресурсов с YouTube (никаких отличий от типового парсинга товаров с и-магазинов, но требуется почистить результаты парсинга – примерно 80% будет мусора – такова специфика).

Парсим данные веб камер по стримингу:
- youtube.com

Результат Вашей работы – в виде заполненной таблицы Эксель (для последующей заливки в БД проекта) с полями:
- ID камеры;
- ресурс камеры (полный УРЛ потока);
- сайт-донор ресурса (youtube.com);
- заголовок камеры (текстовое поле в коде страницы камеры);
- мета-теги камеры (текстовое поле в коде страницы камеры);
- описание камеры (текстовое поле в коде страницы камеры);
- картинка камеры (если есть, обычно в jpg);
- страна (тег на карточке камеры или категория-раздел на странице);
- город (тег на карточке камеры или категория-раздел на странице);
- тематика камеры (выбор из списка – трансляции с городских достопримечательностей, площадей, парков, храмов и соборов, стадионов, горнолыжных курортов, пляжей, набережных, портов, оживленных перекрестков крупных городов);
- описание места (текстовое поле со страницы камеры);
- гео-данные камеры (координаты в формате для Google-карт или Яндекс-карт, если есть);
- дата (и время) создания записи;
- текущий статус камеры (on-line, картинка-заставка, трансляция прекращена, битая ссылка, статус неопределен).

Видео с камеры в туалете жилой квартиры – не интересует. Интересуют трансляции столичных достопримечательностей, монументов, с площадей, парков, храмов и соборов, стадионов, горнолыжных курортов, пляжей, набережных, портов, оживленных перекрестков крупных городов.

Как вывод по выполненной работе – Ваши рекомендации по тегам поиска и по фильтрации результатов парсинга. 
Дальнейшее планируемое развитие проекта – разработка скрипта для парсинга с этого ресурса и реализация первичной фильтрации результатов. Скрипт необходим будет на стеке Laravel&Vue (бюджет скрипта, сроки проработки – обсуждаем после выполнения работы и оплаты по основному заказу). 

Оплата. Если у Вас высокая карма на бирже – мы готовы работать по БС с предоплатой. Иначе – оплата по результату.
Планируемые сроки на реализацию – 4 дня, планируемый бюджет 5к за каждые 5к отфильтрованных записей.

Требования к результатам: не менее 80% активных on-line камер, не менее 70% данных по таблице заполнено, не более 10% дублей, камер по сша – не более 10%, камер по России – не более 30%.
Прошу в мессенджеры на этапе обсуждения заказа не приглашать. Спасибо за понимание.

Полный список прорабатываемых по проекту скриптов (для информации): www.fl.ru/projects/472277...
Категория
Источник: fl.ru

Похожие проекты

safe$22
9 0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
safe 
28 0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
safe 
44 1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
safe$44
49 0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe$1111
48 0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
 
38 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
31 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
40 1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59 1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
 
96 0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75 1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
 
117 3
Очень простой криптообменник в виде веб-сайта. Без смарт-контрактов и т. Все платежи вручную....
Смотреть все