Бюджет 583$ / 35000
руб
в месяц
Создан: 2 года назад
На модерации
Описание
Многопоток. Прокси
Я загрузаю в парсер ссылку вида:
www.avito.ru/moskva_i_mo/...
Я таких грузить буду несколько , от 1-10
ПЕРВЫЙ ЭТАП: 
Перейдя по этой ссылке на странице нам покажет 45-50 обьявлений, когда я загружаю вот эти ссылки я должен указать глубину сколько страниц по каждой будем собирать
например я загрузил:
www.avito.ru/moskva_i_mo/... ГЛУБИНА 5
www.avito.ru/moskva_i_mo/... ГЛУБИНА 5
Парсер переходит по каждой из этих ссылок + через конструктор строит переход на 2-3-4-5 страницы, собирает ссылки на все обьявления оттуда. 
То есть первый этап это сбор ссылок на обьявлений через ссылки для сбора
ВТОРОЙ ЭТАП:
Скрипт должен переходить по каждой обьяве и в следующем алгоритме чекать:
Сначало он смотрит на количество просмотров обьявления, там 2 цифры
Первая значит просмотров сегодня, вторая значит просмотров всего, мне нужны обьявы только сегодняшние, значит эти 2 числа должны совпадать. Если он чекает что просмотров сегодня и просмотров всего совпадает, мы такое обьявление берем в работу, собираем с него следующую информацию:
Название, цена, ссылка ( Вывод в ексель будет нужен офк)
Далее в такой обьяве нужно загрузить профиль продавца, ссылка на него так же будет в коде ссылки обьявления ее можно спарсить. с профиля продавца нам нужна следующая информация: 
Количество активных обьявлений и количество завершенных обьявлений. Далее вывод в ексель
Заголовок объявления – цена – ссылка на объявление – активных обьяв – завершенных обьяв
ТАК ЖЕ ПАРСЕР ДОЛЖЕН ВЕСТИ ИСТОРИЮ ПРОДАВЦОВ,  мне надо что бы ид каждого продавца который был спаршен заносился в историю продавцов, и когда мы перешли на обьяву чекнули что она подошла нам по просмотрам, мы получили ссылку на продавца, мы должны чекать нет ли этого ИД продавца у нас в базе, если есть, обьяву скипаем без загрузки страницы продавца , там ИД прям в ссылке, такую же систему нужно сделать для самих обьявлений, хранить историю и не парсить уже те что есть в истории.
Работа будет на awm проксях там по кд будет гугл капча, что то не загружаться, надо будет в случае таких ошибок просто брать следующую проксю , ну это мы еще с тобой конкретно обсудим когда писать будем по ходу появления ошибок
Прокси у меня будут авм, там 12к прокси и 70% из них за сутки обновляются
Главное что бы он быстро перебирал неудачи и догружал все без ошибок
Категория
Источник: fl.ru

Похожие проекты

safe$22
9 0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
safe 
28 0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
safe 
44 1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
safe$44
49 0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe$1111
48 0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
 
38 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
31 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
40 1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59 1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
 
96 0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75 1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
 
117 3
Очень простой криптообменник в виде веб-сайта. Без смарт-контрактов и т. Все платежи вручную....
Смотреть все