Парсер большой, многопоточный, сложный, и страшный

Бюджет 370$ / 22222
руб
в месяц
Создан: 2 года назад
На модерации
Описание
Парсеры сейчас пишут кто угодно, но нам нужен супер-спец с большим опытом, уже писавший именно такие сложные распределенные и многопоточные проекты.

Написание только на РНР (другие языки не предлагать). Также можно использовать Laravel (по желанию).

Цель – сделать парсер который будет парсить с мега-большой скоростью за счет параллельной многопоточности (планируем использовать около 500 IP-адресов, то есть 500 разных хостов).

Архитектура должна быть такой:
1) Центральная БД, куда стекаются все данные.
2) Пауки (идентичные), работающие на 200-500 разных IP-адресах и хостах (каждый паук на своем хосте), подключающиеся к центральной БД для получения списка парсинг-страниц и занесению в БД следующие по очереди страницы, и скачивающие html-страницы сайта который мы парсим. Настройки скорости работы и нагрузки (хаотично настраиваемые паузы в миллисекундах и т.п.). Эмуляция разных заголовков браузеров.
3) Сrawler, который анализирует все что скачали пауки, распарсивает скачанные html-страницы, и заносит итоговую информацию в БД.

Пункты 2 и 3 друг с другом фактически никак не связаны. Работают отдельно друг от друга.
Соответственно и стоимость работ тоже можно разбить на эти две части. Ну или одну в целом написать.

ВАЖНО: Спам-ответы типа "мы пишем парсеры хорошие и разные" я буду игнорировать. Напишите пожалуйста антиспам-фразу "я всё прочитал". И не теряйте время на пустые письма, сразу пишите примеры, доказательство вашего опыта, я ведь все равно об этом начну спрашивать, и мы еще неделю будем переписываться.

Предпочтения отдаются ИП или самозанятым исполнителям.
Категория
Источник: fl.ru

Похожие проекты

safe$22
9 0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
safe 
28 0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
safe 
44 1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
safe$44
49 0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe$1111
48 0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
 
38 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
31 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
40 1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59 1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
 
96 0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75 1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
 
117 3
Очень простой криптообменник в виде веб-сайта. Без смарт-контрактов и т. Все платежи вручную....
Смотреть все