Парсер большой, многопоточный, сложный, и страшный

Бюджет 370$ / 22222
руб
в месяц
Создан: 1 год назад
На модерации
Описание
Парсеры сейчас пишут кто угодно, но нам нужен супер-спец с большим опытом, уже писавший именно такие сложные распределенные и многопоточные проекты.

Написание только на РНР (другие языки не предлагать). Также можно использовать Laravel (по желанию).

Цель – сделать парсер который будет парсить с мега-большой скоростью за счет параллельной многопоточности (планируем использовать около 500 IP-адресов, то есть 500 разных хостов).

Архитектура должна быть такой:
1) Центральная БД, куда стекаются все данные.
2) Пауки (идентичные), работающие на 200-500 разных IP-адресах и хостах (каждый паук на своем хосте), подключающиеся к центральной БД для получения списка парсинг-страниц и занесению в БД следующие по очереди страницы, и скачивающие html-страницы сайта который мы парсим. Настройки скорости работы и нагрузки (хаотично настраиваемые паузы в миллисекундах и т.п.). Эмуляция разных заголовков браузеров.
3) Сrawler, который анализирует все что скачали пауки, распарсивает скачанные html-страницы, и заносит итоговую информацию в БД.

Пункты 2 и 3 друг с другом фактически никак не связаны. Работают отдельно друг от друга.
Соответственно и стоимость работ тоже можно разбить на эти две части. Ну или одну в целом написать.

ВАЖНО: Спам-ответы типа "мы пишем парсеры хорошие и разные" я буду игнорировать. Напишите пожалуйста антиспам-фразу "я всё прочитал". И не теряйте время на пустые письма, сразу пишите примеры, доказательство вашего опыта, я ведь все равно об этом начну спрашивать, и мы еще неделю будем переписываться.

Предпочтения отдаются ИП или самозанятым исполнителям.
Категория
Источник: fl.ru

Похожие проекты

$21
0 1
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 неделя назад
safe 
0 0
Разработать впн сервис ( Приложения на ios и android + сайт для оплаты подписки). Настройка Серверов. Оплата по договоренности. Работаем черед безопасную сделку....
2 недели назад
safe$21
0 3
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 месяц назад
$214
0 1
Здравствуйте, у кого есть проект по продвижению chaturbate? Или кто-то делает?...
1 месяц назад
$21
0 0
Заказные доработки функционирующих учётно-управленческих систем на производственных предприятиях. Навыки программирования в MS SQL, VBScript, 1С, знание принципов ООП....
safe$36
0 2
Нужно опубликовать мобильное приложение для Android в Гугл маркет с аккаунта разработчика Гугл плей консоль, созданного ДО Ноября 2023. В рамках проекта, необходимо прислать приглашение мне на почту, чтобы я загрузила приложение и отправила его на модерацию, с сохранением безвременного доступа к моему......
safe$71
0 3
Сделать игру для яндекс игр, настроить рекламу в игре и помочь с публикацией игры в платформе яндекс игры. Игра - карточная игра Пасьянс Паук (косынка) Игровой процесс: Тип игры: Пасьянс Паук. Количество мастей: Игрок может выбирать количество мастей: 1, 2, 3 или 4. Подсказки: Автоматические подсказки,......
$14
0 2
Без акцента на идею, необходимо создать мобильное приложение iOs и Android, с возможностью трансляции основной информации в миниапп Tg. Интеграция с платежной системой, внутренний кошелек, две валюты. В зависимости от гео, возможность конвертации валют ч/з сервер. На старте, сервер скорее облачный. Двухфакторная......
$1200
0 0
Необходимо перевести действующую БД с версии 77 на 8 (переписать конфигурацию, настроить обработки для переноса данных).   Не типовая конфигурация по учету пенсионеров в ГУ РК....
safe$22
9 3
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
$714
0 1
Описание задачи: Необходимо разработать serverless функцию на базе NestJS и TypeScript для автоматизированной обработки видеофайлов, загружаемых в Yandex Cloud Storage. Функция должна выполнять конвертацию видео в формат, поддерживаемый основными веб-браузерами, с последующим сжатием до оптимального......
safe$44
49 1
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe 
28 1
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
2 месяца назад
safe 
44 7
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
2 месяца назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
2 месяца назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
2 месяца назад
Смотреть все