Парсер большой, многопоточный, сложный, и страшный

Бюджет 370$ / 22222
руб
в месяц
Создан: 2 года назад
На модерации
Описание
Парсеры сейчас пишут кто угодно, но нам нужен супер-спец с большим опытом, уже писавший именно такие сложные распределенные и многопоточные проекты.

Написание только на РНР (другие языки не предлагать). Также можно использовать Laravel (по желанию).

Цель – сделать парсер который будет парсить с мега-большой скоростью за счет параллельной многопоточности (планируем использовать около 500 IP-адресов, то есть 500 разных хостов).

Архитектура должна быть такой:
1) Центральная БД, куда стекаются все данные.
2) Пауки (идентичные), работающие на 200-500 разных IP-адресах и хостах (каждый паук на своем хосте), подключающиеся к центральной БД для получения списка парсинг-страниц и занесению в БД следующие по очереди страницы, и скачивающие html-страницы сайта который мы парсим. Настройки скорости работы и нагрузки (хаотично настраиваемые паузы в миллисекундах и т.п.). Эмуляция разных заголовков браузеров.
3) Сrawler, который анализирует все что скачали пауки, распарсивает скачанные html-страницы, и заносит итоговую информацию в БД.

Пункты 2 и 3 друг с другом фактически никак не связаны. Работают отдельно друг от друга.
Соответственно и стоимость работ тоже можно разбить на эти две части. Ну или одну в целом написать.

ВАЖНО: Спам-ответы типа "мы пишем парсеры хорошие и разные" я буду игнорировать. Напишите пожалуйста антиспам-фразу "я всё прочитал". И не теряйте время на пустые письма, сразу пишите примеры, доказательство вашего опыта, я ведь все равно об этом начну спрашивать, и мы еще неделю будем переписываться.

Предпочтения отдаются ИП или самозанятым исполнителям.
Категория
Источник: fl.ru

Похожие проекты

safe 
0 2
Необходимо разработать систему, которая: Подключается к API Diagnocat и iDent (через токены доступа). Получает данные о пациенте, результатах диагностики, снимках и назначениях. Автоматически формирует структурированный отчет по шаблону (включая врачей, этапы лечения, стоимость и описание процедур).......
 
0 0
Необходимо связать БД 1C:ERP с БД Outlook, MS Access, Битрикс24. Например при вводе нового сотрудника в 1С:ERP он должен автоматически появляться в вышеперечисленных БД....
1 месяц назад
 
0 1
Требуется реализация отчёта на кастомизированной 1С:УПП 1. 2, ТЗ и контрольный пример во вложении, 80% кода должно быть покрыто модульными тестами....
2 месяца назад
$7
0 1
Мне нужно копировать мой текст и вставлять в одну группу ВК с открытой стеной для публикации рекламы. Задача скрипта/сервиса/программы - примерно каждые 10 секунд брать мой текст и вставлять в эту группу. Я пробовал через одну программу, которая записывает действия мышки и потом повторяет, но она как-то......
4 месяца назад
safe 
0 0
Написать прошивку для A94B114, используя 2 подобные рабочие прошивки. Все файлы есть....
$21
0 2
Нужно разархивировать файл архив. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы(скрины)....
6 месяцев назад
safe 
0 1
Входные: Имеется скрипт по обработке email писем и добавление их в систему Redmine   Проблема: Система обработки этих писем написана некорректная и негибкая    Задача: Переписать логику обработки входящих писем, чтобы исключить их потерю при незначительных отклонениях от ожидаемой структуры....
$37
0 1
- В обязанности сотрудника входит поддержание мобильного приложения системы автоматизации бизнеса. - Работа сдельная: задачи выдаются на оценку, далее после согласования передаются на реализацию. - Заключаем договор и NDA (соглашение о неразглашении)....
$71
0 0
Информация о проекте: Проект включает в себя React Native приложение с Expo внутри которого находится webview с сайтом На устройствах с ОС IOS проблема с воспроизведением видео....
6 месяцев назад
safe 
0 0
Разрабатываю десктопные программы на языке Java,  а так же Java + SQL....
 
0 6
  1. Чтобы можно было писать описание события (без заголовка) - превью в списке берется N количества букв с начала. (в списке писать дату события и сколько осталось до него) . Выставление даты и времени напоминания и ИНТЕРВАЛА ПОВТОРА ОТ 1 МИНУТЫ! Выставлять количество повторов, далее напоминания прекращаются.......
safe 
0 4
Сайт arg2028t. beget. tech/. Нужно сделать вот такой калькулятор. airprint. by/outdoor/wide-format. и еще некоторые доработки....
safe 
0 6
Краткое описание: Мы ищем исполнителя для тестирования функционала мобильного приложения на платформе Android. Задача включает проверку основных функций приложения, таких как работа комнаты, передача видео, звука и чата, а также создание подробной отчетности о найденных ошибках.   Требования к исполнителю:......
safe 
0 12
Разработка чат-бота под ваши нужды....
$143
0 0
Oпpocы (1008pyб/чaс) Заходитe на сaйт: gonsù....
9 месяцев назад
 
0 4
Требуется создать скрипт для premiere pro. Данная суть скрипта: в выделеном бине нужно что бы автоматически проставлялся in out ровно по серидине файла так что бы выделенная область была длиной 3 секунды. И требуется кнопка что бы работало через окно expressions. Проблема текущего в том что он не работает......
 
0 2
Нужно создать приложения под гемблинг/беттинг, на котлин. Приложение должно работать Firebase. Детали вышлю при обсуждение....
$21
0 4
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 год назад
safe 
0 3
Разработать впн сервис ( Приложения на ios и android + сайт для оплаты подписки). Настройка Серверов. Оплата по договоренности. Работаем черед безопасную сделку....
1 год назад
Смотреть все