Парсер большой, многопоточный, сложный, и страшный
Бюджет
370$
/ 22222
руб
в месяц
Создан: 2 года назад
На модерации
- Описание
- Парсеры сейчас пишут кто угодно, но нам нужен супер-спец с большим опытом, уже писавший именно такие сложные распределенные и многопоточные проекты.
Написание только на РНР (другие языки не предлагать). Также можно использовать Laravel (по желанию).
Цель сделать парсер который будет парсить с мега-большой скоростью за счет параллельной многопоточности (планируем использовать около 500 IP-адресов, то есть 500 разных хостов).
Архитектура должна быть такой:
1) Центральная БД, куда стекаются все данные.
2) Пауки (идентичные), работающие на 200-500 разных IP-адресах и хостах (каждый паук на своем хосте), подключающиеся к центральной БД для получения списка парсинг-страниц и занесению в БД следующие по очереди страницы, и скачивающие html-страницы сайта который мы парсим. Настройки скорости работы и нагрузки (хаотично настраиваемые паузы в миллисекундах и т.п.). Эмуляция разных заголовков браузеров.
3) Сrawler, который анализирует все что скачали пауки, распарсивает скачанные html-страницы, и заносит итоговую информацию в БД.
Пункты 2 и 3 друг с другом фактически никак не связаны. Работают отдельно друг от друга.
Соответственно и стоимость работ тоже можно разбить на эти две части. Ну или одну в целом написать.
ВАЖНО: Спам-ответы типа "мы пишем парсеры хорошие и разные" я буду игнорировать. Напишите пожалуйста антиспам-фразу "я всё прочитал". И не теряйте время на пустые письма, сразу пишите примеры, доказательство вашего опыта, я ведь все равно об этом начну спрашивать, и мы еще неделю будем переписываться.
Предпочтения отдаются ИП или самозанятым исполнителям.
- Категория
Источник: fl.ru
Похожие проекты
$22
9
0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
1 год назад
28
0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
44
1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
1 год назад
$1111
23
0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
1 год назад
$22
55
0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
$33
31
1
$44
49
0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
1 год назад
$1111
48
0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
83
4
70
2
38
0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
36
0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
37
0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
31
0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
40
1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59
1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
96
0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75
1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
105
8
85
1
117
3
Очень простой криптообменник в виде веб-сайта. Без смарт-контрактов и т. Все платежи вручную....
1 год назад
Похожая удалённая работа
- Удаленная работа для веб-программиста
- Удаленная работа для разработчика баз данных
- Удаленная работа для прикладного программиста
- Удаленная работа для системного программиста
- Удаленная работа для разработчика игр
- Удаленная работа для разработчика мобильных приложений
- Удаленная работа для тестировщика ПО
- Удаленная работа для 1С программиста
- Удаленная работа для разработчика встраиваемых систем
- Удаленная работа для разработчика CRM и ERP