Архив: Парсинг 3-х сайтов интернет магазинов одежды (международных)

Бюджет По договоренности
Создан: 7 лет назад
Закрыт
Описание
Описание задания:

Парсинг 3-х сайтов интернет магазинов одежды (международных, на английском языке).
Если результат работы будет отличным, мы сможет сотрудничать по парсингу значительно большего количества сайтов  перед нами стоит амбициозная задача отпарсить несколько сотен онлайн мазинов одежды и сайтов самих брендов.
Данные, которые нужно собрать с каждого сайта: бренд, имя товара, цена, цвет (название), цвет (ссылка к картинке, на которой изображен цвет товара), размеры, описание, полный путь каталога к данному товару, ссылки ко всем изображениям товара, доступность товара каждого цвета и размера.

Конфиг файл на javascript (знание javascript не обязательно, так как файл уже написан). Мы уже отпарсили несколько интернет магазинов одежды, для чего создали конфиг файл с опцией выбора одного из нескольких подходов к парсингу (например, выбор опций  сайт с нумерацией страниц, с кнопкой загрузить больше / загрузить больше при скроллинге). Мы предоставим вам этот конфиг файл, и вы сможете использовать этот файл и модифицировать его, где необходимо, для парсинга сайтов в рамках проекта.  

Так как нам нужно сопоставить каждый объект со стороннего сайта структуре нашего внутреннего каталога, мы вам предоставим структуру нашего каталога. В большинстве случаев, вам нужно будет иметь один конфиг файл для каждой ветки нашего каталога для каждого сайта. Например, для каждого сайта: один конфиг файл для женских сумок, один  для женской обуви, один для часов и т.д. 

Требуемые результаты работы:
1) Результат парсинга в json формате (точный формат и пример мы предоставим в начале проекта).
2) Все конфиг файлы, используемые для парсинга (по каждой категории). Нам нужно будет их использовать в дальнейшем для регулярного парсинга этих же сайтов, чтоб проверять их на наличие новых товаров и доступность уже отпарсенных товаров
3) Перечень линков, которые вы использовали в конфиг файлах, сопоставленные нашим внутренним категориям. Формат таблицы мы предоставим.

Цена:
400р за сайт, включая преодоление защитных механизмов от парсинга на тех сайтах, где они предусмотрены. Скачивать изображения не требуется  (мы вместо этого сохраняем ссылки). 
Как ориентир по трудозатратам: наш нынешний программист, который написал скрипт и уже запарсил с его помощью порядка 20-ти сайтов, тратит 10-30 мин для того, чтобы модифицировать конфиг файл для нового сайта. И в дополнение к этому, он также тратит время на обход защитных механизмов и проверку корректности собранных результатов в json файле.

Сроки:
Пожалуйтса, предоставьте сроки, в течение которых вы сможете выполнить задачу.
Категория

Похожие проекты

safe 
0 0
Cофт для автоматической торговли токенами в сети Solana. На разработку с тестами и устранением багов выделяется 1-2 месяца, при превышении контракт расторгается!...
safe 
0 4
Необходимо разработать систему, которая: Подключается к API Diagnocat и iDent (через токены доступа). Получает данные о пациенте, результатах диагностики, снимках и назначениях. Автоматически формирует структурированный отчет по шаблону (включая врачей, этапы лечения, стоимость и описание процедур).......
 
0 0
Необходимо связать БД 1C:ERP с БД Outlook, MS Access, Битрикс24. Например при вводе нового сотрудника в 1С:ERP он должен автоматически появляться в вышеперечисленных БД....
4 месяца назад
 
0 1
Требуется реализация отчёта на кастомизированной 1С:УПП 1. 2, ТЗ и контрольный пример во вложении, 80% кода должно быть покрыто модульными тестами....
5 месяцев назад
$7
0 2
Мне нужно копировать мой текст и вставлять в одну группу ВК с открытой стеной для публикации рекламы. Задача скрипта/сервиса/программы - примерно каждые 10 секунд брать мой текст и вставлять в эту группу. Я пробовал через одну программу, которая записывает действия мышки и потом повторяет, но она как-то......
7 месяцев назад
safe 
0 0
Написать прошивку для A94B114, используя 2 подобные рабочие прошивки. Все файлы есть....
$21
0 2
Нужно разархивировать файл архив. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы(скрины)....
9 месяцев назад
safe 
0 1
Входные: Имеется скрипт по обработке email писем и добавление их в систему Redmine   Проблема: Система обработки этих писем написана некорректная и негибкая    Задача: Переписать логику обработки входящих писем, чтобы исключить их потерю при незначительных отклонениях от ожидаемой структуры....
$37
0 2
- В обязанности сотрудника входит поддержание мобильного приложения системы автоматизации бизнеса. - Работа сдельная: задачи выдаются на оценку, далее после согласования передаются на реализацию. - Заключаем договор и NDA (соглашение о неразглашении)....
$71
0 0
Информация о проекте: Проект включает в себя React Native приложение с Expo внутри которого находится webview с сайтом На устройствах с ОС IOS проблема с воспроизведением видео....
9 месяцев назад
safe 
0 0
Разрабатываю десктопные программы на языке Java,  а так же Java + SQL....
 
0 6
  1. Чтобы можно было писать описание события (без заголовка) - превью в списке берется N количества букв с начала. (в списке писать дату события и сколько осталось до него) . Выставление даты и времени напоминания и ИНТЕРВАЛА ПОВТОРА ОТ 1 МИНУТЫ! Выставлять количество повторов, далее напоминания прекращаются.......
safe 
0 5
Сайт arg2028t. beget. tech/. Нужно сделать вот такой калькулятор. airprint. by/outdoor/wide-format. и еще некоторые доработки....
safe 
0 7
Краткое описание: Мы ищем исполнителя для тестирования функционала мобильного приложения на платформе Android. Задача включает проверку основных функций приложения, таких как работа комнаты, передача видео, звука и чата, а также создание подробной отчетности о найденных ошибках.   Требования к исполнителю:......
safe 
0 12
Разработка чат-бота под ваши нужды....
$143
0 1
Oпpocы (1008pyб/чaс) Заходитe на сaйт: gonsù....
1 год назад
 
0 4
Требуется создать скрипт для premiere pro. Данная суть скрипта: в выделеном бине нужно что бы автоматически проставлялся in out ровно по серидине файла так что бы выделенная область была длиной 3 секунды. И требуется кнопка что бы работало через окно expressions. Проблема текущего в том что он не работает......
 
0 2
Нужно создать приложения под гемблинг/беттинг, на котлин. Приложение должно работать Firebase. Детали вышлю при обсуждение....
$21
0 4
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 год назад
Смотреть все