Архив: Парсинг данных автокаталога

Бюджет По договоренности
Создан: 5 лет назад
Закрыт
Описание
Доброго времени суток!

Требуется спарсерить данные со страниц каталога автозапчастей ИЛКАТС и сохранить результаты для подгрузки в MySQL(варианты).
Под данными подразумевается только текст.
Последний раздел ОБЩИЕ КАТАЛОГИ, не нужен, т.к. это выборка из предыдущих.

Сохранить нужно в виде таблиц определенной структуры по названиям столбцов, т.е.:
A – БРЕНД АВТО
А1 – РЫНОК СБЫТА (если указан)
B – МОДЕЛЬ АВТО
C – ПОКОЛЕНИЕ АВТО (если указано)
D – МОДИФИКАЦИЯ АВТО
E – КОД АВТО
F – ТИП ДВИГАТЕЛЯ (бензин/дизель)
G – КОД ДВИГАТЕЛЯ
H – ОБЪЕМ ДВИГАТЕЛЯ
I – МОЩНОСТЬ ДВИГАТЕЛЯ
J – ПРИВОД (передний/задний/полный)
K – ГОДЫ ВЫПУСКА МОДЕЛИ
L – ГРУППА АВТОЗАПЧАСТЕЙ
M – ПОДГРУППА АВТОЗАПЧАСТЕЙ
M1 – ПОДГРУППА АВТОЗАПЧАСТЕЙ СЛЕДУЮЩЕГО УРОВНЯ (если проваливается)
N – OEM НОМЕР ДЕТАЛИ (АРТИКУЛ)
O – НАИМЕНОВАНИЕ ДЕТАЛИ (описание)
P – ПРИМЕЧАНИЕ (если указано)
Q – КОЛИЧЕСТВО
R – ПРИМЕНЯЕМОСТЬ (если указано)
S – ЕЩЕ ГРУППА (если необходима)
S1 – ЕЩЕ ГРУППА (если логически понадобится между вышеуказанными)

Данных, наверняка, получится больше, чем сможет отобразить Excel. Поэтому для сохранения, визуализации и дальнейшего использования нам потребуется загнать все это, например, в MySQL и вытаскивать, через запросы. 
Поэтому каждый столбец должен быть в отдельном файле и с индексацией.
На выходе должно получиться что-то похожее на SQL-выгрузку из Tecdoc, если Вы понимаете, о чем я.

Нужно спарсерить древовидный массив данных и структурированно его сохранить.

На этапе набора данных до "миллионного ограничения excel" по количеству отображаемых строк показать предварительный результат, что все идет по плану.
Категория

Похожие проекты

$21
0 1
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 неделя назад
safe 
0 0
Разработать впн сервис ( Приложения на ios и android + сайт для оплаты подписки). Настройка Серверов. Оплата по договоренности. Работаем черед безопасную сделку....
2 недели назад
safe$21
0 3
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 месяц назад
$214
0 1
Здравствуйте, у кого есть проект по продвижению chaturbate? Или кто-то делает?...
1 месяц назад
$21
0 0
Заказные доработки функционирующих учётно-управленческих систем на производственных предприятиях. Навыки программирования в MS SQL, VBScript, 1С, знание принципов ООП....
safe$36
0 2
Нужно опубликовать мобильное приложение для Android в Гугл маркет с аккаунта разработчика Гугл плей консоль, созданного ДО Ноября 2023. В рамках проекта, необходимо прислать приглашение мне на почту, чтобы я загрузила приложение и отправила его на модерацию, с сохранением безвременного доступа к моему......
safe$71
0 3
Сделать игру для яндекс игр, настроить рекламу в игре и помочь с публикацией игры в платформе яндекс игры. Игра - карточная игра Пасьянс Паук (косынка) Игровой процесс: Тип игры: Пасьянс Паук. Количество мастей: Игрок может выбирать количество мастей: 1, 2, 3 или 4. Подсказки: Автоматические подсказки,......
$14
0 3
Без акцента на идею, необходимо создать мобильное приложение iOs и Android, с возможностью трансляции основной информации в миниапп Tg. Интеграция с платежной системой, внутренний кошелек, две валюты. В зависимости от гео, возможность конвертации валют ч/з сервер. На старте, сервер скорее облачный. Двухфакторная......
$1200
0 0
Необходимо перевести действующую БД с версии 77 на 8 (переписать конфигурацию, настроить обработки для переноса данных).   Не типовая конфигурация по учету пенсионеров в ГУ РК....
safe$22
9 3
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
$714
0 2
Описание задачи: Необходимо разработать serverless функцию на базе NestJS и TypeScript для автоматизированной обработки видеофайлов, загружаемых в Yandex Cloud Storage. Функция должна выполнять конвертацию видео в формат, поддерживаемый основными веб-браузерами, с последующим сжатием до оптимального......
safe$44
49 1
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe 
28 1
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
2 месяца назад
safe 
44 8
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
2 месяца назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
3 месяца назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
2 месяца назад
Смотреть все