Архив: Парсинг данных автокаталога

Бюджет По договоренности
Создан: 5 лет назад
Закрыт
Описание
Доброго времени суток!

Требуется спарсерить данные со страниц каталога автозапчастей ИЛКАТС и сохранить результаты для подгрузки в MySQL(варианты).
Под данными подразумевается только текст.
Последний раздел ОБЩИЕ КАТАЛОГИ, не нужен, т.к. это выборка из предыдущих.

Сохранить нужно в виде таблиц определенной структуры по названиям столбцов, т.е.:
A – БРЕНД АВТО
А1 – РЫНОК СБЫТА (если указан)
B – МОДЕЛЬ АВТО
C – ПОКОЛЕНИЕ АВТО (если указано)
D – МОДИФИКАЦИЯ АВТО
E – КОД АВТО
F – ТИП ДВИГАТЕЛЯ (бензин/дизель)
G – КОД ДВИГАТЕЛЯ
H – ОБЪЕМ ДВИГАТЕЛЯ
I – МОЩНОСТЬ ДВИГАТЕЛЯ
J – ПРИВОД (передний/задний/полный)
K – ГОДЫ ВЫПУСКА МОДЕЛИ
L – ГРУППА АВТОЗАПЧАСТЕЙ
M – ПОДГРУППА АВТОЗАПЧАСТЕЙ
M1 – ПОДГРУППА АВТОЗАПЧАСТЕЙ СЛЕДУЮЩЕГО УРОВНЯ (если проваливается)
N – OEM НОМЕР ДЕТАЛИ (АРТИКУЛ)
O – НАИМЕНОВАНИЕ ДЕТАЛИ (описание)
P – ПРИМЕЧАНИЕ (если указано)
Q – КОЛИЧЕСТВО
R – ПРИМЕНЯЕМОСТЬ (если указано)
S – ЕЩЕ ГРУППА (если необходима)
S1 – ЕЩЕ ГРУППА (если логически понадобится между вышеуказанными)

Данных, наверняка, получится больше, чем сможет отобразить Excel. Поэтому для сохранения, визуализации и дальнейшего использования нам потребуется загнать все это, например, в MySQL и вытаскивать, через запросы. 
Поэтому каждый столбец должен быть в отдельном файле и с индексацией.
На выходе должно получиться что-то похожее на SQL-выгрузку из Tecdoc, если Вы понимаете, о чем я.

Нужно спарсерить древовидный массив данных и структурированно его сохранить.

На этапе набора данных до "миллионного ограничения excel" по количеству отображаемых строк показать предварительный результат, что все идет по плану.
Категория

Похожие проекты

safe$22
9 0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
safe 
28 0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
safe 
44 1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
safe$44
49 0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe$1111
48 0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
 
38 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
31 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
40 1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59 1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
 
96 0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75 1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
 
117 3
Очень простой криптообменник в виде веб-сайта. Без смарт-контрактов и т. Все платежи вручную....
Смотреть все