Скраппер сайта по продаже вина

Бюджет 50$ / 3000
руб
в месяц
Создан: 3 года назад
На модерации
Описание
Необходимо создать скраппер информации о вине с сайта SimpleWine.ru, затем получить рейтинг каждой бутылки вина через АПИ vivino, затем сделать экспорт всех полученных данных в Excel .xslx


Стек: python 3.8+, scrapy, sqlite, sqlalchemy, git


Паук для SimpleWine.ru:
- обходит каталог вина simplewine.ru/catalog/vin...
- сохраняет все текстовые данные о вине, изображения бутылок, ссылку на страницу сайта в БД SQLite;


Паук для Vivino:
- читает данные о бутылках из БД;
- запрашивает дополнительные данные о бутылках через АПИ Vivino;
- делает базовые проверки, что Vivino правильно распознало бутылку;
- сохраняет дополнительные данные в БД;

Документация по АПИ Vivino не публична, но был сделан реверс-инжиниринг. Будет предоставлен скрипт на питоне, который демонстрирует как работать с этим АПИ.
Логика работы АПИ следующая: скрипт загружает изображение бутылки на сервер, ждет некоторое время пока Vivino распознает название и год выпуска бутылки по этикетке, скрипт получает в качестве ответа JSON с данными.


Экспорт данных в Excel
Нужно настроить экспорт данных из SQLite в Excel – на выходе должна получаться одна таблица со списком всех бутылок.
Для экспорта можно использовать Sqlite browser или любое другое решение.
Важно, чтобы в файле корректно отображались изображения бутылок, а ссылки на страницы сайтов корректно работали.


Ожидаемый результат работы – код в репозитории на github, успешный запуск скраппера (excel файл, логи).


Бутылок на SimpleWine не много – порядка 5000.
Проект в целом не сложный, но нужно будет вникнуть в особенности представления информации о вине.
Проект подойдет даже для новичка.
По моей оценке, выполнение проекта займет два дня работы, если уже есть опыт с перечисленным стеком.


Оформление только через Безопасную сделку.
Категория
Источник: fl.ru

Похожие проекты

safe$22
9 0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
safe 
28 0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
safe 
44 1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
safe$44
49 0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe$1111
48 0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
 
38 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
31 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
40 1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59 1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
 
96 0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75 1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
 
117 3
Очень простой криптообменник в виде веб-сайта. Без смарт-контрактов и т. Все платежи вручную....
Смотреть все