Архив: Распарсить html блок верстка которого постоянно меняется
Бюджет
По договоренности
Создан: 6 лет назад
Закрыт
- Описание
- Стоит задача распарсить html блок верстка которого постоянно меняется
(
изменяются классы,
теги,
позиция тегов в коде
то есть таким образом система защищена от парсинга
)
поэтому xpath и CSS селекторы бессильны ..)
Возможно такое можно реализовать используя регулярные выражения (regular expressions) !?
Нужна реализация на js
Вот некоторые критерии которыми можно описать информацию внутри блока который нужно распарсить ($ {data_name})
$name
# Не включает html тегов
$price
# Не включает html тегов
# Состоит из буквенного кода валюты и цифр (UAH 315.00 | UAH 315 | USD 315.00 ...)
$shop_name
# Не включает html тегов
# Как правило находится около $price (справа от $price)
# Может содержать ленты (from | в | в) которая идет перед названием магазина и т.д.
$description
# Может отсутствовать
# Может содержать html теги
# Как правило размещен после $shop_name
$img
# Не включает html тегов
# Содержится в html атрибуте "src"
# Может быть в формате url (например src = "https://example.com/fefwef/4tajfg/")
# Может быть в формате base64 (например src = "data: image / webp; base64, UklGRq4ZAABX .......")
- Категория