Архив: Распарсить html блок верстка которого постоянно меняется

Бюджет По договоренности
Создан: 6 лет назад
Закрыт
Описание
Стоит задача распарсить html блок верстка которого постоянно меняется

(

изменяются классы,

теги,

позиция тегов в коде

то есть таким образом система защищена от парсинга

)



поэтому xpath и CSS селекторы бессильны ..)

Возможно такое можно реализовать используя регулярные выражения (regular expressions) !?

Нужна реализация на js



Вот некоторые критерии которыми можно описать информацию внутри блока который нужно распарсить ($ {data_name})





$name

# Не включает html тегов



$price

# Не включает html тегов

# Состоит из буквенного кода валюты и цифр (UAH 315.00 | UAH 315 | USD 315.00 ...)

$shop_name

# Не включает html тегов

# Как правило находится около $price (справа от $price)

# Может содержать ленты (from | в | в) которая идет перед названием магазина и т.д.



$description

# Может отсутствовать

# Может содержать html теги

# Как правило размещен после $shop_name



$img

# Не включает html тегов

# Содержится в html атрибуте "src"

# Может быть в формате url (например src = "https://example.com/fefwef/4tajfg/")

# Может быть в формате base64 (например src = "data: image / webp; base64, UklGRq4ZAABX .......")
Категория