Архив: Скрипт для определения размера статей с указанных сайтов (на php 7)

Бюджет По договоренности
Создан: 6 лет назад
Закрыт
Описание
нужен скрипт который получает (POST) n url сайтов и определяет средний размер статьи на каждом.

В списке обычно до 50% сайтов на WP.

Методы определения

1) Поиск RSS

2) Поискать микроразметку (blogposting или Article)

3) Найти родителя h1. Значит все, что выше этого родительского контейнера, уже можно отбросить, останется только тело статьи со всякими служебными элементами, которые, в принципе, тоже реально вычислить.

4) и другие методы которые вы посчитаете адекватными



5) Вычислить размер статьи без html тегов, округляем до сотен.



Отдаем GET (например в csv)запросом информацию виду

url=значение

url=значение

В случае если определить размер статьи не получается возвращаем ноль.

url=0

Если есть более 30% точных результатов = возвращаем также

sredn=значение

Если высчитать не удалось возвращаем 0.
Категория