Архив: Разработать PHP скрипт: парсер страницы портала

Бюджет 5$ / 300
руб
в месяц
Создан: 5 лет назад
Закрыт
Описание
За неимением времени на все задачи, возникающие по проекту, ищу себе помощника.

Начнём с одной задачи, если всё ок, то у меня тут полный задачник задач. В частности есть около 10 сайтов, которые надо спарсить по идентичному алгоритму и я все эти сайты хочу отдать Вам на парсинг.
-------------
Задача простая – спарсить типовую страничку статьи из HBR и вытащить из неё нужные данные в конкретный массив.

Вход в скрипт будет таким:

$link="https:// hbr-russia .ru /management/ strategiya/767838"; //(пробелы убрать) Естественно, линк будет меняться, но все линки будут именно на статьи HBR
$content=get_html_code_url($link); //Получили страничку в HTML, такая функция уже работает, если нужна, могу дать ее текст
Вот эту $content и нужно распарсить и получить следующие данные на выходе:

$artcl['article_title'] – это название статьи (в примере это "Идеальный штурм")

$artcl['article_content'] – содержание статьи в HTML (начинается с "Около 20 лет назад я проводил мозговой" и заканчивается " лидерства и инноваций в Школе менеджмента Слоуна.")

$artcl['SEO_descrtn'] – описание из тега <meta  name="description"> ("Нужны прорывные идеи? Ищите вопросы, а не ответы")

$artcl['page_img'] – URL картинки у статьи (https:/ /cdn. hbr-russia. ru /image/ 2018/37/z2scs/ original-19gl.jpg), вытаскивать или из картинки, или из og:image

$artcl['pubDate'] – дата публикации со страницы (10 мая 2018)

$author_name – имя автора статьи (Хол Грегерсен)

$artcl['tags'] – теги маленькими буквами через ;; (в примере "нужны;;прорывные;;идеи;;ищите;;вопросы;;отве ты;;менеджмент;;стратегия"). Брать из <meta name="keywords"> и из названия раздела

-----------------
Я сам разработчик PHP, поэтому буду понимать, что Вы написали, когда буду проверять работу.
Проверять буду на 3-4 конкретных статьях, так что быстро проверю и заплачу.

Я не перфекционист, мне лишь бы работало. Но всё же совсем не красивый гоп-код не подойдёт. Желательно, при парсинге пользоваться DOMDocument и поиском в нём. Но если сделаете как то проще, то и хорошо.

Могу дать пример подобного скрипта для другого сайта, если Вам это поможет.

По ходу скрипта должны быть комментарии, поясняющие что делаем.
Категория

Похожие проекты

$71
0 0
Всем привет! Необходимо разработать лендинг на платформе Salebot. Лендинг будет в стиле визитка для кофейни. Интересует именно данная платформа, так как многие мои услуги сделаны именно там....
safe 
0 0
Ищу клиента для создания учебного проекта и оформления портфолио бесплатно или за символическую сумму....
safe$500
0 3
Мы ищем fullstack разработчика, который может сделать сайт под ключ. Есть детальное ТЗ, обязатедбное к ознакомлению и наработки по дизайну в виде макета Figma....
safe$120
0 4
Должно быть у исполнителя готовое и грамотно сделанное портфолио....
3 месяца назад
safe 
11 1
Нужен сайт по открытию кейсов для игры Standoff 2. Нужен самый обычный дизайн. Личный кабинет, инвентарь, авторизация через ВК. В Админке должна быть возможность создавать/удалять кейсы, редактировать шансы на выпадение какого-либо дропа, количество кейсов, устанавливать цену. В Админке должна быть возможность......
3 месяца назад
 
0 5
Требуется веб дизайнер для  2х проектов:. Оптимизации существующего сайта (лендинг) по танцевальному фитнесу на wix. com. Создание онлайн магазина био добавок и его оптимизация.   Ищем профессионального дизайнера, который готов на долгосрочное сотрудничество....
 
0 2
Нужно сделать сайт просчет оффера. Верстка страницы с Figma....
3 месяца назад
$33
10 1
Мне нужен бот перехватчик для программы ( taxsee driver ) чтобы брать предварительные и текущие заказы. Требования: . 1 бот перехватчик нужен для android. 2 можно писать bоt под моим аккаунтом или другие варианты. 3 функция отключения и включения бота когда он нужен или не нужен. За хорошую работу готов......
3 месяца назад
 
76 1
Ищу фрилансера для создания лендингов на Битрикс24. Занятость постоянная, 1 раз в 3 месяца....
4 месяца назад
 
138 2
safe 
498 6
Необходимо написать небольшую серверную часть учебного сайта для запуска под виртуальной машиной Oracle VM VirtualBox  Debian 6. 1 используя php7. 33 и базу MongoDB....
safe 
134 7
ИЩУ СПЕЦОВ – ВЫСОКОГО УРОВНЯ!   1). Уточните, какое у вас образование. 2). Обязательно предоставьте портфолио - лучшие работы. 3). Условия сотрудничества – по договоренности (сообщите ваши предварительные условия).   П. все предложения, которые меня заинтересуют – либо отвечу, либо сохраню контакты в......
4 месяца назад
 
89 1
Нужно будет делать видео по примеру уже готового видео. Вы подойдете если : имеете базовые-легкие знания в трейдинге,если у вас хороший микрофон, нормальная дикция, и есть программа для снятия экрана на видео. (Себя снимать не нужно,только видео экрана) Чем выше качество тем выше оплата . Оплата за среднее......
safe$111
122 2
Добрый день заинтересовавшимся! У нас сайт на стадии разработки на ОС 3. Создано ТЗ. Необходимо выполнить все пункты в ТЗ. Предварительно 10 000 руб. Поднятие цены можно и обсудить....
$1000
286 5
TALP GROUP Мы занимаемся разработкой и продвижением IT- продуктов. В нашем арсенале множество интересных кейсов, большинство из которых реализованы на нашей собственной low/no code платформе Аltrp. Мы работаем как над внутренними проектами, так и с внешними заказчиками. Среди них: разработка швейцарской......
safe 
174 17
Добрый день. Мне необходимо скопировать действующий сайт с полным функционалом  https://gk-grupp....
4 месяца назад
 
198 12
Ищем специалиста для работы над дизайном агенства недвижимости для англоязычной аудитории....
safe 
109 2
Меняли хостинг сайта поэтому имена сервера слетели, надо поменять на новые и все....
$250
315 17
Разработка продающего лендинга, ТЗ во вложенных файлах....
 
164 6
Нужно ускорить загрузку сайта....
4 месяца назад
Смотреть все