Архив: Разработать PHP скрипт: парсер страницы портала
Бюджет
5$
/ 300
руб
в месяц
Создан: 5 лет назад
Закрыт
- Описание
- За неимением времени на все задачи, возникающие по проекту, ищу себе помощника.
Начнём с одной задачи, если всё ок, то у меня тут полный задачник задач. В частности есть около 10 сайтов, которые надо спарсить по идентичному алгоритму и я все эти сайты хочу отдать Вам на парсинг.
-------------
Задача простая спарсить типовую страничку статьи из HBR и вытащить из неё нужные данные в конкретный массив.
Вход в скрипт будет таким:
$link="https:// hbr-russia .ru /management/ strategiya/767838"; //(пробелы убрать) Естественно, линк будет меняться, но все линки будут именно на статьи HBR
$content=get_html_code_url($link); //Получили страничку в HTML, такая функция уже работает, если нужна, могу дать ее текст
Вот эту $content и нужно распарсить и получить следующие данные на выходе:
$artcl['article_title'] это название статьи (в примере это "Идеальный штурм")
$artcl['article_content'] содержание статьи в HTML (начинается с "Около 20 лет назад я проводил мозговой" и заканчивается " лидерства и инноваций в Школе менеджмента Слоуна.")
$artcl['SEO_descrtn'] описание из тега <meta name="description"> ("Нужны прорывные идеи? Ищите вопросы, а не ответы")
$artcl['page_img'] URL картинки у статьи (https:/ /cdn. hbr-russia. ru /image/ 2018/37/z2scs/ original-19gl.jpg), вытаскивать или из картинки, или из og:image
$artcl['pubDate'] дата публикации со страницы (10 мая 2018)
$author_name имя автора статьи (Хол Грегерсен)
$artcl['tags'] теги маленькими буквами через ;; (в примере "нужны;;прорывные;;идеи;;ищите;;вопросы;;отве ты;;менеджмент;;стратегия"). Брать из <meta name="keywords"> и из названия раздела
-----------------
Я сам разработчик PHP, поэтому буду понимать, что Вы написали, когда буду проверять работу.
Проверять буду на 3-4 конкретных статьях, так что быстро проверю и заплачу.
Я не перфекционист, мне лишь бы работало. Но всё же совсем не красивый гоп-код не подойдёт. Желательно, при парсинге пользоваться DOMDocument и поиском в нём. Но если сделаете как то проще, то и хорошо.
Могу дать пример подобного скрипта для другого сайта, если Вам это поможет.
По ходу скрипта должны быть комментарии, поясняющие что делаем.
- Категория
Похожие проекты
$71
0
0
Всем привет! Необходимо разработать лендинг на платформе Salebot. Лендинг будет в стиле визитка для кофейни. Интересует именно данная платформа, так как многие мои услуги сделаны именно там....
1 неделя назад
0
0
Ищу клиента для создания учебного проекта и оформления портфолио бесплатно или за символическую сумму....
3 недели назад
$500
0
3
Мы ищем fullstack разработчика, который может сделать сайт под ключ. Есть детальное ТЗ, обязатедбное к ознакомлению и наработки по дизайну в виде макета Figma....
2 месяца назад
$120
0
4
Должно быть у исполнителя готовое и грамотно сделанное портфолио....
3 месяца назад
11
1
Нужен сайт по открытию кейсов для игры Standoff 2. Нужен самый обычный дизайн. Личный кабинет, инвентарь, авторизация через ВК. В Админке должна быть возможность создавать/удалять кейсы, редактировать шансы на выпадение какого-либо дропа, количество кейсов, устанавливать цену. В Админке должна быть возможность......
3 месяца назад
0
5
Требуется веб дизайнер для 2х проектов:. Оптимизации существующего сайта (лендинг) по танцевальному фитнесу на wix. com. Создание онлайн магазина био добавок и его оптимизация. Ищем профессионального дизайнера, который готов на долгосрочное сотрудничество....
3 месяца назад
0
2
Нужно сделать сайт просчет оффера. Верстка страницы с Figma....
3 месяца назад
$33
10
1
Мне нужен бот перехватчик для программы ( taxsee driver ) чтобы брать предварительные и текущие заказы. Требования: . 1 бот перехватчик нужен для android. 2 можно писать bоt под моим аккаунтом или другие варианты. 3 функция отключения и включения бота когда он нужен или не нужен. За хорошую работу готов......
3 месяца назад
$22
27
2
76
1
Ищу фрилансера для создания лендингов на Битрикс24. Занятость постоянная, 1 раз в 3 месяца....
4 месяца назад
138
2
Обменник криптовалют ( ТЗ во вложении)....
4 месяца назад
498
6
Необходимо написать небольшую серверную часть учебного сайта для запуска под виртуальной машиной Oracle VM VirtualBox Debian 6. 1 используя php7. 33 и базу MongoDB....
4 месяца назад
134
7
ИЩУ СПЕЦОВ – ВЫСОКОГО УРОВНЯ! 1). Уточните, какое у вас образование. 2). Обязательно предоставьте портфолио - лучшие работы. 3). Условия сотрудничества – по договоренности (сообщите ваши предварительные условия). П. все предложения, которые меня заинтересуют – либо отвечу, либо сохраню контакты в......
4 месяца назад
89
1
Нужно будет делать видео по примеру уже готового видео. Вы подойдете если : имеете базовые-легкие знания в трейдинге,если у вас хороший микрофон, нормальная дикция, и есть программа для снятия экрана на видео. (Себя снимать не нужно,только видео экрана) Чем выше качество тем выше оплата . Оплата за среднее......
4 месяца назад
$111
122
2
Добрый день заинтересовавшимся! У нас сайт на стадии разработки на ОС 3. Создано ТЗ. Необходимо выполнить все пункты в ТЗ. Предварительно 10 000 руб. Поднятие цены можно и обсудить....
4 месяца назад
$1000
286
5
TALP GROUP Мы занимаемся разработкой и продвижением IT- продуктов. В нашем арсенале множество интересных кейсов, большинство из которых реализованы на нашей собственной low/no code платформе Аltrp. Мы работаем как над внутренними проектами, так и с внешними заказчиками. Среди них: разработка швейцарской......
4 месяца назад
174
17
Добрый день. Мне необходимо скопировать действующий сайт с полным функционалом https://gk-grupp....
4 месяца назад
198
12
Ищем специалиста для работы над дизайном агенства недвижимости для англоязычной аудитории....
4 месяца назад
109
2
Меняли хостинг сайта поэтому имена сервера слетели, надо поменять на новые и все....
4 месяца назад
$250
315
17
Разработка продающего лендинга, ТЗ во вложенных файлах....
4 месяца назад
164
6