Архив: Сделать систему по сбору и парсингу данных о доменных именах

Бюджет 500$ / 30000
руб
в месяц
Создан: 5 лет назад
Закрыт
Описание
нужно сделать систему сбора данных по освобождающимся доменам, состоящую из
1) общей базы данных, в которой хранятся все данные и с которой работают все сервисы
база данных будет содержать обновляемый список доменов (большой, ~5млн строк), по которому сервисы собирают различные данные 
2) сервис обновления списка доменов
- скачивает актуальный список доменов с регистратора
- распаковывает, заливает во временную таблицу
- переносит в архив из основного списка доменов те домены, которых в актуальном скаченном списке нет (удалены)
- обновляет поля данных (оплачен до, истекает, делегирован и пр.) в основном списке данными из актуального списка.
3) сервис проверки размещенных на доменах сайтов, выбирающий домены из основного списка по определенным критериям и по каждому из них
- проверяющий, делегирован домен или нет (резолвится или нет), сохраняем ip адрес
- если резолвится, то отвечает HTTP 200ым кодом или редирект на другой домен (с учетом www), сохраняем куда редирект
- если 200 и без редиректа на другой домен, то проверяет отданную страницу по списку стоп-слов, сохраняем прошло проверку на стоп-слова или нет
4) сервис проверки доменов, прошедших сервис проверки на индексацию домена Яндексом, работающий через прокси сервис (сторонний, дам доступ) к yandex.xml
- сохраняет список сайтов, которые отдал Яндекс при поиске по ключу "%DOMAIN_NAME%"
- выполняет расчет рейтинга домена по формуле в зависимости от того, какие сайты в выдаче яндекса при поиске проверяемого домена
5) сервис проверки whois данных, работающий через список прокси, запрашивающий whois по доменам, прошедшим сервис проверки и сохраняющий его базу (нски, owner, registrar)

техническое решение на базе php/mysql, будет крутиться на отдельной впске.

обязателен опыт парсинга и написания скриптов, работающих по расписанию в параллельном режиме (в несколько процессов/потоков). обязательно умение работать самостоятельно без пошагового ТЗ.

в ответе пожалуйста напишите 111, чтобы было понятно, что это не автоответ.
Категория

Похожие проекты

$714
0 0
Описание задачи: Необходимо разработать serverless функцию на базе NestJS и TypeScript для автоматизированной обработки видеофайлов, загружаемых в Yandex Cloud Storage. Функция должна выполнять конвертацию видео в формат, поддерживаемый основными веб-браузерами, с последующим сжатием до оптимального......
safe$22
9 0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
safe 
28 0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
safe 
44 1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
safe$44
49 0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe$1111
48 0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
 
38 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
31 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
40 1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59 1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
 
96 0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75 1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
Смотреть все