Разработать модуль поиска на базе DeepPavlov

Бюджет 500$ / 30000
руб
в месяц
Создан: 2 года назад
На модерации
Описание
Описание.
- Имеется набор документов смешанного содержания, в основном состоящий из текстовых и табличных данных.
- Контент документов – техническая литература на комплексное оборудование.
- Необходима реализация поиска по телу документов.
- примеры поисковых запросов: сколько весит трансформатор Trihal? что такое Accusine? Какие бывают автоматические выключатели? Compact NSX. Зачем нужен masterpact MTZ и так далее
- Предполагается что поставленная задача решается средствами open-source версии deep pavlov, по крайней мере демо версия удовлетворяет ожиданиям www.fl.ru/away/?href=http...
- Реализация будет использоваться в качестве подключаемого модуля и должна иметь возможность оперативного переобучения

Техническое задание на разработку.
1. Выполнить инсталляцию и конфигурирование open-source версии deep pavlov на centos 7.
2. Исследовать и описать возможные опции настройки применительно к функциональным требованиям.
3. Реализация должна иметь воможность расширения набора исходных документов с прогнозируемым влиянием на скорость и качество поиска, либо с грубой оценкой падения скорости и качества поиска.
4. Реализация должна иметь программные точки интеграции для выполнения поисковых запросов, точки интеграции для добавления документов / переобучения. В идеале по аналогии с подключением библиотеки python и вызов поиска из кода.
5. Реализация должна иметь автоматический корректор опечаток. Если невозможно – обосновать.

Функциональные требования.
1. Поиск слов и сочетаний слов по предоставляемым справочникам
2. В качестве результатов поиска приемлимы варианты:
2.1 Выбранные параграфы / предложения из документов с указателями на документ и место в документе с лимитированным количеством результатов поиска с сортировкой по уменьшению вероятности попадания в запрос пользователя (по аналогии с главной страницей google.com)
2.2 Точные ответы на вопросы пользователя, подразумевающие однозначный ответ. Пример – Сколько лет Наташе Ростовой?
3. Не допускается ручная корректировка каждого отдельного запроса для завышения качества поиска, движок должен с одинаковой точностью выполнять любые запросы по любым данным.
4. «Шаманство» допускается только как комплексный подход, например – анализ и автоматическаое построение базы ключевых слов, их подмен итд по всем исходным данным.
5. Контент документов преимущественно русскоязычный со значительным объемом специализированных аббревиатур, сокращений, в т.ч. на английском.
6. Необходима грубая оценка сложности повторения реализации для произвольного популярного языка (английский, французский..)
7. По результатам этапа исследования возможно согласование процесса подготовки пользовательских запросов, в таком случае тестирование будет выполняться по согласованным "чистым" поисковым запросам. Имеется ввиду %пользовательский_запрос% -> %сторонний_корректор_ошибок% -> %движок_deep_pavlov%.

Результат.
1. Развернутый движок с ограниченным набором подготовленных исходных документов и настройками для корректного поиска по ним.
2. Документация процессов установки, настройки и обучения движка.
3. Тесты выполнения поиска по предоставляемому набору поисковых запросов, релевантных для конкретного ограниченного набора данных.
4. Рекомендации по подготовке сырых данных для обучения движка.
5. Рекомендации по п.7 функциональных требований.

Все этапы должны сопровождаться подробным описанием действий для возможности пошагового воспроизведения результатов.
Документация может иметь любой удобный формат, критерии – воспроизводимость действий, полнота описаний шагов, достаточность описаний.
Сервер для разворачивания движка будет предоставлен.
Категория
Источник: fl.ru

Похожие проекты

safe$22
9 0
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
safe 
28 0
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
1 год назад
safe 
44 1
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
1 год назад
safe$44
49 0
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe$1111
48 0
Требуется написать парсер маркетплейса, у которого есть только мобильное приложение (IOS, Android). Есть исходный код Android приложения (Java + Kotlin), реверснутый через JADX. Необходимо парсить данные о товарах, полученные по артикулу. За подробностями тг: @markermann)....
1 год назад
 
38 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
31 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
 
40 1
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
1 год назад
$22
59 1
В Геткурсе нужно сделать интеграцию со Сбербанком для оформления рассрочки/кредита. Основная задача – передача суммы и номера заказа при переходе для оформления рассрочки и возврат сведений при удачном оформлении. Эквайринг от Сбербанка к Геткурсу подключён, а готовой интеграции для рассрочки нет. Если......
1 год назад
 
96 0
Нужно сделать бот перехватчик заказов по фильтру такси Максим!...
1 год назад
$33
75 1
Как можно загрузить готовое фото из галереи, если приложение просит загрузить фото и при этом открывает камеру телефона? Нужно вместо использования реальной камеры смоделировать вход камеры и при этом загрузить фото из галереи....
1 год назад
 
117 3
Очень простой криптообменник в виде веб-сайта. Без смарт-контрактов и т. Все платежи вручную....
Смотреть все