Разработать модуль поиска на базе DeepPavlov

Бюджет 500$ / 30000
руб
в месяц
Создан: 1 год назад
На модерации
Описание
Описание.
- Имеется набор документов смешанного содержания, в основном состоящий из текстовых и табличных данных.
- Контент документов – техническая литература на комплексное оборудование.
- Необходима реализация поиска по телу документов.
- примеры поисковых запросов: сколько весит трансформатор Trihal? что такое Accusine? Какие бывают автоматические выключатели? Compact NSX. Зачем нужен masterpact MTZ и так далее
- Предполагается что поставленная задача решается средствами open-source версии deep pavlov, по крайней мере демо версия удовлетворяет ожиданиям www.fl.ru/away/?href=http...
- Реализация будет использоваться в качестве подключаемого модуля и должна иметь возможность оперативного переобучения

Техническое задание на разработку.
1. Выполнить инсталляцию и конфигурирование open-source версии deep pavlov на centos 7.
2. Исследовать и описать возможные опции настройки применительно к функциональным требованиям.
3. Реализация должна иметь воможность расширения набора исходных документов с прогнозируемым влиянием на скорость и качество поиска, либо с грубой оценкой падения скорости и качества поиска.
4. Реализация должна иметь программные точки интеграции для выполнения поисковых запросов, точки интеграции для добавления документов / переобучения. В идеале по аналогии с подключением библиотеки python и вызов поиска из кода.
5. Реализация должна иметь автоматический корректор опечаток. Если невозможно – обосновать.

Функциональные требования.
1. Поиск слов и сочетаний слов по предоставляемым справочникам
2. В качестве результатов поиска приемлимы варианты:
2.1 Выбранные параграфы / предложения из документов с указателями на документ и место в документе с лимитированным количеством результатов поиска с сортировкой по уменьшению вероятности попадания в запрос пользователя (по аналогии с главной страницей google.com)
2.2 Точные ответы на вопросы пользователя, подразумевающие однозначный ответ. Пример – Сколько лет Наташе Ростовой?
3. Не допускается ручная корректировка каждого отдельного запроса для завышения качества поиска, движок должен с одинаковой точностью выполнять любые запросы по любым данным.
4. «Шаманство» допускается только как комплексный подход, например – анализ и автоматическаое построение базы ключевых слов, их подмен итд по всем исходным данным.
5. Контент документов преимущественно русскоязычный со значительным объемом специализированных аббревиатур, сокращений, в т.ч. на английском.
6. Необходима грубая оценка сложности повторения реализации для произвольного популярного языка (английский, французский..)
7. По результатам этапа исследования возможно согласование процесса подготовки пользовательских запросов, в таком случае тестирование будет выполняться по согласованным "чистым" поисковым запросам. Имеется ввиду %пользовательский_запрос% -> %сторонний_корректор_ошибок% -> %движок_deep_pavlov%.

Результат.
1. Развернутый движок с ограниченным набором подготовленных исходных документов и настройками для корректного поиска по ним.
2. Документация процессов установки, настройки и обучения движка.
3. Тесты выполнения поиска по предоставляемому набору поисковых запросов, релевантных для конкретного ограниченного набора данных.
4. Рекомендации по подготовке сырых данных для обучения движка.
5. Рекомендации по п.7 функциональных требований.

Все этапы должны сопровождаться подробным описанием действий для возможности пошагового воспроизведения результатов.
Документация может иметь любой удобный формат, критерии – воспроизводимость действий, полнота описаний шагов, достаточность описаний.
Сервер для разворачивания движка будет предоставлен.
Категория
Источник: fl.ru

Похожие проекты

$21
0 1
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 месяц назад
safe 
0 0
Разработать впн сервис ( Приложения на ios и android + сайт для оплаты подписки). Настройка Серверов. Оплата по договоренности. Работаем черед безопасную сделку....
1 месяц назад
safe$21
0 3
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
2 месяца назад
$214
0 1
Здравствуйте, у кого есть проект по продвижению chaturbate? Или кто-то делает?...
2 месяца назад
$21
0 0
Заказные доработки функционирующих учётно-управленческих систем на производственных предприятиях. Навыки программирования в MS SQL, VBScript, 1С, знание принципов ООП....
safe$36
0 2
Нужно опубликовать мобильное приложение для Android в Гугл маркет с аккаунта разработчика Гугл плей консоль, созданного ДО Ноября 2023. В рамках проекта, необходимо прислать приглашение мне на почту, чтобы я загрузила приложение и отправила его на модерацию, с сохранением безвременного доступа к моему......
safe$71
0 3
Сделать игру для яндекс игр, настроить рекламу в игре и помочь с публикацией игры в платформе яндекс игры. Игра - карточная игра Пасьянс Паук (косынка) Игровой процесс: Тип игры: Пасьянс Паук. Количество мастей: Игрок может выбирать количество мастей: 1, 2, 3 или 4. Подсказки: Автоматические подсказки,......
$14
0 3
Без акцента на идею, необходимо создать мобильное приложение iOs и Android, с возможностью трансляции основной информации в миниапп Tg. Интеграция с платежной системой, внутренний кошелек, две валюты. В зависимости от гео, возможность конвертации валют ч/з сервер. На старте, сервер скорее облачный. Двухфакторная......
$1200
0 0
Необходимо перевести действующую БД с версии 77 на 8 (переписать конфигурацию, настроить обработки для переноса данных).   Не типовая конфигурация по учету пенсионеров в ГУ РК....
safe$22
9 3
требуется готовую онлайн анкету на django по приему на работу перенести в whatsapp, telegram и viber. Нужно чтобы кандидат мог с удобством заполнять анкету с телефона, а все заполненные им данные по всем позициям автоматически загружались в нашу базу данных. В нашей базе будет создаваться резюме кандидата......
$714
0 2
Описание задачи: Необходимо разработать serverless функцию на базе NestJS и TypeScript для автоматизированной обработки видеофайлов, загружаемых в Yandex Cloud Storage. Функция должна выполнять конвертацию видео в формат, поддерживаемый основными веб-браузерами, с последующим сжатием до оптимального......
safe$44
49 1
Трипланарная транспортная задача (отправители - транспорт - получатели) генерация исходных данных трехэтапное решение 1....
safe 
28 1
В наличии массив кадастровых номеров (КН), необходимо путем запроса на ПКК определить примерные географические координаты каждого объекта из массива КН (ОКС, ЗУ), вывести в результирующий файл эти ко-ты и ряд сопутствующих данных по этому КН....
3 месяца назад
safe 
44 8
Необходимо разработать бек и фронт мини-сервиса таким образом, чтоб его можно было развернуть внутри другого проекта....
safe$1111
23 0
Стоит на Бизнесе для своих нужд на простеньком базовом шаблоне, складываю туда контент потихоньку. Нужно начинать приводить в соответствие что бы публика сразу не убегала, а как то цеплялась, да и продвигать не торопясь. Шаблон где порвался от вставки баннеров подправить, для мобилок может сверстать.......
safe$22
55 0
Парсер для сайта stockx. com на питоне (selenium/pyppeteer). Необходим следующий функционал: 1. На главной странице с поиском по ключевым словам найти первый результат из поиска (ссылку на страницу товара) ....
3 месяца назад
 
36 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
3 месяца назад
 
37 0
Требуется написать софт , который будет делать рассылку по личным сообщениям на площадке Ebay Kleinanzeigen по заранее спаршенным обьявлениям....
3 месяца назад
Смотреть все