Разработать модуль поиска на базе DeepPavlov

Бюджет 500$ / 30000
руб
в месяц
Создан: 2 года назад
На модерации
Описание
Описание.
- Имеется набор документов смешанного содержания, в основном состоящий из текстовых и табличных данных.
- Контент документов – техническая литература на комплексное оборудование.
- Необходима реализация поиска по телу документов.
- примеры поисковых запросов: сколько весит трансформатор Trihal? что такое Accusine? Какие бывают автоматические выключатели? Compact NSX. Зачем нужен masterpact MTZ и так далее
- Предполагается что поставленная задача решается средствами open-source версии deep pavlov, по крайней мере демо версия удовлетворяет ожиданиям www.fl.ru/away/?href=http...
- Реализация будет использоваться в качестве подключаемого модуля и должна иметь возможность оперативного переобучения

Техническое задание на разработку.
1. Выполнить инсталляцию и конфигурирование open-source версии deep pavlov на centos 7.
2. Исследовать и описать возможные опции настройки применительно к функциональным требованиям.
3. Реализация должна иметь воможность расширения набора исходных документов с прогнозируемым влиянием на скорость и качество поиска, либо с грубой оценкой падения скорости и качества поиска.
4. Реализация должна иметь программные точки интеграции для выполнения поисковых запросов, точки интеграции для добавления документов / переобучения. В идеале по аналогии с подключением библиотеки python и вызов поиска из кода.
5. Реализация должна иметь автоматический корректор опечаток. Если невозможно – обосновать.

Функциональные требования.
1. Поиск слов и сочетаний слов по предоставляемым справочникам
2. В качестве результатов поиска приемлимы варианты:
2.1 Выбранные параграфы / предложения из документов с указателями на документ и место в документе с лимитированным количеством результатов поиска с сортировкой по уменьшению вероятности попадания в запрос пользователя (по аналогии с главной страницей google.com)
2.2 Точные ответы на вопросы пользователя, подразумевающие однозначный ответ. Пример – Сколько лет Наташе Ростовой?
3. Не допускается ручная корректировка каждого отдельного запроса для завышения качества поиска, движок должен с одинаковой точностью выполнять любые запросы по любым данным.
4. «Шаманство» допускается только как комплексный подход, например – анализ и автоматическаое построение базы ключевых слов, их подмен итд по всем исходным данным.
5. Контент документов преимущественно русскоязычный со значительным объемом специализированных аббревиатур, сокращений, в т.ч. на английском.
6. Необходима грубая оценка сложности повторения реализации для произвольного популярного языка (английский, французский..)
7. По результатам этапа исследования возможно согласование процесса подготовки пользовательских запросов, в таком случае тестирование будет выполняться по согласованным "чистым" поисковым запросам. Имеется ввиду %пользовательский_запрос% -> %сторонний_корректор_ошибок% -> %движок_deep_pavlov%.

Результат.
1. Развернутый движок с ограниченным набором подготовленных исходных документов и настройками для корректного поиска по ним.
2. Документация процессов установки, настройки и обучения движка.
3. Тесты выполнения поиска по предоставляемому набору поисковых запросов, релевантных для конкретного ограниченного набора данных.
4. Рекомендации по подготовке сырых данных для обучения движка.
5. Рекомендации по п.7 функциональных требований.

Все этапы должны сопровождаться подробным описанием действий для возможности пошагового воспроизведения результатов.
Документация может иметь любой удобный формат, критерии – воспроизводимость действий, полнота описаний шагов, достаточность описаний.
Сервер для разворачивания движка будет предоставлен.
Категория
Источник: fl.ru

Похожие проекты

safe 
0 2
Необходимо разработать систему, которая: Подключается к API Diagnocat и iDent (через токены доступа). Получает данные о пациенте, результатах диагностики, снимках и назначениях. Автоматически формирует структурированный отчет по шаблону (включая врачей, этапы лечения, стоимость и описание процедур).......
 
0 0
Необходимо связать БД 1C:ERP с БД Outlook, MS Access, Битрикс24. Например при вводе нового сотрудника в 1С:ERP он должен автоматически появляться в вышеперечисленных БД....
1 месяц назад
 
0 1
Требуется реализация отчёта на кастомизированной 1С:УПП 1. 2, ТЗ и контрольный пример во вложении, 80% кода должно быть покрыто модульными тестами....
2 месяца назад
$7
0 1
Мне нужно копировать мой текст и вставлять в одну группу ВК с открытой стеной для публикации рекламы. Задача скрипта/сервиса/программы - примерно каждые 10 секунд брать мой текст и вставлять в эту группу. Я пробовал через одну программу, которая записывает действия мышки и потом повторяет, но она как-то......
4 месяца назад
safe 
0 0
Написать прошивку для A94B114, используя 2 подобные рабочие прошивки. Все файлы есть....
$21
0 2
Нужно разархивировать файл архив. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы(скрины)....
6 месяцев назад
safe 
0 1
Входные: Имеется скрипт по обработке email писем и добавление их в систему Redmine   Проблема: Система обработки этих писем написана некорректная и негибкая    Задача: Переписать логику обработки входящих писем, чтобы исключить их потерю при незначительных отклонениях от ожидаемой структуры....
$37
0 1
- В обязанности сотрудника входит поддержание мобильного приложения системы автоматизации бизнеса. - Работа сдельная: задачи выдаются на оценку, далее после согласования передаются на реализацию. - Заключаем договор и NDA (соглашение о неразглашении)....
$71
0 0
Информация о проекте: Проект включает в себя React Native приложение с Expo внутри которого находится webview с сайтом На устройствах с ОС IOS проблема с воспроизведением видео....
6 месяцев назад
safe 
0 0
Разрабатываю десктопные программы на языке Java,  а так же Java + SQL....
 
0 6
  1. Чтобы можно было писать описание события (без заголовка) - превью в списке берется N количества букв с начала. (в списке писать дату события и сколько осталось до него) . Выставление даты и времени напоминания и ИНТЕРВАЛА ПОВТОРА ОТ 1 МИНУТЫ! Выставлять количество повторов, далее напоминания прекращаются.......
safe 
0 4
Сайт arg2028t. beget. tech/. Нужно сделать вот такой калькулятор. airprint. by/outdoor/wide-format. и еще некоторые доработки....
safe 
0 6
Краткое описание: Мы ищем исполнителя для тестирования функционала мобильного приложения на платформе Android. Задача включает проверку основных функций приложения, таких как работа комнаты, передача видео, звука и чата, а также создание подробной отчетности о найденных ошибках.   Требования к исполнителю:......
safe 
0 12
Разработка чат-бота под ваши нужды....
$143
0 0
Oпpocы (1008pyб/чaс) Заходитe на сaйт: gonsù....
9 месяцев назад
 
0 4
Требуется создать скрипт для premiere pro. Данная суть скрипта: в выделеном бине нужно что бы автоматически проставлялся in out ровно по серидине файла так что бы выделенная область была длиной 3 секунды. И требуется кнопка что бы работало через окно expressions. Проблема текущего в том что он не работает......
 
0 2
Нужно создать приложения под гемблинг/беттинг, на котлин. Приложение должно работать Firebase. Детали вышлю при обсуждение....
$21
0 4
Нужно разархивировать файл archive. ujems, есть распаковщик, но выдает ошибку. Прислать пруфы  ....
1 год назад
safe 
0 3
Разработать впн сервис ( Приложения на ios и android + сайт для оплаты подписки). Настройка Серверов. Оплата по договоренности. Работаем черед безопасную сделку....
1 год назад
Смотреть все