«Расширенный поиск» предназначен для поиска информации по Карте Идей, с учетом морфологии русского языка и связей между объектами предметной области.
Карта Идей (сокращенно КИ) – специальное программное обеспечение, используемое для хранения, обработки и наглядной визуализации неструктурированных данных любого типа.
Карта Языка (сокращенно КЯ) – интерактивный словарь русского языка, реализованный на базе программного обеспечения Карты Идей.
Информация в КИ представлена в виде трех базовых типов объектов:
Узел представляет собой произвольное понятие (сущность, идею, концепцию) моделируемой предметной области. Например, в КЯ узлами выступают слова русского языка.
Связь выражает какое-либо устойчивое взаимоотношение или взаимосвязь между понятиями предметной области. Примеры связей реализованных для КЯ – ассоциативная (близкий смысл), синонимическая, антонимическая.
Маршрут – последовательность связанных по смыслу понятий предметной области. Некоторые примеры маршрутов в КЯ – поговорка, идиома, словосочетание, произвольный текст.
Текущая версия расширенного поиска позволяет искать:
Перейти к поиску по КИ:
Введите поисковый запрос в поле Строка поиска и нажмите кнопку Искать (или клавишу Enter).
В качестве поискового запроса может быть введена любая последовательность слов разделенных пробелами или символами , . ; ! ? – " ' ( ) : \ / (разделители слов не учитываются при поиске).
Найденные маршруты ранжируются и выводятся на экран в порядке возрастания их весов.
Вес маршрута (дробное число в диапазоне между нулем и единицей) условно выражает степень его близости к поисковому запросу. Чем меньше вес, тем ближе по смыслу маршрут к введенному запросу (последовательность слов не учитывается при определении веса). Вес маршрута отображается рядом с его идентификатором (в круглых скобках).
На экране одновременно отображается максимум двадцать похожих маршрутов.
Кроме идентификатора и веса, для каждого маршрута отображаются его имя, расширенное описание и список объектов КИ, через которые он проходит.
Маршрут (или объект, через который он проходит) можно просмотреть с использованием Текстового или Графического интерфейсов в отдельном окне. Для этого достаточно щелкнуть по идентификатору маршрута (или объекту, через который он проходит) мышкой.
Помимо найденных маршрутов, на экране могут отображаться промежуточные результаты поиска, а также кратчайшие пути (в зависимости от заданных параметров поиска).
Примеры поиска похожих маршрутов:
крущащиеся дервиши
хороший пес
Кратчайший путь – маршрут минимальной длины, проходящий между двумя объектами по связям КИ.
Кратчайший путь можно также интерпретировать как смысловое расстояние между двумя понятиями предметной области. Для непосредственно связанных понятий оно равно единице и увеличивается по мере удаления объектов друг от друга.
Для поиска кратчайших путей выберите опцию Искать кратчайшие пути в параметрах расширенного поиска.
Названия объектов КИ, между которыми ищется кратчайший путь, введите через пробел в поле Строка поиска и нажмите кнопку Искать (или клавишу Enter).
Можно ввести больше двух названий объектов разделенных пробелом. В этом случае будет найдено несколько кратчайших путей – от первого объекта до второго, от второго до третьего и т.д.
Список объектов КИ, через который проходит кратчайший путь, визуализируется в виде маршрута.
Примеры поиска кратчайших путей:
дервиш Руми
зикр медитация
желание удовольствие боль
| Параметр | URL-название | Описание |
| Строка поиска | str | Исходная строка для поиска |
| Искать похожие маршруты | search_similar_paths | Определяет, необходимо ли искать похожие маршруты |
| Искать кратчайшие пути | search_shortest_paths | Определяет, необходимо ли искать кратчайшие пути |
| Показывать введенную строку | show_str | Управляет выводом строки поиска в результатах поиска (секция «Исходная строка») |
| Показывать лексемы и их словоформы | show_tokens | Управляет выводом результатов приведения слов к основным словоформам языка (секция «Морфологический анализ») |
| Показывать найденные узлы | show_nodes | Управляет выводом результатов отображения на КИ (секция «Поиск по узлам»). Данная секция также содержит результаты разрешения неоднозначностей при отображении слов на КИ ( |
| Показывать найденные маршруты | show_path | Управляет выводом результатов поиска похожих маршрутов (секция «Похожие маршруты») |
| Тип интерфейса КИ | viewer_type | ++Тип интерфейса, которому будет передано управление в результате щелчка по объекту КИ ++ |
URL-название можно использовать для передачи параметров в расширенный поиск непосредственно через URL строку, минуя форму запроса параметров.
Это может быть полезно при вызове расширенного поиска из других приложений.
Пример вызова расширенного поиска с передачей параметров через URL:
http://www.sufism.ru/ki/maps/sufi/ki_search.php?str=суфий&search_similar_paths=yes
(на примере Карты Языка)
Введенная строка запроса разбивается на слова (с использованием разделителей слов).
Полученный список слов приводится к основным словоформам языка (лексемам). Для этого в текущей версии расширенного поиска задействуется морфологический анализатор
RuMor.
Список основных словоформ отображается на Карту Языка – при этом каждой лексеме ставится в соответствие один узел КЯ. Если слово отсутствует в БД КЯ, задействуются механизмы нечеткого поиска для нахождения похожих по написанию слов.
При наличии неоднозначностей в трактовке слов (например, одному слову сопоставлено несколько, похожих по написанию, основных словоформ) они разрешаются путем ранжирования альтернатив по степени близости к исходному слову. Для этого используется алгоритм
Левенштейна.
Список узлов КЯ, полученный на этапе отображения, используется для поиска похожих маршрутов или же кратчайших путей.
При поиске похожих маршрутов учитываются ассоциативные связи между объектами КИ. Ранжирование найденных маршрутов по степени их близости к исходному (вычисление их весов), осуществляется по методу
общих подстрок (еще известен как метод n-грамм).
Для поиска кратчайших путей использована модификация
алгоритма Дейкстры.
|
|