Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Часто задаваемые вопросы (FAQ) :  ИРБИС Irbis
Исключительно важный раздел форума, который необходимо прочитать всем, кто только начинает работать с Ирбисом. Если ваши знания не так широки, как вам хотелось бы, тогда обязательно прочитайте этот раздел. Если вы не нашли, что искали, то воспользуйтесь поиском по форуму, и, скорее всего, вы найдете ответ на свой вопрос среди существующих сообщений. 
Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Alio (IP-адрес скрыт)
Дата: 19, August, 2011 18:20

Если в БД электронного каталога (ЭК) вы используете в качестве ВНЕШНИХ ОБЪЕКТОВ (951 поле) полные тексты документов, есть возможность их индексировать, т.е. создавать в БД ЭК словари на их основе - при условии, что Вы имеете ПОЛНОТЕКСТОВЫЙ АРМ Администратор. О том, как это сделать, можно прочитать здесь:


[wiki.elnit.org]

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 20, September, 2011 18:23

Но не все же слова текста могут быть ключевыми!?

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 20, September, 2011 19:13

Если рассматривается полнотекстовый поиск, то все слова, которые встречаются в тексте - ключевые.

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 20, September, 2011 20:12

В том числе предлоги, союзы, междометия?

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 21, September, 2011 09:28

Еще немного теории: стоп-слова ни в одном нормальном поиске не учитываются. Это же касается и полнотекстового поиска.

Правда есть исключения. Например ля поиска по названиям песен нужно учитывать некоторые стоп слова, потому что композиция с названием "Только ты" никогда не будет найдена, потому что название состоит полностью из стоп-слов.

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 21, September, 2011 11:42

Значит, правила подбора стоп-слов должны быть очень сложными, или своими для каждой БД, или для разных полей?

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 21, September, 2011 12:05

Скорее свои для каждой базы данных. Как, в общем-то, сейчас и сделано. В идеале было бы не плохо привязывать стоп-слова к номерам полей, но такую возможность мало кто будет использовать.

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 22, September, 2011 05:30

Практически нереализуемая идея, а в случае с названиями песен вообще невыполнимая.



Редактировано 1 раз. Последний раз 22.09.2011 08:27 пользователем Lavrinovich.

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Novinka (IP-адрес скрыт)
Дата: 22, September, 2011 12:19

Alio написал(а):
-------------------------------------------------------
> Если в БД электронного каталога (ЭК) вы
> используете в качестве ВНЕШНИХ ОБЪЕКТОВ (951 поле)
> полные тексты документов, есть возможность их
> индексировать, т.е. создавать в БД ЭК словари на
> их основе - при условии, что Вы имеете
> ПОЛНОТЕКСТОВЫЙ АРМ Администратор. О том, как это
> сделать, можно прочитать здесь:
>
Здравствуйте,
это только если полнотекст включен в обычный Ирбис (т.е. только для 64) или для 32 тоже?

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Alio (IP-адрес скрыт)
Дата: 22, September, 2011 13:04

только для 64

Re: Создание словарей в БД электронного каталога на основе полных текстов
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 24, November, 2011 06:55

Еще немного теории: свои стоп-слова для каждого языка. Например, die в немецком и английском.



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.