Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
АРМ Администратор полнотекстовых БД
Пользователь: yana-2007 (IP-адрес скрыт)
Дата: 18, July, 2008 17:16

Проконсультируйте, пожалуйста, как добавить украинский язык (АРМ администратор полнотекстовых БД) в меню выбора основного языка текстов в полнотекстовом сервисе (естественно-тематическая классификация текстов).
Заранее благодарна,
Яна Савина, Мариуполь

Re: АРМ Администратор полнотекстовых БД
Пользователь: Constantin (IP-адрес скрыт)
Дата: 21, July, 2008 09:59

Украинский язык добавить в список нельзя
Нет в системе частотного словаря для украинского языка

Re: АРМ Администратор полнотекстовых БД
Пользователь: library_gov (IP-адрес скрыт)
Дата: 23, July, 2008 19:28

А как сделать так, чтобы в системе повился частотный словарь украинского языка? Мы, украинские пользователи системы ИРБИС, готовы помочь вам, разработчикам системы, чтобы эта задача была решена положительно и в максимально короткие сроки

Re: АРМ Администратор полнотекстовых БД
Пользователь: Constantin (IP-адрес скрыт)
Дата: 04, August, 2008 12:58

Необходимо иметь большой массив газетных текстов
Далее составить частотник по этим текстам из слов без окончаний то есть усеченных

Чтобы проделать эту работу для начала необходим массив газетных текстов
Трудность здесь в том что нужно большой массив - как минимум на 100Мб если измерять тексты в формате plain/text

Впрочем, для того чтобы использовать технологию создания тематических словарей (которые нужны для поиска "похожих" текстов в ИРБИС ПБД) частотник не обязателен. Отберите по нужной теме несколько 100 статей и создайте общий тематический словарь. (Система создает такой словарь автоматически при создании полнотекстовой БД). Словарь будет включать 100-400 слов. Проанализируйте его вручную. После этого повторите эту операцию для других тематик.
Теперь Вы для любой полнотекстовой БД будете иметь набор словарей
Запишите их в директорию БД с индексами 1,2 и тд (Файл имяБДиндекс.dct - например text0.dct - общий тематический словарь)
и создайте для этой БД в Администраторе в режиме естественно-тематическая классификация текстов соответствующие индексы.



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.