Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Полнотекстовые БД
Пользователь: Бродовский (IP-адрес скрыт)
Дата: 29, December, 2004 17:10

Здесь предлагается обсуждать проблемы полнотекстовых БД в ИРБИС64

Re: Полнотекстовые БД
Пользователь: Карауш (IP-адрес скрыт)
Дата: 30, December, 2004 10:33

А где взять возможности (программу хотя бы для тестирования), чтобы поскладывать туда данные и поискать их там? А сейчас - проблем-то нет. В демонстрации все работает нормально.

Re: Полнотекстовые БД
Пользователь: Alio (IP-адрес скрыт)
Дата: 04, February, 2005 10:11

Начато распространение ИРБИС64 ПОЛНОТЕКСТОВЫЕ БД - в составе двух модулей: АРМ Администратор (стандартный АРМ Администратор ИРБИС64+дополнительные функции для создания и ведения полнотекстовых БД) и АРМ Конечного пользователя (для публикации полнотекстовых БД в локальной сети и на CD). Данное решение может использоваться как автономно, т.е. без собственно ИРБИСа (и ИРБИС32, и ИРБИС64) - так и в составе ИРБИС64.

Re: Полнотекстовые БД
Пользователь: Рудзский Л. З. (IP-адрес скрыт)
Дата: 10, February, 2005 13:10

Начато распространение ИРБИС64 ПОЛНОТЕКСТОВЫЕ БД - в составе двух модулей: АРМ Администратор (стандартный АРМ Администратор ИРБИС64+дополнительные функции для создания и ведения полнотекстовых БД) и АРМ Конечного пользователя (для публикации полнотекстовых БД в локальной сети и на CD). Данное решение может использоваться как автономно, т.е. без собственно ИРБИСа (и ИРБИС32, и ИРБИС64) - так и в составе ИРБИС64.

А где стоимость этого решения? Я что-то в прас-листе, который на сайте - ничего не нашел... Нужна стомиость этого решения для новых пользователей и для старых, которые уже работают с системой

Re: Полнотекстовые БД
Пользователь: Алексей Лавринович (IP-адрес скрыт)
Дата: 07, April, 2005 13:27

Очевидно, что библиотечная система поиска, анализа автоклассификации полнотекстовых документов должна чем-то отличаться от «простых» «поисковиков», в том числе локальных типа Google Desktop Search, MSN Desktop Search и Yahoo! Desktop Search.
И понятно чем именно — интеграцией библиографических, полнотекстовых и документально-фактографических БД.
Еще наблюдение. Если «десктопные поисковики» сделаны на основе «интернет-поисковиков», то они должны работать и в ЛВС (LAN search or intranet search)?



Отправка отредактированного (12-04-05 12:26)

Re: Полнотекстовые БД
Пользователь: Алексей Лавринович (IP-адрес скрыт)
Дата: 12, April, 2005 12:23

Уста премудрых нам гласят, что «переход на ИРБИС64 предречен для всех, кто использует систему Win2000 и выше» (А.С.К.)
Но будут ли приобретать ИРБИС64 специально и только (или в основном) для смыслового анализа и классификации полнотекстовых документов?
Ведь сейчас много говорится о подобных системах — от бесплатных «настольных поисковиков» до огромных и могучих корпоративных технологий.
Для примера приведу цитаты из одной публикации (со слегка исправленными ссылками) — [www.computerra.ru]

…под открытыми ОС такие вот поисковые системы, работающие в пределах диска — давно уже не редкость […] (www.offline.computerra.ru/2004/567/36689). […]
И только после выхода Google Desktop Search (www.offline.computerra.ru/2004/565/36526) на этот сектор рынка обратили внимание другие крупные игроки. Microsoft и Yahoo! в частности — речь сегодня пойдет об их творениях. Поисковик от MS вышел в конце прошлого года, от Yahoo! (www.desktop.yahoo.com/filetypes) — в начале нынешнего. В каждом из них заявлен необходимый минимум функциональности — поиск по документам форматов Microsoft Office, простым текстовым, основанным на этом формате (HTML, XML), и мультимедийным файлам, почтовым базам Outlook.
MSN Desktop Search 02.00.0000.1180
Данный поисковик является частью набора утилит, распространяемого с сайта [toolbar.msn.com]. Кроме Desktop Search в набор включены MSN Toolbar (его можно скачать и отдельно) и MSN Deskbar. Первый из них встраивается в стандартный «Проводник» Windows, а также в Outlook и Internet Explorer, предоставляя доступ к онлайновому поисковику от Microsoft, либо к Desktop Search […]. Также со страницы FAQ по программе
(http://search.msn.com/docs/toolbar.aspx?t=MSNTbar_DS_FAQ.htm#ADOBE)
есть ссылка на большой плагин (более 9 Мбайт), после установки которого Desktop Search начинает индексировать PDF-файлы и производить поиск в них. […]
Русский поддерживается, прописные и строчные буквы обрабатываются нормально.
В целом, как мне кажется, сейчас набор утилит от Microsoft — и есть тот самый оптимальный вариант для использования русскоязычным пользователем.
Протасов П. Положь, где взял, возьми, где положил // Компьютерра. — 2005 — 8 февр.

Re: Полнотекстовые БД
Пользователь: Алексей Лавринович (IP-адрес скрыт)
Дата: 12, April, 2005 12:25

Второй пример — технология Web-Fountain, разработанная IBM. Некоторые ее особенности:
 сбор информации из интернета, и не только с html-страниц, но и из «корпоративных БД» (?), e-mail и т. д.
 контент-анализ и структурирование документов (!). Модули контент-анализа (аннотаторы) могут быть сторонними, видимо, пишутся «вручную» (в том числе пользователями); при этом из-за XML-аннотаций объем текста вырастает в 10 раз (и, естественно, встает вопрос о качестве такого аннотирования).
 поиск по индексированным документам (анализаторы) и вывод результатов.

Никитин Л. Фонтаны рая // Компьютерра. — 2004. — №11. — С.55-57)
www.
Кстати, здесь же приводится пример невозможности автоопределения содержания (темы): «нетрудно представить себе текст, в котором говорится о присутствовавших на концерте Queen членах королевской фамилии». Да, тут не поможет даже «ручное» указание предметной области.

Re: Полнотекстовые БД
Пользователь: Алексей Лавринович (IP-адрес скрыт)
Дата: 12, April, 2005 12:28

Константин Сбочаков писал(а):
«Сейчас в WEB ИРБИС64 есть расширение для рассылки документов на которые подписался Читатель
В сценарии рассылки задается поисковый запрос (формат) и кому рассылать (также)
Эту возможность можно использовать для рассылки с любой периодичностью любого набора отформатировнных записей из Каталога»

Поскольку посмотреть как это выглядит или почитать поподробнее пока негде, возникает много новых вопросов и пожеланий.
1. Каков механизм подписки? В каком (каких) АРМе (АРМах) реализована эта функция?
2. «Поисковый запрос (формат)» — это, видимо, что-то вроде «постоянных запросов», формируемых администратором или библиографом? Но у них и без того много дел, поэтому хорошо бы дать такую возможность читателю, то есть ввести в Web-ИРБИС (в том числе 32) функцию постоянных запросов.
3. «Отформатированные» — в каком формате?
4. «Записи из Каталога» — то есть библиографические? Если в виде списков (RTF или HTML/XML), то это хорошо, но мало. Здесь уже когда-то обсуждалась эта идея. Может быть, для ее реализации можно «прикрутить» к ИРБИСу/Web-ИРБИСу утилиту ISIS2XML, или сделать нечто подобное свое, как в WinISIS 1.5? Цитата: «Генерить — создавать что-либо (обычно программу или стандартные сообщения) с помощью полуавтоматических средств» (Воройский Ф.С. Информатика. Раздел «Компьютерный сленг»). Но способ, которым «генерятся» HTML-списки новых поступлений в ГПНТБ (по крайней мере, так было в 2002 г.) — скорее «чисто ручной».
А если это копирование из БД в БД и/или экспорт в ISO, то это гораздо интереснее — наконец-то будет автоформирование специализированных БД. В ИРБИСе, в файле irbismsg.txt, давно есть строка: «выгрузка результатов поиска в виде БД». Но ни в «Общем описании системы», ни в одном другом месте нет такой функции. Может быть имеется в виду запланированная, но пока не реализованная функция создания индивидуальных пользовательских БД? Но тогда нужно выдавать подписчикам Web-Читатель или АРМ Читатель64. Предлагаю еще раз обсудить идею системы «Домашний читатель», интергрированной с браузером и текстовым редактором.
5. А если имеются в виду полнотекстовые документы, то это похоже на давно известные в интернете почтовые рассылки и группы новостей (Usenet).
Сразу представляется большое научное учреждение, имеющее в своем составе много филиалов, институтов, отделений и т. д.
Но библиотечная рассылка должна же чем-то отличаться от «простой» рассылки! А именно — интеграцией библиографических, полнотекстовых и фактографических данных. То есть полнотекстовые документы должны быть связаны с их библиографическими описаниями, отбор должен вестись по ЭК.



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.