Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Часто задаваемые вопросы (FAQ) :  ИРБИС Irbis
Исключительно важный раздел форума, который необходимо прочитать всем, кто только начинает работать с Ирбисом. Если ваши знания не так широки, как вам хотелось бы, тогда обязательно прочитайте этот раздел. Если вы не нашли, что искали, то воспользуйтесь поиском по форуму, и, скорее всего, вы найдете ответ на свой вопрос среди существующих сообщений. 
Формирование Полнотекстовой БД в ИРБИС64 ПБД
Пользователь: Alio (IP-адрес скрыт)
Дата: 22, December, 2009 17:06

Имеются различные способы включения текстов в полнотекстовую базу данных, созданную в полнотекстовом Администраторе. Под текстом понимается файл типа HTML, DOC, PDF или DJVU с распознанным текстовым слоем. Способ включения текстов зависит от:
• Способа адресации текстов для просмотра
• Возможного хранения текстов в виде архива
• Возможного разбиения текста на страницы
• Сопровождения текстов неким сайтом
• Формирования полнотекстовой БД из базы данных каталога ИРБИС-64

В полнотекстовом Администраторе по опции главного меню «Полнотекстовый сервис» – «Добавить (удалить) тексты в БД» вызывается форма, в которой задается способ добавления и по кнопке Добавить выполняется добавление, при котором в полнотекстовой БД создаются записи.
Рассматриваются действия администратора при различных способах формирования БД.
1. Тексты включаются в БД по относительным путям. Т.е. тексты расположены внутри директории БД, в этой же директории или в поддиректориях. Достоинство этого метода - тексты будут доступны и при переносе данных в сети, и при установке базы данных на WEB. Если в тексте имеются ссылки на другие файлы (страницы, картинки), то для их отображения на WEB они должны иметь URL адреса.
В записи, которая соответствует одному включенному тексту, в поле 952 создается подполе B, в котором прописывается относительный путь к тексту от директории БД.
Для добавления следует:
Отметить Добавить тексты в виде ссылок
Отметить Относительный путь
Опция Добавлять директорию с текстами определяет способ добавления – отдельных текстов или все тексты выбранной директории.
После нажатия кнопки Добавить в диалоговом окне выбрать директорию с текстами внутри директории БД, см. рис.1.

2. Тексты добавляются НЕ в виде ссылок. Тексты берутся из любых мест сети. Добавлять можно, указав всю директорию, можно отдельными текстами (как на рис.2). Администратор создает в директории БД файл архива текстов с расширением IZP. Достоинство – компактное хранение текстов, возможность переноса в сети. На WEB сервере тексы будут недоступны. В записи БД имя текста будет помещено в поле 952^A.
Для добавления следует:
Убрать Добавить тексты в виде ссылок
Если убрана отметка Добавлять директорию с текстами, то после нажатия кнопки Добавить в диалоговом окне выбрать текст, см. рис.2.

3. Тексты добавляются по абсолютному пути. Тексты расположены в любом месте сети. В записи БД, соответствующей тексту, в поле 952 создается подполе B, содержащее полный путь на текст. Для видимости текстов в сети рекомендуется формировать полные сетевые пути с указанием имени машины (рис.3).
На WEB сервере эти тексты будут недоступны. Если эти тексты (или их аналоги) имеют URL адреса, то для WEB читателя можно сделать перенаправление текстов, заменяя их сетевые адреса на URL. Для этого в файле irbis_server.ini, который был создан при инсталляции в «Директории WEB-сервера для шлюза», в секции MAIN задать параметры (приведен пример значений параметров):

FullTextPathDbn=\\Alio1\irbiswrk\lusia\PDF_text\
FullTextPathWeb=ftp:\\ftp.gpntb.ru\pub\irbis\

В первом параметре следует указать сетевой путь на тексты, которые располагались по этому пути при их добавлении, в примере это -
\\Alio1\irbiswrk\lusia\PDF_text\. Во втором параметре следует указать часть URL текстов (до их названия) их расположения. В примере это - ftp:\\ftp.gpntb.ru\pub\irbis\.

В формате BRIEFHTML_ft.pft имеется вставка (если нет, добавить), которая замещает в адресе текста (в подполе 952^B) путь на файл при создании на URL местоположения текста. Часть формата:

/* возможность замены формата через параметры irbis_server.ini из cgi
if &uf('IMAIN,FullTextPathDbn,')<>'' and &uf('IMAIN,FullTextPathWeb,')<>''
then
&uf('+7W10#',&uf('+9I?',,&uf('IMAIN,FullTextPathDbn,'),,'?#',,&uf('IMAIN,FullTextPathWeb,'),,'#',v952^B)),
'<a style="border:0px;font-size:12px;" target=_blank href="',G10,
else
/*

Здесь использован форматный выход &uf('+9I?исходная строка?#выходная строка#строка где замена). Ограничители ? и # могут быть любыми символами с кодом меньше 128.
Для добавления следует:
Отметить Добавить тексты в виде ссылок
Отметить Полный путь
После нажатия кнопки Добавить в диалоговом окне выбрать текст либо директорию с текстами, см. рис.3.


4. Добавляются тексты, хранящиеся в архиве ZIP или RAR. Сам архив может добавляться как по относительному пути, так и по полному. При добавлении следует вызвать средство Дополнительные параметры Задать параметр извлечения из архива (рис.4). Следует отметить, что параметр извлечения их архива и параметр разбиения на страницы совместимы для файла PDF, но не для файла DJVU.

5. Если имеются тексты PDF или DJVU, разбитые на страницы, то при добавлении их в БД также можно включать отдельные страницы. Тогда по словам запроса будут показываться соответствующие страницы текста. Кроме того будет возможным листание текста по страницам.
В записи БД формируются подполя:
952^B – Полный или относительный адрес виртуальной страницы текста, для которой создана данная запись. Состоит из пути на исходный текст и имени виртуальной страницы. Имя складывается из: имени исходного текста + разделитель + порядковый номер страницы.
952^C – Полный или относительный адрес исходного текста.
Для доступа текстов на WEB – см. п.3.
Для добавления следует (если текст не их архива):
Отметить Добавить тексты в виде ссылок
Отметить Полный путь либо Относительный путь
Задать параметр Разбивать тексты…
После нажатия кнопки Добавить в диалоговом окне выбрать текст либо директорию с текстами, см. рис.5.
Для добавления текста DJVU с разбиением на страницы имеется особенность: текст не должен быть заархивирован и добавлять нужно по файлам, т.е. не использовать опцию «Добавлять директорию с текстами».
Другая особенность использования текста DJVU – для просмотра текста в браузере, возможно, следует выполнить: DJVUCNTL_61_EN.exe
6. Имеются тексты, встроенные в некий сайт. Ссылки на тексты относительные и тексты расположены рядом со страницами сайта. Первая страница сайта должна иметь имя index.html.
Возможны два варианта построения полнотекстовой БД на базе сайта.
1. Использовать абсолютные сетевые пути на директорию, где расположен сайт с текстами. Первую страницу сайта следует поместить в созданную БД с именем index.html. Добавление выполнять как на рис. 6. В этом случае тексты будут доступны для пользователя сети. Абсолютные сетевые адреса будут помещены в подполе 952^B.
2. Сайт поместить в директорию БД и при добавлении использовать относительные адреса. Тексты также будут доступны для сетевого пользователя, относительные адреса текстов будут помещены в подполе 952^B.
В обоих случаях тексты не будут доступны пользователю WEB. Можно использовать переадресацию как в п. 3.

7. Полнотекстовая база данных создается из базы данных электронного каталога ИРБИС-64. Этот способ можно использовать, если имеется БД в ИРБИС-64, в которой имеются записи, связанные с полными текстами. Для добавления текстов в Администраторе имеется специальная кнопка – Добавить тексты из ЭК. Из других кнопок можно воспользоваться кнопкой Дополнительные параметры, а именно, Разбивать тексты PDF + Разбивать тексты DJVU. В диалоговом окне будет открыта директория DATAI и следует выбрать файл “имя БД.par”, см. рис.7. При добавлении происходит следующее:
1. Из всех записей ЭК будет отобраны те, которые имеют в поле 951 ссылки на тексты знакомых расширений: doc, html, pdf, djvu.
2. Для каждой записи ЭК будет создана запись в ПБД. Библиографические данные перенесутся в поля Dublin Corr в соответствии с таблицей переформатирования dublinc.fst.
3. Будет сформировано поле 952, причем:
• - если внешний объект задан URL в подполе 951^I, то этот URL переносится в подполе 952^I, а в подполе 952^B формируется строка: «имя файла: URL». В формате отображения появится текст (internet-ссылка)
• - если внешний объект задан именем в подполе 951^A, то полный путь на файл в момент переноса пишется в подполе 952^B
• - если внешний объект задан полным путем на файл в подполе 951^A, то это имя файла с полным путем переносится в подполе 952^B
• - если внешний объект – книга (PDF или DJVU) и задано разбиение на страницы (можно задать оба варианта), то в 952^C запишется полный путь на файл книги; в 952^B – полный путь на виртуальный файл очередной страницы книги, при этом сам файл не создается

В АРМе «Полнотекстовый читатель» (не WEB) данные Dublin Corr можно использовать для отбора текстов. Для этого надо задать параметр в файле irbisr_FullText.ini:
//признак видимости видов поиска
PanelForListSch_Visible=1
Виды поиска сформируются в соответствии с данными секции [SEARCH].
Для WEB читателя доступными будут тексты, URL адреса которых заданы в подполе 952^I.



Редактировано 1 раз. Последний раз 15.02.2010 16:07 пользователем Alio.

Вложения: Иллюстрации к Добавление текстов....doc (299KB)  
Re: Формирование Полнотекстовой БД в ИРБИС64 ПБД
Пользователь: svarog (IP-адрес скрыт)
Дата: 23, March, 2010 16:22

Вопрос к разработчикам.
Где можно почитать состав полей ПБД, а также о пакетном выполнении задания в АРМ Администратора ПБД в встроенном хелпе информации нет.



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.