Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
Полнотекстовые базы данных в Ирбис :  ИРБИС Irbis
 
Страницы: <<123>>
Страница: 2 из 3
Re: Полнотекстовый Ирбис 64
Пользователь: SokV (IP-адрес скрыт)
Дата: 17, May, 2011 13:53

Оценить данную аргументацию можно только дополнив конкретными цифрами.

Наскоро поискал цены на SAS диски: от 7 до 32 рублей за гигабайт. Если размер распознанной страницы в формате pdf 100 килобайт, то миллион страниц займёт 100 Гб и соответствующее место на жёстком диске будет стоить 3200 рублей (я взял максимальную из найденных цен). За какое время база будет прирастать миллионом страниц? Думаю, в большинстве случаев правильно будет сказать - более года или много более года. 3200 рублей в год за место на диске SAS это очень дорого?

Аргументация насчёт нагрузки выглядит справедливо. К сожалению, нет количественных оценок.

При использовании относительных путей в достаточно длительной перспективе есть проблема масштабируемости. Если изначально выбрали маленький жёсткий диск и постепенно забили его текстами, как с минимальным временем отключения системы решить проблему?

Стоит подумать, возможно удобны и масштабируемы были бы относительные пути, но связанные не обязательно с папкой БД, а с некоторым параметризуемым местоположением.

Re: Полнотекстовый Ирбис 64
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 17, May, 2011 14:31

Я не понимаю, о какой масштабируемости ты говоришь? Какая масштабируемость? Место под тексты? тогда как тут помогут относительные пути? Ну не понимаю я.

Проводить тесты для подтверждения приведенных показателей считаю не рациональным. Там разница будет в мелочи на самом деле, но это не значит, что этими замечаниями можно пренебречь, чтобы не делать по уму :).

Re: Полнотекстовый Ирбис 64
Пользователь: ferrum (IP-адрес скрыт)
Дата: 26, May, 2011 07:23

Панев Максим написал(а):
-------------------------------------------------------
> По какой причине?
> 1. Резервная копия у нас делается созданием образа
> диска, а не простым копированием. По этому
> увеличение размера образа на 15ГБ ничем вообще не
> оправдано.
> 2. Сервер специально проектировался так, чтобы
> быстро меняющиеся данные и статичный контент
> лежали на разных дисках. Размещать полнотекстовый
> архив на SAS дисках, цена которых за гигабайт
> достаточно велика, это совершенно не приемлемо.
> 3. При доступе к полным текстам дергать диск, на
> который и так ложиться очень большая нагрузка от
> каталогизаторов и веба, это опять же не правильно.
> Вот и всё.
>
> Этих причин должно быть достаточно. Если нет, то у
> меня больше нет аргументов.
>
> По поводу доступа к полным текстам из сети и через
> интернет. Проблема в том, что изначально пути
> делились на абсолютные и относительные. Это была
> стратегическая ошибка. Пути должны быть только
> абсолютные и никакие больше.


Подключусь к Максиму, я с ним не просто согласен, более того уже убедился на своем сервере к чему это привело...

Стоит у нас сервер Крафтвей 100, у него было 3 скази диска.
Один уже вышел из строя и стоимость за 1 гигабайт составил не 32 рубля,
а 43 и то по московским ценам,но это не главное, пропал весь ирбис и востановлению не подлежит.

Дело даже не в 43 рублях,а в том что данную вещь при хорошем раскладе в наших "джунглях" я получу через месяц, а оплатят еще через месяц...
Одно слово бюджет и поэтому хотелось бы добротности...

хорошо копирование было в сеть, но там нет полнотекста :(

на сегодня копия только ирбиса у нас 1600 mb, а добавлю полнотекст?
там порядка 50 Гигов, как копию ирбиса сохранять?

Сохраняем только /Datai



Редактировано 2 раз. Последний раз 26.05.2011 07:32 пользователем ferrum.

Re: Полнотекстовый Ирбис 64
Пользователь: ochagova (IP-адрес скрыт)
Дата: 26, May, 2011 10:38

Не надо сохранять директорию datai! В каждой директории БД есть два файла, которые надо сохранять - имя БД.mst + имя БД.xrf. Можно еще, как и положено, резервное копирование делать через Администратор. Это один файл.

Re: Полнотекстовый Ирбис 64
Пользователь: ferrum (IP-адрес скрыт)
Дата: 26, May, 2011 11:01

ochagova написал(а):
-------------------------------------------------------
> Не надо сохранять директорию datai! В каждой
> директории БД есть два файла, которые надо
> сохранять - имя БД.mst + имя БД.xrf. Можно еще,
> как и положено, резервное копирование делать через
> Администратор. Это один файл.

Я бы рад, но это все ручками , а мне в отпуск скоро...
у меня стоит программа резервного копирования, она останавливает
ирбис в 18:00 и копирует все по указанному пути со сжатием в rar

но раз подругому никак, радмин мне в помощь. :(



Редактировано 1 раз. Последний раз 26.05.2011 11:02 пользователем ferrum.

Re: Полнотекстовый Ирбис 64
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 26, May, 2011 11:11

Ни что не мешает сделать пакетное задание для АРМа Администратор и поставить его в задание. А по расписанию копировать выгрузку куда-нибудь в каталог с меткой времени.

Re: Полнотекстовый Ирбис 64
Пользователь: ferrum (IP-адрес скрыт)
Дата: 27, May, 2011 04:14

МАксим!

Уважаемый, подскажи как это сделать буду очень благодарен.
Если есть скрипт то кинь на почту, пожалуйста.
Ну очень надо.

Я пока все папку сохраняю, а размер огромен :(

С уважением, Евгений.

Re: Полнотекстовый Ирбис 64
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 27, May, 2011 07:31

Инструмент тут [irbis.gpntb.ru].
Инструкции в Общем описании системы в разделе про АРМ Администратор. А конкретно в той его части, которая рассказывает про пункт меню "Сервис - Выполнить пакетное задание". Готового примера нет, поскольку лично у меня на сервере сохраняется дельта диска Семантеком, а не только каталог с Ирбисом.

Хочется так же подметить, что в твоем случае я рекомендую сделать так же, поскольку суммарный объем данных у тебя очень велик. Каждый раз делать полную копию не рационально совершенно. Да и оправдано ли постоянно сохранять такой объем? У тебя рабочая база что ли много весит? Каков объем тех баз данных, которые подвергаются ежедневной корректировке (RDR, RQST, каталог)?

Re: Полнотекстовый Ирбис 64
Пользователь: Gena (IP-адрес скрыт)
Дата: 30, May, 2011 14:24

По поводу архивирования - копировать папку ДАТАИ все же надо, так как по мимо самой БД там хранится тьма доработок, которые делаются в библиотеки. Другой вопрос, что это надо делать редко. Оптимально раз в месяц копировать всю директорию ДАТАИ, а каждый день на автомате копировать только файлы документов нужных БД.

Возвращаясь к вопросу о полных текстах. У нас две БД: Электронный каталог и Полнотекстовая БД. Если я использую относительные пути, то файлы должны лежать в директории БД. А если я хочу, что бы и в БД ЭК были ссылки на полнотекстовые версии документов, и сама база полных текстов работали, то мне прийдется дважды скопировать все тексты?

AVD System, Техническая поддержка, [www.open4u.ru]

Re: Полнотекстовый Ирбис 64
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 30, May, 2011 23:59

Ссылка ссылается на саму себя!?

Re: Полнотекстовый Ирбис 64
Пользователь: ochagova (IP-адрес скрыт)
Дата: 31, May, 2011 11:00

Полагаю, что файлы должны лежать только в директории электронного каталога. Если Полнотекстовая БД создана в режиме "...из ЭК", то тексты в Полнотекстовой будут видны. Если речь о WEB, то последнее слово за Соколинским.

Re: Полнотекстовый Ирбис 64
Пользователь: guesswho (IP-адрес скрыт)
Дата: 10, June, 2011 08:37

Доброй ночи.Я сопровождаю программу Ирбис в Казахстане город Актобе
ЗКГМУ им.Оспанова.меня интересует банальный вопрос как сделать так
чтобы pdf документ находил по тексту.Я пользовался ковертором и
преобразовывал файл с распознаванным тестовым слоем,но у меня не все
документы находит, примерно из 10 документов по тексту находит
6,пользовался разными конверторами,но те документы которые не находит
как только не пробовал конвертировать,в чём может быть проблемы
подскажите,как можно в базе задать текст для поиска конкретного
документа или какой нужен конвертор,какой конкретный фортмат нужен или какой либо ещё способ.Буду
искрени благодарен за помощь

Re: Полнотекстовый Ирбис 64
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 10, June, 2011 12:59

Прикрепите к сообщению файл, который у вас категорически не находится.

Re: Полнотекстовый Ирбис 64
Пользователь: guesswho (IP-адрес скрыт)
Дата: 14, June, 2011 21:10

а как это сделать уточните действия если не сложно пож-ты,txt файл лепить?через какую прог-му и т.д.

Re: Полнотекстовый Ирбис 64
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 14, June, 2011 23:59

К сообщению на форуме можно прикрепить файл. Что у вас вызывает трудности?

Re: Полнотекстовый Ирбис 64
Пользователь: guesswho (IP-адрес скрыт)
Дата: 15, June, 2011 08:36

я с подобными программами встречался очень редко,но принцип мне вроде бы понятен,я хотел уточнить все ньюансы,какой программой крепить,насколько я понял нужно к pdf файлу прекрипить txt???

Re: Полнотекстовый Ирбис 64
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 15, June, 2011 08:53

Нет, вы о чем-то не о том думаете. Когда вы пишете сообщение на форум, над окном сообщения выше кнопок форматирования есть ссылка "Прикрепить файл...". Я вас просил прикрепить файл, который вы помещаете в полнотекстовый Ирбис, и который не находится поиском. Видимо это PDF файл. Никаких TXT прикреплять не нужно (если вы, конечно, в качестве полных текстов используете PDF, а не TXT).

Re: Полнотекстовый Ирбис 64
Пользователь: woodyfon (IP-адрес скрыт)
Дата: 15, June, 2011 16:27

Панев Максим
Человек, наверное, в такие дебри ушел, что простые вопросы кажутся сложными.
guesswho
Какие конверторы использовали? Не каждый конвертор корректно сохраняет pdf-файл c OCR-слоем.
Также после OCR могут возникать ошибки. Например, в вы пытаетесь найти слова из книги (и вводите так как в книге), а слово в слое совсем другое. Вот и не находит.



Редактировано 1 раз. Последний раз 15.06.2011 16:30 пользователем woodyfon.

Re: Полнотекстовый Ирбис 64
Пользователь: Панев Максим (IP-адрес скрыт)
Дата: 15, June, 2011 17:19

Есть еще один момент: человек из Казахстана. Возможно в файле просто напросто национальная кодировка и проблемы связаны с ней.

Re: Полнотекстовый Ирбис 64
Пользователь: woodyfon (IP-адрес скрыт)
Дата: 15, June, 2011 21:00

Панев Максим
Очень даже может быть. Сначала и не подумал.
В общем ждем файлsmiling smiley. Самому интересно.

Re: Полнотекстовый Ирбис 64
Пользователь: guesswho (IP-адрес скрыт)
Дата: 27, June, 2011 08:09

Вот образец,я раньше не сталкивался с подобными файлами,не судите строго :-),С казахским шрифтом тоже некоторые находит,а некоторые нет,мне подойдёт такой вариант чтобы ввести отдельный текст для поиска "Название" это основное,ну и лучше чтобы грамотно распознать остальной текст

Вложения: Учебное пособие.Ибатов А.Н. Наркология. 2009г..pdf (974.6KB)  
Re: Полнотекстовый Ирбис 64
Пользователь: ochagova (IP-адрес скрыт)
Дата: 27, June, 2011 11:35

Возможно, неудача связана со свойствами этого файла - см. Doc0.
В вашем случае надо воспользоваться технологией "Искать текст-подложку".
Для этого сохраните PDF как текст с именем основным + .txt - см. Doc1. При добавлении текста включить чек "Искать...", как на Doc1. Тогда словарь создается - см. Doc3

Вложения: Doc0.doc (101KB)   Doc1.doc (236KB)   Doc3.doc (101.5KB)  
Re: Полнотекстовый Ирбис 64
Пользователь: guesswho (IP-адрес скрыт)
Дата: 27, June, 2011 20:05

Если сохранить как txt то этот файл можно редактировать,а этот вариант к сожелению не подходит(((

Re: Полнотекстовый Ирбис 64
Пользователь: ochagova (IP-адрес скрыт)
Дата: 28, June, 2011 10:00

Но текст pdf, отображенный на экране, также можно выделять, сохранять и редактировать.
Кроме того, если у "вредителя" есть доступ к файлу txt, то у него есть доступ и к файлу pdf, и наоборот.

Re: Полнотекстовый Ирбис 64
Пользователь: guesswho (IP-адрес скрыт)
Дата: 30, June, 2011 18:50

я имею в веду что можно непосредственно в полнотекстовой базе читатель открывать файл в тхт формате и там его редактировать и сохронять,а pdf нельзя редактировать,не из папки а из читателя,что можно сделать поскажите пож-та какие есть варианты,как можно проще,уже незнаю что делать*((

Re: Полнотекстовый Ирбис 64
Пользователь: ochagova (IP-адрес скрыт)
Дата: 01, July, 2011 10:19

В чем трагедия, если кто-то отредактирует фай txt? Он нужен только для того, чтобы сформировать словарь ключевых слов, по которым будет искаться файл pdf. Ну, уйдут одни ключевые слова, добавятся другие. Это всего лишь инструмент для основного PDF.

Re: Полнотекстовый Ирбис 64
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 08, July, 2011 13:40

Максим, не Семантек, а Симантек, к тому же это название фирмы, у которой не один продукт...
И еще меня критикуете... не учи ученого, съешь файлА печеного... меня. потомственного редактора...



Редактировано 1 раз. Последний раз 03.04.2012 07:01 пользователем Lavrinovich.

Re: Полнотекстовый Ирбис 64
Пользователь: Ulia (IP-адрес скрыт)
Дата: 27, March, 2012 09:40

Я не могу установить Ирбис 64 2008. полнотекствую БД, у меня нету, хорошей инструкции, не могли бы ВЫ мне скинуть подробную инструкцию, по установки и работы в нем(соединения с ini файлами), а так же WEB-Ирбису

Re: Полнотекстовый Ирбис 64
Пользователь: SokV (IP-адрес скрыт)
Дата: 27, March, 2012 11:59

Установка ИРБИС для полнотекстовых баз данных выполняется просто: необходимо запустить установщик - файл setup64_FullText.exe. Некоторые особенности развёртывания ИРБИС ПБД см. на вики.

Инструкция по установке веб-ИРБИС (в том числе ПБД) тоже есть на вики. Все вопросы по Веб-шлюзу ИРБИС, в том числе и по его установке, рекомендую задавать в соответствующем разделе форума Web Ирбис и Z-Ирбис.

Насчёт "соединения с ini файлами" - объясните, что имеете в виду.



Редактировано 1 раз. Последний раз 27.03.2012 12:15 пользователем SokV.

Re: Полнотекстовый Ирбис 64
Пользователь: Lavrinovich (IP-адрес скрыт)
Дата: 03, April, 2012 06:53

Национальная кодировка. Но большинство букв совпадают с русскими, что-нибудь да найдется (!?)
Вообще по моему опыту, с моей колокольни, видится, что многие проблемы на самом деле железячные, особенно в недавнем прошлом. Но судя по журналам, у многих так и сейчас (например, нужны легкие браузеры).

irbis_arbat@mail.ru



Редактировано 1 раз. Последний раз 03.04.2012 06:58 пользователем Lavrinovich.

Страницы: <<123>>
Страница: 2 из 3


Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.