Ассоциация ЭБНИТ    ИРБИС-корпорация    Вики-Ирбис    Online/CHM справка Ирбис    FTP-сервер
ИМИДЖ-КАТАЛОГ :  ИРБИС Irbis
 
Отделение нераспознанных сканов КК от распознанных
Пользователь: library_gov (IP-адрес скрыт)
Дата: 01, September, 2011 22:22

В процессе распознавания сканов КК может случиться так, что часть сканов НЕ будет распознана из-за того, что КК полностью рукописная, и с лицевой и с оборотной стороны, или из-за плохого качества сканирования, т.е. нераспознанный скан НЕ попадет на глаза каталогизатору в окне просмотра ни по какому поисковому признаку. Можно ли разработчикам на этапе распознавания или выделить подобного рода сканы, например наделить их каким-либо ПОИСКОВЫМ признаком (например - НЕРАПСОЗНАН) по которому их можно было в последующем найти через поисковый словарь и ручками, глядя на скан КК создать запись. Или в процессе распознавания отделить подобного рода сканы от общей массы сканов, чтобы потом передать их пользователю, который просмотрел бы их стандартным инструментом и вручную создал на них запись. Цель данной просьбы состоит с том, чтобы ПОЛНОСТЬЮ нераспознанные сканы КК НЕ пропадали для читателя. Нам кажется это актуальным, т.к. при сканировании могут встретиться ПОЛНОСТЬЮ рукописные КК.

Re: Отделение нераспознанных сканов КК от распознанных
Пользователь: library_gov (IP-адрес скрыт)
Дата: 02, September, 2011 09:27

Продолжение темы. Дело в том, что в последнее время на рынке услуг ДЛЯ библиотек, появился сервис СКАНИРОВАНИЯ КК сторонней организацией. Представитель организации приходит в библиотеку с носимым скоростным специальным сканером и проводит операцию сканирования, которая в зависимости от производительности сканера, числа КК, даже при больших объемах КК может занимать от одного до нескольких месяцев. После окончания процесса сканирования, его результаты предоставляются пользователю в "просмоторщике", в среде которого можно выставить массив сканов как внутри библиотечной сети, так и на сайте библиотеки, например [predmet.shpl.ru] В дальнейшем сторонняя организация может предложить сервис ретроконверсии, который заключается в ручном вводе визуально распознанной оператором информации со скана КК в какой-либо ("самопал") инструмент и последующем импорте данных из этого продукта в АБИС библиотеки на основе коммуникативного формата (настроить один раз "самопал" на определенный коммуникативный формат вполне возможно). При сравнении данного сервиса с предложением от ИРБИС, т.е. распознавание результатов сканирования на основе продукта ABBYY и последующего импорта этих результатов в ИРБИС, за несравнимо более короткие сроки, представители организации могут утверждать, что продукт от ABBYY НЕ РАСПОЗНАЕТ ПОЛНОСТЬЮ рукописную КК, что может привести к потери информации с таких КК. Поэтому и возникло желание на каком-то этапе ВЫЧЛЕНИТЬ подобные КК. Если процесс сканирования проводится сотрудниками САМОЙ библиотеки, т.е. библиотека приобретает специальный сканер КК, может быть не такой скоростной, и проводит сканирование, то она на ЭТАПЕ самостоятельного сканирования может отсечь подобного рода, т.е. полностью рукописные КК, перед тем. как их передать на распознавание разработчику с помощью продукта от ABBYY. В дальнейшем можно вернуться к сканам "рукописных" КК и ввести с них информацию в ИРБИС. Просить проводить такой процесс представителей сторонней организации не совсем удобно, т.к. она заинтересована в УСКОРЕННОМ процессе сканирования, а не в скрупулезной работе, присущей библиотекарям. В то же время, от такого сервиса нельзя отказываться, т.к. НЕ каждая библиотека может позволить себе приобрести специальный сканер, а кроме того процесс сканирования КК - конечный процесс, т.е. когда массик КК для сканирования закончится... Конечно в таком случае библиотека сможет самостоятельно предоставлять побобного рода услуги другим библиотекам.

Re: Отделение нераспознанных сканов КК от распознанных
Пользователь: Alio (IP-адрес скрыт)
Дата: 02, September, 2011 10:09

library_gov написал(а):
-------------------------------------------------------
> В процессе распознавания сканов КК может случиться
> так, что часть сканов НЕ будет распознана из-за
> того, что КК полностью рукописная, и с лицевой и с
> оборотной стороны, или из-за плохого качества
> сканирования, т.е. нераспознанный скан НЕ попадет
> на глаза каталогизатору в окне просмотра ни по
> какому поисковому признаку.
А для чего существует поиск ПО ЯЩИКАМ/РАЗДЕЛИТЕЛЯМ, который не имеет НИКАКОГО отношения к распознаванию? Т.е. не надо забывать, что функция поиска КАК В БУМАЖНОМ КАТАЛОГЕ ПОЛНОСТЬЮ сохраняется в ИМИДЖ-каталоге.


Можно ли разработчикам
> на этапе распознавания или выделить подобного рода
> сканы, например наделить их каким-либо ПОИСКОВЫМ
> признаком (например - НЕРАПСОЗНАН) по которому их
> можно было в последующем найти через поисковый
> словарь и ручками, глядя на скан КК создать
> запись. Или в процессе распознавания отделить
> подобного рода сканы от общей массы сканов, чтобы
> потом передать их пользователю, который просмотрел
> бы их стандартным инструментом и вручную создал на
> них запись. Цель данной просьбы состоит с том,
> чтобы ПОЛНОСТЬЮ нераспознанные сканы КК НЕ
> пропадали для читателя. Нам кажется это
> актуальным, т.к. при сканировании могут
> встретиться ПОЛНОСТЬЮ рукописные КК.
Нераспознанные карточки найти очень просто - по отсутствию 953 поля, т.е. в СВОБОДНОМ ПОИСКЕ последовательного поиска надо задать:
a(v953)
Если хотите - можно создать словарь НЕРАСПОЗНАННЫЕ карточки. Для этого в FST БД надо включить соответствующую инверсию, что-нибудь вроде

953 0 if a(v953) then 'XX=Нет' fi

Re: Отделение нераспознанных сканов КК от распознанных
Пользователь: library_gov (IP-адрес скрыт)
Дата: 03, September, 2011 22:11

Большое спасибо, Александр Иосифович, за абсолютно четкое решение проблемы! Мне кажется, что в версии 2011.1 или в последующих нужно создать словарь НЕРАСПОЗНАННЫЕ КК, как вы предлагаете. Это ЗНАЧИТЕЛЬНО облегчит работу при оценке качества сканирования, распознавания,а также МНГНОВЕННО укажит с каких записей необходимо начать работу для редактирования "имидж-каталога".

Re: Отделение нераспознанных сканов КК от распознанных
Пользователь: library_gov (IP-адрес скрыт)
Дата: 03, September, 2011 22:16

..........
Нераспознанные карточки найти очень просто - по отсутствию 953 поля, т.е. в СВОБОДНОМ ПОИСКЕ последовательного поиска надо задать:
a(v953)

попробовал, но в БД "Имидж-каталог" - меню Поиск - Последовательный поиск - функция НЕ АКТИВНА :(((

Re: Отделение нераспознанных сканов КК от распознанных
Пользователь: Alio (IP-адрес скрыт)
Дата: 04, September, 2011 18:37

В \irbis64\datai\image\image.ini поставьте
SeqSearch=1



Извините, только зарегистрированные пользователи могут писать в этом форуме.
This forum powered by Phorum.