Міжнародні інформаційні системи - Навчальний посібник

1.3. бібліотечно-архівні інформаційні системи

В наш час заміни паперових технологій безпаперовими всі архіви, які фактично є найбільшими накопичувачами інформації на паперових носіях, повинні бути як найшвидше переведені на безпаперову основу.

Головною проблемою при переході на таку основу є стандартизація форматів програмних продуктів, що мають забезпечувати всі сервіси сучасного архіву.

Термін MARC являє собою акронім назви системи Machine- Readable Catalogue or Cataloguing (Каталог або каталогізація, що читається машиною.) Однак ця назва не є зовсім точною, оскільки MARC не є ні яким-небудь виглядом каталогу, ні методом каталогізації. Фактично MARC - це короткий та зручний термін для позначення процесу маркування будь-якої частини каталогізаційного запису так, щоб вона могла бути оброблена за допомогою комп’ютера.

У загальних словах, комунікативний формат MARC повинен забезпечувати:

можливість його застосування для всіх видів бібліотечних та архівних документів;

достатню гнучкість для рішення різноманітних задач в доповнення до каталогізації;

зручність застосування в різних автоматизованих системах.

Застосування стандарту MARC в архіві, який до цього працював з каталожними картками, помітно збільшить швидкість роботи, тобто не буде необхідності стояти "бог знає скільки часу" біля каталогу, щоб знайти потрібну картку. Стандарт MARC дозволяє знайти будь-який документ, який є в архіві, в лічені секунди. Наприклад, якщо читач забув або не знає якого-небудь потрібного опису документу (автор, назва і т.п.), то MARC дає можливість знайти цей документ за ключовими словами. До переваг MARC-а потрібно віднести і те, що він вимагає мінімум одного комп’ютеру, тобто всі ті каталоги з картками стають непотрібними.

Використання стандарту MARC запобігає дублюванню роботи та допомагає архівам і бібліотекам краще розпорядиться їх ресурсами.

Застосування стандарту MARC при управлінні архівними операціями дозволяє архіваріусам використовувати існуючі автоматизовані архівні системи. Багато систем, доступні архівам різного рівня, спроектовані для роботи з форматом MARC. Вони технічно обслуговуються і удосконалюються, так що архіви можуть користуватися перевагами останніх досягнень в комп’ютерній технології. Стандарт MARC дозволяє також архівам замінити одну систему на іншу з упевненістю, що їх дані будуть сумісні.

Незважаючи на співпрацю країн в цій області з’явилося, декілька версій формату MARC таких, як UKMARC, INTERMARC, USMARC, розходження в яких були викликані відмінностями в національних правилах і практиці каталогізації.

Архів Конгресу є офіційним депозитарієм публікацій Сполучених Штатів і первинним джерелом каталогізаційних записів для міжнародних публікацій та публікацій США. У 1960-і рр. архів Конгресу розробив формат MARC Бібліотеки Конгресу (формат LC MARC), систему, що використовує в каталогізаційному записі цифри, букви та інші символи для позначення різних типів інформації. У процесі розвитку формат LC MARC став форматом USMARC (форматом MARC США). Ведення архівного формату USMARC, також як і офіційної документації USMARC, здійснюється Бібліотекою Конгресу.

Терміни USMARC та їх визначення.

Покажчики даних (Signposts): Щоб прочитувати та інтерпретувати архівний запис, комп’ютеру необхідна допомога. Таблиця 1 ілюструє інформацію, для позначення якої потрібні "signposts".

Таблиця 1

Запис з текстовими "signposts": Той же запис з мітками MARC:

"SIGNPOSTS"

ДАНІ

"SIGNPOSTS"

ДАНІ

Заголовок основного

архівного запису:

Ім’я:

King,

Stephen

1

King, Stephen

Заголовок та дані про відповідальність:

Основний заголовок:

Дані про відповідальність :

 

Misery

Jim Arnosky

10

Misery

 

Jim Arnosky

Галузь видання:

Інформація про видання:

1 st ed.

250 $а

1 st ed.

Порівняння одного і того ж запису з текстовими "signposts" і з мітками USMARC ілюструє компактність формату USMARC, тобто економне витрачання об’єму комп’ютерної пам’яті.

Таблиця 1 ілюструє запис MARC, розмічений "signposts". Найменуваннями цих "signposts" є: ПОЛЕ, МІТКА, ІНДИКАТОР, ПІДПОЛЕ, КОД ПІДПОЛЯ і ВИЗНАЧНИК ЗМІСТУ. Розглянемо ці терміни окремо.

Поле: Кожний архівний запис логічно ділиться на поля. Є поле для автора, поле для інформації про заголовок і т.д. Ці поля поділяються на одне або декілька "підполій".

Як було відмічено раніше, текстові найменування полів дуже довгі, щоб їх приводити в кожному записі USMARC. Замість цього, поля представляються 3-х цифровими мітками.

Мітка: Кожне поле асоціюється з трьохцифровим числом, яке називається міткою. Мітка ідентифікує поле (тип даних), яке слідує після неї. Навіть якщо на екрані дисплею, відразу після мітки виведені ще і індикатори (таким чином, може з’явитися число з 4 або 5 цифр), мітка завжди являє собою перші три цифри.

Індикатори: За кожною міткою поля слідують дві позиції символів (за винятком полів 001 - 009). Одна або обидві ці позиції символів можуть використовуватися для індикаторів. У деяких полях застосовується тільки перша або друга позиція; в інших полях використовуються обидві позиції; а в таких полях, як 020 або 300, позиції не використовуються зовсім. Якщо позиція індикатора не використовується, індикатор характеризується як "невизначений", позиція залишається незаповненою. У даному роботі, в прикладах, незаповнені або невизначені позиції індикатора означаються символом " # ".

Значенням кожного індикатора є цифра від 0 до 9. (Хоч правилами допускаються букви, вони використовуються рідко). Навіть, якщо два індикатори разом можуть здаватися 2-х значним числом, насправді вони є двома окремими цифрами. У приведеному нижче прикладі перші 3 цифри є міткою (245 визначає поле заголовка), 2 наступні цифри (1 і 4) є значеннями індикаторів. "1 - "перший індикатор; "4 - "другий індикатор.

 

24514 $a The waste lands / $c adapted from Stephen King.

 

Значення 1 першого індикатора в полі заголовка вказує, що в даному каталозі повинен бути окремий архівний запис на заголовок. У картковому каталозі це означає, що для одиниці опису повинна розпечатуватися картка з додатковим архівним записом на заголовок, а в довідці про додаткові записи повинно бути вказано "Заголовок".

За допомогою другого індикатора на екрані дисплея вказується кількість символів на початку поля (включаючи пропуски (spaces)), які не повинні враховуватися комп’ютером в процесі сортування і розставлення. Для заголовка The waste lands другий індикатор встановлюється на цифрі "4", щоб перші чотири символи ("T, "h, "e, "пропуск) не враховувалися при сортуванні і заголовок сортувався в файлі на слово "waste".

Підполе: Більшість полів містить декілька окремих взаємопов’язаних даних. Кожний тип даних в полі називається підполем, і кожному підполю передує код підполя. Поля від 001 до 009 не мають підполей.

Наприклад, поле фізичного опису для документів включає підполе для об’єму (кількість сторінок), підполе для інших фізичних характеристик (інформація про ілюстрації), а також підполе для розмірів (сантиметри):

 

300 ## $a 675 p.; $b ill.; $c 24 см.

 

Код підполя: Код підполя являє собою одну букву нижнього регістра (в окремих випадках цифру), якою передує роздільник підполя. Кожний код підполя вказує, який тип даних слідує після нього.

Роздільник: Різні програми математичного забезпечення для уявлення роздільника на екрані використовують різні символи. Прикладами можуть служити подвійні дужки ((), знак "ет" (@), знак долара ($), лінія підкреслення (_) і інші. У даному випадку як частина коду підполя, що є роздільником, використовується знак долара ($).

У приведеному вище прикладі кодами підполей є: $а для позначення об’єму, $b для інших фізичних характеристик і $с для розміру.

Цілі створення формату UNIMARC.

З початку 70-х років сімейство MARC збільшилося більш ніж на 20 форматів. Відмінності в змісті даних цих форматів викликають необхідність редагування запису до обміну ними.

Для подолання несумісності форматів було прийняте рішення розробити міжнародний формат MARC (UNIMARC), який дозволив би приймати записи, складені в будь-якому форматі MARC так, щоб вони могли конвертуватися в UNIMARC, а з нього в будь-який інший формат MARC. Для цього кожній національній службі досить буде становити тільки дві програми (одну для конвертування в UNIMARC, іншу з формату UNIMARC) замість спеціальних програм конвертування в кожний з форматів MARC, наприклад, INTERMARC в UKMARC, USMARC в UKMARC і т.д. Таким чином, основною метою створення формату UNIMARC є сприяння міжнародному обміну даними в машиночитаємій формі між національними архівними службами, а також більш простого і зручного складання опису архівних одиниць, їх пошук і контроль. Останнє досягається за допомогою розроблених методів запису архівної інформації, здійснюваною відповідно до міжнародних стандартів.

Відмінність формату UNIMARC від формату USMARC.

Передусім треба відмітити, що ті визначення, які приводилися для формату USMARC підходять (або правильніше сказати застосовуються) в форматі UNIMARC (тобто поняття поля, влучні, індикатора, маркера, довідника та інше зберігаються). Таким чином, не має значення описувати так же детально формат UNIMARC, як був описаний формат USMARC. Тому варто зупинитися на тих фрагментах, які відрізняють ці два формати.

Основною відмінністю форматів UNIMARC і USMARC є передусім невідповідності полів, підполій, індикаторів і т.п. (тобто правильніше буде сказати невідповідності міток полів, підполій, індикаторів і т.д. До відмінностей можна віднести також і те, що кількість полів в форматі UNIMARC не співпадає з кількістю полів в форматі USMARC, причому в UNIMARC полів більше ніж в USMARC. Це пов’язано з тим, що сам формат UNIMARC, як було сказано раніше, створювався значно пізніше, ніж формат USMARC і, відповідно, при створенні UNIMARC враховувалося все, щоб цей формат був кращим і замінив всі інші формати.

Подальші відмінності між форматами UNIMARC і USMARC є більш дрібними і пов’язані знову таки з тим, що формат UNIMARC "молодше" формату USMARC (наприклад, кількість підполій в полях, довжини полів, відмінності в позначеннях індикаторів та інше).

Конвертування даних по структурі USMARC -UNIMARC.

При створенні конверторів USMARC-UNIMARC необхідно скласти певні алгоритми програм.

Розглянемо алгоритм програми-конвертора UNIMARC -USMARC.

Програма-конвертор може складатися з 3 блоків.

У першому блоці програма-конвертор повинна прочитувати ті дані з файла, які необхідно конвертувати.

Другий блок є основним і самим складним. У ньому, власне, і відбувається конвертування даних. Це конвертування також можна розділити на декілька складових частин. Спочатку необхідно перебудувати маркер. Після має бути конвертування довідника. Тут буде важливим перевести всі мітки полів, підполій і індикаторів, які не співпадають. Цю задачу можна вирішити за допомогою додаткового файлу, в якому вказані всі мітки полів, підполів і індикаторів одного з форматів. Також треба враховувати і те, що довжини полів формату, який конвертується можуть не співпадати з довжинами полів нового формату (тобто треба перерахувати ці довжини).

У третьому блоці новий запис необхідно записати в новий файл, який і буде відображати форму запису нового формату.

Алгоритм конвертора USMARC-UNIMARC будується аналогічним чином.

Отже, ми провели невеликий огляд по форматах автоматизованих архівних і бібліотечних систем USMARC та UNIMARC (оскільки саме ці два формати мають найбільше поширення і довір’я в світі).

Основна мета даного розділу полягала не в детальному розгляді форматів USMARC і UNIMARC, а в тому, щоб підкреслити факт переходу архівів на ці автоматизовані системи.