Економіка та організація інформаційного бізнесу - Навчальний посібник (Лазарєва С. Ф.)

6.6. технологія формування і використання інформаційних ресурсів в інформаційному виробництві

У кожному інформаційному виробництві існують специфічні для нього технологічні позиції. Неможливо охопити всю різноманітність технологічних позицій в суспільному інформаційному виробництві, тому обмежимося аналізом найбільш поширених і найбільш розроблених технологічних процесів, використовуваних у більшості інформаційних виробництв різної природи [4].

Ми вже згадували процедуру узгодження інформаційного продукту з прецедентами (аналогічними продуктами) і зацікавленими суб’єктами інформаційного виробництва. Для виконання цієї процедури необхідно мати прецеденти і вміти визначати характеристики відповідності прецедентів тому інформаційному продукту, що пропонується.

Усі прецеденти є продуктами деяких інформаційних виробництв і в сукупності складають інформаційні ресурси людини, сім’ї, підприємства, організації, органу державної влади, країни і світу. Ці ресурси являють собою масиви документів, на яких зафіксовано вербальну інформацію, що сприймається суміжниками з інформаційного виробництва.

Іноді до інформаційних ресурсів відносять не тільки документи з вербальною інформацією, представленою якоюсь мовою, а й масиви матеріальних зразків типу мінералів, гербаріїв, насіннєвих генофондів, музейних експонатів тощо. Виходячи з прийнятого уявлення про інформаційне виробництво подібні масиви і зібрання матеріальних предметів потрібно вважати матеріальними ресурсами інформаційного виробництва.

Відповідно до законів інформаційного тяжіння, інформаційної складності та старіння інформації основна частина інформаційних ресурсів, що інтенсивно використовуються як предмети праці в процедурах узгодження з прецедентами в інформаційному виробництві, є простою інформацією про окремі події, предмети і факти, які стосуються найближчих суміжників в інформаційному виробництві і виявилися в ньому відносно недавно. Цю частину інформаційних ресурсів природно називати оперативними інформаційними ресурсами.

З плином часу інтенсивність використання інформаційних ресурсів зменшується, і вони переходять у розряд ретроспективних, а потім — архівних ресурсів.

Оперативні інформаційні ресурси сприймають усі новостворені продукти інформаційного виробництва. Частина їх може бути напівфабрикатом і втрачатися в процесі створення інших інформаційних продуктів. Така інформація доступна суміжним суб’єктам інформаційного виробництва короткий час, від моменту її народження до моменту використання і втрати. Її ми не будемо відносити до інформаційних ресурсів, вважаючи поточною інформацією інформаційного виробництва.

Частина оперативних інформаційних ресурсів, що зберігається, активно взаємодіє з ретроспективними інформаційними ресурсами. З одного боку, вона поповнює ретроспективні інформаційні ресурси, а з іншого — сама за необхідності поповнюється документами з ретроспективних ресурсів.

Аналогічно ретроспективні інформаційні ресурси взаємодіють з архівними. Документи архівних ресурсів, до яких виявлено інтерес, можуть деякий час знаходитися в оперативних ресурсах.

У цій загальній моделі руху інформаційних ресурсів під дією попиту на інформацію відбуваються такі технологічні операції:

створення або формування нових записів і/або документів;

поширення їх серед зацікавлених суб’єктів інформаційного виробництва;

формування масивів документів і/або баз даних оперативного, ретроспективного або архівного зберігання;

пошук документів у цих масивах за запитами будь-яких суб’єктів інформаційного виробництва (пошук прецедентів).

Наведений порядок технологічних операцій не означає, що такою є послідовність відповідних технологічних етапів в інформаційному виробництві. Наприклад, формування нових записів може бути не початковою, а завершальною стадією складного ін­формаційного виробництва, якій передує декілька операцій пошуку прецедентів в інформаційних ресурсах.

Загалом топологія зв’язків між технологічними позиціями в складному інформаційному виробництві є графом, у якому нарівні з лінійними можна виявити кільцеві, ієрархічні та більш складні структурні утворення.

Типи технологічних процесів у їх взаємозв’язку простіше виявити в простих структурах, тому уперед розглянемо деякі типові лінійні структури, а в них почнемо з технології пошуку прецедентів.

Найпростіша технологія пошуку прецедентів вимагає задання запиту як деякого ключа у вигляді набору символів. Документ в пошуковому масиві або в базі даних уважається релевантним запиту в тому разі, коли в ньому міститься точна копія ключа. Таку операцію називатимемо пошуком за простим ключем або елементарним пошуком.

Елементарний пошук можна спостерігати в будь-якому інформаційному виробництві, пов’язаному з документами, що ідентифікують об’єкти і/або суб’єктів суспільних відносин. У транспортних і банківських системах, в системах пенсійного забезпе­чення та охорони здоров’я та в інших системах, де ключем прецедентів є ідентифікатори особи, місць перебування людей і/або предметів, банківських реквізитів, марок матеріальних і/або інформаційних продуктів тощо, елементарний пошук часто є єдиним необхідним видом пошуку.

Якщо масив прецедентів невеликий, то елементарний пошук можна здійснити через перегляд усіх документів масиву. Така процедура називається послідовним пошуком (або перебором).

За великого об’єму масивів прецедентів навіть елементарний пошук викликає потребу у спеціальній організації цих масивів з метою зменшення часу і трудомісткості пошуку. Практика давно виробила універсальну процедуру організації великих масивів прецедентів, орієнтовану на спрощення елементарного пошуку. Це широко використовуване впорядкування документів масиву прецедентів за унікальним простим ключем. У результаті документи в масиві розташовуються в порядку зростання або (значно рідше) убування значень ключа, виражених в будь-якій системі числення.

Широко використовуються в інформаційному виробництві словники і довідники, в яких записи і/або документи розташовуються в лексикографічному порядку слів і/або словосполучень, що задають значення унікальних ключів.

У кожному інформаційному виробництві є ланцюжок з двох технологічних операцій — це організація масиву прецедентів і пошук прецедентів у масиві за деяким простим унікальним ключем.

Ця пара технологічних операцій по суті є основою кожного інформаційного виробництва, на підвищення їх ефективності спрямовані зусилля творців нових інформаційних технологій, а технічні і програмні засоби організації пам’яті (сховища прецедентів) становлять основу сучасних найбільш потужних засобів інформаційного виробництва — ЕОМ.

Звичайно, на практиці часто виникає необхідність пошуку прецедентів за ознаками, які не є їх простими унікальними ключами. Розглядаючи як приклад інформаційного виробництва конструкторське бюро, легко виявити технологічну позицію пошуку прецедентів за унікальним ключем на етапі нормоконтролю. Тут специфікації матеріалів і комплектовання перевіряються на наявність їх імен (марок) у каталогах дозволених до застосування матеріалів і комплектовання або на відсутність їх у каталогах заборонених до застосування матеріалів і комплектовання.

Якість семантичного пошуку визначається не тільки можливостями процедур організації масивів прецедентів і пошуку в них релевантних складному ключу документів, але й якістю складання складного ключа, що відображає інтереси суб’єкта, який шукає прецеденти.

У результаті в інформаційних виробництвах з’являється ланцюжок операцій формування складного ключа і пошук прецедентів, релевантних цьому ключу. Якщо впорядкування документів за унікальним ключем і пошук у впорядкованому масиві документів за цим ключем є формальними операціями, то складання складного ключа — інтелектуальна (неформальна) процедура. Коли складний ключ формалізований, то пошук релевантних йому документів може бути також формалізований. Для цього під час формування масиву прецедентів кожному документу необхідно присвоїти складний ключ, що відображає його зміст. У загальному випадку ця операція також є інтелектуальною.

Отже, в більш або менш складному інформаційному виробництві спостерігається технологічний ланцюжок операцій присвоєння складного ключа документу (1), формування масиву прецедентів, організованого за складним ключем (2), формування складного ключа за змістом запиту (3), пошук релевантних складному ключу документів (4).

Зауважимо, що у такому ланцюжку присутній елемент так званого «штучного інтелекту» — процедура ознайомлення фахів­ця з усіма прецедентами масиву замінюється на процедуру формального пошуку за складним ключем.

Аналогічні стадії розвитку можна спостерігати в будь-якому інформаційному виробництві, що досягло рівня штучного інтелек­ту. Автоматичний переклад з однієї мови на іншу починався з підрядкового перекладу, де застосовувався пошук за простим уні­кальним ключем в однослівному словнику. Автоматичний композитор починався з автоматичного пошуку і відтворення музичних фраз за фіксованим набором нот тощо.

Формування масивів записів і документів, або баз даних, для пошуку прецедентів в інформаційному виробництві проводиться також шляхом порівняння ключів нових документів, що породжуються в даному або в суміжних інформаційних виробництвах, з ключами інтересів, функціональних обов’язків, предметних областей та інших атрибутів, притаманних відповідному інформаційному виробництву.

Найпоширенішою формою комплектування баз даних є відбір з нових документів за унікальним ключем документів, потрібних даному інформаційному виробництву. До такої форми комплектування належить передплата на видання різного виду за їх найменуванням і/або унікальними класифікаційними індексами. Деякі види нових документів (наприклад, нормативно-розпорядчі), направляються в бази даних інформаційних виробництв примусово, за принципом «усім, усім, усім», що також можна вважати передплатою.

Іншою формою комплектування баз даних є відбір за складним ключем документів з доступного потоку нових документів. Ця форма має два різновиди поширення (розподілу) інформації: внутрішнє і зовнішнє вибіркове. Перший різновид використовується інформаційним виробництвом, що формує базу прецедентів з власних інформаційних продуктів і/або із загальнодоступних джерел інформації (наприклад, із засобів масової інформації), а другий використовується зовнішнім інформаційним виробництвом, зацікавленим у розширенні споживання своїх інформаційних продуктів з економічних, політичних та інших міркувань.

За наявності доступних зовнішніх баз даних доводиться вирішувати задачу оптимального управління формуванням власних баз даних із зовнішніх джерел з урахуванням інтенсивності використання у виробництві відповідних даних. Може виявитися вигідним не комплектувати свою базу зовнішніми даними у запас за допомогою процедури виборчого поширення інформації, а за потреби застосовувати процедури пошуку прецедентів у зовнішніх базах даних. Унаслідок закону старіння отримані за запитом релевантні дані можна вважати новими і включати їх у власні оперативні інформаційні ресурси. Цю процедуру формування баз даних природно назвати комплектуванням за запитами до зовнішніх баз даних.

У разі комплектування інформаційних ресурсів із зовнішніх баз даних можна кількісно оцінити корисність тієї або іншої БД для даного виробництва через прямий підрахунок кількості документів, релевантних запитам, що надійшли з відповідної БД. Отримане число можна назвати індексом цитованості бази даних в інформаційному ресурсі. Аналогічно можна визначити індекси цитованості будь-яких джерел інформації, використовуваних для комплектування інформаційного ресурсу шляхом відбору за простим або складним ключем.

Індекси цитованості дають змогу вирішувати задачу оптимального комплектування інформаційних ресурсів. Наприклад, ранжування за індексом цитованості журналів, що публікують статті за профілем даного інформаційного виробництва, уможливлює досить просте визначення оптимальної передплати на журнали. Треба оформити передплату на групу журналів, що стоять поспіль на початку списку. Число журналів при цьому визначиться розміром асигнувань, виділених на передплати, і вартістю передплати на кожний журнал.

У США вже давно й успішно функціонує популярне в усьому світі комерційне інформаційне виробництво, що надає різноманітні послуги на базі текстів статей з науково-технічних журналів усього світу. Ідеолог і беззмінний керівник цього виробництва доктор Ю. Гарфілд використовує в різних аспектах, у тому числі й для визначення передплати на журнали, індекси цитованості, отримані підрахунком кількості посилань на статті, опубліковані у відповідних журналах, наведені в статтях інших журналів. На сьогодні надійнішого способу формального оцінювання популярності журналу, а також авторів публікацій, ніж їх цитованість, світовою науково-технічною громадськістю ще не знайдено [4].

Разом із наведеними досить чіткими процедурами формування інформаційних ресурсів окремих інформаційних виробництв, що обумовлюють інтенсивні потоки запитів і даних, у суспільному інформаційному виробництві спостерігаються могутні потоки інформації, спрямовані не на конкретного споживача. Це передусім усі види масової інформації, пропаганди, агітації та реклами.

Як зазначалося вище, ці потоки можуть використовуватися для комплектування власних інформаційних ресурсів окремих інформаційних виробництв. Крім того, ця інформація має зберігатися в інформаційних ресурсах її виробників і видаватися за запитами будь-якого суб’єкта інформаційного виробництва, в тому числі за запитами окремої людини, для уточнення даних у разі виникнення будь-яких наслідків її не контрольованого поширення.

Аналогічну ситуацію можна спостерігати в інших виробництвах загальнозначущої інформації, зокрема у виробництвах законодавчої і нормативної інформації, що визначає права та обо­в’язки всіх членів суспільства. Закони та інші нормативні документи мають бути доступними для всіх членів суспільства в будь-який час, а не тільки в момент їх появи.

Отже, нарівні з інформаційними ресурсами окремих інформаційних виробництв, що взаємодіють одне з одним у процесі суспільного відтворювання відповідно до своїх потреб, у суспільстві функціонують інформаційні виробництва, зобов’язані за своїм призначенням формувати загальнодоступні державні інформаційні ресурси. Склад, а також порядок формування і використання таких інформаційних ресурсів повинна визначати держава, враховуючи інтереси суспільства загалом.

Цей порядок має встановлюватися законодавчо, з урахуванням права громадян на інформацію, з одного боку, і необхідності збереження особистої, комерційної, службової і державної таємниць — з іншого.

Технологія збереження таємниці включає як фізичні, так і інформаційні методи обмеження небажаного доступу до яких-небудь частин інформаційних ресурсів. Фізичні методи обмежують фізичні контакти (прямі або непрямі) потенційних порушників таємниць із засобами зберігання і поширення інформації. Інформаційні методи обмеження доступу базуються на внесенні в тексти документів спеціальних ключів, відсутність яких у запитах блокує доступ. Отже, інформаційний захист є не що інше, як зворотна перевірка запиту на наявність у ньому деякого складного ключа. Відсутність такого ключа робить запит нерелевантним інформаційному ресурсу.

У разі поширення (передавання) інформації обмеженого доступу використовуються спеціальні інформаційні процедури шифрування та дешифрування інформації. Ці процедури базуються на спеціальних матеріальних та інформаційних засобах криптографії, одного з найдавніших розділів інформатики. Криптографія народилася разом із знаковою системою спілкування. Теоретичні і прикладні проблеми криптографії широко висвітлюються в літературі, тому на них ми не зупинятимемося.

Укрупнена модель руху інформації в суспільстві може виглядати як ієрархія взаємопов’язаних інформаційних ресурсів, єдиним коренем якої є світові інформаційні ресурси. На першому рів­ні ієрархії знаходяться інформаційні ресурси окремих країн і міжнародних професійних, тематичних і предметних об’єднань. На другому рівні природно розмістити інформаційні ресурси окремих країн, керовані державою. Тоді на третьому рівні можуть бути інформаційні ресурси великих виробничих, економічних і суспільних об’єднань, а на четвертому — інформаційні ресурси окремих підприємств та організацій. На п’ятому, найбільш масовому та активному рівні суспільного інформаційного виробництва знаходиться людина з її інформаційними ресурсами, потребами і продуктами.

Рух інформації між рівнями в цій моделі підпадає під дію розглянутих раніше законів. Якщо умовно поділити інформацію, що рухається на кожному рівні людей, на інформацію внутрішнього і зовнішнього призначення, то можна виявити загальну тенденцію для інформаційних продуктів усіх рівнів. Вона полягає в істотному переважанні обсягів інформації внутрішнього призначення над обсягами інформації зовнішнього призначення.

Кожний з власного досвіду знає, як багато варіантів нового інформаційного продукту доводиться зробити, перш ніж буде обрано остаточний вид продукту, призначений для суміжників у інформаційному виробництві. Спілкування людей в одній організації набагато інтенсивніше за спілкування цієї організації з іншими організаціями тощо.

Співвідношення видів інформаційних продуктів (зовнішніх і внутрішніх) визначається за емпіричною формулою «20:80» (закон Парето*). Умовність цього співвідношення очевидна. Таким самим є співвідношення обсягів нижнього і верхнього споживання інформації зовнішнього призначення. Під верхнім споживанням будемо розуміти використання інформаційного продукту, зробленого на будь-якому рівні розглянутої моделі, інформаційними виробництвами на більш вищих рівнях, а під нижнім споживанням — використання того самого продукту інформаційними виробництвами, що знаходяться на тому самому або на нижчих рівнях моделі.

Огляд і детальне вивчення класифікації та особливостей інформаційних ресурсів, окремих складних інформаційних виробництв і державних інформаційних ресурсів є об’єктом окремої розмови.