Міжнародні інформаційні системи - Навчальний посібник

14.2. принципи роботи системи wais

Розглянемо деякі принципи роботи системи WAIS. Щоб змусити WAIS виконувати команди користувача, необхідно правильно задавати питання та команди. При цьому необхідно знати як будувати ці питання, і як система WAIS їх обробляє.

Система WAIS репрезентує розподілену службу пошуку тексту .В її основу покладений стандарт номер Z 39.50. Це стандарт Американського національного інституту стандартів, що визначає процедуру запита бібліографічної інформації. Цей стандарт довгий час розроблявся фахівцями по бібліотечній справі та комп`ютерній техніці. Даний стандарт регламентує процедуру пошуку, тобто визначає порядок взаємодії двох комп`ютерів в ситуації, коли один комп`ютер повинен запитувати, а інший проведення для нього пошуку. Система WAIS є однією з перших реалізацій цього проекту стандарту і самою найбільш використованою із числа аналогічних систем в сучасній час.

Щоб отримати доступ до документу через сервер WAIS, необхідно створити для цого серверу індекс, якій буде використовуватися при пошуку. При роботі з текстовою інформацією звичайно індексується кожне слово. Коли дається із програми-клієнта WAIS запитання на пошук, ця програма встановлює контакт з серверами, що контролюють вказівки бібліотеки. Програма-клієнт запитує по черзі всі сервери і виконує пошук у їх індексах по заданій сукупності слів. Сервер посилає користувачеві список документів, які можливо для користувача будуть необхідні. Кожному із таких документів приписується цілком визначене число ”балів”. Таким чином, WAIS оцінює, наскільки даний документ, на її думку , підходить для відповіді на запит. Документ, який найбільш повніше задовольняє критерії пошуку, отримує, наприклад, 1000 балів.

Якщо користувач системи WAIS задав пошук документів, що вміщують слова “Clinton and Gore “, то система WAIS аналізує індекси та підраховує, скільки разів в кожному документі зустрічаються слова “Clinton”, ” and “, “Gore”. Потім кожне із цих чисел помножується на деякій коефіцієнт, яким визначається важливість даного слова - так званий ваговий коефіцієнт. Кількість балів для документу обчислюється як сума отриманих значень. По закінченні пошуку в усіх бібліотеках система WAIS видає заголовки документів, що отримали максимальну кількість балів.

Існує обмеження на розмір списку документів, що видаються. Як правило це від 15 до 50 заголовків документів. Із отриманого списку користувач системи зможе вибрати документи для перегляду.

Незважаючи на деякі недоліки системи WAIS: відсутність “контекстної фільтрації, відсутність альтернативних запитань при формуванні запиту, ця система – одна із самих корисних в мережі Internet.

Система WAIS окрім того, має ще одну унікальну властивість: подібний зворотній зв`язок (relevance feedback). Це означає, що деякі програми-клієнти дозволяють знаходити подібні документи.