Интернет-журналистика - Учебник (Калмыков А.А., Коханова Л.А.)

Глава 2. мир платной информации

 

Разговор о базах данных обязательно должен коснуться темы плат­ной информации. Связь проста — базы данных есть продукт серь­езного профессионального труда. Чем выше профессионализм созда­телей базы, чем большие массивы информации им удалось обрабо­тать и подготовить для хранения, чем совершеннее инструменты по­иска и обработки информации, которые сопровождают базу, тем выше ценность базы, но тем выше и цена обращения к базе. Поэто­му, базами пользуются в основном профессиональные поисковики и журналисты. Большинство серьезных изданий подписаны на сле­дующие текстовые базы данных.

•  «Лексис-Нексис — крупнейшая полнотекстовая политематическая электронная библиотека, инструменты и информационые ресурсы которой позволяют решать любые поисковые задачи. Ресурсы системы баз данных LexisNexis, созданной в 1968 г., насчитывают более 33 000 информационных источников (более 3,5 млрд. документов) с глубиной архива до 30 лет для бизнес-информации и более 600 лет для юридической информации. Общий объем информации в LexisNexis — около 30 терабайт. Еженедельно в архивы LexisNexis ложится 18 млн. документов из самых разных сфер — бизнеса, экономики, политики, науки, юриспруденции в Европе, Америке, Азии, Австралии, Африке и Тихоокеанском регионе. LexisNexis включает: финансовые отчеты и прогнозы о компаниях во всем мире, аналитические исследования по странам и регионам, маркетинговые отчеты, подготовленные наиболее известными коммерческими и государственными компаниями; более 20 000 постоянно обновляемых полнотекстовых периодических источников деловой и юридической информации, включая специальную и отраслевую прессу, информагентства; законы, судебную практику, юридическую информацию США, ЕС, Великобритании, Франции, Канады, Австралии, Новой Зеландии, Китая, РФ и других стран; более 6,5 млн. патентов, поданных в Бюро Патентов США с 1790 г.; более 100 баз данных о сотнях миллионов компаний мира и др.

•  «Интегрум» — российская компания, которая ведет единый электронный архив всех русскоязычных открытых источников информации и предлагает клиентам доступ к архиву в комплексе с уникальными инструментами поиска и обработки данных. «Интегрум» располагает крупнейшим в мире массивом русскоязычных докумен­тов в электронном виде. Это старейшая компания России, занимаю­щаяся сканированием информационного пространства. Круглосу­точно базы «Интегрума» пополняются материалами прессы, радио и ТВ, открытыми документами коммерческих и государственных структур, материалами интернет-сайтов, адресно-справочными ба­зами данных — более 10 000 документов ежедневно, включая и элек­тронные версии только что вышедших из печати документов и ар­хивные массивы. На момент написания этого текста в хранилищах «Интегрума» насчитывалось 257,45 млн. документов, а объем баз со­ставлял 896,79 Гбайт. В отличие от большинства платных поисковых систем, работающих либо со СМИ, либо с узкотематическими база­ми данных, «Интегрум» аккумулирует электронные версии любых текстовых документов и документы, относящиеся к любым общест­венно значимым темам.

•  Публичная интернет-библиотека — специализируется на предоставлении услуг «в области отечественной периодики и исходя из этого решает следующие основные задачи: создание архива публикаций центральных и региональных периодических изданий, предоставление массового доступа к нему, организация справочно-библиографического обслуживания пользователей, исследование рынка СМИ. Основной фонд библиотеки составляют публикации отечественных газет и журналов. Фонды хранятся на бумажных носителях и в электронном виде.

•  «Лабиринт» — электронная БД, включающая комплекс справок по политической и экономической жизни России. На апрель 2004 г. включала в себя 34 500 справок общим объемом 211 Мбайт: 21 685 биографий российских политиков, чиновников, бизнесменов; комплексные справки по 89 субъектам Российской Федерации (1869 справок) и материалы по региональным выборам; свыше 1000 справок по федеральным органам власти; 1470 справок по коммерческим структурам; 1810 справок по политическим организациям. 1373 справки по федеральным выборам 1993—2004 гг.

•  «Гарант» — компьютерная справочная правовая система. Полный объем информационного банка системы «Гарант» более 1 000 000 документов и комментариев к нормативным актам, еженедельное пополнение составляет около 4000 документов. Это специализированные правовые блоки по всем разделам федерального законодательства и 132 правовых блока по законодательству субъектов Федерации. В системе «Гарант» представлено законодательство 77 регионов Российской Федерации, а также практика 10 федеральных арбитражных судов.

•  «Кодекс» — интернет-версия профессиональных юридических и специализированных систем «Кодекс». Банк данных нормативно-правовой, нормативно-технической и специализированной информации для всех сфер деятельности, включающий более чем 700 000 документов. Система представляет в том числе базы данных по арбитраж­ ной практике и нормативно-технические документы (ГОСТы, СНиПы, СанПиНы, ЕНИРы и т.п.) по различным отраслям: строительство, топливно-энергетический комплекс, электроэнергетика, торговля, библиотечное дело и т.п. Кодекс предоставляет также образцы правовых и деловых документов, формы отчетности в той или иной области, консультации юристов и аудиторов, словари юридических и бухгалтерских терминов, ежедневные обзоры законодательства России, Москвы, Санкт-Петербурга, проекты нормативно-правовых документов и новости о них, электронную юридическую библиотеку, Большую Российскую юридическую энциклопедию и др.

•  AK&M-LIST. База данных содержит полную информацию о деятельности предприятий, банков и финансовых компаний, а также подробную информацию обо всех сегментах финансового рынка. Объединяет все данные о российском фондовом рынке и компаниях-эмитентах за период с 1993 г. по настоящее время. Веб-интерфейс AK&M-LIST позволяет получить доступ к информации этой базы данных через сеть интернет (www.disclosure.ru).

В числе наиболее популярных баз данных, доступных в онлайно­вом режиме. «Лексис-Нексис» и «Интегрум» заслуживают отдельного внимания, так как фактически являются гипертекстовыми, аккуму­лируя документы различного типа, включая в себя массивы других баз данных, в том числе и не имеющих электронных версий вне «Лексис-Нексис» или «Интегрум».

По сути, база предполагает, что часть поисковой работы уже вы­полнена — материалы собраны по тематике, разложены в определен­ной последовательности и снабжены каталогом, который позволяет легко ориентироваться в информационном пространстве базы, снаб­жены инструментами поиска и обработки информации, а также часто дополнительными видами сервиса.

Доступные бесплатно в онлайновом режиме фрагменты такого рода баз, как правило, отличаются от платного массива отсутствием последних обновлений, наиболее актуальной информации или наи­более ценных источников.

Выбирая между платными и бесплатными источниками, следует учесть и еще один момент — бесплатные поисковые машины типа Яндекса и Google предоставляют журналисту не материал, а лишь ссылку на страницу, где он находится. Однако может оказаться, что попасть на страницу нельзя — хранение бесконечно больших объемов информации, кроме того бесплатное архивирование даже одного сегмента глобальной сети, например рунета, несколько раз в сутки по­просту невозможно. В то же время базы данных гарантируют бессроч­ное хранение информации в том виде, как она поступила в базу.

В ряде сетевых ресурсов, куда приведет журналиста общедоступ­ная поисковая машина, существуют сложности с идентификацией текстов — определением даты создания материала, автора или перво­источника (например, при перепечатке), и найденная интересная «новость» может оказаться не такой уж новой. В базах данных, как правило, дата, автор и источник восстановлены и указаны, и наличе­ствуют гарантии правовой чистоты материалов.

Безусловно, поисковый аппарат баз данных (язык поиска, поля описания материалов, структура базы) создан с учетом особенностей базы и материалов, которые в ней содержатся. Глобальные поискови­ки работают с разными материалами сети на общих принципах.

Итак, основные отличия поиска в платных базах данных от бес­платных источников: гарантии доступа к материалу и совершенство инструментов. Следовательно, журналист или поисковик, определяя, пользоваться ему платными или бесплатными ресурсами, может вы­бирать по следующим параметрам: охват источников, глубина архи­вов, уровень «шума», полнота документов, а также доступность мате­риалов и время на доступ.

Кроме платных баз данных существуют также отдельные платные источники — информационные агентства, газеты, журналы, анали­тические издания, ресурсы, занимающиеся маркетинговыми или со­циологическими исследованиями и т.д. Как правило, они предлагают действительно эксклюзивную информацию. Среди крупнейших рос­сийских источников платного контента можно назвать РБК, Интер­факс, РИА «Новости». Однако перед тем как платить за доступ к та­кого рода источнику, следует выяснить, не поступают ли его мате­риалы в глобальные базы данных, чтобы не платить дважды и полу­чить доступ сразу к максимальному количеству источников.

Платным является большинство ресурсов мультимедийной ин­формации, которая также может потребоваться журналистам как он­лайновых, так и традиционных изданий в целях получения информа­ции, а также для иллюстрации текстов.

Говоря о платных источниках, нельзя не упомянуть о существо­вании так называемых «серых» баз. По сути эта информация в мо­мент появления на рынке уже открыта, но необходимо отметить, что такие серые базы даже при условии, что диск, на котором они запи­саны, небракованный, не гарантируют полноты и актуальности дан­ных и не имеют профессионального инструментария.