Агратин Е.Г. Особенности каталогизации источников в поисковых базах данных средств массовой информации // Информационные ресурсы России. – 2017. – №1. – С. 2–7.
УДК 011/019
Аннотация. Статья посвящена системе каталогов, которую практикуют информационно-поисковые базы данных средств массовой информации (СМИ): «Factiva» (https://global.factiva.com), «Медиалогия» (http://www.mlg.ru), «Интегрум» (http://integrum.ru), «Публичная библиотека» (http://public.ru), «Система комплексного анализа новостей» (http://scan-interfax.ru). Особенности каталогизации, используемой поисковыми системами, подробно характеризуются по типам источников, с учетом их тематического и территориального охвата. В частности, делается вывод, что каталогизация источников и её многочисленные аспекты должны чаще рассматриваться специалистами соответствующих дисциплин – книговедения, библиографии, библиотечного и издательского дела, информатики и журналистики.
Abstract. The article deals with the system catalogs that is practiced by the information retrieval database of the mass media: "Factiva" (https://global.factiva.com), "Medialogia" (http://www.mlg.ru), "Integrum" (http://integrum.ru), "Public Library" (http://public.ru), "System of Complex Analysis of News" (http://scan-interfax.ru). The peculiarities of cataloging used by search engines are described in detail by the types of sources, with consideration of their thematic and territorial coverage. In particular, it is concluded that the cataloguing of the sources and its many aspects must often be considered by specialists of the relevant disciplines – bibliology, bibliography, library and publishing, computer science and journalism.
Ключевые слова. catalog, cataloging, information retrieval database, source, search engine, media
Агратин Евгений Георгиевич – кандидат филологических наук, начальник отдела информационного обеспечения ЗАО "Интерфакс"
Уровень информатизации определяет и особенности развития библиографии. Именно она стоит на пороге тотальной автоматизации [3]
А.А.Гречихин, книговед
В толковых словарях термин "каталог" (от греческого "katalogos") определяется как список, перечень каких-либо однородных предметов (книг, рукописей, экспонатов, товаров), составленный в определённом порядке. Это общее понятие. В нашем случае речь идет о каталогизации произведений печати, и здесь уместно говорить в первую очередь о библиотечных каталогах, которые различаются по назначению (читательские и служебные каталоги), способу группировки (алфавитные, систематические, предметные, территориальные, отраслевые каталоги), видам и типам произведений печати.
Система каталогов отражает библиотечный фонд с разных точек зрения в зависимости от специализации библиотеки. Каталоги бывают карточные (традиционные), которые реализованы в карточной бумажной форме, и электронные. Электронный каталог, как правило, совмещает в себе функции нескольких традиционных каталогов: алфавитного, систематического, предметного, территориального, отраслевого и многих других, предоставляя пользователю возможность вести многоаспектный поиск и получать релевантную информацию об источниках.
Таким образом, библиотечный каталог – это совокупность расположенных по определенным правилам библиографических записей на документы, раскрывающая состав и содержание библиотечного фонда [5]. Здесь следует подчеркнуть, что существуют определенные правила составления библиографических записей, отраженные в «ГОСТ 7.1–2003. Библиографическая запись. Библиографическое описание: общие требования и правила составления». Библиографические записи являются элементом библиографической информации, фиксирующим в документальной форме сведения о документе, позволяющим его идентифицировать, раскрыть составные части и содержание в целях поиска. Библиографическая запись включает в себя заголовок, библиографическое описание, классификационные индексы, шифры хранения документа, сведения служебного характера [2].
Электронный каталог способен отображать не только печатную продукцию, но и любые другие информационные источники, в том числе и в электронном виде. Если мы говорим об электронном каталоге, его использование получило распространение не только в библиотечных фондах, но и в поисковых базах данных, широкая популярность которых началась с появлением интернета.
В настоящее время существует три типа поисковых баз данных – библиографическая, обеспечивающая поиск библиографической информации, фактографическая, предназначенная для поиска фактов, и полнотекстовая, которая осуществляет полнотекстовый поиск. В данной работе будет рассмотрена каталогизация источников в полнотекстовых поисковых базах данных средств массовой информации (СМИ). Под полнотекстовой базой данных будем понимать текстовую базу первичных данных, содержащую полные тексты документов.
Несмотря на буквально лавинообразный рост полнотекстовых информационно-поисковых систем в России и мире, количество баз данных, которые специализируются на сборе, обработке и накоплению ресурсов средств массовой информации, составляет небольшое число. Общество изначально уделяло больше внимания автоматизации научно-технической информации - двигателю технического прогресса, инвестируя именно в это направление, как в объективную необходимость. Разница между автоматизацией научно-технической информации и СМИ, составляет не один десяток лет, поэтому опыт, накопленный в создании автоматизированных систем в области научно-технической информации, оказал существенное влияние на построение информационно-поисковых баз данных в средствах массовой информации и, в меньшей степени, на каталогизацию источников в поисковых системах в силу специфических особенностей научно-технической информации. Библиотечные фонды, особенно по общественным наукам, которые по содержанию наиболее близки к фондам поисковых баз данных СМИ, также не смогли передать опыт каталогизации источников, в данном случае уже по причине специфических особенностей средств массовой информации. В самой теории журналистики каталогизации источников не уделяли существенного внимания, руководствуясь теоретическими разработками смежных дисциплин, например, книговедения, библиографии, библиотечного дела и информатики. Поэтому каталогизация источников в поисковых базах данных СМИ приняла самобытный характер, с точки зрения содержания, целевого назначения и терминологического обозначения, доходящий порой до метакогнитивного искажения, которое заключается в том, что специалисты, имеющие низкий уровень квалификации, делают ошибочные выводы, принимают неудачные решения и при этом не способны осознавать свои ошибки в силу низкого уровня квалификации.
В нашем исследовании особенности каталогизации источников в СМИ будут рассмотрены на примере пяти поисковых баз данных, которые ориентированы на комплектование источников средств массовой информации, это "Factiva" (https://global.factiva.com), "Интегрум" (http://integrum.ru), "Медиалогия" (http://www.mlg.ru), "Публичная библиотека" (http://public.ru) и "Система комплексного анализа новостей (СКАН)" (http://scan-interfax.ru).
"Factiva" (https://global.factiva.com) - подразделение компании "DowJones" (USA), которое занимается предоставлением доступа к деловой и аналитической информации, в том числе к полным текстам газетной и журнальной периодики, новостям информационных агентств, материалам интернет-изданий. Основные подписчики базы данных – это инвестиционные, страховые, торговые и юридические компании, банки, промышленные предприятия, специалисты в области массовых коммуникаций, PR и информационно-аналитической деятельности, маркетинга и средств массовой информации.
Чем полнее и разнообразнее укомплектована база данных источниками, тем больше возможностей удовлетворить информационные потребности пользователей. В тоже время большие объемы информации и разнообразие запросов требуют раскрытия и дальнейшего отыскания источников с использованием электронных каталогов. Изложенное выше имеет прямое отношение к базе данных "Factiva", где широко представленное разнообразие ее информационных фондов обусловливает необходимость создания сложной системы каталогов, отличающихся своим назначением и структурой. Рассмотрим основные из них, которые заслуживают особого внимания. В частности, в поисковой базе данных "Factiva" представлены каталоги, которые дополняют друг друга и, одновременно составляют систему - единое целое. Это: "Language", "Region", "Type", "Industry", "News sources for Factive products", "Top Sources".
"Language" – каталог источников, который характеризует их языковую принадлежность, так как в базе данных Factiva представлена информация на 23 языках мира. Каталог позволяет отсортировать источники по языковому признаку с дальнейшим проведением поиска в них на том языке, который соответствует найденному источнику.
"Region" – каталог позволяет провести поиск по источникам и отсортировать их по региональному признаку (в базе данных Factiva представлены источники из 159 стран мира).
"Type" – каталог характеризует источники по типовому признаку: газеты, журналы, транскрипты ТВ и Радио, продукты информационных агентств, интернет-источники, официальные документы (бюллетени) и т.д.
"Industry" – каталог отраслевого характера (тематический). Выполняет функции отображения источников с соответствующими тематическими направлениями. Имеет древовидную структуру, категории разветвляются от более общих до конкретных. Тематический каталог в некоторых случаях имеет преимущества перед другими каталогами, например, если об источнике ничего не известно, проводится поиск по тематике.
"News sources for Factive products" – каталог новых источников, которые поступили в поисковую базу данных в течение определенного отрезка времени. Новые поступления автоматически отображаются по завершении каждого обновления. Такое оповещение позволяет вычленить новые источники из общего информационного массива базы данных, не потерять их в десятках тысяч имеющихся источников с возможностью дальнейшего полнотекстового поиска по ним.
"Top Sources" – каталог главных источников. В нём представлен список наиболее востребованных источников, которые пользуется наибольшим спросом у пользователей. Такой каталог имеет функцию ротации перманентного характера, когда список обновляется в зависимости от спроса на главные источники.
Каталогизация источников в базе данных "Factiva" наиболее приближена к стандартизации в области информационно-поисковых систем, которая является важнейшим условием эффективной организации процессов обработки источников и их поиска. Можно с большой долей уверенности утверждать, что в основе каталогов базы данных "Factiva" лежат международные системы классификаций, которые были разработаны либо крупными библиотеками, либо специальными комитетами, например, Десятичная Классификации Дьюи или Универсальная Десятичная классификации (УДК). Особо следует подчеркнуть, что названия каталогов в поисковой базе данных "Factiva"с точки зрения понятийного аппарата точно передают их цели и задачи.
"Интегрум" (http://integrum.ru) – на рынке с 1996 г. На сегодняшний день является электронным архивом русскоязычных СМИ. База данных содержит как материалы печатных, электронных и медийных СМИ, так и данные из ряда других источников: бюллетеней, каталогов, информационных публикаций официальных учреждений, адресно-справочных баз данных и статистических справочников. Среди клиентов компании крупные промышленные предприятия и частные лица, инвестиционные компании и банки, спецслужбы и органы власти, политические и аналитические структуры, СМИ и библиотеки, юридические, консультационные и PR-агентства.
Что касается каталогизации, источники базы данных компании представлены всего лишь на уровне верхних тематических рубрик, имеющие скорее характер заголовков: зарубежная пресса, интернет-издания, центральные информагентства, региональные информагентства, зарубежные информагентства, информагентства Содружества Независимых Государств (СНГ), региональная пресса, телерадиоэфир, центральная пресса, финансовые и биржевые новости и т.д. Как таковая, каталогизация в том понимании, в котором мы ее рассматриваем, в поисковой базе данных Интегрум отсутствует. Основной способ поиска в базе данных - это контекстный поиск, который осуществляется с помощью логического языка запросов. Поиск можно осуществлять как по всей базе в целом, так и с введением условий (например, создавать личные выборки источников информации или осуществлять поиск за определенный отрезок времени). По умолчанию пользователям предлагается список типовых запросов, которые существенно облегчают поиск интересующей информации. Кроме того, пользователь может самостоятельно сформировать запрос к системе с дальнейшим его сохранением в системе и с возможностью его повторного использования.
Отсутствие системы каталогов в базе данных "Интегрум" существенно снижает ее поисковые возможности, не отображает всей полноты информации об источниках, ограничивает результаты поиска релевантных документов и тем самым ухудшает эффективность удовлетворения информационных потребностей пользователей.
Компания "Медиалогия" (http://www.mlg.ru) была создана в 2003 году. Система состоит из базы данных СМИ и автоматизированного аналитического модуля, который позволяет проводить самостоятельный поиск и анализ по количественным и качественным характеристикам информации за любой заданный период. В базу данных круглосуточно поступают новости информагентств, газеты, журналы, транскрипты передач радио и телевидения, интернет-источники, блоги и т.д.. С "Медиалогией" работают пресс-службы публичных коммерческих организаций и государственных учреждений. Работа с системой позволяет осуществлять оперативный круглосуточный контроль информационного поля, выгружать требуемые тексты в традиционный формат мониторинга, а также проводить анализ самостоятельно с результатами в виде графиков и таблиц.
Основным способом поиска информации в базе данных "Медиалогия" является объектно-ориентированный поиск, когда физическое лицо, компания или бренд указывается в системе как отдельный объект. Плюсом такого способа поиска является то, что к каждому объекту прикрепляется список слов-маркеров, которыми он может обозначаться в источниках информации, и поиск ведется по всем возможным обозначениям объекта. Также выделена группа географических объектов (регионы, области, города), которая позволяет строить распределения упоминания персон, компаний и брендов в привязке к определенной географии. Кроме объектно-ориентированного поиска в системе осуществляются контекстный поиск (схожий с поиском в наиболее популярных поисковых системах "Яндекс" или "Рамблер"), поиск по отдельным полям и атрибутам документов, а также поиск информации в персональных наборах источников информации, определяемых пользователем.
Если говорить о каталогизации источников в поисковой базе данных "Медиалогия", здесь, также как и база данных "Factiva", есть каталог источников, который характеризует их языковую принадлежность, территориальную и тематическую (отраслевую). Что касается каталога по типам источников - газеты, журналы, транскрипты ТВ и Радио, ленты информационных агентств, интернет-источники, блоги и т.д., он также имеется в наличии.
Следует заметить, что "Медиалогия" грешит выдуманной ею самой терминологией, когда речь идет о названиях каталогов, что, на наш взгляд, сбивает с толку пользователей поисковой базы данных и наносит определенный вред теории и практике в области библиографии, журналистики и информатики. В частности, территориальный каталог озаглавлен, как "Уровень СМИ". Такое общее размытое наименование каталога никакой смысловой нагрузки не несет, и может интерпретироваться потребителями информации как угодно, особенно в момент его практического применения. Тоже относится и к тематическому (отраслевому) каталогу, название которого "Отрасль/тип". Наименование состоит из двух слов, которые противоречат друг другу с точки зрения целевого назначения каталога и его содержания. Что касается типового каталога источников, он обозначен как "категория", что вносит существенную путаницу в его определение и неоправданный отказ от терминологического наследства в области библиографии, библиотечного и издательского дела. Здесь следует заметить, что такое обозначение каталогов переняли разработчики поисковой базы данных СКАН (система комплексного анализа новостей). Позже более детально мы вернемся к её каталогам и слепому подражанию с точки зрения их обозначения.
Компания «Публичная Библиотека» (http://public.ru) развивает собственную базу данных материалов СМИ с 2000 года. Предоставляет полный спектр услуг по работе с материалами масс-медиа: от онлайн-доступа к коллекции публикаций СМИ до мониторинга прессы и проведения эксклюзивных аналитических исследований на базе открытых источников. Среди клиентов библиотеки пресс-службы и аналитические подразделения коммерческих организаций и государственных учреждений, PR-компании и группы мониторинга СМИ, маркетинговые агентства и консалтинговые компании.
Поисковая база данных "Public.Ru" позиционируется как публичная библиотека и соответственно решает следующие задачи: создание архива публикаций центральных и региональных периодических СМИ, организация массового доступа к архиву, организация справочно-библиографического обслуживания пользователей. Пользователям библиотеки предоставляется доступ к следующим материалам:
- центральные печатные СМИ;
- центральные информагентства;
- теле-радио эфир (транскрипты ТВ и радио эфира);
- ТВ и радио ONLINE (сайты телерадиокомпаний);
- региональные печатные СМИ;
- региональные информагентства;
- пресса ONLINE (сайты газет и журналов);
- интернет-СМИ;
- интернет Government (сайты органов власти);
- зарубежные СМИ (пресса, ИА, интернет-ресурсы).
Для удобства и повышения оперативности поиска источников в базе данных Public.Ru каталог сгруппирован по тематике и месту издания, типам СМИ и периодичности выхода. Можно также воспользоваться поиском источников по алфавиту на кириллице и латинице. Параметры поиска:
- название;
- место издания;
- тематика;
- тип издания;
- периодичность;
- тираж.
Таким образом, каталогизация источников в поисковой базе данных Public.Ru наиболее приближена к традиционным электронным каталогам библиотек, что позволяет проводить эффективный поиск в материалах СМИ. Кроме этого отбор источников по параметрам в каталоге СМИ позволяет создать персональную коллекцию источников для эффективной работы с тематическими, региональными и другими пулами российских СМИ.
Заслуживает внимания информационно-поисковая система «СКАН» (http://scan.interfax.ru), аббревиатура которой расшифровывается как "Система комплексного анализа новостей" [1]. Ее основные технологические принципы в 2007 г. были реализованы сотрудниками Международной информационной группы «Интерфакс» (Interfax Information Services), которая специализируется в создании информационных продуктов и средств коммуникации, служащих для принятия решений в политике и бизнесе.
Поисковая база данных «СКАН» содержит полные тексты газетно-журнальной периодики, новости информационных агентств, материалы интернет-изданий, мониторинг прессы и телерадиоэфира России, СНГ , Ближнего и Дальнего Зарубежья, включая архив новостных сообщений группы компаний «Интерфакс» с 1989 года.
Основные категории пользователей базы данных "СКАН" – это руководство компаний, специалисты в области массовых коммуникаций, PR и информационно-аналитической деятельности, банков и банковского дела, инвестиций, маркетинга и средств массовой информации.
Среда разработки информационно-поисковой база данных «СКАН» - Microsoft.NET. Полнотекстовый индекс был разработан на базе Lucene.NET базы каталогов SQL Server, приложения ASP.NET в среде IIS. Что касается морфологии, лингвистики, выделения и индексов объектов, все это является собственной разработкой сотрудников Международной информационной группы «Интерфакс». В частности, решались две задачи – индексирование документов и индексирование запросов. Таким образом язык индексирования послужил мостом между языком документов и языком запросов. Индексирование документов с помощью слов, содержащихся в этих же документах, позволяет использовать так называемый естественный язык в диалоге с базой данных «СКАН», что упрощает и облегчает задачу отыскания релевантных документов. Поисковая система дает возможность искать информацию с использованием логических выражений, последовательности слов, указывать степень удаленности слов друг от друга в предложении и многое другое. Результаты поиска можно фильтровать и сортировать, используя дополнительные возможности системы. Поисковый механизм учитывает морфологические особенности русского и английского языков, позволяет выделять объекты, людей и компании и использовать найденные объекты для связи с другими источниками информации. Для удобства работы пользователя система хранит последние поисковые запросы.
Интеграция базы данных «СКАН» с другими информационными системами «Интерфакса», в частности с базой данных «СПАРК» (http://www.spark-interfax.ru/promo/)
обеспечивает уникальный набор инструментов для сопоставления данных и проведения более глубокого анализа полученной информации. База данных «СПАРК» содержит систематизированную и структурированную информацию практически по всем зарегистрированным в России юридическим лицам, а также самих компаний, включает в себя данные, предоставляемые Федеральной службой государственной статистики, Федеральной налоговой службой, Федеральной службой по финансовым рынкам и других ведомств.
В системе «СКАН» также предусмотрены следующие каталоги: "Категория источников", "Тематика источников", "Уровни источников", "Регионы источников", "Темы публикаций" и "Язык публикаций". Рассмотрим каждый из них более детально.
Каталог "Категория источников" имеет древовидную структуру и содержит следующие верхние уровни: "Блоги", "Интернет", "Ленты информагентств", "Обзоры", "Периодические издания", "Пресс-релизы", "Раскрытие информации", "ТВ и Радио". В свою очередь большинство этих уровней делятся на подуровни, например "Блоги" содержат блоги компаний, блоги СМИ, отраслевые блоги и т.д., "Периодические издания" содержат газеты и журналы, что создает многоуровневый характер каталога.
Здесь мы сталкивается с той же проблемой, что изложена выше по поводу наименования каталогов в поисковой базе данных "Медиалогия". Название "Категория источников" носит общий характер и не имеет ничего общего с типовыми признаками источника. В нашем случае тип источника - это обобщенная модель издания, представляющая собой совокупность наиболее существенных признаков, определяющих типовые содержательные особенности и внешние качества издания: социально-функциональное и читательское назначение, материальную конструкцию, знаковую форму основного материала (текст, изображение, нотная запись, картографическое изображение), характер связи с другими изданиями и временные особенности выпуска (непериодическое, периодическое, продолжающееся, серийное издание) [4].
Еще один существенный недостаток каталога "Категория источников" заключается в том, что в нем может присутствовать тип источника, которого нет в поисковой базе данных "СКАН" и не ожидается, например, "Продуктовые блоги". Нет ясности, чем отличаются "Отраслевые блоги" от "Блогов компаний", так как компании часто носят отраслевой характер. Чужеродным для типового признака источника представлена такая "категория" как "Раскрытие информации". Ряд источников, в которых есть острая необходимость, просто отсутствуют в каталоге "Категорий источников", например, "Бюллетени", "Вестники", "Справочники", "Базы данных". Кроме этого, в каталоге "Категория источников" перемешаны жанры и типы источников, что влечет за собой подмену понятий. Обзоры, которые делятся на "Обзоры общего характера", "Отраслевые обзоры" и почему-то "Сводки новостей (дайджесты)" относятся к жанрам источника (произведения). Под жанром произведения понимают устойчивые особенности его содержательно-тематических характеристик, типа отображаемой действительности, композиции, стилистики. Жанры периодики условно можно разделить на следующие: информационные, аналитические, художественно-публицистические. Для информационных публикаций общей чертой является стремление наиболее точно передать знание о событии, факте. Основное содержание аналитических материалов – авторские размышления по поводу событий, фактов, явлений действительности. Художественно-публицистические сочетают документализм с литературным вымыслом, дают эмоциональную оценку событий. В источниках разного типа – разные жанровые системы.
Каталог "Тематика источников" представляет собой одноуровневый классификатор, состоящий из тематических рубрик, которые размещены в алфавитном порядке: "Авиакосмическая промышленность", "Автомобильная промышленность", "Банки. Финансовые организации", "Безопасность бизнеса", "Бизнес. Предпринимательство. Рынки", Бухгалтерский учет. Финансовый консалтинг", "Военные и силовые структуры. Армейская служба" и т.д. Он не имеет древовидной структуры, что не позволяет проводить поиск источников от общего к частному. Отсутствие древовидности не позволяет каталогу с такой структурой развиваться. Многоуровневый каталог - это очень мощная концепция, использование которой упрощает управление рубриками для пользователей. Количество уровней (ветвей) каталога не ограничено. Поэтому преимущество многоуровневого каталога - возможность построения большого количества фактически независимых подрубрик, использующих разный набор признаков и характеризующих источники с разных сторон.
"Уровни источников" содержит в себе территориальные признаки источников: федеральные, региональные, зарубежные. Здесь мы снова наблюдаем такое название каталога, которое не несет в себе никакой смысловой нагрузки и соответственно вводит пользователя в заблуждение с точки зрения его целевого назначения. Каталог "Уровни источников" уместнее разместить в каталоге "Регионы источников", который представлен в базе данных "СКАН" такими признаками как: страна, округ, область (район), город.
Каталог "Темы публикаций" также как и "Тематика источников" представляет собой одноуровневый классификатор, состоящий из тематических рубрик, которые размещены в алфавитном порядке. Практическое применение этого каталога до конца не ясно, так как его одноуровневый характер и весьма абстрактный перечень рубрик, явно заимствованный из другой базы данных, осложняет поиск (сортировку) публикаций, главным образом с точки зрения их корректной тематической идентификации.
Каталог "Язык публикаций" характеризует языковую принадлежность источников, и позволяет проводить поиск информации на трёх языках – русский, английский и украинский.
Подводя итог изложенному выше обзору, который посвящен каталогизации источников в поисковых базах данных средств массовой информации, следует отметить, что к ней предъявляется ряд требований, суть которых в следующем:
- каталогизация источников – это основа любой информационной деятельности, поэтому её следует рассматривать как обязательный элемент в работе поисковых баз данных;
- каталогизация источников должна определяться характером поисковых баз данных, обусловленным их особенностями с точки зрения поставленных целей и задач;
- каталогизация источников должна способствовать получению максимальной полноты информации об источниках;
- поисковая база данных не должна ограничиваться каким-то одним каталогом, так как пользователи обращаются в поисковую систему с различными запросами, которые можно выполнить только с использованием совокупности и многообразия каталогов;
- каталогизацию источников необходимо постоянно совершенствовать, так как увеличивается состав фондов поисковой базы данных, усложняется их структура, возрастает число пользователей, развиваются традиционные и появляются новые формы информационного обслуживания;
- система каталогов расширяется, что влечёт за собой необходимость установления более рациональных связей между ними;
- широта тематики и многообразие типов и видов источников, составляющих фонд поисковых баз данных, а также существенные различия запросов пользователей обусловливают необходимость создания сложной системы каталогов, отличающихся своим назначением и структурой;
- создание единой системы каталогизации источников в поисковых базах данных средств массовой информации может положительно повлиять на эффективность поиска источников, удовлетворение информационных потребностей пользователей и наиболее полно раскрыть фонды поисковых систем;
- каталогизация источников должна использовать единые термины и определения;
- каталогизация должна соответствовать тем источникам, которые содержатся или ожидаются в фондах поисковой базы исходя из её целевого назначения;
- каталогизация источников и её многочисленные аспекты должны чаще рассматриваться специалистами соответствующих дисциплин – книговедения, библиографии, библиотечного и издательского дела, информатики и, конечно, журналистики.
В заключение следует отметить, что разрозненные локальные поисковые базы данных средств массовой информации можно объединить в единую целостную систему, чтобы обеспечить формирование и эффективное использование источников, интегрировать их в информационное пространство и содействовать созданию рынка информационной продукции и услуг, только при условии соблюдения общей системы стандартов каталогизации источников, понятийного аппарата, нормативной базы и технологических принципов.
ЛИТЕРАТУРА:
1.Агратин Е.Г. Система комплексного анализа новостей. // Информационные ресурсы России. – 2007. – №6 (100) – С. 24.
2.Библиографическая запись. Библиографическое описание. Общие требования и правила составления [Текст] : ГОСТ 7.1-2003. – Введ. 2004-01-07. – М., 2006. – 52 с. - Система стандартов по информации, библиотечному и издательскому делу.
3.Гречихин, А. А. Общая библиография [Текст] : учебник для вузов / Александр Андреевич Гречихин. - 2-е изд., перераб. и доп. - М. : Изд-во МГУП, 2000. - 588 с.
4.Издания. Основные виды. Термины и определения [Текст] : ГОСТ 7.60-90. - Введ. 1991-01-01. - М., 1990. - 29 с. - (Система стандартов по информации, библиотечному и издательскому делу).
5.Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения [Текст] : ГОСТ 7.76-96. – Введ. 1998-01-01. – М., 1997. – 56 с. - Система стандартов по информации, библиотечному и издательскому делу.