birmaga.ru
добавить свой файл

1
Ситуационные карты


и навигация в сетевых информационных потоках
Ландэ Д.В.,  Григорьев А.Н., Брайчевский С.М.

Информационный центр «ЭЛВИСТИ», Киев

1. В связи с быстрым ростом объемов данных в сети Интернет, а также темпов их обновления особое значение приобретает понятие навигации в информационных потоках [1]. Поскольку информационные потоки представляют собой динамическое явление, они предполагают высокую скорость обработки, т.е. данные необходимо обработать и использовать до того, как они устареют или будут заменены чем-то другим.

2. Информация, заключенная в потоках слишком обширна и слишком разнообразна для того, чтобы машина могла в ней «разобраться» с помощью формальных критериев. Поэтому одним из путей решения этой задачи состоит в использовании интеллектуальных систем, которые способны выполнять достаточно сложные процедуры, имитирующие содержательный анализ. Это обстоятельство порождает необходимость в более развитых методах обработки документов, в том числе средствах выявления понятий [2] и содержательных связей между ними [3, 4], а также их визуализации [5].

3. Крайне перспективной, с нашей точки зрения, является технология, основанная на использовании так называемых ситуационных карт. Речь идет об интерактивной системе, которая позволяет пользователю с помощью интуитивно понятного интерфейса выявлять информационные объекты из некоторой предметной области, представленные в виде двумерной таблицы (ситуационной карты), а также определять их содержательные взаимосвязи, не только прямые, но и косвенные [4].

При этом отбор документов и выделение понятий осуществляются автоматически в режиме реального времени.

4. Отметим перспективность ситуационных карт в совершенствовании технологии информационного поиска, которая определяется в первую очередь возможностью их использования для последовательного уточнения запросов. Преимущество метода ситуационных карт состоит прежде всего в том, что его использование позволяет в достаточно широких рамках модифицировать исходный запрос, исключая из него ненужные элементы и добавляя новые. Причем это делает сам пользователь в интерактивном режиме. Ключевым моментом здесь является то, что оптимальное направление модификации запроса может возникнуть уже в процессе работы, после нескольких итераций с использованием в каждой из них новых данных, предоставляемых системой пользователю. Таким образом, реализуется гибкий механизм, дающий возможность пользователю активно управлять процессом извлечения информации и, тем самым, обеспечивать высоки уровень эффективности работы.


5. Существует два общих алгоритма, реализующих построение таблиц взаимосвязей на основе применения ситуационных карт, как средств первичного отображения понятий:


  • вычисление общего вхождения признаков различных понятий в один и тот же документ;

  • вычисление корреляций наборов ключевых слов, входящих в документы, которые содержат в себе признаки различных понятий.

6. Ситуационные карты были реализованы авторами при создании систем на основе технологии интеграции информационных ресурсов InfoStream [6]. На рис. 1. представлена один из возможных интерфейсов. Ситуационная карта в данном случае обеспечивает визуализацию таких понятий, как географические названия, персоналии, наименования организаций и других характеристик, выявленных в текстовых документах, релевантных первоначальному поисковому запросу.



Рис. Пример интерфейса ситуационной карты, построенной на основе технологии InfoStream

7. Технология, основанная на использовании ситуационных карт, позволяет на практике создавать высокоэффективные системы навигации в сетевых информационных потоках для различных предметных областей. Ситуационные карты, являясь логическим расширением технологии «информационных портретов» [1, 6], представляют собой удобные инструментальные средства, которые могут быть легко адаптированы к специфике конкретных задач пользователей. В частности, типичным примером использования ситуационных карт может служить система автоматического построения классификаторов.

Список литературы

  1. Ландэ Д.В. Основы интеграции информационных потоков - Киев: Инжиниринг, 2006. — 240 с.

  2. R. Grishman. Information extraction: Techniques and challenges. In Information Extraction (International Summer School SCIE-97). Springer-Verlag, 1997.
  3. Калиткин Н.Н., Карпенко Н.В., Михайлов А.П. и др. Математические модели природы и общества –М.: ФИЗМАТЛИТ, 2005. -360 с.


  4. Додонов А.Г., Ландэ Д.В. Выявление понятий и их взаимосвязей в рамках технологии контент-мониторинга // Регистрация, хранение и обработка данных, 2006, Т. 8, № 4.– С. 45 - 52.

  5. Григорьев А.Н., Ландэ Д.В. Многоуровневый классификатор-навигатор по откликам информационно-поисковой системы // Компьютерная лингвистика и интеллектуальные технологии: труды международной конференции Диалог'2006 – М.: Наука, 2006. - С. 329-331.

  6. Григорьев А.Н., Ландэ Д.В., Бороденков С.А., Мазуркевич Р.В., Пацьора В.Н. InfoStream. Мониторинг новостей из Интернет: технология, система, сервис: научно-методическое пособие. – Киев: ООО «Старт-98», 2007. – 40 с.