[ Russian ] [ English ]

Новые подходы в технологии индексирования XML-документов

Дмитрий Барашев,
Санкт-Петербургский университет,
db2@acm.org

Во многих современных приложениях возникает необходимость хранить большие XML-документы и выполнять запросы к ним. Эта задача требует наличия эффективных индексных структур, которые способны обрабатывать древовидную структуру XML-документов и навигационные выражения в запросах. Кроме того, поскольку большая масса документов разбросана по различным Web-узлам и имеет нерегулярную структуру с полным отсутствием DTD, необходимо задуматься о поддержке регулярных выражений и распределенных документов.

В докладе дается обзор нескольких появившихся в последние два-три года индексных структур, охватывающий различные подходы к индексированию XML-документов. Рассмотрено применение многомерных структур (XPath Accelerator), схем динамического хеширования (Index Fabric) и традиционных B-деревьев (XISS). Затронуты также некоторые аспекты выполнения запросов в распределенных документах.

Литература:

  1. Quanzhong Li and Bongki Moon. "Indexing and Querying {XML} Data for Regular Path Expressions", Proceedings of 27th International Conference on Very Large Data Bases 2001.
  2. Torsten Grust. "Accelerating XPath Location Steps". Proceedings of ACM SIGMOD 2002, June 4-6, Madison, USA, 2002.
  3. Dan Suciu. "Distributed query evaluation on semistructured data". "ACM Transactions on Database Systems (TODS)", vol.27, no.1, 2002.
  4. Brian Cooper and Neal Sample and Michael J. Franklin and Gisli R. Hjaltason and Moshe Shadmon. "A Fast Index for Semistructured Data". Proceedings of 27th International Conference on Very Large Data Bases. 2001.
  5. Dmitry Barashev and Boris Novikov. "Indexing XML to support path expressions". Proceedings of the 6th East European Conference on Advances in DataBases and Information Systems, vol.2, 2002.
Supported by Synthesis Group