[ Russian ] [ English ]

Стоимостная оптимизация XQuery-запросов при хранении документов на основе описывающей схемы

Илья Таранов,
Институт системного программирования РАН,
ilya@taranoff.net

Прирождённые (native) XML-СУБД постепенно занимают определённую нишу среди программных продуктов. Также выделяются различные варианты использования XML-данных [1], для многих из которых необходимо хранение XML-документов в недекомпозированном виде. При этом важной частью XML-СУБД становится оптимизация запросов с учётом статистики, собранной по хранимым данным.

В докладе рассмотрены некоторые специфические аспекты эффективного исполнения запросов в прирождённых XML-СУБД. В том числе, рассматриваются различные подходы к хранению XML-документов [2-4], различные типы индексов над XML-данными, а также специфика модели данных XML с точки зрения физического исполнения запросов [5] по сравнению с реляционной моделью данных.

Стандартом языка запросов к XML-данным на данный момент является язык XQuery. Основной темой доклада являются особенности стоимостной оптимизации XQuery-запросов и XPath-выражений в прирождённых XML-СУБД [5-8]. Кроме того, рассматривается предлагаемый автором подход к оптимизации XQuery запросов с использованием выделения путевых выражений и операций соединения.

Слайды к докладу в формате PDF: taranov20111027.pdf

Литература:

  1. Liu, Z. H., & Murthy, R. (2009). A Decade of XML Data Management: An Industrial Experience Report from Oracle. 2009 IEEE 25th International Conference on Data Engineering, 1351-1362. Ieee. doi: 10.1109/ICDE.2009.18.
  2. Fiebig, T. (2002). Anatomy of a native XML base management system. The VLDB Journal The International Journal on Very Large Data Bases, 11(4), 292-314. doi: 10.1007/s00778-002-0080-y.
  3. Zhang, N., Agarwal, N., Chandrasekar, S., Idicula, S., Medi, V., Petride, S., & Sthanikam, B. (2009). Binary XML storage and query processing in Oracle 11g. Proceedings of the VLDB Endowment, 2(2), 1354–1365. VLDB Endowment.
  4. Taranov, I., Shcheklein, I., Kalinin, A., Novak, L., Kuznetsov, S., Pastukhov, R., et al., others. (2010). Sedna: native XML database management system (internals overview). Proceedings of the 2010 International Conference on Management of Data (p. 1037–1046). ACM. Retrieved December 30, 2010
  5. Georgiadis, H., Charalambides, M., & Vassalos, V. (2010). Efficient physical operators for cost-based XPath execution. Proceedings of the 13th International Conference on Extending Database Technology (pp. 171–182). ACM.
  6. Re, C., Simйon, J., & Fernandez, M. (2006). A complete and efficient algebraic compiler for XQuery. Clio - A Journal of Literature History & the Philosophy of History. IEEE Computer Society.
  7. Georgiadis, H., Charalambides, M., & Vassalos, V. (2009). Cost based plan selection for xpath. Proceedings of the 35th SIGMOD international conference on Management of data (pp. 603–614). ACM.
  8. Weiner, A. M., Harder, T., & Mathis, C. (2008). Towards Cost-based Query Optimization in Native XML Database Management Systems. Proceedings of the Spring Young Researcher’s Colloquium on Database and Information Systems, Saint-Petersburg, Russia, 2008.
Supported by Synthesis Group