Стоимостная оптимизация XQuery-запросов при хранении документов на основе описывающей схемы
Илья Таранов,
Институт системного программирования РАН,
ilya@taranoff.net
Прирождённые (native) XML-СУБД постепенно занимают определённую нишу среди программных продуктов. Также выделяются различные варианты использования XML-данных [1], для многих из которых необходимо хранение XML-документов в недекомпозированном виде. При этом важной частью XML-СУБД становится оптимизация запросов с учётом статистики, собранной по хранимым данным.
В докладе рассмотрены некоторые специфические аспекты эффективного исполнения запросов в прирождённых XML-СУБД. В том числе, рассматриваются различные подходы к хранению XML-документов [2-4], различные типы индексов над XML-данными, а также специфика модели данных XML с точки зрения физического исполнения запросов [5] по сравнению с реляционной моделью данных.
Стандартом языка запросов к XML-данным на данный момент является язык XQuery. Основной темой доклада являются особенности стоимостной оптимизации XQuery-запросов и XPath-выражений в прирождённых XML-СУБД [5-8]. Кроме того, рассматривается предлагаемый автором подход к оптимизации XQuery запросов с использованием выделения путевых выражений и операций соединения.
Слайды к докладу в формате PDF: taranov20111027.pdf
Литература:
- Liu, Z. H., & Murthy, R. (2009). A Decade of XML Data Management: An Industrial Experience Report from Oracle. 2009 IEEE 25th International Conference on Data Engineering, 1351-1362. Ieee. doi: 10.1109/ICDE.2009.18.
- Fiebig, T. (2002). Anatomy of a native XML base management system. The VLDB Journal The International Journal on Very Large Data Bases, 11(4), 292-314. doi: 10.1007/s00778-002-0080-y.
- Zhang, N., Agarwal, N., Chandrasekar, S., Idicula, S., Medi, V., Petride, S., & Sthanikam, B. (2009). Binary XML storage and query processing in Oracle 11g. Proceedings of the VLDB Endowment, 2(2), 1354–1365. VLDB Endowment.
- Taranov, I., Shcheklein, I., Kalinin, A., Novak, L., Kuznetsov, S., Pastukhov, R., et al., others. (2010). Sedna: native XML database management system (internals overview). Proceedings of the 2010 International Conference on Management of Data (p. 1037–1046). ACM. Retrieved December 30, 2010
- Georgiadis, H., Charalambides, M., & Vassalos, V. (2010). Efficient physical operators for cost-based XPath execution. Proceedings of the 13th International Conference on Extending Database Technology (pp. 171–182). ACM.
- Re, C., Simйon, J., & Fernandez, M. (2006). A complete and efficient algebraic compiler for XQuery. Clio - A Journal of Literature History & the Philosophy of History. IEEE Computer Society.
- Georgiadis, H., Charalambides, M., & Vassalos, V. (2009). Cost based plan selection for xpath. Proceedings of the 35th SIGMOD international conference on Management of data (pp. 603–614). ACM.
- Weiner, A. M., Harder, T., & Mathis, C. (2008). Towards Cost-based Query Optimization in Native XML Database Management Systems. Proceedings of the Spring Young Researcher’s Colloquium on Database and Information Systems, Saint-Petersburg, Russia, 2008.
|