[ Russian ] [ English ]

Объектная модель данных для хранилищ данных

Александр Коновалов,
ВМиК МГУ, Москва,
kav@cs.msu.su

Одними из основных компонентов в архитектуре хранилища данных являются OLAP-сервер и OLAP-клиент (средство OLAP). OLAP-сервер отвечает за хранение данных, предназначенных для анализа, средство OLAP предоставляет пользователям возможность аналитической обработки этих данных.

E. F. Codd в статье [1] предложил 12 основных правил (требований), которым должно удовлетворять средство OLAP. Основным требованием к средствам OLAP является поддержка многомерного представления информации. На базе многомерного куба средство OLAP позволяет пользователям проводить анализ данных по определенной технологии. Таким образом, основной задачей OLAP-сервера является эффективное хранение многомерных кубов.

Многомерный куб представляет данные в виде фактов (количественные показатели анализируемой области), связанных с измерениями (качественные показатели). Традиционно многомерная модель данных проецируется на три типа логического представления данных: ROLAP (реляционный OLAP), MOLAP (многомерный OLAP) и HOLAP (гибридный OLAP).

Однако, в некоторых прикладных областях многомерная модель данных недостаточна для описания аналитических данных, и требуется более выразительная модель данных. В данном докладе в качестве альтернативы многомерной модели данных приводится объектно-ориентированная модель, расширенная для аналитической обработки данных.

В докладе будут рассмотрены следующие вопросы:

  1. Многомерная модель данных: примеры формализации и операции
  2. Особенности реализации OLAP-сервером для хранения многомерных данных
  3. Недостатки многомерной модели данных и способов хранения многомерных кубов
  4. Объектно-ориентированная модель данных, расширенная для описания аналитической информации
  5. Набор операций расширенной ОО модели данных.

Литература:

  1. Codd, E. F., Codd, S. B., Salley, C. T.: Providing OLAP (On-Line Analytical Processing) to user-analysts: An IT mandate. Technical report, 1993.
  2. Agrawal, R., Gupta, A., Sarawagi, A.: Modeling Multidimentional Databases. IBM Research Report, IBM Almaden Research Center, September 1995.
  3. Gyssen, M., Lakshmanan, L. V. S.: A Foundation for Multi-Dimensional Databases. Proceedings of the 22nd VLDB Conference Mumbai (Bombay), India, 1996.
  4. Li, C., Wang, X. S.: A Data Model for Supporting On-Line Analytical Processing. Proceedings Conference on Information and Knowledge Management. Baltimore, MD, November 1996. pp. 81-88.
  5. Chaudhuri, S., Dayal, U.: An Overview of Data Warehousing and OLAP technology. ACM SIGMOD Record, 26(1): 65-74, 1997.
  6. Kimball, R.: The Data Warehouse Lifecycle Toolkit. John Wiley & Sons, Inc., 1998.
  7. Pedersen, T. B., Shoshani, A., Gu, J., Jensen, C. S.: Extending OLAP Querying to External Object Databases. Technical report R-00-5002, Department of Computer Science, Aalborg University, 2000.
  8. Cattell, R. G. G. (ed.): The Object Data Standard: ODMG 3.0. Morgan Kaufmann, 2000.
  9. Huynh, T. N., Mangisengi, O., Tjoa, A. M.: Metadata for Object-Relational Data Warehouse. Proceedings of DMDW'2000, Stockholm, Sweden, June 2000.
  10. Nguyen, T. B., Tjoa, A. M., Wagner, R.: An Object Oriented Multidimensional Data Model for OLAP. Proc. of 1st Int. Conf. on Web-Age Information Management (WAIM), volume 1846 of LNCS, pages 83--94. Springer, 2000.
  11. Abello, A., Samos, J., Saltor, F.: Benefits of an Object-Oriented Multidimensional Data Model. 14th European Conference on Object-Oriented Programming. Cannes, France, June 12 - 16, 2000
  12. Trujillo, J., Palomar, M.: An Object Oriented Approach to Multidimensional Database Conceptual Modeling. In Proceedings of the ACM 1st. International Workshop on Data Warehousing and OLAP (DOLAP'98). Washington D.C., USA, November 1998, pp 16-21
  13. Firestone, J. M.: Object-Oriented Data Warehousing. White Paper No. 5. 1997
  14. Lellahi, K., Zamulin, A.: Object-Oriented Database as a Dynamic System with Implicit State. ADBIS'2001, Vilnius, Lithuania, September 2001, pages 239-252
Supported by Synthesis Group