Clusterix-N – консервативная СУБД для хранения и обработки больших данных с регулярным планом обработки запросов
Роман Константинович Классен
КНИТУ-КАИ
Коммерческие OLAP-системы достаточно дороги и потому недоступны организациям с ограниченными финансовыми возможностями. Аналитическую обработку данных значительных объемов в этих организациях можно осуществить с использованием свободно распространяемых программных систем на экономичной кластерной платформе. Ранее созданные Clusterix-подобные СУБД [1,2] консервативного типа (с эпизодическим обновлением данных), использующие регулярный план обработки запросов [3], были недостаточно эффективны. Поэтому исследования по таким системам были развиты с ориентиром на полную загрузку процессорных ядер [4] и применение динамического сегментирования промежуточных и временных отношений на GPU [5,6] (системы Clusterix-N [7-11], N – от New) вплоть до разработки системы, сравнимой по эффективности с перспективной открытой системой Spark. За основу развития была принята методология конструктивного моде¬лирования систем [12,13]. Согласно этой методологии моделирование процесса синтеза рассматриваемых СУБД проводилось итеративно. Каждая итерация предусматривала полную программную разработку соответствующего состояния модели и анализ результатов тестирования на платформе GPU-кластера. Требуемое качество моделирования было получено на пятой итерации.
Слайды доклада.
Видео доклада.
Литература:
- Абрамов Е.В. Параллельная СУБД Clusterix. Разработка прототипа и его натурное исследование // Вестник КГТУ им. А.Н. Туполева., № 2, 2006. С. 50-55.
- Райхлин В.А., Минязев Р.Ш. Мультикластеризация распределенных СУБД консервативного типа //Нелинейный мир,2011. №8. С.473-481.
- Raikhlin V.A. Simulation of Distributed Database Machines //Programming and Computer Soft¬ware, Vol. 22, No. 2, 1996. pp. 68-74.
- Классен Р.К. Повышение эффективности параллельной СУБД консервативного типа на кластерной платформе с многоядерными узлами // Вестник КГТУ им. А.Н.Туполева. Казань. 2015. № 1. С. 112-118.
- Raikhlin V.A., Klassen R.K. Can GPU-accelerator significantly increase the effectiveness of conservative DBMS considerable volumes on cluster platforms? //2017 International Siberian Conference on Control and Communications (SIBCON). 2017. DOI: 10.1109/SIBCON.2017.7998474
- Р.К. Классен Ускорение операций хеширования с применением графических ускорителей // Вестник КГТУ им. А.Н.Туполева. Казань. 2018. № 1. С. 134-141.
- В.А. Райхлин, Р.К. Классен Сравнительно недорогие гибридные технологии консервативных СУБД больших объемов // Информационные технологии и вычислительные системы. Москва. 2018. Т. 68. №1. С. 46-59.
- Классен Р.К. Особенности эффективной обработки SQL-запросов к базам данных консервативного типа // Информационные технологии и вычислительные системы. Москва. 2018. Т. 69. №4. С. 108-118.
- Vadim A. Raikhlin, Roman K. Klassen Constructive Modeling of Conservative DBMS //2019 International Russian Automation Conference (RusAutoCon), Sept. 2019, pp. 1-5. DOI: 10.1109/RUSAUTOCON.2019.8867678
- Р.К. Классен, В.А. Райхлин Повышение эффективности Clusterix-подобных СУБД для аналитической обработки больших данных // Информационные технологии и вычислительные системы. Москва. 2019. №4. С. 43-59
- Raikhlin, V.A., Klassen, R.K. Clusterix-Like BigData DBMS. Data Sci. Eng. 5, 80–93 (2020). https://doi.org/10.1007/s41019-020-00116-2
- Райхлин В.А. Методология конструктивного моделирования систем //Новости искусственного интеллекта. 2005. №1. C.5 -17.
- Райхлин В.А., Вершини И.С., Минязев Р.Ш., Гибадуллин Р.Ф. Конструктивное моделирование систем информатики. Казань: Изд-во «Ф?н» («Наука»), 2016. 312 с.
|