 |
|
Related Communities:
|
 |
|
 |
Классификация затменных двойных звезд на основе Ensembled
Weka в системе АстроГрид
Краткое описание:
Методы извлечения знаний из данных (Data Mining) применяются в различных областях науки, в том числе в астрономии, как средства, помогающие получать новые знания, делать научные открытия. В данной работе обсуждается важность встраивания в состав виртуальных обсерваторий средств для решения астрономических задач методами Data Mining, рассматриваются существующие подходы, отдается предпочтение использованию ансамблей алгоритмов и предлагается соответствующая архитектура (Ensembled Weka) встраивания системы Weka в инфраструктуру виртуальной обсерватории.
Затменно-переменные звезды – это системы двойных звезд, плоскость вращения которых образует малый угол с направлением на Землю. Такие звезды при вращении затмевают друг друга, что приводит к периодическому изменению их общей светимости. Часто компоненты такой звездной системы не могут наблюдаться независимо друг от друга, поэтому их изучение базируется на анализе изменения светимости.
Существует несколько каталогов затменно-переменных звезд, например: General Catalogue of Variable Stars (GCVS); A Finding List for Observers of Interacting Binary Systems, 5th Edition; Eclipsing variables in microlensing surveys. Данные из этих каталогов были собраны О.Ю.Малковым в один каталог, в котором сейчас есть информация о 6675 звездах. Из них определен класс у 1161 звезды.

В общем случае после получения входных данных один или несколько раз выполняется следующая процедура: данные, подготовленные в соответствии с описанием задачи, передаются требуемым алгоритмам. Результаты работы алгоритмов передаются требуемой функции обобщения.
Результатом работы ансамбля является новая таблица, уже содержащая тот или иной результат в зависимости от типа задачи. Схема работы Ensembled Weka представлена выше.
Приложения АстроГрида, используемые для решения задачи классификации затменных двойных звезд:
- FormatConverter (ivo://ipi.ac.ru/formatConvert)
Данное приложение преобразует таблицы между различными форматами. Для решения данной задачи,
используется пробразование из формата ARFF (представления таблиц естественного для WEKA) в формат VOTable (стандарт ВО)
- Weka Classifier (ivo://ipi.ac.ru/dmWekaEnsembleClassifier)
Данное приложение производит классификацию данных, переданных во входной таблице. Помимо таблицы,
приложению передается конфигурационный файл, в котором описаны структура классов, необходимые для решения задачи
лгоритмы, и другие необходимые параметры.
Пример конфигурационного файла, используемого при решении задачи классификации затменных двойных звезд представлен здесь
Результаты:
В результате работы ансамбля было отклассифицировано 5514 звёзд, распределившихся по классам следующим образом:
C - 852
CB - 89
CBF - 74
CBV - 149
CE - 15
CG - 1
CW - 84
CWA - 427
CWW - 331
S - 547
S2C - 3
SA - 1902
SC - 1
SH - 13
D - 553
DG - 41
DM - 422
DR – 10
В качестве порогового значения индекса уверенности было выбрано 7, и звёзды, отклассифицированные с индексом уверенности, меньшим 7, получили неполную классификацию.
|
|