Спецсеминар ВМиК для 2го-6го курсов, студентов магистратуры и РКТ
Платформы и аналитика больших данных
Руководители семинара: С.А. Ступников
Цели семинара
В бизнесе, науке и технике происходит революция, движимая накоплением массивных коллекций данных, генерируемых с экспоненциально
растущей интенсивностью в инфраструктурах бизнеса, социальной сферы, технологий, в научных экспериментах и моделях.
Умение извлекать знания из таких Big Data на основе специальных методов и технологий предопределяет успех бизнеса,
экономики, науки. Экономика ведущих стран мира остро нуждается в квалифицированных специалистах, способных вести
анализ данных, извлечение информации из данных на основе развитых аналитических методов и современных
аппаратурно-программных платформ. Тысячи объявлений о соответствующих вакансиях можно обнаружить, например, на
сайте
http://www.indeed.com/q-Vacancies-jobs.html.
Многие десятки университетов в мире организовали подготовку специалистов (“data scientist”) для работы в областях с интенсивным использованием данных (ИИД), анализа Big Data.
Учитывая названные тенденции, предлагаемый семинар направлен на изучение и анализ направлений развития методов и средств аналитики Big Data, высокопроизводительных платформ анализа Big Data, их применения в различных областях наук с ИИД (таких как, например, астрономия, биология, науки о Земле), экономики, социальной сферы, и др.
Направления работы семинара
Теория: общие подходы и методы моделирования и вычислений над данными; математические основания моделей, методов и алгоритмов, применяемых с целью извлечения информации (знаний) из Big Data; теоретические основания аппаратурно-программных инфраструктур для поддержки Big Data.
Инструменты и платформы для хранения, интеграции данных, организации их хранилищ, управления, потоковой обработки, анализа Big Data. Семинар должен развивать понимание и умение анализировать тенденции и направления развития платформ и инструментов, умение соучаствовать в таком процессе развития, умение использовать подобные платформы. Современные платформы включают средства организации хранилищ данных на основе параллельных машин баз данных, кластерных архитектур оперирования разнообразно структурированными коллекциями данных, вычислений над потоковыми данными, и других средств. В них включаются также средства программирования в MapReduce, R и других языках разработки аналитических алгоритмов, средства SPSS и других признанных инструментов. Средства современных платформ (например, IBM Big Data) будут доступны для реализации проектов и экспериментов.
Проекты и применения, связанные с организацией и анализом Big Data.
Семинары 2017
Спецкурсы
Информация и вопросы по спецсеминару
к.т.н. С.А. Ступников (sstupnikov at gmail dot com)
|