В современном контексте анализ данных становится фундаментальной компетенцией, актуальной в различных областях – от бизнеса до научных исследований. В последние годы наблюдается значительный рост интереса к применению анализа образовательных данных (Educational Data Mining) при принятии управленческих решений в сфере образования. Это связано с развитием информационно-автоматизированных систем, используемых в образовательной сфере.
Значительное число инициатив и планов относительно цифровизации образования нашло отражение в Указе Президента Российской Федерации «Стратегии развития информационного общества в Российской Федерации [1] и национальном проекте «Экономика данных и цифровая трансформация государства» [2], согласно которым развитие дистанционных образовательных технологий и электронного обучения является обязательной составляющей формирования информационного пространства знаний.
Образовательные данные – это информация об учебных результатах обучающихся, развитии образовательных систем, условиях образования (образовательных программах, особенностях образовательной среды, образовательных методиках и др.) [6].
Термин «анализ образовательных данных» связан с обработкой больших данных, где целью поиска становится набор паттернов как разновидности различных данных в виде образцов, схем, закономерностей действий и т. п. в образовательной деятельности. В анализе образовательных данных используются три группы методов: методы аналитики обучения (learning analytics); аналитико-статистические методы исследования интеллектуальных обучающих систем (Intelligent Tutoring System); методы inmemory-аналитики в исследовании «цифровых следов» [4,5].
О.А. Фиофанова [5] подчеркивает, что анализ больших данных в образовании становится ключевым инструментом для принятия управленческих решений и разработки доказательной образовательной политики, которая позволяет оценить эффективность программ обучения, оптимизировать учебные процессы и создавать индивидуальные образовательные траектории для учащихся.
A. Petrovski, A. Djukic, J. Marić и J. Kazak [7] подчеркивают потенциал использования цифровых технологий для разработки инновационных методик обучения на основе взаимодействия с окружающей средой, в настоящее время растет спрос на развитие новых подходов к обучению, а также созданию новых онлайн сервисов и инструментов таких как онлайн-опросы, системы дополненной реальности и социальные медиа-платформы, которое могут помочь в создании значимых результатов за счет повышения взаимодействия между людьми и окружающей средой.
Одним из основных преимуществ использования цифровых инструментов для анализа образовательных данных является возможность автоматизации рутинных операций, связанных с обработкой больших объемов информации. Это позволяет значительно сократить время, затрачиваемое на анализ данных, и повысить точность результатов. Например, системы управления обучением (LMS), предоставляют встроенные средства для автоматического сбора и анализа данных о деятельности студентов, включая посещаемость занятий, выполнение домашних заданий и участие в онлайн-дискуссиях предлагая широкий спектр возможностей, которые позволяют педагогам и исследователям глубже понять поведение учащихся, выявлять области для улучшения и разрабатывать персонализированные подходы к обучению. Среди них можно выделить следующие сервисы, которые используются для анализа образовательных данных: Microsoft Power BI, Tableau и Orange Data Mining. Рассмотрим подробно каждый из сервисов и выделим возможности и ограничения.
Microsoft Power BI (http://powerbi.microsoft.com/ru-ru/) – это мощная аналитическая платформа, позволяющая преподавателям и администраторам визуализировать учебные данные и создавать прогнозные модели.
Данная платформа предоставляет возможности глубокого анализ данных об успеваемости, посещаемости и вовлеченности студентов, визуализацию данных в виде интерактивных отчетов и дашбордов и интеграцию с другими образовательными системами, включая LMS (Learning Management Systems).
В то же время платформа имеет ограничения, которые требует технических навыков для настройки сложных отчетов, и высокая цена корпоративных лицензий на платформу является значимым барьером для образовательных учреждений, планирующих её внедрение.
Tableau (http://
tableau.com/) – инструмент бизнес-аналитики, активно используемый в образовательных учреждениях для обработки и визуализации больших массивов данных.
Возможности Tableau являются визуализация данных, которая предлагает разнообразные инструменты для создания графиков, диаграмм и информационных панелей, включая столбчатые и линейные графики, круговые диаграммы, тепловые карты и географические карты, интеграцию с источниками данных, которая поддерживает подключение к множеству источников данных, таких как базы данных (MySQL, PostgreSQL, Oracle), облачные сервисы (Google Analytics, Salesforce) и файлы (Excel, CSV), без необходимости написания кода, интерактивные панели мониторинга, когда пользователи могут создавать интерактивные панели мониторинга, что позволяет глубже анализировать данные в режиме реального времени, гибкость и настройка пользователей, которые могут адаптировать визуализации под свои нужды, изменяя элементы графиков и добавляя аннотации, а также совместная работа Tableau Server, которая позволяет делиться отчетами и информационными панелями с коллегами, обеспечивая контроль доступа и безопасность данных.
В то же время платформа имеет ограничения, связанные с поддержкой отсутствия конфиденциальности данных, с которым может столкнулся пользователь, а также несмотря на интуитивно понятный интерфейс, пользователям может потребоваться время, чтобы изучить все.
Orange Data Mining (http://orangedatamining.com/) представляет собой аналитическую платформу с открытым исходным кодом, предназначенную для машинного обучения и визуализации данных в образовательных целях.
Данная платформа характеризуется интерактивным анализом данных, обеспечивающим возможность оперативного построения и изучения моделей данных. Визуальное программирование, реализованное посредством соединения виджетов, способствует интуитивному построению аналитических процедур. Разнообразные визуализации, включающие диаграммы рассеяния, гистограммы, деревья решений, сети и тепловые карты, а также широкий спектр инструментов для машинного обучения, биоинформатики и анализа текста, расширяют функциональные возможности платформы.
Аналитическая платформа Orange Data Mining обладает рядом ограничений, которые следует рассматривать в контексте необходимости адаптации пользователей для эффективного использования. В частности, освоение интерфейса и функциональности виджетов может потребовать значительного времени. Кроме того, несмотря на широкий спектр инструментов, платформа демонстрирует ограниченные возможности для выполнения сложных аналитических задач, что может потребовать обращения к другим специализированным программным решениям для достижения.
Инструменты Data Mining предназначены для извлечения полезной информации из больших массивов данных. В контексте образования они могут использоваться для выявления паттернов поведения студентов, определения факторов, влияющих на успеваемость, и разработки персонализированных рекомендаций.
Приведем сравнительный анализ вышеупомянутых сервисов:
№ | Характеристика | Microsoft Power BI | Tableau | Orange Data Mining |
1 | Возможность глубокого анализа данных | + | + | + |
2 | Наличие гибких инструментов для построения интерактивных отчетов и дашбордов | + | + | + |
3 | Возможность интеграции с другими образовательными системами | + | + | - |
4 | Наличие технических навыков для настройки сложных отчетов | - | - | - |
5 | Наличие совместной работы с другими пользователями | - | + | - |
6 | Поддержка конфиденциальности данных | - | - | - |
7 | Наличие закрытого доступа в России | - | + | - |