СЕКЦИЯ
Искусственный интеллект и технологии на основе данных в образовании

Флегонтов А.В.,

Матюшичев И.Ю.,

Винокурова Д.В.

РГПУ им. А.И. Герцена,

г. Санкт-Петербург

Интеллектуальный анализ образовательных данных

и адаптивная образовательная среда

В статье рассмотрены современные образовательные тенденции в области интеллектуального анализа данных, интеллектуальных систем обучения и адаптивной образовательной среды. Рассмотрена проблема неточной разметки в современных методах машинного обучения. Приводятся сравнительные оценки вычислительной сложности алгоритмов машины опорных векторов и ближайших соседей. Анализируется проблема использования искусственного интеллекта и метрических методов машинного обучения в задачах анализа данных. На примерах интеллектуальных систем обучения рассматриваются тенденции в развитии интеллектуального анализа образовательных данных. Приводятся примеры в области моделирования и проектирования информационных систем с использованием искусственного интеллекта.

Flegontov A.V.,

Matyushichev I.Yu.,

Vinokurova D.V.

HSPU,

St. Petersburg, Russia

Educational Data Mining and adaptive educational environment

The article describes modern educational trends in the field of data mining, educational data mining and adaptive educational environment. The problem of inaccurate markup in modern machine learning methods is considered. Comparative estimates of the computational complexity of the algorithms of the support vector machine and k-nearest neighbors are given. The problem of using artificial intelligence and metric machine learning methods in data analysis tasks is analyzed. Using the examples of intelligent learning systems, the trends in the development of educational data mining are considered. Examples in the field of modeling and designing information systems using artificial intelligence are given.
Опираясь на исторический обзор развития области искусственного интеллекта (ИИ) [1], рассмотрим основные современные образовательные тенденции в этой области связанные с интеллектуальным анализом данных (ИАД) и интеллектуальными системами обучения (ИСО), и применениями ИИ для учебного материала.
Хорошо известно, что в ИИ ключевую роль играют данные. Они могут быть как структурированными, слабо-структурированными или неструктурированными (особенно характерно для гуманитарных областей [2]), размеченными и неразмеченными, метрическими и ранговыми, а также линейными и нелинейными, реальными и имитационными, детерминированными и случайными, дискретными и непрерывными и т.п. Но в любом случае, как подмечено в работе [3], они являются основным «топливом для большинства систем ИИ». Также как и в естественном интеллекте, рассматриваются сочетания четырех аспектов: ИИ восприятия, ИИ понимания, ИИ управления, ИИ осознания. Именно в основе ИИ восприятия и лежат данные, и разработка различных методов извлечения из них полезной и применимой на практике информации. Эту область в ИИ принято называть ИАД [2], [4-6].
ИАД. Метрики, разметка.
Рассмотрим некоторые из актуальных вопросов в области ИАД, разрабатываемых в последние годы. В работе [5] рассматривалась проблема неточной разметки данных, решать которую часто приходится при использовании методов машинного обучения для создания систем ИИ. Рассматривались наиболее распространенные современные методы машинного обучения (наивный байесовский классификатор, трехслойный перцептрон, метод ближайших соседей, деревья решений, случайный лес, логистическая регрессия, машина опорных векторов) и две структуры данных (простая и сложная). По результатам проведенного экспериментального исследования реакции различных алгоритмов машинного обучения был получен интересный результат, свидетельствующий о том, что алгоритмы машины опорных векторов с полиномиальным ядром и - ближайших соседей продемонстрировали способность игнорировать ошибки разметки. Однако следует отметить, что вычислительная сложность алгоритма машины опорных векторов составляет или , в то время как у алгоритма - ближайших соседей такая сложность составляет либо , где - количество объектов, - число признаков.
В работе [6] представлен обзор проблемы использования ИИ и метрических методов машинного обучения в задачах анализа данных. Подчеркивается необходимость единого пространства признаков для всех объектов. Это действительно актуальная и значимая проблема, так как реальные данные часто обладают сложной и разнородной структурой, требующей более гибких подходов. В этой работе изложена сама идея конструирования локальных пространств признаков и нахождения индивидуальных мер для объектов, которая представляется перспективной и инновационной. Вводятся специализированные метрики, которые учитывают различия в рядах удаленностей объектов в разных локальных пространствах. Приводится также пример использования многомерного метрического шкалирования для визуального анализа композиций объектов с локальными описаниями. Такой пример (см. [6]) с распознаванием типов транспортных средств по геометрическим признакам их силуэтов иллюстрирует практическое применение предложенного в работе подхода.
В случае непараметрической корреляции локальные метрики различных объектов оценивают, как правило, ранговую близость либо классификационный показатель. Так, например, при вычислении евклидова расстояния метрика превращается в классическую метрику в виде

,

где в частном случае. Если же используется мера подобия - Кендалла, то подставляя коэффициент ранговой корреляции, можно метрику представить в виде

где - количество пар, для которых совпадает порядок на ранговой переменной с порядком на другой ранговой переменной .

ИИ в образовании (AIEd).
Именно с развитием алгоритмов обработки больших данных ИИ получает сегодня бурное развитие в сфере образования. На первый план выходит интеллектуальный анализ образовательных данных (Educational Data Mining), а также основанная на нем предсказательная и учебная аналитика, персонализированное обучение и адаптивная образовательная среда.
ИСО - наиболее распространенная и давно применимая сфера приложения ИИ в образовании. ИСО представляет собой персонализированное учебное пособие, которое организует материал в зависимости от возможностей и потребностей обучающегося. Наиболее удачно такие системы зарекомендовали себя в точных науках как хорошо структурированных областях знания.
Роль ИИ в замене учебника.
«01Математика» – онлайн-система, реализуемая при помощи ИИ и адаптивных технологий для персонализированного обучения школьников математике [7].
Платформа использует алгоритмы NLP, дообученную нейросеть SBERT, статистические данные, экспертные оценки. «01Математика» строит индивидуальные траектории обучения на основе персонализированной статистики, анализирует поведение для подсказок и следующих заданий.
Магистры кафедры информационных систем РГПУ им. А.И. Герцена 2021 и 2022 гг. выпуска занимались разработкой ИСО в области математического образования (среднего и начального высшего).
Разрабатывалась ИСО для решения квадратных уравнений с параметром. Объектом исследования являлся собственно сам образовательный процесс. А предметом исследования являлся процесс совершенствования обучения решению квадратных уравнений с параметром. При этом самостоятельно создавалась архитектура информационной системы, разрабатывались генераторы задач, генераторы задач с помощником, накапливался теоретический и практический материал для решения подобных задач.
Проводился сравнительный анализ существующих программных продуктов для решения математических задач с параметрами. Были проанализированы такие средства как Universal Math Solver (UMS), Algebrator и Mathway.
Universal Math Solver (UMS) – программа выводит на экран пошаговые решения математических задач с голосовым сопровождением по арифметике, алгебре, тригонометрии и математическому анализу для школьников 5-11 классов и студентов первых курсов университета. Существует база примеров, которая пополняется пользователями [8].
Algebrator – это обучающая система по алгебре, предназначенная для решения алгебраических задач школьного курса математики с пошаговым решением и его графическим отображением. Отсутствует возможность осуществлять вычисления системы неравенств [9].
Mathway – онлайн-сервис для решения задач по алгебре, тригонометрии, линейной алгебре, математическому анализу. В бесплатной версии расчеты сопровождаются кратким описанием необходимых действий. В полной версии присутствуют промежуточные шаги вычислений [10].
Анализ систем показал, что ни в одной из рассмотренных программ нет возможности оценить знания обучающихся. Пошаговое решение задач присутствует только в платных версиях, наличие теоретической информации только частично объясняет принцип решения. Обучающийся прежде, чем вводить задачу, должен подобрать теорему и правильно подставить необходимые параметры. Генерация задач присутствует только в UMS, но для доступа к этой возможности необходима лицензия.
Самостоятельно разработанная магистрами ИСО представляет интерес как для обучающихся, так и для преподавателей. Преподаватель имеет возможность производить генерацию задач, оценивать уровень подготовки обучающихся. Обучающийся может выбрать в окне генератора любую из введенных в систему теорем и проанализировать ход решения сгенерированной задачи, используя теоретический справочник о расположении корней квадратного трехчлена. При активации режима «Решить с помощником», будут генерироваться задачи и на каждом шаге, в появившемся поле ввода, обучающемуся будет предложено совершить определенные операции. Далее осуществляется проверка введенной информации. В случае появления ошибок оценка производится по следующим критериям: ошибки при нахождении множества решений, ошибки при вычислении неравенств, ошибки при нахождении пересечения множеств. В конце вычислений даются рекомендации по совершенствованию умений обучающегося.
Аспиранты кафедры информационных систем Института информационных технологий и технологического образования РГПУ им. А.И. Герцена в 2024 г. проводили численные эксперименты по использованию нейронных сетей в области дискретной математики, а также эксперименты вычислительных способностей современных чат-ботов в решении задач по математическому анализу и вычислительной математике [11]. Анализировались возможности чат-ботов YandexGPT 2, ChatGPT 3.5, Gemini, Bing Chat, Copilot для решения вычислительных задач дискретной математики, математического анализа (пределы, производные, интегралы), включающий 693 задачу, и вычислительной математики (решение нелинейных уравнений, решение систем линейных уравнений, интерполяция функций, численное интегрирование), состоящий из 45 задач.
Применения ИИ в задачах моделирования.
Использование ИИ при создании информационной системы (ИС) с помощью языка моделирования UML (Unified Modeling Language) [12] может значительно упростить и ускорить процесс проектирования, а также повысить качество конечного продукта.
Рассмотрим основные этапы использования ИИ.
1. Анализ требований. На этапе анализа требований к ИС ИИ может помочь в автоматическом анализе текстовых документов, а именно ИИ-системы, такие как GPT или другие NLP-модели, могут анализировать требования, написанные на естественном языке, и преобразовывать их в формальные спецификации. Генерация Use Case диаграмм. На основе входных данных ИИ может автоматически создавать Use Case диаграммы, выделяя акторов (пользователей системы) и взаимодействия между ними.
Пример 1. Если в документации указано, что «Пользователь должен иметь возможность регистрироваться в системе», ИИ может предложить соответствующий Use Case и добавить его на диаграмму.
2. Проектирование структуры системы. На этапе проектирования структуры системы ИИ может использоваться для создания различных типов UML-диаграмм. Для диаграмм классов (Class Diagrams) ИИ может анализировать описания сущностей и их взаимосвязей, предлагая классы, атрибуты и методы.
Пример 2. Запрос: «Система должна хранить информацию о клиентах, включая имя, адрес и заказы». Ответ: Класс `Customer` с атрибутами `name`, `address` и связью с классом `Order`.
Для диаграммы последовательности (Sequence Diagrams) ИИ может генерировать сценарии взаимодействия объектов на основе логики работы системы.
Для диаграммы состояний (State Diagrams) ИИ может определять возможные состояния объектов и переходы между ними.
Пример 3. Если система должна обрабатывать заказы, ИИ может предложить диаграмму состояний для объекта `Order`, включающую состояния «Новый», «В обработке», «Отправлен» и «Завершен».
3. Оптимизация архитектуры. ИИ может помочь в оптимизации архитектуры информационной системы. При анализе сложности ИИ может анализировать диаграммы и предлагать улучшения для уменьшения сложности системы. Например, может рекомендовать разделить крупный класс на несколько более мелких. ИИ может также выявлять потенциальные проблемы, такие как циклические зависимости или избыточные связи между классами.
4. Генерация кода. Многие современные инструменты, использующие ИИ, могут автоматически генерировать код на основе UML-диаграмм. ИИ может преобразовывать классовые диаграммы в код на выбранном языке программирования (например, Java, Python или C#). ИИ может создавать тестовые сценарии на основе диаграмм последовательности и диаграмм состояний.
5. Поддержка совместной работы. ИИ может быть полезен также и для команд разработчиков. При изменении требований ИИ может автоматически обновлять UML-диаграммы, чтобы они оставались актуальными. ИИ может анализировать работу команды и предлагать улучшения на основе лучших практик проектирования.
Пример 4. Предположим, что мы создаем ИС для интернет-магазина. Мы хотим использовать UML для проектирования, и вот как ИИ может помочь. На уровне анализа требований к входным данным «Пользователь может просматривать каталог товаров, добавлять товары в корзину и оформлять заказ» ИИ создает Use Case диаграмму с актором `User` и случаями использования `View Catalog`, `Add to Cart`, `Place Order`. На уровне создания диаграммы классов ИИ предлагает классы `Product`, `Cart`, `Order` с соответствующими атрибутами и методами. На уровне формирования диаграммы последовательности ИИ создает сценарий, показывающий, как пользователь добавляет товар в корзину: `User -> Cart: Add Product`. На заключительном уровне генерации кода ИИ преобразует классовую диаграмму в код на Python или Java.
Использование ИИ при создании ИС с помощью UML позволяет автоматизировать рутинные задачи, уменьшить количество ошибок и ускорить процесс разработки. Однако следует помнить, что ИИ – это инструмент, который дополняет, но не заменяет опыт и знания разработчиков. Таким образом, ИИ может быть успешно применен на всех этапах создания ИС с использованием UML, включая анализ требований, проектирование, оптимизацию архитектуры, генерацию кода и поддержку совместной работы.
Таким образом, в связи с развитием современных алгоритмов обработки данных, базовой математики нового уровня для эффективных и успешных систем, ИИ приобретает положительный вектор развития. Наравне с ИАД толчок к развитию получает и интеллектуальный анализ образовательных данных, а вместе с ним предсказательная и учебная аналитика, персонализированное обучение (ИСО) и адаптивная образовательная среда (в первую очередь, в вопросах моделирования и проектирования ИС).
Исследование выполнено за счет внутренних грантов РГПУ им. А. И. Герцена (проект N 75-ВГ, проект N 77-ВГ).

Литература:
  1. AI в обучении: на что способны технологии уже сейчас? EduTech, № 4(491), 2022. Сбер Университет, 2022 – 60 с. https://EduTech/49/web.pdf [Дата обращения: 15.02.25]
  2. Дюк В.А., Флегонтов А.В., Фомина И.К. Применение интеллектуального анализа данных в естественнонаучных, технических и гуманитарных областях // Известия Российского государственного педагогического университета им. А.И. Герцена, 2011. № 138. С. 77-84. eLIBRARY ID: 15607229
  3. Нельсон Х. Базовая математика для искусственного интеллекта: Пер. с англ. – Астона: АЛИСТ, 2024. – 592 с.
  4. Лаптев В.В., Флегонтов А.В., Фомин В.В. О разработке инструментария интеллектуального анализа данных // Информатизация образования и науки. 2022. № 1 (53). С. 121-138. https://elibrary.ru/item.asp?id=48059788
  5. Дюк В.А. Экспериментальное исследование реакции алгоритмов машинного обучения на ошибки разметки данных // Дифференциальные уравнения и процессы управления. Электронный журнал. - http://diffjournal.spbu.ru/, 2022. № 3. С. 59-72.
  6. Дюк В.А. Визуализация композиций многомерных объектов с локальными описаниями в метрических алгоритмах машинного обучения // Дифференциальные уравнения и процессы управления. Электронный журнал. - http://diffjournal.spbu.ru/, 2024. № 4. 14 с.
  7. 01Математика – обучающая онлайн—система в математике. https://01math.com [Дата обращения: 26.02.25]
  8. Программа Universal Math Solver (UMS) [Электронный ресурс]. Режим доступа: https://www.universalmathsolver.com/ [Дата обращения 15.01.2025]
  9. Сергиевская Л.А. Компьютерные программы для решения задач по математике. Режим доступа: https://урок.рф [Дата обращения 10.01.2025]
  10. Онлайн сервис для решения задач по математике Mathway: [Электронный ресурс]. Режим доступа: https://www.mathway.com/ru/Algebra [Дата обращения 09.01.2025]
  11. Винокурова Д.В. Численный эксперимент по использованию нейронных сетей в области дискретной математики// Сб. Студенческая весна – 2024. Сборник научных статей 78—ой региональной научно—технической конференции студентов, аспирантов и молодых ученых. Санкт—Петербург, 2024. С. 111—116.
  12. Матюшичев И.Ю. Моделирование информационных систем. Unified Modeling Language : учебное пособие / А. В. Флегонтов, И. Ю. Матюшичев. 3-е изд., доп. — Санкт-Петербург : Лань, 2023. — 140 с. https://elibrary.ru/item.asp?id=39226777
ВОПРОСЫ И КОММЕНТАРИИ
Made on
Tilda