СЕКЦИЯ
Цифровые образовательные практики

Григорьев С. Г.,

Мариносян А. Х.

Московский городской педагогический университет,

г. Москва

Академическая генеалогия и анализ концептуальных связей образовательных теорий

В статье рассматривается проблема систематизации и сравнения образовательных теорий и концепций. Представлен алгоритм анализа диссертационных исследований по педагогическим наукам с использованием больших языковых моделей. Алгоритм включает три этапа: структурированное извлечение образовательных концепций из научных текстов; векторное представление концепций на основе семантических эмбеддингов; кластеризация и классификация концептуального пространства образовательных теорий. Предложенный подход может быть использован для анализа динамики развития педагогического знания.

Grigoriev S. G.,

Marinosyan A. K.

Moscow City Pedagogical University,

Moscow

Academic Genealogy and Analysis of Conceptual Connections between Educational Theories

The article substantiates the importance of integrating digital technologies into the formation of mathematical literacy among students of technical colleges. Various tools and platforms are analyzed that help improve understanding of mathematical concepts and increase motivation for learning. The results of the study emphasize the importance of integrating digital technologies into the educational process to improve the quality of mathematical education.
Цифровая трансформация образования создает потребность в новых инструментах анализа и систематизации педагогических знаний. В условиях стремительного роста объема научных публикаций в сфере образования традиционные методы изучения концептуальных основ педагогики становятся недостаточно эффективными. Современное образовательное пространство нуждается в автоматизированных способах выявления, структурирования и сопоставления педагогических концепций для обеспечения преемственности знаний и определения перспективных направлений развития. Развитие технологий искусственного интеллекта, в частности больших языковых моделей (БЯМ), открывает новые возможности для анализа научных текстов и извлечения из них структурированной информации.
Одним из эффективных методов анализа эволюции научных и образовательных концепций является академическая генеалогия – междисциплинарная область, изучающая структуру, динамику и эволюцию науки через призму отношений научного руководства и интеллектуальной преемственности [1]. Исторически она фокусировалась на формальных связях между научным руководителем и учеником, визуализируя их в виде графов, где узлами выступают ученые, а ребрами – отношения научного руководства. Такой подход позволяет количественно оценивать влияние ученых через различные метрики [2].
Успешными примерами формальной академической генеалогии стали проекты Mathematics Genealogy Project и Neurotree, систематизирующие данные о научных руководителях в соответствующих областях [3, 4]. Аналогично, наша научная группа построила деревья научного руководства для школы академика РАО А.А. Кузнецова [5], используя автоматизированное извлечение данных из авторефератов диссертаций.
Однако для полноценного изучения эволюции образовательных концепций формальных связей недостаточно. Они не отражают всю сложность интеллектуального взаимодействия, поскольку ученые испытывают влияние не только своих руководителей, но и более широкого круга исследователей. Поэтому академическая генеалогия должна учитывать и концептуальные связи, исследуя преемственность и взаимовлияние научных идей, методов и традиций [6–8].
Ранее предложенный нами метод лексических базисов позволял разложить содержание научных работ для количественного анализа динамики внимания к различным концепциям [9], но не предполагал их непосредственного анализа. Именно здесь БЯМ открывают новые возможности для исследования академической генеалогии, которые напрямую соотносятся с задачей анализа развития педагогических концепций в эпоху цифровизации образования.
Описываемый нами в настоящей статье алгоритм анализа диссертационных исследований по педагогическим наукам с использованием БЯМ включает извлечение концепций из научных текстов, их сопоставление и выявление типов отношений между ними. Это позволяет строить «карты концепций», отражающие структуру и динамику развития педагогической науки, что важно для систематизации образовательных теорий в условиях цифровой трансформации.

Этап 1. Структурированное извлечение образовательных концепций
Первый этап направлен на автоматизированное извлечение из научных текстов ключевых образовательных концепций (теорий, методов, педагогических моделей) с учетом их функциональной структуры. Для структурированного анализа каждой концепции вводится разделение семантического поля на две функциональные области:
1) Область определения образовательной концепции – совокупность терминов, характеризующих образовательные объекты, процессы или проблемы, с которыми работает данная концепция (например, «цифровая грамотность», «метапознание», «персонализированное обучение»).
2) Область значения образовательной концепции – совокупность терминов, характеризующих образовательные результаты, эффекты или трансформации, которые предлагает или осуществляет данная концепция (например, «развитие критического мышления», «формирование компетенций», «повышение вовлеченности»).
Для извлечения концепций разрабатывается специализированный промпт для БЯМ, направляющий модель на выявление из текста образовательных теорий и их атрибутов. Результаты структурируются в JSON-формате со следующими полями: название образовательной концепции; позиция автора (поддержка/критика/нейтральное упоминание); эмпирический статус (апробирована/не апробирована/экспериментальная); степень доказанности (численная оценка от 0 до 1); ключевые термины области определения; ключевые термины области значения; аннотации областей определения и значения. Для повышения надежности результатов применяется кросс-валидация между различными БЯМ и выборочная экспертная оценка результатов.

Этап 2. Векторное представление образовательных концепций
Второй этап направлен на построение векторного представления образовательных концепций, отражающего их семантическое содержание и функциональную структуру. Настоящий алгоритм предполагает раздельную векторизацию области определения и области значения каждой концепции.
Для векторизации используются современные методы семантических эмбеддингов (Word2Vec, BERT и т.д.). Возможны два основных варианта векторизации. Первый вариант – векторизация на основе ключевых терминов: каждый термин преобразуется в эмбеддинг-вектор, затем формируются два композитных вектора (для области определения и для области значения образовательных концепций) путем взвешенного суммирования. Второй вариант – векторизация на основе аннотаций: аннотации областей определения и значения преобразуются в соответствующие эмбеддинг-векторы с использованием моделей, кодирующих семантику предложений.
После получения векторов формируется матричное представление концепции путем внешнего произведения композитного векторного области определения и композитного вектора области значения. Такое матричное представление позволяет более детально отразить взаимосвязь между тем, что образовательная концепция описывает, и тем, какие результаты она предполагает достичь.

Этап 3. Анализ концептуального пространства образовательных теорий
Третий этап направлен на анализ концептуального пространства, сформированного матричными представлениями образовательных концепций. Для сравнения концепций используется метрика расстояния Фробениуса между матрицами.
На основе выбранной метрики проводится:
1) Поиск близких образовательных концепций, выявляющий потенциальную преемственность или параллельное развитие педагогических идей.
2) Кластеризация концепций, группирующая образовательные теории и подходы в кластеры, отражающие различные направления в педагогике и образовательных исследованиях.
3) Анализ временной динамики для выявления тенденций развития образовательных теорий, появления новых направлений или затухания интереса к определенным концепциям.
4) Построение графа концептуальных связей между образовательными теориями и подходами.

Применение алгоритма в образовательной сфере
Предложенный алгоритм имеет значительный потенциал для применения в решении следующих задач, связанных с образованием:
1) Картирование педагогических концепций – нахождение по заданным критериям образовательных методик, описанных в диссертационных исследованиях, и выявление взаимосвязей между ними.
2) Анализ исследований в области образования – определение ключевых слов и понятий, отслеживание эволюции и выявление трендов в развитии педагогических исследований по определенным направлениям.
3) Онтология образовательных понятий – выявление в учебных пособиях основных концепций и понятий, выстраивание иерархии между ними.
4) Аналитика педагогической методики – поддержка методистов в построении оптимальной для учащихся последовательности изучения концепций и понятий по различным предметам.
5) Автоматизированная проверка соответствия последовательности изложения основных концепций и понятий в учебных пособиях тому порядку, который предусмотрен образовательными стандартами и методическими рекомендациями.

Литература:
  1. Лернер И.М., Мариносян А.Х., Григорьев С.Г., Юсупов А.Р., Аникьева М.А., Гарифуллина Г.А. Подход к формированию интеллектуальной академической генеалогии с использованием больших языковых моделей // Электромагнитные волны и электронные системы. 2024. Т. 29. № 4. С. 108–120.
  2. Rossi L., Damaceno R.J., Freire I.L., Bechara E.J., Mena-Chalco J.P. Topological metrics in academic genealogy graphs // Journal of Informetrics. 2018. V. 12. No. 4. P. 1042–1058.
  3. Mulcahy C. The Mathematics Genealogy Project comes of age at twenty-one // Notices of the AMS. 2017. V. 64. No. 5. P. 466–470.
  4. David S.V., Hayden B.Y. (2012). Neurotree: A collaborative, graphical database of the academic genealogy of neuroscience // PloS One. 2012. V. 7. No. 10. e46608.
  5. Григорьев С.Г., Мариносян А.Х., Лернер И.М. Цифровые методы в анализе исследований в области образования: научная школа А. А. Кузнецова по информатизации образования // От информатики в школе к цифровой трансформации образования: материалы научно-практической конференции памяти академика РАО А. А. Кузнецова. 25 октября 2024 г., г. Москва / под научн. ред. Л. Л. Босовой. – М.: Российская академия образования, 2024. С. 183–188.
  6. Garfield E. Citation indexing: Its theory and application in science, technology, and humanities. – New York: John Wiley & Sons. 1979. 274 p.
  7. Small H. Co-citation in the scientific literature: A new measure of the relationship between two documents // Journal of the American Society for Information Science. 1973. V. 24. No. 4. P. 265–269.
  8. Leydesdorff L. The Evolutionary Dynamics of Discursive Knowledge. Qualitative and Quantitative Analysis of Scientific and Scholarly Communication. – Cham: Springer. 2021. 248 p.
  9. Мариносян А.Х., Григорьев С.Г., Лернер И.М. Применение метода лексических базисов для анализа тенденций и управления исследованиями в сфере образования // Информатизация образования и методика электронного обучения: цифровые технологии в образовании: материалы VIII Междунар. науч. конф. Красноярск, 24–27 сентября 2024 г.: в 4 ч. Ч. 1 / под ред. М. В. Носкова. – Красноярск : Красноярский государственный педагогический университет им. В.П. Астафьева, 2024. С. 202–206.
ВОПРОСЫ И КОММЕНТАРИИ
Made on
Tilda