Рис. 1 ˗ Зависимость плотности от изменения параметров
Также следует отметить, что в Python существует такое понятие, как DataFrame – структуры, состоящие из данных, организованных в двух измерениях. Преобразовав массив данных в такую структуру, можно выполнять операции как со всем массивом данных, так и по столбцам или строкам. Так, например, используя соответствующую библиотеку, можно получить числовые характеристики сразу по всем необходимым столбцам.
После изучения данных и подготовки их к обработке можно проводить анализ. Рассмотрим одну из типичных задач анализа данных: расчет коэффициентов уравнения линейной регрессии. Здесь существует выбор способа реализации. Например, можно использовать классическую схему – составить систему нормальных уравнений и найти коэффициенты уравнения регрессии, решив указанную систему, затем оценить качество полученного уравнения. Можно рассмотреть определение коэффициентов уравнения регрессии как задачу нелинейной оптимизации и использовать для ее решения какой-либо поисковый метод или соответствующий программный продукт. Можно применить готовую библиотеку, например, scikit-learn, и также получить коэффициенты линейного уравнения регрессии. Можно воспользоваться готовыми пакетами как для решения оптимизационных задач, так и для построения уравнения регрессии, соответствующие возможности есть даже в Excel или, например, в MathCad.
А еще можно использовать алгоритмы машинного обучения Python. С точки зрения машинного обучения данная задача относится к классу задач обучения с учителем, т.е. модель учится на размеченных наборах данных и сопоставляет точки данных с наиболее подходящими линейными функциями, которые можно использовать для прогнозирования новых данных. Разумеется, какой бы способ не был использован, требования к исходным данным для построения уравнения регрессии едины: данные должны удовлетворять условиям Гаусса-Маркова для регрессионных моделей. Студент освобождается от проведения громоздких вычислений, у него появляется возможность научиться делать выводы на основании полученных данных, определять по результатам возможное нарушение классических предположений, при необходимости изменять полученную модель, чтобы ее можно было использовать для практических целей.
Применение цифровых технологий для сбора и обработки информации в сочетании с соответствующим программным обеспечением позволяет автоматизировать «техническую» сторону решения, существенно увеличить объем расчетов, ускорить оценку и отбор различных вариантов решений. Внедрение современных информационных технологий в образовательный процесс дает возможность повысить качество обучения и подготовить студентов к жизни и работе в условиях цифровой экономики.
Литература:- Почему цифровые технологии вытесняют аналоговые. (дата обращения: 16.02.2025)
- Флах П. Машинное обучение. М.: ДМК Пресс, 2015. 400 с.