Рис. 1 – Фрагменты сгенерированных изображений для цифровых проектов по марийскому языку и литературе
Основой успешной работы с генеративными искусственным интеллектом является умение пользователя грамотно формулировать запросы к нейросетям – промпты. Под промптом можно понимать структурированный набор инструкций для больших языковых моделей, который как формирует их поведение, так и настраивает LLM для ведения диалога с пользователем и генерирования формата ответа (код, таблицы, пошаговое рассуждение и т.д.) [5]. В условиях применения нейросетей в системе образования качество и правильность промпта становится важнейшим фактором между поверхностными или вводящими в заблуждение выводами и ответами, и теми ответами нейросети, которые действительно служат эффективному выполнению поставленных задач [6].
В силу вышеуказанных факторов значительное внимание уделяется развитию технологии промпт-инжиниринга, под которым понимается процесс написания, уточнения и оптимизации промптов для получения ответов от систем генеративного искусственного интеллекта, которые являлись бы максимально точными и соответствующими запросам пользователя [5].
В структуре промптинга генерации изображений обычно выделяется первоначально описание основного объекта изображения, который затем детализируется с учетом гендерной, возрастной, этнической, функциональной и символической принадлежности. После необходимой детализации уточняется стиль генерации, композиция и требуемый ракурс изображения. В завершение уточняются параметры освещения, цветовая палитра и прочие качества. Зачастую имеет актуальность использование отрицательного промпта, который используется для исключения на изображении нежелательных артефактов.
В случае генерации уникальных этнокультурных изображений необходимо использовать точные этнографические данные, избегая обобщений, так как нейросети склонны к обобщению и стереотипизации. К примеру, следует указывать этническую принадлежность элемента (с различением субэтнических групп: горные, луговые, восточные мари и др.); пол, возраст, социальный статус; функциональное назначение (повседневный, свадебный, ритуальный и др.); региональную локализацию.
К примеру, промпт должен быть составлен не «
национальный костюм народа мари», а «
праздничный женский костюм луговых мари: белая рубаха с красной вышивкой по подолу, красный сарафан, черный передник с геометрическим узором, головной убор с серебряными монетами».
При составлении промтов для генерации изображений этнокультурной тематики лучше перечислять структурные элементы объекта (части костюма, материалы, способы ношения, декоративные элементы) с их подробным описанием, поскольку нейросети склонны к генерации обобщённых или стереотипных форм. К примеру, можно указывать тип одежды, крой, способы застёжки, характер орнамента, цветовую гамму и др.
В этнокультурных промптах следует делать акцент на исторической и культурной достоверности, это поможет нейросети избегать стилистических иконок, вымышленных узоров или некорректного смешения культурных элементов при генерации изображений. Например, использовать следующие формулировки:
«этнографически точный», «основан на музейных экспонатах XIX века», «исторически достоверные материалы: лён, шерсть, натуральные красители», «без фантастических элементов, без современных влияний».
Можно также использовать отрицательный промпт, в котором, к примеру, исключить элементы костюмов других народов, вымышленные символы, артефакты, не соответствующие историческому периоду.
Стиль изображения должен соответствовать целям разрабатываемого проекта. К примеру, для изображений научной тематики можно использовать такие вставки в промпт:
«стиль музейной документации, нейтральное освещение, простой фон» и т.д. Для образовательных проектов уместны будут формулировки
«рисунок четких линий, обозначение частей, учебный плакат» и т.д. Для художественных репрезентаций –
«этнографическая живопись, реализм XIX века» и т.д.
Кроме того, содержание промпта должно быть ориентировано на конкретную образовательную или исследовательскую задачу цифрового проекта, а не только на визуальный результат, что особенно важно в педагогической практике.
Пример промпта для образовательного цифрового проекта (рис.2): «
Сгенерировать реалистичное изображение традиционного женского повседневного костюма луговых мари конца XIX века для цифрового учебного проекта по марийскому языку. Изобразить костюм в полный рост, без художественной стилизации. Костюм должен включать льняную рубаху прямого кроя, тканый пояс с геометрическим орнаментом, нагрудные украшения из металлических подвесок, традиционный головной убор. Цветовая гамма — белая основа с красными и чёрными элементами. Изображение предназначено для изучения терминологии элементов национального костюма».