Статья посвящена сравнительному анализу моделей автоматической генерации заданий для учебных дисциплин в условиях растущей диспропорции между численностью студентов и преподавателей и растущих случаев академической нечестности. Цель исследования — сравнить существующие модели генерации по трём критериям: вариативность заданий, трудозатраты на применение и объяснимость результатов — для снижения нагрузки на преподавателей при сохранении качества образовательного процесса. Методология включает анализ публикаций 2020-2025 гг. с классификацией моделей на шаблонные, грамматические, статистические, графовые, рекуррентные нейронные сети, эволюционные алгоритмы и большие языковые модели (LLM). Основные результаты: установлено, что LLM превосходят альтернативные подходы по разнообразию генерируемого контента и вычислительной эффективности при использовании предобученных моделей. Шаблонные и грамматические системы ограничены низкой вариативностью, эволюционные алгоритмы требуют на порядки больше времени, а рекуррентные сети уступают в поддержании семантической целостности. Критическими недостатками LLM являются низкая объяснимость результатов и склонность к галлюцинациям, что требует обязательного экспертного контроля результата. Работа представляет практическую ценность для разработчиков образовательных систем и преподавателей, стремящихся к масштабированию учебного процесса при сохранении педагогического контроля. С. 74-90.
The article presents a comparative analysis of models for the automatic generation of assessment tasks for university courses in the context of a growing mismatch between student and instructor numbers and an increase in cases of academic dishonesty. The aim of the study is to compare existing generation models according to three criteria—task variability, effort required for implementation, and explainability of results—in order to reduce instructors’ workload while preserving the quality of the educational process. The methodology includes an analysis of publications from 2020–2025 and a classification of models into template-based, grammar-based, statistical, graph-based, recurrent neural networks, evolutionary algorithms, and large language models (LLMs). Key findings: LLMs outperform alternative approaches in the diversity of generated content and computational efficiency when pre-trained models are used. Template-based and grammar-based systems are constrained by low variability, evolutionary algorithms require significantly more time, and recurrent networks are inferior in maintaining semantic coherence. Critical drawbacks of LLMs are limited explainability and a tendency to hallucinate, which necessitates mandatory expert oversight of outputs. The work has practical relevance for developers of educational systems and for instructors seeking to scale instruction while retaining pedagogical control.
Ключевые слова: автоматическая генерация заданий, большие языковые модели, генерация кода, академическая нечестность, модели автоматической генерации.
Keywords: automatic task generation, large language models, code generation, academic dishonesty, automated generation models.