На основе опыта использования программного комплекса distolymp в интернет-олимпиадах школьников по физике и при проведении занятий со студентами проведен анализ общих особенностей разработки компьютерных заданий. Обсуждена специфика и общие черты трех принципиально отличающихся типов заданий: тестов, теоретических задач и заданий на основе виртуальных лабораторий по физике. Обсуждается погрешность измерений, надежность и валидность заданий, влияние сложности заданий на корректность измерений. Особое внимание уделено обсуждению особенностей заданий на основе моделей виртуальных лабораторий.
On the basis of experience of use of the program complex distolymp in the Online Competition in Physics the analysis of the general features of development of computer-aided tasks is carried out. Specifics and common features of three essentially different types of tasks are discussed: tests, theoretical tasks and tasks on the basis of virtual laboratories in Physics. The error of measurements, reliability and validity of tasks, influence of complexity of tasks on a correctness of measurements is discussed. The special attention is paid to discussion of features of tasks on the basis of models of virtual laboratories.
Ключевые слова: тест, тестирование, дистанционное обучение, образование, физика, моделирование, интернет-олимпиада, BARSIC, distolymp, погрешность измерений баллов, надежность, валидность, IRT, программное обеспечение.
Keywords: Test, Assessment, Distance Education, Physics, Mathematical Simulation, Online Competition, BARSIC, distolymp, Score Level Errors, Validity, Reliability, IRT, Software.
Предложен метод обработки данных для оценки погрешности измерения шкалированных (тестовых) баллов. Он включает в себя разделение заданий на два параллельных варианта (полутеста), масштабирование первичных баллов полутестов до эффективных первичных баллов по полному тесту и преобразование их в шкалированные тестовые баллы. Показано, что метод позволяет с высокой точностью оценить погрешность измерения. Предложен подход к визуализации данных, который использует удаление части данных, соответствующих наиболее редким значениям. В случае сильно зашумленных данных этот метод помогает устранить вклад нетипичных значений и обеспечивает значительное увеличение наглядности графиков рассеяния. С. 24-40. (на англ.)
A data processing method is proposed for estimating the measurement error of scaled test scores; this involves scaling half-test raw scores to effective full-test raw scores and converting them to scaled test scores. It is shown that the method allows to estimate the measurement error with high accuracy. The proposed approach to data visualization involves the removal of the part of the data corresponding to the rarest values. In the case of very noisy data, this method helps to eliminate the contribution of atypical values and provides a significant increase in the visibility of scatter plots.
Ключевые слова: обработка данных, визуализация данных, компьютерное тестирование.
Keywords: data processing, data visualization, computer aided assessment.
Российский образовательный портал по физике разрабатывается в рамках программы Министерства Образования РФ по созданию образовательных порталов. Основная цель создания портала - предоставление свободно доступных через Интернет образовательных ресурсов по физике. Портал рассчитан на пользователей школьного и вузовского уровня, а также на учащихся и преподавателей.
Авторы представляют разработанный ими вариант системы проведения экспериментальных туров олимпиады по физике с использованием виртуальных лабораторий. Приводится описание используемых технологий. Функциональные особенности виртуальных лабораторий проиллюстрированы на конкретных примерах.
Профессиональные стандарты
Проведено сравнение результатов ЕГЭ по физике и математике для относительно больших групп учащихся. Наблюдалась высокая корреляция результатов ЕГЭ по физике и математике (0,63–0,73). Среднеквадратичный статистический разброс результатов для каждого из этих экзаменов составлял 6,1±0,6 баллов, а ширина зоны статистически значимого разброса 24 балла. Наличие этого разброса препятствует использованию ЕГЭ для приема учащихся в ведущие вузы. Показано, что дистанционные туры интернет-олимпиады в имеющемся формате могут быть использованы в качестве независимого средства мониторинга системы образования. Также показано, что очный тур интернет-олимпиады позволяет проверять способности учащихся в диапазоне, наиболее интересном для ведущих вузов и недоступном для проверки с помощью ЕГЭ.
A comparison of the results of Russian Unified State Examinations in physics and mathematics for relatively large groups of students was done. A high correlation (0,63-0,73) between the results in physics and mathematics was found. The standard deviation of the results for each of these examinations was estimated as 6.1 Р’В± 0.6 points for 100-points scale. It is shown that distance tours of online competitions may be used as an independent means of monitoring the education system. And that final tour of online competition allows checking studentsРІР‚в„ў ability in the range of most interest to the leading universities.
Ключевые слова: ЕГЭ, интернет-олимпиада, аппроксимация, МНК, TLS, тестирование, IRT, теория Раша, теория Бирнбаума, мониторинг, образование, физика, математика.
Keywords: Unified State Examination, Online Competition, approximation, Least Squares, TLS, assessment, IRT, Rush theory, Birnbaum theory, monitoring, education, physics, mathematics.
Профессиональные стандарты
Проведен анализ результатов ЕГЭ по физике для 10472 учащихся, а также моделирование на основе теории Раша с параметрами заданий, соответствующими результатам ЕГЭ. Предложена методика выявления формы зависимостей с помощью усреднения специальным образом отсортированных данных. Показано, что результаты выполнения заданий ЕГЭ части A (тестов с выбором одного варианта из нескольких) могут быть объяснены с помощью теории Раша. Результаты выполнения заданий других типов (заданий частей B и C) качественно соответствуют предсказаниям теории Раша, но количественно отклоняются от соответствующих зависимостей. При сравнении испытаний различной сложности очень важными факторами являются статистический разброс и нелинейность зависимостей. Показано, что способность выполнять простые задания соответствует очень широкому диапазону способности выполнения более сложных заданий, от низкого до высокого. Показано, что способность выполнять сложные задания гарантирует способность выполнять более простые задания.
The analysis of results of Russian Unified State Examination in physics for 10472 pupils was done as well as modeling on the basis of Rush’s theory. The technique of revealing of the form of dependences by means of averaging of in special way sorted data is offered. It is shown that only results for part A of the examination can be explained by means of Rush’s theory. Results for the other types of tasks (parts B and C) agree qualitatively with the predictions of the Rush’s theory, but quantitatively deviate from the corresponding dependencies. Statistical scatter and non-linearity of dependences are very important factors in a comparison of results of tests of different difficulty. It is shown that ability to perform simple tasks corresponds to very wide range of ability to perform more difficult tasks, from low to the high. It is shown that ability to perform difficult tasks guarantees ability to perform more simple tasks.
Ключевые слова: ЕГЭ, Единый Государственный Экзамен, тестирование, теория Раша, IRT, образование, физика, моделирование, программное обеспечение.
Keywords: Unified State Examination, assessment, Rush theory, IRT, education, physics, mathematical simulation, software.
В статье приведены примеры используемых в Интернете технологий для создания виртуальных лабораторий с различными возможностями управления, а также дано описание достоинств и недостатков этих технологий.