Понимание масштабированных баллов при стандартизированных тестах

Шкала баллов - это тип экзаменационной оценки. Они обычно используются тестирующими компаниями, которые проводят экзамены с высокими ставками, такие как прием, сертификация и лицензионные экзамены. Шкала баллов также используется для общего тестирования K-12 и других экзаменов, которые оценивают навыки учащихся и оценивают прогресс в обучении.

Необработанные результаты против Масштабные результаты

Первый шаг к пониманию оцененных баллов - узнать, как они отличаются от необработанных баллов. Необработанный балл представляет количество экзаменационных вопросов, на которые вы правильно ответили. Например, если на экзамене есть 100 вопросов, и вы правильно ответили на 80, ваш исходный балл равен 80. Ваш процент правильного процента, который является типом необработанного счета, составляет 80%, и ваш класс является B-.

Масштабная оценка - это необработанная оценка, которая была скорректирована и преобразована в стандартную шкалу Если ваш исходный балл равен 80 (потому что вы правильно ответили на 80 из 100 вопросов), этот балл корректируется и преобразуется в масштабированный балл. Необработанные оценки могут быть преобразованы

instagram viewer

линейно или нелинейно.

Пример шкалирования

ACT пример экзамена, который использует линейное преобразование для преобразования необработанных баллов в масштабированные баллы. Следующая таблица разговоров показывает, как необработанные оценки из каждого раздела ACT преобразовываются в масштабированные оценки.

Raw Score English	Сырье Оценка по математике	Необработанный счет чтения	Сырье Оценка Науки	Масштабная оценка
75	60	40	40	36
72-74	58-59	39	39	35
71	57	38	38	34
70	55-56	37	37	33
68-69	54	35-36	-	32
67	52-53	34	36	31
66	50-51	33	35	30
65	48-49	32	34	29
63-64	45-47	31	33	28
62	43-44	30	32	27
60-61	40-42	29	30-31	26
58-59	38-39	28	28-29	25
56-57	36-37	27	26-27	24
53-55	34-35	25-26	24-25	23
51-52	32-33	24	22-23	22
48-50	30-31	22-23	21	21
45-47	29	21	19-20	20
43-44	27-28	19-20	17-18	19
41-42	24-26	18	16	18
39-40	21-23	17	14-15	17
36-38	17-20	15-16	13	16
32-35	13-16	14	12	15
29-31	11-12	12-13	11	14
27-28	8-10	11	10	13
25-26	7	9-10	9	12
23-24	5-6	8	8	11
20-22	4	6-7	7	10
18-19	-	-	5-6	9
15-17	3	5	-	8
12-14	-	4	4	7
10-11	2	3	3	6
8-9	-	-	2	5
6-7	1	2	-	4
4-5	-	-	1	3
2-3	-	1	-	2
0-1	0	0	0	1

Источник: ACT.org.

Уравнительный процесс

Процесс масштабирования создает базовый масштаб, который служит ссылкой для другого процесса, известного как уравнение. Процесс уравнивания необходим для учета различий между несколькими версиями одного и того же теста.

Несмотря на то, что создатели тестов стараются поддерживать одинаковый уровень сложности теста от одной версии к другой, различия неизбежны. Выравнивание позволяет тестировщику статистически корректировать оценки, чтобы средняя производительность по версии один из тестов равен средней производительности по второй версии теста, третьей версии теста и т. д. на.

После прохождения как масштабирования, так и приравнивания масштабированные оценки должны быть взаимозаменяемыми и легко сопоставимыми независимо от того, какой вариант теста был взят.

Пример уравнения

Давайте посмотрим на пример, чтобы увидеть, как процесс приравнивания может повлиять на шкалированные результаты в стандартизированных тестах. Представьте, что вы и друг принимаете СИДЕЛ. Вы оба будете сдавать экзамен в одном и том же центре тестирования, но вы будете сдавать тест в январе, а ваш друг будет сдавать экзамен в феврале. У вас разные даты тестирования, и нет никакой гарантии, что вы оба примете одну и ту же версию SAT. Вы можете увидеть одну форму теста, а ваш друг - другую. Хотя оба теста имеют одинаковое содержание, вопросы не совсем одинаковы.

После сдачи SAT вы и ваш друг соберетесь и сравните свои результаты. Вы оба получили 50 баллов по математике, но ваш балл 710, а ваш друг 700. Твой приятель интересуется, что произошло, поскольку у вас обоих одинаковое количество правильных вопросов. Но объяснение довольно простое; каждый из вас прошел разные версии теста, и ваша версия оказалась сложнее его. Чтобы получить тот же результат в SAT, ему нужно было бы правильно ответить на большее количество вопросов, чем вы.

Создатели тестов, использующие уравнивающий процесс, используют разные формулы для создания уникальной шкалы для каждой версии экзамена. Это означает, что для каждой версии экзамена не существует единой диаграммы конверсии для оценки по шкале. Вот почему в нашем предыдущем примере предварительная оценка 50 была преобразована в 710 в один день и в 700 в другой день. Имейте это в виду, когда вы проходите практические тесты и используете диаграммы конверсии, чтобы преобразовать ваш исходный результат в масштабированный.

Цель шкал оценки

Необработанные баллы определенно легче рассчитать, чем масштабированные баллы. Но компании, проводящие тестирование, хотят убедиться, что результаты тестов могут быть справедливо и точно сопоставлены, даже если тестируемые принимают разные версии или формы теста в разные даты. Масштабные оценки позволяют проводить точные сравнения и гарантируют, что люди, прошедшие более сложный тест, не будут оштрафованы, а люди, прошедшие менее сложный тест, не получат несправедливого преимущества.