Научная электронная библиотека

СТРАТЕГИЯ АНТИЦИПАТИВНОЙ ПЕДАГОГИКИ ОБРАЗОВАТЕЛЬНОЙ ПРАКТИКИ

Анисимова Т. С., Маслак А. А., Лукьяненко М. А.,

2.2 Шкалы измерений

Шкала (лат. scala – лестница) в буквальном значении есть измерительный инструмент. Вид шкалы определяет совокупность методов, которые могут быть использованы для обработки экспериментальных данных.

В соответствии с этим определением выделяют несколько типов шкал, наиболее часто используются следующие:

– шкала наименований (nominal scale);

– порядковая шкала (ordinal or ranked scale);

– интервальная шкала (interval scale);

– шкала отношений (ratio scale).

Измерения, осуществляемые с помощью двух первых шкал, считаются качественными, а измерения, осуществляемые с помощью двух последних шкал, – количественными. Принято также шкалы, приводящие к качественным измерениям, называть дискретными, а шкалы, приводящие к количественным измерениям, – непрерывными [84].

Для того чтобы понять суть измерений, целесообразно рассмотреть каждую из этих шкал.

Шкала наименований

Шкала наименований, или номинативная (номинальная) шкала (лат. nomen – имя, название), получается путем присвоения «имен» объектам. Присвоение имени происходит на основе операции сравнения, которая является первичной для построения любой шкалы. Объекты сравниваются друг с другом, и определяется их эквивалентность или неэквивалентность. В результате выполнения этой процедуры образуется совокупность классов эквивалентности. Объекты, принадлежащие одному классу, эквивалентны друг другу и отличны от объектов, относящихся к другим классам. Эквивалентным объектам присваиваются одинаковые имена. Таким образом, все объекты разделяются на непересекающиеся подмножества и распределяются по ячейкам классификации.

Это самая простая измерительная шкала, она только классифицирует по названию. Хотя в качестве названий могут использоваться числа, эти названия не измеряются количественно, они лишь позволяют отличить один объект от другого.

Простейший случай номинативной шкалы – дихотомическая шкала, состоящая всего лишь из двух ячеек, или двух классов. Измерением по такой шкале является, например, классификация учащихся по полу и приписывание числа 1 каждой девочке и числа 2 каждому мальчику. Признак, который измеряется по дихотомической шкале наименований, называется альтернативным. Согласно определению, он может принимать всего два значения. Если исследователь заинтересован только в одном из них, то тогда он говорит, что признак «проявился», если тот принял интересующее его значение, и что признак «не проявился», если он принял противоположное значение. Например, признак «леворукости» проявился у 20 испытуемых из 50. Здесь номинативная шкала также состоит из двух ячеек – «признак проявился» и «признак не проявился». Более сложный вариант номинативной шкалы – классификация из трех и более ячеек. Так, шкала классических темпераментов — холерик, сангвиник, меланхолик и флегматик – является шкалой наименований.
В качестве еще одного примера приведем классификацию учащихся по состоянию двух признаков: пол и успешность выполнения контрольного задания. В состоянии каждого признака выделим по две градации: 1) девочка / мальчик и 2) верный ответ / неверный ответ. В результате по состоянию двух признаков коллектив учащихся разделяется на четыре подмножества: девочки, верно выполнившие задание (ячейка 1); девочки, неверно выполнившие задание (ячейка 2); мальчики, верно выполнившие задание (ячейка 3); мальчики, неверно выполнившие задание (ячейка 4). Классификация совокупности объектов по нескольким признакам позволяет не только выявить структуру этой совокупности, но и получить данные, необходимые для выяснения связи двух и более признаков. В этом примере такими признаками являются пол учащихся и выполнение контрольного задания.

Несмотря на кажущуюся примитивность шкалы наименований, она широко используется как в педагогике, так и в психологии. Здесь обработка данных проводится не с самими классами, а с числами, характеризующими количество объектов, попавших в каждый класс. Статистические методы, применяемые для обработки данных, измеренных по шкале наименований, называют методами обработки долей и частот, или методами анализа качественных признаков.

Примеры использования шкалы наименований

В шкале наименований измерены номера телефонов, паспортов, студенческих билетов, национальность, цвет волос. Буквы в алфавите пронумерованы, однако очевидно, что нет смысла складывать или умножать их номера. Измерения в шкале наименований необходимы для того, чтобы различать объекты. Так, шкафчики в раздевалках для взрослых различают по номерам, т.е. по числам, а в детском саду используются рисунки, поскольку дети еще не знают чисел.

В шкале наименований можно использовать достаточно большой класс статистических процедур:

– нахождение абсолютной и относительной частоты каждого класса;

– вычисление моды – класса с наибольшей абсолютной частотой, которую можно использовать для решения задач прогноза;

– нахождение показателей корреляции качественных признаков, например наличия или отсутствия взаимосвязи между успеваемостью учащихся и их полом;

– определение близости распределения признаков, например эмпирического с теоретическим равномерным при помощью критерия Хи-квадрат;

– проверка гипотез относительно долей признаков с помощью биномиального критерия.

Порядковая шкала

Порядковая шкала, или шкала порядка, более сложная, чем шкала наименований. Она классифицирует не по принципу «эквивалентно –неэквивалентно», а по принципу «больше – меньше». Если в шкале наименований было безразлично, в каком порядке располагались классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки «самое малое значение» к ячейке «самое большое значение» (или наоборот). Ячейки теперь уместнее называть классами (или категориями). Это обусловлено тем, что именно по отношению к ним используются определения «низкий», «средний», «высокий» класс или первая, вторая, третья категория и т. д.

Порядковую шкалу можно использовать тогда, когда для множества измеряемых объектов выполняются следующие свойства.

1. Отношение равенства (эквивалентности – неэквивалентности), т.е. для любых двух объектов A и B такой критерий позволяет установить истинность одного из следующих утверждений: A = B или A ≠ B.

2. Отношение порядка. Так, в случае A ≠ B установить истинность одного из следующих утверждений: A > B или A < B.

3. Транзитивность отношения порядка. Это означает, что для любых трех объектов A, B, C, таких, что A > B и B > C, должно быть верным неравенство A > C; также для любых трех объектов A, B, C, таких, что A = B и B = C, должно быть верным равенство A = C.

Примером порядковой шкалы являются оценки успеваемости в школе.

На первый взгляд, кажется, что эти свойства всегда выполняются и, следовательно, всегда можно использовать порядковую шкалу. Однако это не так. Например, необходимо упорядочить трех шахматистов по результатам сыгранных ими партий (каждая пара шахматистов играет одну партию). Естественно предположить, что игрок A сильнее игрока B, если A выиграл партию у B. Однако транзитивности при таком упорядочении нет. Действительно, если A выиграл у B, а B выиграл у C, то это еще не означает, что A обязательно выиграет у C. Шахматисты ранжируются с помощью специальной процедуры определения их рейтинга.

Принципиальным отличием шкалы порядка от шкалы наименований является то, что шкала порядка упорядочивает объекты по тому или иному признаку. Тем самым вводится важнейшее понятие – измеряемое свойство. Переходным вариантом шкалы наименований к порядковой является дихотомическая классификация: 1 – «есть свойство», 0 – «нет свойства».

Важным аспектом является число классов в порядковой шкале. По определению в порядковой шкале должно быть не менее трех классов, например «положительная реакция – нейтральная реакция – отрицательная реакция». Однако все многообразие объектов нерационально помещать только в три класса, потому что в один и тот же класс могут попасть объекты, достаточно сильно отличающиеся друг от друга. Кроме того, чем больше классов в шкале, тем больше возможностей для проверки статистических гипотез (тем больше разрешающая способность статистических критериев). С другой стороны, если число классов равно числу объектов, как, например, в принудительном ранжировании, т.е. опасность искусственного преувеличения различия между объектами.

На практике выходом из положения является использование дробной классификационной системы, как правило, из 10 классов, или градаций, признака. От классов легко перейти к числам, если, например, условиться, что низший класс получает ранг 1, средний класс – ранг 2, а высший класс – ранг 3, или наоборот.

В порядковой шкале неизвестно истинное расстояние между классами, неизвестно также, равны эти расстояния или нет. Известно лишь то, что они образуют последовательность. Значения величин можно заменять квадратами, логарифмами, нормализовать и т.д. При таких монотонных преобразованиях места объектов на порядковой шкале не меняются.

Единица измерения в шкале порядка — расстояние в 1 класс или в 1 ранг, при этом, еще раз подчеркнем, расстояние между классами и рангами может быть разным.

Шкалы порядка, наверное, чаще других шкал используются как в педагогике, так и в психологии. Все психологические методы, использующие ранжирование, построены на применении шкалы порядка. Классическим примером использования порядковых шкал является тестирование способностей личности.

Измерения по шкале порядка обладают всеми свойствами и возможностями измерений по шкале наименований и некоторыми новыми свойствами.

Количество классов или рангов, которые приписываются объектам, зависит от числа различаемых состояний измеряемого свойства в этих объектах. Если можно различить, например, 5 различных состояний, то порядковая шкала будет составлена из 5 чисел, представляющих монотонно возрастающую или убывающую последовательность. В монотонно возрастающей (убывающей) последовательности каждый последующий член последовательности больше (меньше) предыдущего.

Поскольку шкала порядка устанавливает только отношения равенства и порядка, то для приписывания объектам могут быть использованы любые пять чисел, которые можно расположить в порядке возрастания (убывания), например: 1, 2, 3, 4, 5 или 2, 4, 8, 16, 18.

Поэтому результаты арифметических действий с такими измерениями зависят не только от свойств объектов, но и от выбора балловых оценок. Это означает, что с числами или рангами, которые присвоены объектам, нельзя выполнять арифметические операции: вычислять суммы, находить средние значения, дисперсии и другие параметры.

Однако существуют характеристики выборки объектов, которые остаются неизменными при любой n-балльной системе оценок состояния измеряемого свойства. Кроме моды (класса с наибольшим числом объектов) такой характеристикой является медиана. Медиана – это такое значение на порядковой шкале, которое превосходит по состоянию измеряемого свойства 50% объектов выборки и меньше которого остальные 50% объектов. Медиана является мерой центральной тенденции выборки.

В порядковой шкале мера рассеивания значений измеряемого признака в выборке измеряется с помощью квантилей. Квантиль – это значение на порядковой шкале, которое делит выборку на две части с известными пропорциями объектов в каждой из них. Наиболее часто используемыми квантилями являются квартили, децили и процентили. Квантили – три значения (Q1, Q2, Q3), которые делят совокупность на четыре равные части (кварты). Четвертая часть объектов выборки лежит ниже Q1, половина объектов находится ниже Q2 (медианы), три четверти объектов – ниже Q3. Аналогично девять децилей делят объекты выборки на десять равных частей, а 99 процентилей делят выборку на 100 равных частей. Очевидно, что децили, а тем более процентили используются только в случае больших выборок.

В порядковой шкале числа используют не только для различения объектов, но и для установления порядка между объектами. Простейший пример – 4-балльная система в школе (2, 3, 4, 5). В вузах – аналогичная шкала «неудовлетворительно», «удовлетворительно», «хорошо» и «отлично». Словесные оценки подчеркивают нечисловой характер шкалы. Мнения экспертов обычно выражаются в порядковой шкале, потому что проще ответить что лучше, а что хуже, чем сказать насколько лучше или хуже. Номера домов также измерены в порядковой шкале, они показывают, в каком порядке стоят дома вдоль улицы.

Существует минералогическая шкала твёрдости, предложенная немецким ученым Моосом в 1841 году. Это набор эталонных минералов для определения относительной твёрдости методом царапания. В качестве эталонов приняты 10 минералов, расположенных в порядке возрастающей твёрдости. Предназначена для грубой сравнительной оценки твёрдости материалов по системе мягче-твёрже. Испытываемый материал либо царапает эталон и его твёрдость по шкале Мооса выше, либо царапается эталоном и его твёрдость ниже эталона. Таким образом, шкала Мооса информирует только об относительной твёрдости минералов. В качестве эталонов выбраны наиболее распространенные минералы: тальк имеет 1 балл, гипс – 2, кальций – 3, флюорит – 4, апатит – 5, ортоклаз – 6, кварц – 7, топаз – 8, корунд – 9, алмаз – 10.

Мнения экспертов часто выражаются в порядковой шкале. Это объясняется тем, что, например при определении веса человеку проще определить, какой из предметов легче, чем сказать насколько легче.

Для обработки данных, полученных с помощью порядковой шкалы, можно использовать все статистические процедуры, которые применимы к данным, полученным в шкале наименований. Кроме того, можно использовать:

– медиану – в качестве меры центральной тенденции выборки;

– квантили – в качестве меры разброса объектов выборки по тому или иному показателю;

– так называемые ранговые критерии, которые позволяют проверять статистические гипотезы именно на основе рангов, например коэффициент ранговой корреляции Спирмена для определения взаимосвязи между двумя выборками, критерий для сравнения двух зависимых выборок и др.

Однако необходимо еще раз подчеркнуть, что числовые значения порядковой шкалы нельзя складывать, вычитать, делить и умножать.

Также следует отметить, что данная шкала является основой для построения многих шкал: Тёрстоуна, Гутмана, Лайкерта и др.

Шкала интервалов

Шкала интервалов, интервальная шкала или шкала равных единиц классифицирует объекты по правилу «больше на определенное количество единиц – меньше на определенное количество единиц». Шкала интервалов в отличие от порядковой шкалы позволяет определить не только различие между объектами, но и величину различий между объектами в проявлении того или иного свойства.

Однако в этой шкале априори не существует ни начало отсчета, ни единицы измерения. Здесь необходимо договариваться и о точке отсчета, и о единице измерения. Например, в шкале Цельсия за точку отсчета (начало координат выбрана температура таяния льда (0°С), а за 100 градусов – температура кипения воды. Единица измерения (1 градус) – это сотая часть температуры кипения воды. Шкала получила название в честь шведского ученого Цельсия в 1742 году. Еще ранее, в 1709 г., немецким физиком Фаренгейтом был изобретен первый спиртовой и ртутный термометр. В нем использовались другие опорные точки. За 00F по Фаренгейту была принята температура соленого раствора льда, воды и хлорида аммония в соотношении 1:1:1 (это 18 градусов по Цельсию, температура человеческого тела была принята за 96°F. Этот диапазон последовательно делился на 2 части. Разница температур в 1° F эквивалентна разнице температур в 0,556°C. Формула перевода градусов Фаренгейта имеет вид:

°C=(°F-32) / 1,8

Например, в США шкала Фаренгейта используется даже чаще, чем шкала Цельсия. Интересно, в некоторых британских газетах принято указывать градусы Цельсия для отрицательных температур и Фаренгейта для положительных. Так, в статье о психологии восприятия прогнозов погоды, говорилось, что – 6°С звучит для человека холоднее, чем 21°F, а 94°F звучит более впечатляюще, чем 34°С.

В такой шкале возможны арифметические операции над измерениями. Например, можно утверждать, что 5 – 4 = 4 – 3, чего нельзя сделать, если измерения получены по шкале порядка. Интервальная шкала используется тогда, когда с помощью отклика можно установить количество некоторого свойства в объекте исследования и зафиксировать равные различия. Для интервальной шкалы устанавливается единица измерения (метр, грамм, минута и т. д.). Отклику присваивается число, равное количеству единиц измерения, которое эквивалентно количеству имеющегося свойства.

Единственное ограничение интервальной шкалы заключается в том, что нельзя определить, во сколько раз один объект больше другого по величине измеряемого свойства. Классическим примером применения этой шкалы является измерение температуры по Цельсию. Эта шкала имеет масштабную единицу, но положение нуля на ней произвольно. Поэтому, например, если один объект имеет температуру 30°C, а другой – 10°C, то это не означает, что первый объект имеет втрое большую температуру, чем второй. Этот же недостаток имеет и шкала времени, которая не имеет начала отсчета и поэтому является интервальной шкалой. Такая ситуация характерна, в частности, и для сферы образования. Так, нет смысла говорить об абсолютном нуле (полном отсутствии изучаемого качества) при измерении знаний или умственного развития. Здесь нуль верных ответов на вопросы задания не означает полного отсутствия знаний у учащегося – это условный нулевой уровень.

Шкала интервалов часто используется исследователями в самых разных науках. Тем не менее, некоторые исследователи считают, что в общественных науках, в том числе в образовании, нет интервальных измерительных шкал. Здесь имеются в виду собственные интервальные измерительные шкалы, а не часто используемые физические единицы измерения. Однако даже при использовании физических единиц измерения не все так просто. Можно предположить, что если время решения задачи измеряется в секундах, то это уже явно шкала интервалов. Например, психологически различие в 10 секунд между испытуемыми А и Б может быть не равно различию в 10 секунд между испытуемыми В и Г, если испытуемый А решил задачу за 3 секунды, Б – за 13, В – за 313, а Г – за 323. С уверенностью можно лишь утверждать, что испытуемый А решил задачу быстрее Б, Б – быстрее В, а В – быстрее Г.

Значения интервальной шкалы инвариантны относительно линейных преобразований: y = ax + b. Это означает, что можно изменять масштаб шкалы x, умножая каждое значение на константу a, и производить ее сдвиг на любое расстояние вправо или влево, прибавляя или отнимая константу b.

Интервальная шкала позволяет применять для анализа данных практически все статистические методы. Помимо медианы и моды для характеристики центральной тенденции используется среднее арифметическое, а для оценки разброса – дисперсия. Можно вычислять коэффициенты асимметрии, эксцесса и другие параметры распределения. Для оценки величины статистической связи между переменными применяется коэффициент линейной корреляции Пирсона и др.

Исключение составляет вычисление коэффициента вариации, который определяется по формуле V = s / x, где x – среднее значение выборки, s – среднеквадратическое отклонение. Это объясняется следующим. Если начало отсчета на шкале выбрано так, что x = 0, то выражение для V не имеет смысла.

Шкала отношений

Шкала отношений, или шкала равных отношений, – наиболее часто используемая в естественных науках, и прежде всего в физике.

Отличительная особенность этих шкал состоит в том, что в них есть естественное начало отсчета – это нуль, т.е. отсутствие измеряемого свойства, но, как и в интервальных шкалах нет естественной единицы измерений. Исторически многие меры массы были кратны эталону – массе семени различных растений: пшеницы, ячменя. В системе СИ за единицу массы принят 1 кг. Однако в США и в Великобритании сохранились старые системы: фунт (pound, lb 454 грамма), унция (ounce, oz 1/16 фунта) и т. д.

Это еще более гибкая шкала, здесь кроме определения равенства, рангового порядка, равенства интервалов известно еще и равенство отношений. Шкала отношений позволяет определить не только то, насколько больше (меньше) один объект другого в отношении измеряемого свойства, но и во сколько раз больше (меньше). В такой шкале устанавливается равенство отношений чисел, приписываемых объектам. Например, для четырех объектов с откликами 3, 4, 6 и 8 выполняется отношение 3 / 4 = 6 / 8. Это обусловлено тем, что в шкале отношений, в отличие от интервальной шкалы, нулевое значение отклика указывает на полное отсутствие измеряемого свойства. Измерения массы, длины, веса, температуры по Кельвину, времени реакции и выполнения тестового задания — примеры шкалы отношений.

В интервальной же шкале выбор нулевой точки произволен, т. е. оцениваемое свойство объекта не равно нулю, когда результат измерения равен нулю. Так, вода при нуле градусов по Цельсию имеет все же некоторую температуру. Интервальную шкалу можно превратить в шкалу отношений, если возможно зафиксировать начало отсчета, как, например, при измерении температуры по Кельвину. Другой пример – измерение того или иного свойства числом верных ответов.

В психологии шкалы отношений встречаются редко. Считается, что такими шкалами являются шкалы порогов абсолютной чувствительности.

В шкале отношений к измерениям применимы все арифметические операции и, следовательно, все понятия и методы математической статистики.

Для интервальной шкалы и шкалы отношений используются одни и те же методы статистического анализа [51, 89, 90, 92, 96, 138]. Поэтому обе эти шкалы часто объединяются термином «линейная шкала».

Необходимо отметить, что с развитием науки тип шкалы для измерения одной и той же переменной может меняться. Например, в древние времена температура измерялась на порядковой шкале (холоднее – теплее), с развитием науки – на интервальной шкале (шкалы Цельсия, Фаренгейта). После открытия абсолютного нуля температуру стало возможным измерять на шкале отношений (шкала Кельвина).

Особенности типизации шкал

Необходимо отметить принципиальный недостаток этой типизации шкал. Он заключается в том, что первые два типа шкал по существу не являются измерительными шкалами: номинальная и ранговая шкалы фактически только классифицируют объекты. Такая типизация была сделана еще тогда, когда не была разработана теория измерения латентных переменных.

Возвращаясь к приведенному выше определению С.С. Стивенса, измерение – это не приписывание чисел, а выявление численных взаимоотношений между измеряемыми объектами и их проявлениями (индикаторами). Измерить – это, в первую очередь, показать, есть или нет в данных количественная структура, пригодная для измерений. И если данные обладают такой структурой, то они могут быть использованы для измерений. Именно этим, как будет показано ниже, и занимается теория измерения латентных переменных.

Недостаток определения С.С. Стивенса в том, что оно очень общее и недостаточно конструктивное для того, чтобы раскрыть суть и основные свойства измерения.

Для того чтобы измерения были полезными, необходимо, чтобы единицы измерения и точка отсчета были согласованы между теми, кто будет их использовать. Построение измерительного инструмента является ключевым для понимания самой латентной переменной и факторов, которые влияют на построение такого инструмента.

Очень важным вопросом является способ обработки результатов измерений в социальных системах. Существуют две основные теории измерения – классическая теория измерения и теория измерения латентных переменных. Эти теории подробно описаны в монографиях [84, 91]. Для использования той или иной теории необходимо их многоаспектное сравнение.

Научная электронная библиотека

Монографии, изданные в издательстве Российской Академии Естествознания

2.2 Шкалы измерений

Научная электронная библиотека
Монографии, изданные в издательстве Российской Академии Естествознания