Процентная ранговая шкала. Типы измерительных шкал Данные в порядковой шкале

Существует четыре основных типа шкал (по Стивенсу):

1. Номинальная шкала (шкала наименований).

2. Порядковая шкала (ординальная, ранговая).

3. Интервальная (шкала равных интервалов).

4. Шкала равных отношений (относительная).

Номинальная шкала (шкала наименований) - это шкала, классифицирующая по названию. Название не измеряется количественно, оно лишь позволяет отличить один объект от другого.

Простейшая форма номинальной шкалы, это - дихотомическая шкала, которая имеет только 2 значения (да - нет, мужчина - женщина, купил - не купил).

Шкала наименований позволяет подсчитать частоту, встречаемость разных наименований, а затем работать с этой частотой, с помощью математических методов. Допустимо только ограниченное количество статистических расчетов, базирующихся на подсчете частот. К ним относятся процентные соотношения, мода, хи-квадрат, биноминальный критерий, угловое преобразование Фишера.

Порядковая шкала (ординальная, ранговая) - это шкала, классифицирующая по принципу «больше - меньше». Если в номинальной шкале безразлично, в каком порядке находятся ячейки, то в порядковой шкале они образуют последовательность от ячейки «самое малое» к ячейке «самое большое» или наоборот. Здесь мы не знаем, на сколько именно значение следующей ячейки больше или меньше значения предыдущей. Знаем лишь, что они образуют последовательность. Все методы использующие ранжирование основаны на порядковых шкалах.

Единица измерения здесь - расстояние в один класс (ранг), при этом расстояние это может быть разным. Для анализа данных, измеренных на основе этой шкалы, применимы все непараметрические критерии, кроме того, имеют смысл расчеты процентилей, квартилей, медианы и ранговой корреляции.

Интервальная шкала (шкала равных интервалов) - это шкала, классифицирующая по принципу «больше на определенное количество единиц», «меньше на определенное количество единиц». Здесь каждое из возможных значений признака отстоит от последующего на равном расстоянии. В интервальной шкале точки начала отсчета нет (нулевой точки нет).

Шкала равных отношений (относительная шкала)

Классифицирует объекты или субъекты пропорционально степени выраженности измеряемого свойства. Шкала предполагает наличие нулевой точки отсчета, наиболее информативная шкала. Она обладает всеми свойствами номинальной, порядковой и интервальной шкал. К ней применимы все параметрические и непараметрические методы обработки. С помощью таких шкал можно определять, классифицировать и ранжировать объекты, сравнивать интервалы и разницы.

Примерами таких шкал являются: килограммы, метры, градусы и т.д.

Шкалы дают возможность:

1) идентифицировать,

2) классифицировать,

3) ранжировать,

4) измерять.

Используемые в маркетинге методы шкалирования условно подразделяются на две группы:

Сравнительные методы, предполагающие прямое сравнение объектов;

Несравнительные методы, заключающиеся в самостоятельной оценке каждого обьекта.

К сравнительным методам относятся попарное сравнение, упорядоченное шкалирование, шкалирование с постоянной суммой и Q-сортировка .

Попарное сравнение - в качестве вариантов ответа респонденту дается 2 объекта для выбора по определенному критерию. По своей природе данные порядковые. Данные, полученные методом попарного сравнения, могут быть проанализированы несколькими способами: может быть подсчитан процент респондентов, предпочитающих один обьект другому, возможна одновременная оценка всех объектов. Кроме того, они могут быть упорядочены. Упорядоченность попарного сравнения может быть осуществлена на основе свойства транзитивности.

Транзитивность предпочтений - это допущение, сделанное для преобразования данных попарного сравнения в упорядоченные. Допущение предполагает, что если торговой марке А отдается предпочтение перед торговой маркой В, а торговой марке В перед торговой маркой С, то торговой марке А будет отдано предпочтение перед торговой маркой С.

Упорядоченное шкалирование - респонденту предлагается одновременно несколько объектов, с тем, чтобы их проранжировать по определенному критерию. Оно также дает порядковые данные.

Шкалирование с постоянной суммой - респондентов просят распределить постоянные суммы баллов (фишек, процентов, долей) между объектами сравнения по определенному критерию. Если свойство несущественное респондент может поставить ноль. Если какое то свойство в два раза важнее другого, оно получает в два раза больше баллов.

Пример: в результате исследования выявлено, что потребитель выбирает товар по трем признакам: цена, удобство покупки, прочность. При этом, у потребителей различных групп доходности весомость каждого из факторов различна. Для потребителей с высокими доходами на первом месте по весомости стоит удобство, для потребителей с низкими доходами - цена. Потребителю предлагается оценить всю сумму свойств в 100% и разделить эти проценты между свойствами, в соответствии с их значимостью лично для него.

Q-cортировка разработана для быстрого установления различий между большим количеством объектов. Этот метод заключается в процессе упорядочивания, при котором объекты разбиваются на группы в зависимости от схожести по определенному критерию.

Например, респонденту выдается 20 утверждений, написанных на карточках и предлагается разделить эти карточки на 5 групп в зависимости от того, насколько он с этими утверждениями согласен.

Методы несравнительного шкалирования. При их использовании респонденты не сравнивают рассматриваемый объект ни с каким другим, поэтому такие шкалы еще называют монадическими или однопредметными.

К ним относятся следующие шкалы:

Непрерывные рейтинговые шкалы (графические шкалы), при использовании, которых респонденты ставят отметки в соответствующей точке отрезка соединяющей крайние значения критерия. Шкала может иметь различные формы, они легко составляются.

Например: плохой-1 балл, а наилучший- 10 баллов.

Между ними шкала от 1 до 10: плохой - 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9 - 10 - наилучший. Недостаток - сложность подсчета баллов без компьютера.

2. Семантический дифференциал;

3. Шкала Стэпеля.

Шкала Лайкерта - от респондента требуется определить степень согласия или несогласия для каждого набора утверждений о рассматриваемых объектах. Обычно каждый пункт шкалы имеет 5 категорий для ответа от абсолютного несогласия, до полного согласия: каждому утверждению присваиваются определенные баллы.

Например, от -2 до +2 они расположены следующим образом:

1. Абсолютно не согласен - 2;

2. Не согласен - 1;

3. Затрудняюсь ответить - 0;

4. Согласен - 1;

5. Абсолютно согласен - 2.

Недостаток - большой промежуток времени, который тратит респондент.

Семантический дифференциал - 7- балльная шкала с противоположными оценками в крайних точках (слабая - мощная, ненадежная - надежная). Респонденты делают отметки на шкале, которые отражают их мнение, и можно затем сформировать портрет фирмы (профиль) по степени ее надежности. Если в одинаковой шкале на одном листе дать оценку по надежности и другим фирмам, их можно сравнить (профильный анализ). Отдельные пункты семантического дифференциала могут принимать значения от -3 до +3 или от 1 до 7 при обработке. С его помощью можно представить многие параметры не метрического характера, например, - образ фирмы в глазах потребителя.

Шкала Степеля - 10 бальная шкала, состоящая из одной характеристики в середине шкалы с диапазоном противоположных числовых значений.

Ее значения от -5 до +5 без нейтральной нулевой точки. Шкала изображается вертикально. Респондентов просят распределить, выбирая число на шкале, насколько верно каждый термин описывает объект. Респондент предполагает, что чем выше число, тем ближе термин к описанию объекта. Например, допустим выбор универмага: Респонденту предлагается оценить, насколько точно каждая фраза описывает каждый универмаг. Он, выбирает какое то из положительных значений, если считает, что фраза довольно точно описывает данный универмаг, либо какое то из отрицательных, если она не соответствует ситуации в магазине.

Высокое качество Плохой сервис

Данные анализируются так же как семантический дифференциал. Несравнительные детализированные рейтинговые шкалы не обязательно должны использоваться только в рамках вышеуказанных форматов. Они могут принимать много различных форм.

Но при разработке любой другой формы шкалы необходимо ответить на следующие вопросы:

1. Количество используемых категорий;

2. Сбалансирована или не сбалансирована шкала;

4. Допустим ли неопределенный ответ;

5. Каков характер вербального описания;

6. Каков формат шкалы.

Принимают во внимание два противоположных фактора:

Кроме того, при разработке шкал учитывают:

Заинтересованность респондента;

Способ сбора данных;

Методы анализа.

Величина коэффициента корреляции и общепринятая мера связи зависит от числа категорий в шкале, поэтому, если данные будут анализироваться с помощью сложных статистических методик, то число категорий должно быть равно семи.

В сбалансированной шкале количество категорий одинаково. В несбалансированной шкале их количество разное. Для получения объективных данных шкалы должны быть сбалансированы.

Однако, если велика вероятность смещения в положительную или отрицательную сторону, для исследования больше подходит шкала с наибольшим числом смещений в положительную сторону.

При нечетном количестве категорий центральное положение в шкале отображает нейтральность характеристики или безразличие респондента. При расположении такой нейтральной категории можно сильно повлиять на ответ. Если хотя бы у одного респондента возможно нейтральное или безразличное отношение, то категорий должно быть нечетное количество.

Должна быть предусмотрена допустимость неопределенного ответа - возможность респонденту уйти от ответа (не знаю, не помню).

Характером и степенью вербального описания, которое используется для шкалы можно значительно повлиять на ответы. Подробное словесное описание каждой категории может не увеличить точность, а уменьшить ее, так как от обилия слов отвечающий человек теряется. Сила аргумента тоже может влиять.

Существует несколько вариантов форм шкалы: вертикальная форма;

Горизонтальная форма. Категории шкалы могут обозначаться линиями, графами, делением. Шкалы могут иметь или не иметь числовые значения. Числовые значения могут быть со знаками «+», «−» или и те и другие.

Шкалы могут быть многомерными . Их разработка требует специальной подготовки. Измеряемая характеристика чаще всего здесь формируется в несколько приемов и называется конструкцией.

Измерительные шкалы (от лат. scala – «лестница») – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Измерительные шкалы представляют собой метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов числовыми значениями и отображение пропорций континуального состава элементов объекта в соответствующих числах. Каждому элементу совокупности проявлений свойств изучаемого объекта соответствует определенный балл или шкальный индекс, количественно устанавливающий положение наблюдаемой единицы на шкале, которая охватывает всю совокупность или ее часть, существенную с точки зрения задач исследования. Операция упорядочивания исходных эмпирических данных в шкальные носит название шкалирования. Измерительные шкалы являются главным средством сбора и анализа статистического материала как в прикладных, так и в теоретических исследованиях. Они различаются в зависимости от характера функции, лежащей в основе их построения. В качестве такой функции могут служить: сравнение по признаку убывания или возрастания, ранжирование, оценка интенсивности признака или оценка пропорциональных отношений между признаками. Наиболее общая классификация измерительных шкал предложена С. Стивенсон . В ее основу положен признак метрической детерминированности. Согласно этому признаку шкалы делятся на метрические (интервальные и шкалы отношений) и неметрические (номинативные, шкалы порядка).

1. Номинативные шкалы

Номинативные шкалы (шкалы наименований) устанавливают соответствие признака тому или иному классу. Объекты объединяют в классы на основании какого-либо общего свойства (классы эквивалентности) либо символа (обозначения). Необязательно, чтобы между выявленными классами существовала внутренняя взаимосвязь. Само название «шкала наименований» указывает на то, что значения по шкале играют роль лишь названий классов. Одним из распространенных видов номинативной шкалы является классификация объектов на две группы по принципу «А – не-А» (альтернативные признаки в дихотомической шкале наименований). Конкретными примерами применения такой шкалы являются оценивание ответа испытуемого на пункт опросника в виде утверждения или отрицания, соответствие или несоответствие полученного вида ответа ключу (коду) измеряемого свойства (см. личностные опросники).

Примером оценивания в номинативной шкале могут служить классификация решений тестовой задачи или пункт опросника с задачей закрытого типа.

Из названных городов северней расположен город…

2) Нижний Новгород;

3) Волгоград;

4) Новосибирск;

5) Красноярск.

Противоположностью значения «великодушный» является…

1) расточительный;

2) упрямый;

3) малодушный;

4) скупой;

5) щедрый.

Другой простейшей разновидностью номинативной шкалы является перечень или набор каких-либо признаков, группируемых при сборе информации или ее обработке.

Вы предпочитаете проводить досуг…

1) с товарищами и приятелями;

2) на лоне природы;

3) в занятиях спортом;

4) в кругу семьи и т. д.

Распределение признаков в классах шкалы наименований можно охарактеризовать путем определения абсолютных и относительных частот встречаемости, возможно также определение модальных и центральных значений в классах. Оценка статистической связи между группами признаков возможна с помощью анализа корреляции (см. корреляция качественных признаков).

Если один из рядов переменных представлен в дихотомической шкале наименований, а другой – в любой иной (интернальной, отношений или порядковой), то применяются коэффициенты корреляции бисериальной. Переменные в дихотомической шкале могут распределяться по нормальному закону или иначе в зависимости от этого выбирают способ расчета коэффициентов корреляции.

В строгом смысле номинативная шкала не является шкалой измерения. Она допускает лишь операцию равенства и неравенства и более или менее дифференцированную классификацию признаков. Вместе с тем в психологических исследованиях и психологической диагностике этот вид измерительных шкал имеет достаточно большое значение, особенно при фиксации качественной информации (например, данных проективных методик при сборе психологического анамнеза и т. д.).

2. Порядковые шкалы

Порядковые шкалы (ординальные) предназначены для расчленения совокупности признаков на элементы, связанные отношением «больше – меньше», и допускают отнесение переменных к группам, упорядоченным (ранжированным) друг относительно друга и представляющим некое системное единство. Порядковые шкалы дают возможность оценить степень выраженности признака. Они содержат не менее трех классов с установленной последовательностью, не допускающей перестановки. Так, между двумя показателями объектов А и В, обладающих признаком X, возможны три вида отношений: Х А = Х B ; Х А ‹ Х B ; Х А › Х B . Если имеются три объекта A, В, С и между ними установлены отношения Х А ‹ Х B , Х B ‹ Х C , из этого следует, что Х А ‹ Х C . При этом значения разностей между признаками не устанавливаются (шкала неметрическая, единицы измерения отсутствуют). Упорядочивание признаков в ординальной шкале может быть униполярным (при определении классов исходят из степени выраженности измеряемого свойства) и биполярным (в основе разделения лежит ранг степени приближения к одному из противоположных полюсов свойства).

В качестве примера униполярного упорядочивания может быть приведена шкала оценивания качеств внимания: «весьма устойчивое /устойчивое / лабильное / рассеянное». Примером оценивания по биполярному принципу может служить идентификация выраженности свойств между полярными антонимическими характеристиками свойств личностных проявлений:

1) уравновешенный… нестабильный;

2) общительный… замкнутый;

3) подвижный… медлительный.

Порядковые шкалы относятся к числу распространенных в психологической диагностике. В качестве одного из практических приемов оценивания результатов испытуемого по порядковой шкале можно привести модификацию теста «Прогрессивные матрицы Равена», в котором каждый ответ включает три варианта, последовательно приближающихся к правильному. Вариантом применения порядковой шкалы может быть закрытый дифференцированный ответ на пункт опросника:

Бывает, что я никак не могу принять какое-то окончательное решение и упускаю возможность сделать что-то своевременно.

1. Полностью согласен.

2. Пожалуй, могу согласиться.

3. Не уверен.

4. Скорее не согласен.

5. Совершенно не согласен.

Порядковая шкала допускает операции равенства / неравенства и сравнения по интенсивности. По сравнению со шкалой наименований здесь возможны определение медианы распределения , использование коэффициентов ранговой корреляции и сопряженности (см. корреляция качественных признаков).

3. Метрические шкалы

Шкала интервалов относится к метрическим шкалам, в которых элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе ранжирования признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.

В шкале интервалов нулевая точка отсчета может устанавливаться произвольно, а величины единиц и направление отсчета могут определяться по избираемым константам.

К разряду шкалы интервалов относятся шкалы стандартного IQ-показателя, Т-баллов, процентилей и другие (см. стандартизация, оценки шкальные). Шкалирование в интервальной шкале составляет основу психометрических измерений.

В шкалах отношений (пропорциональных) числовые значения присваиваются объектам таким образом, чтобы между числами и объектами соблюдалась пропорциональность. Начало отсчета в такой шкале фиксировано. Шкала предусматривает операции равенства / неравенства, больше / меньше, равенства интервалов и равенства отношений.

Примером использования такой шкалы в психологических измерениях может служить шкала порогов абсолютной чувствительности анализатора.

Наряду с делением шкал на метрические и неметрические существует классификация по признаку формы фиксации эмпирических данных, а именно: шкалы вербальные, шкалы числовые и шкалы графические.

В психологической диагностике важным практическим вопросом является оценка надежности, одномерности и обоснованности измерительных шкал. Надежность шкалы определяется на основе анализа устойчивости повторных измерений.

Под валидностью понимается обоснование гипотезы о приспособленности данной шкалы для измерения критериального качества, о полноте его отражения и техническом соответствии самой процедуры шкалирования. Под одномерностью или соразмерностью шкалы понимаются сопоставимость шкалируемых параметров, отсутствие их смещений или пропорциональность между положительными и отрицательными полюсами шкалы, равенство интервалов шкалы или симметричность различных позиций.

Теоретическая валидизация в социологическом исследовании: Методология и методы

Благодаря Стенли Стивенсону, в нашей исследовательской практике мы оперируем несколькими типами шкал. Некоторые критикуют эту типологию, но судя по-всему никто не придумал ничего лучше.

0 Нажми, если пригодилось =ъ

Независимо от того, какой сложности анкетные вопросы или же тестовые методики вы рассматриваете, все их можно разделить на три типа в зависимости от того, к какой измерительной шкале они относятся. Речь в данном случае идет не о специфических методиках построения измерительных инструментов (например, шкала Гутмана или шкала Терстоуна), а о классификации измерительных шкал, предложенной Стэнли Стивенсом в 1946 году. Знание этой классификации имеет решающее значение с точки зрения использования количественного подхода, поскольку применение тех или иных методов математической статистики опирается, в том числе, и на измерительные шкалы, в которой отображены интересующие исследователя переменные.

Более подробно о понятии "переменная"
"Переменная" является часто употребляемым понятием в рамках научных исследований (не только в социальных и поведенческих науках) и особенно, если мы говорим о количественном подходе и применении статистических методов. Фактически переменная - это любое свойство изучаемых объектов, которое меняется от одного наблюдения к другому. Под наблюдениями в данном случае понимаются объекты изучения (люди, организации, страны или что-либо другое - зависит от самого исследования).
Если же некоторое свойство не изменяется от одного наблюдения к другому, то оно не дает никакой ценной в математическом смысле информации (большинство методов будет просто непригодно для использования).
Таким образом, в рамках количественного подхода изучаемые объекты представляются в виде набора переменных, составляющих интерес и подлежащих изучению. Нетрудно догадаться что переменные, прежде всего, делятся в зависимости от шкал, в которых они отображены. Так, можно выделить, например, номинальные, порядковые и метрические переменные. При этом, порядковые можно разделить на свернутые и непрерывные порядковые. Непрерывные порядковые переменные имеют множество численных значений и выглядят (по крайней мере, на первый взгляд), как метрические. Свернутые порядковые переменные имеют лишь несколько категорий или численных значений (не более пяти-шести). Они могут быть получены либо путем сбора данных в свернутой форме, либо сворачивания непрерывной порядковой или метрической шкалы.
Еще одним важным делением переменных является деление на зависимые и независимые. Часто в процессе анализа выдвигаются гипотезы о влиянии одних переменных на другие. В таких случаях, влияющие переменные называются независимыми, а переменные, на которые влияние оказывается, - зависимыми. Например, если мы говорим о взаимосвязи между полом студента и успешностью его обучения, то пол будет - независимой переменной, а успешность обучения - зависимой.

Согласно классификации Стивенсона, в самом общем виде, можно выделить три типа шкал:
- номинальную,
- порядковую,
- метрическую.

Номинальная шкала включает в себя класс переменных, значения которых можно разделить на группы, но невозможно проранжировать. Примерами соответствующих переменных являются пол, национальность, религия и т.д. Рассмотрим более подробно такую переменную как национальность. В данном случае респондентов можно разделить на разные группы в зависимости от того, к какой национальности они себя относят. Вместе с тем, на основе этой информации, респондентов невозможно упорядочить в смысле количественной выраженности интересующего нас параметра, ведь национальность не является измеряемым, в традиционном значении этого слова, свойством.
Порядковая шкала включает в себя класс переменных, значения которых можно не только разделить на группы, но и проранжировать в зависимости от выраженности измеряемого свойства. Классическим примером порядковой шкалы является Шкала Богардуса, предназначенная для измерения национальной дистанциированности. Ниже приведен адаптированный для населения Украины вариант (Н.Панина, Е.Головаха):

Анкетное задание
Относительно каждой национальности, приведенной ниже, выберите одно из положений, наиболее близкое для вас лично, на которое бы вы допустили представителей этой национальности.
Шкала ответов
1) как членов моей семьи;
2) как близких друзей;
3) как соседей;
4) как колег по работе;
5) как жителей Украины;
6) как поситителей Украины;
7) вообще не допускал бы в Украину.

Эта шкала позволяет упорядочить респондентов в зависимости от их отношения к той или иной национальности. Вместе с тем, она предоставляет лишь приблизительную информацию, которая не дает возможности точно оценить различия между градациями шкалы. Так, например, мы может утверждать, что респондент, готовый допустить евреев в качестве членов своей семьи будет относится к ним лучше, чем тот, кто готов допустить их лишь как соседей. Вместе с тем, мы не можем сказать "на сколько?" или "во сколько?" раз первый респондент лучше относится к представителям еврейской национальности чем второй. Другими словами, у нас нет никаких аргументов, которые бы подтверждали равенство интервалов между пунктами шкалы.
Метрическая шкала включает в себя класс переменных, значения которых можно как разделить на группы и проранжировать, так и определить их величину в точных терминах (те самые "на сколько?" и "во сколько?"). Типичными примерами соответствующих переменных являются возраст, заробтная плата, количество детей и т.д. Измерение каждой из них можно осуществить максимально точно: возраст в годах, зароботнуню плату в гривнах, количество детей в... штуках;)
Естественно, если переменная может быть потенциально выражена в метрической шкале, то эту же переменную можно выразить и в порядковой.

Например, возраст можно выразить в возрастных группах (молодежь, средний возраст, пожилой возраст), которые дают лишь приблизительную информацию о респонденте, несмотря на возможность их ранжирования.
Принадлежность переменной к метрической шкале открывает возможность использования любых статистических методов. В свою очередь принадлежность к порядковой или номинальной ограничивает выбор математических инструментов (в случае порядковой шкалы в меньшей мере, а в случае номинальной - в большой). Классификация статистических методов приведена .
Для того, чтобы сделать различия между номинальной, порядковой и метрической шкалами еще более очевидными, приведу дополнительный пример, посвященный рейтингу профессиоанальных боксеров в супертяжелом весе по версии сайта boxrec.com (информация актуальна по состоянию на 31.01.2012). При этом мы рассмотрим данные относительно боксеров первой десятки по трем переменным: этническая принадлежность боксера, его место в рейтинге и количество рейтинговых очков, которые имелись у него в активе 31.01.2012.

А) Этническая принадлежность (номинальная шкала ). Три боксера (братья Кличко и Димитренко) являются украинцами, один (Поветкин) - русским, один (Адамек) - Поляком, два (Чемберс и Томпсон) - американцами, один (Фьюри) - британцем, один (Хелениус) - фином, один (Пулев) - болгарином. Таким образом переменная "национальность" помогла нам разделить всех боксеров на 7 групп, в зависимости от их этнической принадлежности. Владея этими данными, человек далекий от бокса ничего не сможет сказать об успешности перечисленных боксеров, хотя и получит информацию об этнической принадлежности 10-ти наилучших тяжеловесов (мы и далее будет обращаться к гипотетическому эксперту):
украинцы - 30%;
американцы - 20%;
русские, поляки, британцы, фины и болгары - по 10%.
Б) Место в рейтинге (порядковая шкала ) дает приблизительную информацию об успешности боксера. Ситуация следующая:
1. Владимир Кличко
2. Виталий Кличко
3. Александр Поветкин
4. Томаш Адамек
5. Эдди Чемберс
6. Тайсон Фьюри
7. Роберт Хелениус
8. Тони Томпсон
9. Александр Димитренко
10. Кубрат Пулев
Теперь наш неосведомленный аналитик знает последовательность первой десятки боксеров супертяжелого веса. И хотя здесь уже присутствуют числа от 1 до 10, он все еще не может осуществлять никаких математических операций кроме сравнения. К примеру, он не может сказать, что Владимир Кличко лучше Эдди Чемберса на 4 единицы. Выражение "5 минус 1" в данном случае не имеет смысла. В отношении этих двух боксеров он может утверждать лишь то, что Владимир Кличко лучше Эдди Чемберса как боксер (как впрочем и всех остальных из десятки). Причина невозможности осуществления математических действий заключается в том, что между пунктами с 1-го по 10-й нет равенства интервалов. Каковы на самом деле интервалы между пунктами, можно увидеть благодаря последней переменной.
В) Количество рейтинговых очков (метрическая шкала ). Данный показатель

Кроме количественных существуют качественные шкалы. Типичным представителем качественной шкалы является порядковая шкала , в которой результаты измерений определяются с точность до преобразований вида ф,(у,), где ф, - произвольная строго возрастающая функция. Примерами такой шкалы могут

Установление типа шкалы, т.е. задание группы допустимых преобразований шкалы измерения , является делом специалистов соответствующей прикладной области. Например, оценки привлекательности профессий социологи считают измеренными в порядковой шкале . Однако отдельные эксперты не соглашаются с ними, полагая, что выпускники школ пользуются шкалой с более узкой группой допустимых преобразований , например интервальной шкалой . Очевидно, эта проблема относится не к математике, а к наукам о человеке.

В процедурах принятий окончательного планового решения, использующих в качестве оценок альтернатив по отдельным критериям словесные определения, может быть предусмотрено использование ЭВМ, например, для попарного сопоставления альтернатив, определения групп альтернатив с необходимыми характеристиками и т. д. Понятие шкал измерений является, по нашему мнению, одним из основных в исходной информации второго типа. Показатели шкалы измерения (обычно - упорядоченная система чисел) характеризуют полезность для ЛПР рассматриваемой альтернативы с позиций конкретного качественного критерия или их группы. На практике обычно применяют шкалы четырех типов наименований, порядковые, интервалов и отношений. При этом шкалы первых двух типов являются качественными, где числа в шкалах наименований используются лишь как названия (имена), а в порядковых шкалах числа отражают порядок расположения рассматриваемых элементов по их предпочтительности. Применение порядковых шкал представляется наиболее перспективным. Отметим также, что при принятии решений окончательная полезность альтернатив чаще всего измеряется по порядковым либо интервальным шкалам .

Шкала порядка в общем случае основана на ранжировании объектов. Она имеет свойства описания в сочетании с отношением порядка. Если каждую пару категорий шкалы наименований упорядочить относительно друг друга , то получится порядковая шкала . Оценки, получаемые при измерениях с использованием этой шкалы, называют рангами. Результатом измерения является ранжированный ряд объектов сравнения

Широкое распространение получили так называемые балльные шкалы. Ординальная шкала единственная с точностью до монотонного преобразования . Кроме номинальной и порядковой шкал для определения измерения используются интервальные шкалы.

Выделение разных уровней измерения дает известное основание говорить о внутреннем единстве задач классификации и измерения. В самом деле, неупорядоченная классификация есть не что иное, как построение шкалы некоторого признака (фактора), градациями которого являются названия классов. Таким образом, процедура построения неупорядоченной классификации может рассматриваться как процедура измерения по номинальной шкале . В случаях, когда полученные классы могут быть упорядочены по некоторому основанию, например по расстоянию или по мере сходства между собой так, чтобы стоящие рядом в этом ряду классы были более сходны друг с другом, чем отдаленные, говорят о линейно-упорядоченной классификации. В таких случаях построение классификации подобно измерению по порядковой шкале.

По объективным причинам для социально-экономических измерений характерна низкая контролируемость их точности. Для проверки адекватности можно использовать ряд простых критериев. Например, оценка, представляющая собой линейную комбинацию величин разной размерности с безразмерными коэффициентами, заведомо не может быть адекватной, если не оговорено заранее совместное преобразование единиц измерения . Неадекватными будут оценки, построенные на основе арифметических операций с рангами (такие операции неприменимы к порядковой шкале).

При измерении приоритетов в порядковой шкале их можно определить на основе ранжирования целей с присвоением рангов. Наиболее важная цель получает первый ранг, вторая по важности - второй ранг и т.д.

Оценки экспертов, как уже отмечалось, часто следует считать измеренными в порядковой шкале . Типичным примером являются задачи ранжирования и классификации промышленных объектов, подлежащих экологическому страхованию . Как показали многочисленные опыты, человек более правильно (и с меньшими затруднениями) отвечает на вопросы качественного, например сравнительного, характера, чем количественного. Так, ему легче сказать, какая из двух гирь тяжелее, чем указать их примерную массу в граммах.

В качестве примера рассмотрим обработку мнений экспертов, измеренных в порядковой шкале . Пусть уи у2,. .., уп - совокупность оценок экспертов, выставленных одному объекту экспертизы (например, одному из вариантов стратегического развития фирмы), z, Zi, z - второму объекту экспертизы (другому варианту такого развития).

Эксперт может сравнить два объекта, сказать, какой из двух лучше (метод парных сравнений), дать им оценки типа хороший, приемлемый, плохой, упорядочить несколько объектов по привлекательности, но обычно не может ответить, во сколько раз или на сколько один объект лучше другого. Другими словами, ответы эксперта обычно измерены в порядковой шкале , или являются ранжировками, результатами парных сравнений и другими объектами нечисловой природы, но не числами. Распространенное заблуждение состоит в том, что ответы экспертов стараются рассматривать как числа, занимаются оцифровкой их мнений, приписывая этим мнениям численные значения - баллы, которые потом обрабатывают с помощью методов прикладной статистики как результаты обычных физико-технических измерений. В случае произвольности оцифровки выводы, полученные в результате обработки данных, могут не иметь отношения к реальности.

Эталон измерения называется шкалой. В современных исследованиях применяются четыре вида шкал для измерения различных величин номинальная, порядковая, интервальная и метрическая

Напомним (см.

Выбор рациональной формы представления (или измерения). Показатели эффективности обычно измеряются в количественной шкале , т. е. в виде чисел (в то же время для других целей необходимые характеристики могут измеряться и в номинальной или порядковой шкале номер налогоплательщика, разряд рабочего и др.).

Второй вопрос, который появляется при анализе экспертных оценок правильно ли выбрана шкала, в которой измеряется переменная Хотя вопрос в шкалах неоднократно освещался в литературе, теория измерений часто игнорируется при проведении различных экспертиз, и мы коротко напомним, о чем здесь идет речь. Чаще всего используются шкалы порядковая , интервальная, отношений и абсолютная. Шкала полностью определяется допустимым преобразованием . Преобразование шкалы назы-

Если переменная измерена в порядковой шкале , то неадекватны все утверждения о том, во сколько и на сколько одна величина больше другой, и адекватны утверждения о том, что одна величина больше другой. Это значит, в частности, что все арифметические операции над величинами, измеренными в порядковой шкале , недопустимы и что допустимы не все арифметические операции над величинами, измеренными в шкале интервалов или в шкале отношений . В работах по экспертным оценкам , в практике их использования проблема адекватности

Если целью измерения будет упорядочение объектов одного класса в соответствии с интенсивностью проявления у них какого-то одного общего свойства, то наиболее выразительной и экономной будет ранговая шкала. Например, если общим для характеристики экономической ситуации будет признак "Рост производительности труда ", то ЛПР может упорядочить разные способы повышения производительности труда , например, в порядковой шкале со значениями "высокий", "средний", "низкий". Здесь также можно присвоить градациям шкалы числовые значения - ранги. Шкала в таком случае называется ранговой. Например, если первому в упорядоченном ряду способу наступления присвоить ранг, равный 1, второму - равный 2 и т. д., то получим так называемую прямую ранговую "шкалу. Возможно ранжирование и в обратных ранговых "шкалах, где более предпочтительному объекту присваивается больший, а не меньший ранг. Оценки в ранговых шкалах допускают любые монотонно возрастающие или монотонно убывающие преобразования.

Ранжирование. Это способ, выражения предпочтений, заключающийся в расположении предъявленных элементов в порядке возрастания (так называемое прямое ранжирование) или убывания (обратное ранжирование) их предпочтительности. При ранжировании каждому элементу в упорядоченном ряду приписывают натуральное число , называемое рангом элемента. Таким образом, при прямом ранжировании более предпочтительному элементу будет приписано меньшее натуральное число , а при обратном - большее. Для упрощения процедуры иногда допускают нестрогое ранжирование. При нестрогом ранжировании несколько элементов могут занимать одинаковое место в ранжировке по предпочтительности, и им будет приписан одинаковый ранг. Ранжирование - это измерение в порядковой шкале.

Эта возможность предполагает введение соотношений между различными информационными единицами (т. е. их измерение в какой-либо шкале - порядковой, классификационной, метрической и т. п.) и упорядочение информационных единиц путем измерения интенсивности отношений и свойств.

Разработав план проведения исследования (см. главы и определив, какую именно информацию необходимо собрать, исследователь вплотную сталкивается с проблемой выбора методов измерения и шкалирования. В данной главе рассматривается суть шкалирования и измерения, изучаются четыре основные шкалы номинальная , порядковая, интервальная и относительная. Далее рассматриваются методы сравнительного и несравнительного шкалирования с детальным рассмотрением первого из них. Метод несравнительного шкалирования описывается в главе 9. Также рассматриваются основные факторы , учитываемые при исследовании международных рынков. Определяются некоторые этические аспекты измерения и шкалирования. Завершается глава обсуждением использования Internet и компьютеров при применении основных шкал измерения.

РАНЖИРОВКА (от нем. ranglerung - распределение по порядку) - способ оценки переменной, когда ее значению приписывается место в последовательности величин (т.н. ранг), определяемое при посредстве порядковой шкалы . Хотя результаты Р. имеют численную форму, они не обладают некоторыми фундаментальными свойствами натуральных чисел, вследствие чего операции над ними требуют обращения к специальным аналитическим и вычислительным методам (напр., к неметрическому многомерному шкалированию). В социологии Р. является количественной информации, т.е. выполняет столь же фундаментальные методологические функции, как и измерение в естественных науках.

Ординалистская (порядковая) полезность - субъективная полезность (или удовлетворение, которое потребитель извлекает из потребляемого им блага), измеренная по порядковой шкале . В концепции ординалистской полезности утверждается, что количество полезности, полученной от потребляемого блага, не может быть измерено численно, как это подразумевается критериями кардиналистской теории. Вместо этого ординал исты предполагают упорядочение потребителем своих предпочтений в отношении благ.

Мнения экспертов часто выражены в порядковой шкале , т.е. эксперт может сказать (и обосновать), что один показатель качества продукции более важен, чем другой, первый технологический объект более опасен, чем второй и т.д. Но он не в состоянии сказать, во сколько раз или на сколько более важен, а соответственно, более опасен. Экспертов часто просят дать ранжировку (упорядочение) объектов экспертизы, т.е. расположить их в порядке возрастания (или, точнее, неубывания) интенсивности, интересующей организаторов экспертизы характеристики. Ранг - это номер объекта экспертизы в упорядоченном ряду. Формально ранги выражаются числами 1,. .. п, но с этими числами нельзя проводить привычные арифметические операции . Например, хотя 1 + 2 = 3, но нельзя утверждать, что для объекта, стоящего на третьем месте в упорядочении (ранжировке), интенсивность изучаемой характеристики равна сумме интенсивностей объектов с рангами 1 и 2. Например, одним из видов экспертного оценивания являются оценки учащихся. Вряд ли кто-либо будет утверждать, что знания отличника равны сумме знаний двоечника и троечника (хотя 5 = 2 + 3), знания хорошиста соответствуют знаниям двух двоечников (2 + 2 = 4), а между знаниями отличника и троечника такая же разница, как между знаниями хорошиста и двоечника (5 - 3 = 4 - 2). Поэтому очевидно, что для анализа подобного рода качественных данных необходима не всем известная арифметика, а другая теория, дающая базу для разработки, изучения и применения конкретных

Порядковое измерение предоставляет больше информации, чем номинальное, так как дает возможность не только категоризовать, но и упорядочивать, или ранжировать, явления.

Располагая порядковым измерением, мы можем сказать, какие объекты характеризуются большим (или меньшим) количеством измеряемого свойства по сравнению с какими-то другими объектами; мы можем также расположить объекты по порядку в зависимости от количества того свойства, которое их характеризует.

Порядковая шкала устанавливает отношения равенства между явлениями в каждом классе и отношения последовательности в понятиях «больше» и «меньше» между всеми без исключения классами. Так, перечень профессий можно упорядочить по их сложности, по уровню квалификации, по разрядам и пр.

Порядковые шкалы часто употребляются в социологических исследованиях при опросах общественного мнения. Вот обычные наименования пунктов таких шкал: «вполне согласен», «пожалуй, согласен», «затрудняюсь ответить», «пожалуй, не согласен», «совершенно не согласен»; или: «уверен, что так», «думаю, что так», «затрудняюсь сказать», «думаю, что не так», «уверен, что не так» и т. п.

Ранговая, или порядковая, шкала устанавливает соотношение между выделенными признаками в соответствии с некоторым общим логическим основанием. Например, рассмотрим следующий фрагмент анкеты:

"Скажите, пожалуйста, помогло ли вам обучение на подготовительном отделении поступить в институт? "

· Да, подготовительное отделение дает хорошую подготовку и благодаря ему я поступил(а) в институт - 1

· Подготовительное отделение, безусловно, дает знания, но не очень хорошие, и их недостаточно для поступления в институт - 2

· В целом подготовительное отделение не дает хорошей подготовки, можно было поступить и без него - 3

Коды, проставленные справа, одновременно представляют собой ранги позиций вопроса альтернатив. С точки зрения эффективности подготовительного отделения для поступления в институт первая позиция более значима, чем вторая, а вторая более значима, чем третья. Но числовое обозначение альтернатив не позволяет нам утверждать, что первая позиция по крайней мере на треть значительнее, чем вторая, и на две трети, чем третья.

Хотя мы приписали позициям числовые коды – «1», «2» и «3», на самом деле с этими числами не все математические операции допустимы. Интервалы между позициями «на самом деле не равны».

Порядковое измерение не основано ни на какой стандартной для данной переменной единице и не позволяет установить, насколько далеко в терминах этой переменной отстоят друг от друга разные объекты. Оно лишь позволяет говорить, что у одних объектов данная переменная имеет большее или меньшее значение, чем у других.

· ранжирование (в ряд),

· группировка (ранжирование по группам),

· метод полярных профилей.

Ранжирование.

Часто употребляемая разновидность шкал порядкового типа - ранговые, которые предполагают полное упорядочение каких-то объектов: они располагаются в ряд по степени выраженности какого-либо качества.

Задание на ранжирование респонденту часто формулируется так: «Из перечисленных ниже суждений выберите самое для Вас предпочтительное, затем - наименее предпочтительное, а остальные расположите от первого к последнему».

При обработке данных шкала в цифровом выражении может быть «перевернута» в обратном порядке, т. е. последнему, низшему рангу можно приписать наименьшее числовое значение - 1, а первому - наибольшее.

Следует помнить, что численность объектов для ранжирования не может быть слишком большой, скажем - 15. В противном случае данные ранжирования крайне неустойчивы. При этом всегда более устойчивы первые и последние ранги (при повторных опросах опытных групп они обычно приписываются тем же объектам), а срединная зона, как правило, менее устойчива

Иногда необходимо ранжировать множество объектов, существенно больше 15. В таком случае можно прибегнуть к более трудоемкой для анализа, но более простой для респондента и более надежной процедуре ранжирования методом парных сравнений .

Ранжирование методом парных сравнений состоит в том, что предлагается попарно сопоставить предпочтительность объектов путем всех возможных их парных комбинаций.

Допустим, что у нас имеется 25 объектов, которые надо ранжировать по какому-то свойству. Сделать это непосредственно - психологически почти невыполнимая задача. Тогда предлагается рассматривать все возможные комбинации пар, и из каждой пары выбирать более предпочтительный объект, приписывая ему, например, балл +1. Затем все объекты ранжируются в соответствии с набранной суммой баллов. Естественно, может случиться, что одинаковые значения получат несколько объектов. Доказано, что результаты такого ранжирования весьма устойчивы.

Таким способом мы можем сопоставлять учащихся друг с другом по какому-то качеству. Например, если учащиеся признаются одинаковыми в отношении рассматриваемого свойства, то каждый получает по баллу. Если у одного этого качества больше, чем у другого, первый получает два балла, второй - 0 (как при спортивных играх по круговой системе). Суммируя полученные каждым баллы, получаем количественное выражение уровня развития данного качества у каждого учащегося (его ранг). В результате сравнения получается таблица следующего типа (табл.7.):

Таблица ранжирования методом парных сравнений

Следующим способом ранжирования является группировка всей совокупности объектов наблюдения в несколько рангов, достаточно ясно отличающихся друг от друга по степени измеряемого признака. Примеры: разделение учащихся согласно пятибалльной системе на отличников, хорошистов и т. д.; разбиение респондентов в результате анкетирования на группы «абсолютно согласных» с каким-либо утверждением, «скорее согласных», «скорее не согласных» и «категорически не согласных».

Частными случаями ранжирования являются методы рейтинга и метод полярных профилей . В первом приеме оценка объекта производится путем усреднения оценочных суждений группы компетентных экспертов. Имея общие критерии оценки (в порядковой шкале, в баллах), эксперты независимо друг от друга (в устной или письменной форме) выносят свои суждения. Усредненный результат экспертной оценки является достаточно объективным и называется рейтингом.

Метод полярных профилей предполагает применение для оценки условной шкалы, крайними точными которой являются противоположные значения признака (например, добрый - злой, теплый - холодный и т. п.). Промежуток между полюсами делится на произвольное количество частей (баллов). Например, оценка различных качеств учителя учениками дается в полярной шкале:

(Строгий) 10 - 9 - 8 - 7 - 6 - 5 - 4 - 3 - 2 - 1 (Совсем не строгий)

Операции с числами для порядковой шкалы следующие.

1. Числа поддаются монотонным преобразованиям: их можно заменить другими с сохранением прежнего порядка (поэтому ранговые шкалы являются порядковыми).

Так, вместо ранжирования от 1 до 5 можно упорядочить тот же ряд в числах от 2 до 10 или от (-1) до (+1). Отношения между рангами останутся неизменными. Это свойство важно в тех случаях, когда данные, измеренные шкалами с различным числом интервалов, приходится приводить к «общему знаменателю» , т. е. выражать в одной шкале с постоянной величиной заданных интервалов. При этом суммарные оценки по ряду ранговых шкал - допустимый и хороший способ измерять одно и то же свойство по набору различных индикаторов.

2. Для работы с материалом, собранным по упорядоченной шкале, можно использовать, помимо модальных показателей, поиск средней тенденции с помощью медианы (Me), которая делит ранжированный ряд пополам.

3. Наиболее сильный показатель для ранговых (порядковых) таких шкал - корреляция рангов (по Спирмену или по Кендаллу).

Ранговые корреляции указывают на потенциальное наличие или отсутствие связей в двух рядах признаков, измеренных ранговыми (порядковыми) шкалами.

Интервальное измерение предоставляет исследователю больше информации, чем порядковое или номинальное. Оно основано на представлении о существовании некоторой стандартной единицы измеряемого свойства.

Оно несет информацию о “расстоянии” между ними. Хороший пример такого рода – переменная доход (или возраст).

Если измерять возраст с помощью порядкового измерения, разделяя людей по их возрасту на такие категории, как моложе 20 лет, от 20 до 40 лет и т.д., мы сможем сказать, что у человека 1-й категории возраст меньше, чем у человека 2 категории и т.д., при этом «расстояние» между категориями мы выбрали в 20 лет и на самом деле не сможем сказать точно, насколько эти люди различаются по возрасту, так как не знаем, где именно находится человек внутри своей категории. То есть разницу в соотношении ответов в близких интервалах не всегда можно квалифицировать как содержательное различие.

Таким образом, шкала интервалов (иногда ее называют метрическая шкала равных интервалов ) представляет собой полностью упорядоченный ряд с одинаковыми интервалами между пунктами, причем отсчет начинается с произвольно избранной величины (нет «естественного нуля» на шкале). Она позволяет проводить более строгие математические операции с получаемой информацией. Главная трудность в построении таких шкал - обоснование равенства или разности дистанций между пунктами.

Чаще всего интервальную шкалу используют для снятия информации по четко фиксируемым количественными методами социальным характеристикам, например, по возрасту, зарплате, образованию, стажу работу и пр. Однако всегда возникает проблема, например, при оценке возраста, брать в качестве «цены» деления 5 или десять лет и т.п.

В целом, метрические шкалы в социально-педагогических исследованиях используются гораздо реже, чем порядковые.

Следует заметить, что неопытные исследователи принимают иногда за интервальную шкалу шкалы балльных оценок. Но это псевдометрическая шкала. Так, один из вариантов псевдошкалы с равными интервалами - «термометр общественного мнения». Это шкала, например, в 100 делений, где крайние точки (100 и 0) словесно интерпретируются как минимальное и максимальное одобрение. Например, «если вы категорически согласны с приведенным суждением, укажите свое положение на термометре как 100°», «если вы категорически не согласны, укажите 0°».

В действительности, нет оснований полагать, что лица, отметившие по термометру 35° и 42°, столь же различаются в своих оценках, как отметившие, скажем, 45° и 52°. Одни люди обладают высокой способностью дифференцировать свои оценки, а другие вовсе не могут различать нюансы. Данная шкала измеряет не что иное, как ранги, т.е. является упорядоченной номинальной или ранговой шкалой.

Числа в таких шкалах допускают линейные преобразования: у=ах+b.

Появляются новые возможности корреляционного и регрессионного анализа. Вместо рангового коэффициента можно использовать более чувствительный коэффициент парной корреляции по Пирсону и коэффициенты множественной корреляции.

Наконец, существует шкала пропорциональных оценок (идеальная метрическая ), которая напоминает шкалу равных интервалов, но с одним преимуществом: отсчет в этой шкале начинается не с произвольной точки, а с экспериментально установленного нулевого пункта.

Для таких шкал применимы решительно все операции с числами, так как можно определить, на сколько или во сколько данный пункт на шкале превышает другой. Подобные шкалы приняты в точных науках, где нулевой пункт экспериментально зафиксирован. Идеальные метрические шкалы успешно применяются для измерения некоторых физиологических и психических свойств человека. Точка отсчета определяется в этих случаях как порог восприятия и порог насыщения. Известно, например, что существует среднестатистический порог восприятия звуковых колебаний. То же относится и к некоторым психическим реакциям людей (например, порог различения сходных фигур).

В социально-педагогических исследованийх шкалы такого рода имеют весьма ограниченное применение. Ими пользуются для измерения протяженностей во времени и пространстве, для отсчета натуральных единиц (денежных единиц, продуктов деятельности, поступков). Во всех этих случаях нулевой пункт четко фиксируется.

Операции с числами для идеальных шкал не имеют никаких ограничений. Можно использовать все доступные математике операции с натуральными числами.

Когда речь идет о сравнении явлений, измерения номинального уровня – наименее полезный тип измерения.

Наша задача состоит в том, чтобы там, где это возможно и удобно, стремиться к операционализациям, позволяющим осуществлять измерение интервального уровня.

Естественно, не следует довольствоваться операционализацией, дающей номинальное измерение, когда теоретически оправданно и технически возможно порядковое или интервальное измерение.

Для этого на этапе построения теории мы должны прежде всего спросить себя, лежит ли в основе различий, наблюдаемых в отдельных случаях, некий континуум. Если да, то мы можем предложить для данного понятия порядковое или даже интервальное измерение, в противном случае в качестве измерения может выступать лишь номинальная шкала.

Восприятие шкал имеет свои особенности, которые надо учитывать исследователю.

Во-первых, размышляя о том, давать или не давать словесные наименования каждому элементу шкалы , надо помнить, что представление шкалы без наименований в общем неверно, поскольку респондент все равно осознанно или неосознанно переводит "голую" шкалу в шкалу с наименованиями, придавая то или иное словесное выражение ее элементам. Само по себе число не имеет содержательного значения. Оно существует в сознании человека только в некоторой смысловой определенности и находит выражение в конкретном контексте.

Во-вторых, большое значение имеет длина шкалы . В быту мы чаще всего оперируем трехбалльной шкалой. «Нравится ли Вам мой новый костюм?» - спрашиваем мы у приятеля, и, как правило, ответ легко укладывается в такую градацию: «понравился», «не очень понравился», «не понравился». Иногда добавляются две крайние позиции «очень понравился» или «очень не понравился». И только специалист-модельер может привести более дробные градации.

Применение той или иной шкалы имеет прежде всего содержательное, а не формальное значение. Иначе говоря, чем богаче содержание того или иного явления, тем тоньше должна быть шкала, тем больше градаций в ней должно заключаться. В школе при существующей пятибалльной системе оценок учителя фактически используют восьми-десятибалльную систему, вводя "нелегально" к оценкам плюсы и минусы и тем самым увеличивая общее количество баллов.

Необходимо учитывать также, насколько конкретный респондент способен воспринять многомерную шкалу. Восприятие зависит и от его общей культуры, и от уровня образования, и от умения аналитически мыслить, и от степени информированности, порога чувствительности и т.п.

В вопросах об оценках того или иного явления, в определении согласия с каким-то мнением и т.д. (наиболее распространенные вопросы в социально-педагогических опросах) наиболее хорошо себя зарекомендовали пятибалльные шкалы. Например, для ответа на вопрос: «Скажите, пожалуйста, насколько Вы устаете на занятиях в институте?» - лучше предлагать пятибалльную шкалу: «очень устаю»; «устаю, но не очень»; «немного устаю»; «практически не устаю»; «совсем не устаю».

При очень дробной шкале, когда респондент не может достаточно тонко оценить какое-то явление или определить отношение, происходит огрубление предлагаемой шкалы. Например, в десятибалльной шкале по изучению дружеских отношений в коллективе разница между девятой и десятой позициями редко воспринимается респондентами как существенная, также как и разница между первой и второй. Нередко респондент обводит общим кружком и первую, и вторую позиции или девятую и десятую, показывая тем самым, что не видит особых различий между ними.

Можно дать несколько общих советов по выбору измерительных шкал.

1) Приступая к разработке шкалирования, следует продумать, какие явления, свойства и объекты реально варьируют по их интенсивности, распространенности, состояниям выраженности, а какие могут быть фиксированы лишь на качественном уровне.

2) Определяя тип шкалы, нужно соизмерять его не только с природой объекта, но и с целями исследования и возможностями последующего количественного анализа: излишняя квантификация - напрасная трата усилий, недостаточная - упущенные возможности более обстоятельного изучения объекта.

3) Лучше опираться на достоверные и менее детальные сведения, чем на детальные и малодостоверные: отсюда - указания к выбору приемлемого типа шкал и дробности их метрики.

4) Самое главное состоит в том, что количественный анализ не самоцель, но лишь средство качественного : качественный анализ предшествует квантификации, качественным анализом завершается изучение количественных распределений и связей.

Количественный анализ данных может вводить в заблуждение, если ему не предшествовала тщательная проверка валидности и надежности разработанного инструментария.

Ошибки появляются при измерении всегда, но большое их число может привести в конце концов к ошибочным выводам.

Существует несколько основных источников ошибок измерения:

1) Если характер ответов сильно зависит, скажем, от интеллектуального уровня респондента или от его осведомленности в определенных вопросах.

2) Если ответы на вопросы зависят от настроения или состояния здоровья отвечающего.

3) Если вопросы сформулированы неоднозначно, и респонденты могут дать им разные интерпретации

4) Различия в условиях проведения измерения (например, может влиять пол и возраст интервьюера и т.п.)

5) Ошибки и неоднозначности в инструкциях по применению конкретного инструмента.

6) Ошибки кодировки, ввода данных в компьютер.

Различные ошибки, происходящие из перечисленных источников, обычно подразделяются на систематические и случайные. Систематические ошибки – это ошибки, которые появляются каждый раз, когда используется данный инструмент, и постоянно сопутствуют объектам и исследованиям, в которых используется данное измерение.

Случайные ошибки обусловлены преходящими характеристиками объектов, ситуационными различиями, ошибками в проведении измерения и обработке данных и другими факторами.

Как же избежать такого потенциально разрушительного воздействия на наши результаты ошибок измерения, чтобы оно не превратилось в бесполезное или ошибочное? Чтобы ответить на этот вопрос, необходимо рассмотреть такие понятия как валидность и надежность измерения и обсудить проблемы их обеспечения.

Термин валидность используется для обозначения степени соответствия измерений понятиям, которые эти измерения должны отражать . Интересоваться валидностью измерения – то же самое, что интересоваться, действительно ли с помощью данного измерения мы измеряем то, что предполагали измерять. Обеспечение валидности - одна из основных проблем, связанных с измерениями в социально-педагогических исследованиях.

Чтобы быть валидным, измерение должно быть исчерпывающим и полным. Обеспечение этих свойств происходит на этапе операционализации основных понятий: именно на этом этапе надо позаботиться о полноте. Получение уместных и относительно полных операционализаций зависит как от хорошего знания объекта нашего исследования, так и от осуществления тщательного логического анализа альтернативных операционализаций.

Процесс оценки валидности измерений называется валидизацией.

Существует несколько видов валидизации:

1) в прагматической валидизации мы сверяем результаты, полученные с использованием нашего инструментария, с результатами, полученными путем использования какого-то другого показателя, признанного в качестве валидного измерения соответствующего понятия;

2) внутренняя конструктная валидизация предполагает соотнесение нашего показателя с несколькими другими показателями для того же самого понятия, использующего множественные показатели;

3) внешняя валидизация заключается в соотнесении нашего показателя с показателями для других понятий, с которыми измеряемое понятие теоретически должно быть связано.

Все данные способы валидизации имеют один «маленький недостаток»: проверить валидность наших измерений можно лишь после того, как собраны данные.

С одной стороны, это говорит о необходимости специальных «пилотных» исследований до проведения основного эксперимента, целью которых должна быть апробация разрабатываемого исследовательского инструментария, определение его валидности и надежности.

С другой стороны, поскольку в педагогических исследованиях часто мы не располагаем возможностью проводить такие специальные исследования, особую значимость приобретает так называемая «очевидная валидизация» - признание валидности, исходя из непосредственной очевидности показателя. По сути она сводится к теоретическому обоснованию, к убеждению научного сообщества в том, что это валидный показатель для рассматриваемого понятия.

Когда говорят о надежности измерения, имеют в виду устойчивость получаемых с его помощью значений (воспроизводимость результатов при повторном наблюдении или на другой аналогичной выборке).

Если при неоднократном применении некоторого измерения один и тот же объект не получает одного и того же значения, это измерение является ненадежным показателем соответствующего понятия.

Заметим, что измерение может быть надежным, не будучи валидным, но не может быть валидным, не будучи надежным. Если измерение валидно, оно должно быть надежно.

Чтобы предотвратить угрозу ненадежности, следует продумывать реальный процесс измерения и проводить предварительное тестирование инструментов измерения для выявления возможных причин случайных ошибок.

Существует три типа методов установления надежности измерений:

1) метод неоднократного тестирования;

2) одно и то же измерение применяется к разным группам объектов;

3) метод подвыборки. Этот метод заключается в том, что, сформировав выборку из объектов, мы делим ее на несколько подвыборок таким образом, чтобы все они были похожи друг на друга. Затем мы применяем одно и то же измерение ко всем подвыборкам и используем сходство или различие результатов для подвыборок как показатель надежности измерения.

Надежность измерений, как и валидность, важно установить до того, как будет начат основной эксперимент. Это требует предварительного тестирования измерения посредством сбора данных, предназначенных исключительно для оценки инструментов, которые будут использоваться в самом исследовании. Предварительное тестирование валидности и надежности измерения не обязательно только в том случае, если в исследовании используются измерения, которые были где-то убедительно валидизированы, что отражено в соответствующих публикациях.

Задания и вопросы.

1. Рассмотрите приведенные ниже примеры вопросов и установите для каждого тип использованной шкалы. Предложите, где возможно, преобразования, переводящие шкалы на «более высокий уровень».

1. Какую литературу Вы чаще всего читаете?

2. Учебную, специальную

3. Научно-популярную

4. Художественную

5. Политическую

6. Социально-экономическую

1. К какой группе профессий Вашего завода Вы относите себя:

2. рабочие ручного труда, не требующего специальной подготовки;

3. рабочие ручного труда высокой квалификации;

4. рабочие, занятые на механизированном оборудовании, средней квалификации;

5. рабочие механизированного труда высокой квалификации;

6. автоматчики без навыков наладки;

7. пультовики-наладчики.

1. По какой причине Вы уводились с работы?

2. не устраивал заработок;

3. неудобная сменность;

4. плохие гигиенические условия труда;

5. неинтересная работа.

2. Обоснуйте размер той выборки, на которой Вы собираетесь проводить эксперимент. Какова должна быть численность экспериментальной и контрольной группы, чтобы прогнозируемые Вами различия были статистически достоверны?

3. Найдите в литературе, в интернете минимально достаточные сведения о понятиях нулевой гипотезы, достоверности различий в экспериментальной и контрольной группах, статистических критериях для определения достоверности различий.

4. Как Вы собираетесь проверять валидность и надежность инструментов количественного измерения? Какое пилотное исследование будет необходимо Вам спланировать?

5. Как Вы думаете собирать и обрабатывать данные (вручную, на компьютере, с использованием каких программ, с помощью специалистов и т.п.)?

КАТЕГОРИИ