4.2. Табулирование и представление диагностических данных

До анализа и интерпретации количественных данных, полученных в результате проведенных диагностических процедур, необходимо их обобщить. В таблице 2 приводятся результаты тестирования знаний учащихся по определенному учебному предмету. Отметки в баллах проставлялись в алфавитном порядке так, как записаны в классном журнале. Однако в подобной форме представление результатов тестирования не слишком удобно для анализа. Поэтому необходимо эти данные представить так, чтобы можно было проследить определенную логику и закономерность как в числовом ряде, так и в процессе усвоения знаний учащимися. Для этого в прикладной математической диагностике существуют четко разработанные правила обработки и представления конечного результата.

Таблица 2

Результаты тестирования знаний учащихся по математике

№ п/п Учащийся Оценка   № п/п Учащийся Оценка
1 Андреев И. 90   20 Лаврентьева Ю. 80
2 Авдеева О. 66   21 Леонтьев С. 75
3 Афанасьев Н. 106   22 Левшов Д. 75
4 Борисов Ю. 84   23 Максимов Ю. 51
5 Баринова Н. 105   24 Минашкина Е. 109
6 Ворошилов А. 83   25 Музыкова Л. 89
7 Володин Е. 104   26 Николаев В. 58
8 Викторова Е. 82   27 Орлова Н. 59
9 Владимирова С. 97   28 Петрова З. 72
10 Гаврилов Н. 97   29 Потапов Д. 74
11 Гончарова Ф. 59   30 Романова Е. 75
12 Головина С. 95   31 Смирнов В. 81
13 Данилов М. 78   32 Столяров Ю. 71
14 Дмитриева Н. 70   33 Тихонова Л. 68
15 Ершов И. 47   34 Шашков И. 112
16 Емельянова Е. 95   35 Юнусова Т. 62
17 Иванов Ю. 100   36 Юлдашев Г. 91
18 Казаков К. 69   37 Яковлева Л. 93
19 Костина Е. 44   38 Яковлев Д. 84

70

Первый этап представления данных - это их ранжирование, т.е. упорядочивание оценок по величине от максимальной до минимальной. В таблице 3 рассматриваются те же оценки 38 учеников, что и в таблице 2, но упорядоченные по убыванию от 112 (самого высшего) до 44 (низшего). Теперь будет нетрудно заметить, кто из учеников какой ранг занимает. Но, вероятно, могут иметь место и равные оценки, в особенности при сопоставлении учащихся нескольких классов. Так, в нашем примере два ученика получили по 97 очков. Поскольку в данном случае нельзя утверждать, что один ранг выше другого, мы обязаны приписать им одинаковые ранги. Так как существует шесть учеников, ранг которых выше (1, 2, 3, 4, 5, 6), то следующие два ранга, 7 и 8, усредняются, что дает 7,5. Точно так же среднее рангов 9 и 10 составит 9,5 и т.д. Есть три ученика с оценкой 75 и 21 ученик, ранг которых выше; среднее следующих трех рангов (22, 23 и 24) равно 23, что дает ранг для каждой оценки 75. Кроме того, для определения рангов требуется много времени и сил, список получается длинным, громоздким и неудобным для сравнения с другими классами, большими или меньшими: ранг 19 в классе из 38 учеников будет хуже, чем в классе с бо́льшим числом учащихся.

Второй этап - выявление распределения частот. Этот список можно сократить, классифицируя оценки по распределению частот, иногда называемому просто распределением. Третий и четвертый столбцы таблицы 3 показывают простейший вид распределения. Различные оценки размещаются по величине, в данном случае от 112 до 44, а справа от каждой оценки указывается число ее повторений. Каждое число справа называется частотой и обозначается f а сумма частот обозначается п.

Третий этап- распределение сгруппированных частот. Для большого числа оценок - скажем 100 или более - на следующем этапе может иметь смысл обобщение данных. Как правило, существует настолько широкий диапазон оценок, что целесообразнее сгруппировать их по величинам, например в группы, объединяющие все оценки от 105 до 109 включительно, от 110 до 114 включительно и т.д. Каждая такая группа называется разрядом оценок. В случае полного размещения по группам обычно говорят о распределении сгруппированных частот. Хотя и не существует четкого правила выбора количества разрядов, предпочтительнее образовывать не менее 12 и не более 15 разрядов. Иметь менее 12 разрядов рискованно из-за возможного искажения результатов, в то время как наличие более 15 разрядов затрудняет работу с таблицей.

Четвертый этап - построение распределения сгруппированных частот. Этот процесс построения обычного распределения сгруппированных частот складывается, в свою очередь, еще из четырех этапов. Они показаны в таблице 4, использующей оценки таблицы 2.

71

Таблица 3

Оценки диагностического исследования из таблицы 2, упорядоченные по величине, проранжированные и протабулированные

Убывающая последовательность Ранг Табулирование без последующего группирования
Оценка Частота
112     1 112 1 Сумма = 19
109     2 109 1
106     3 106 1
105     4 105 1
104     5 104 1
100     6 100 1
97 7,5 97 2
97 7,5 95 2
95 9,5 93 1
95 19,5 91 1
93     11 90 1
91     12 89 1
90     13 84 2
89     14 83 1
84 15,5 82 1
84 15,5 81 1
83     17       Середина частот
82     18 80 1 Сумма = 19
81     19 78 1
80     20 75 3
78     21 74 1
75 23 72 1
75 23 71 1
75 23 70 1
74     25 69 1
72     26 68 1
71     27 66 1
70     28 62 1
69     29 59 2
68     30 58 1
66     31 51 1
62     32 47 1
59 33,5 44 1
59 33,5        
58     35   n = 38 = 19 + 19
51     36        
47     37        
44     38        

72

Таблица 4

Иллюстрация процесса построения и распределения сгруппированных частот

Исходные оценки (из табл. 2) Этапы построения распределения
90
66
106
84

Этап 1. Определение размаха
Самая высокая оценка112
Самая низкая оценка 44
Размах = Разность + 1 = 68 + 1 = 69

105
83
104

82
97
97
59
95
78
70

Этап 2. Выбор интервала разрядов
69 : 12 = 5,75 наибольший возможный разрядный интервал
Округляем с уменьшением до 5
69 : 15 = 4,60 наименьший возможный разрядный интервал
Округляем с увеличением до 5

47

Этапы 3 и 4. Определение границ разрядов и табулирование

95
100
Внутренние численные границы 15 разрядов Подсчет Частота (t)
69
44
80
75
75
51
109
89
58
59
72
74
75
81
71
68
112


110 - 114
105 - 109
100 - 104
95 - 99
90 - 94
85 - 89
80 - 84
75 - 79
70 - 74
65 - 69
60 - 64
55 - 59
50 - 54
45 - 49
40 - 44


1
111
11
1111
111
1
111111
1111
1111
111
1
111
1
1
1


1
3
2
4
3
1
6
4
4
3
1
3
1
1
1
62
91
93
84
    n =38

73

1. Определение общего размаха внутри всей выборки, который равен разности между максимальной и минимальной оценками плюс единица. Из имеющихся оценок максимальная равна 112, минимальная - 44, что дает размах (112 - 44) + 1 = 69. Фактически считают, что 112 покрывается единичным интервалом оценок 112,5 - 111,5, а 44 - интервалом 44,5 - 43,5. Заметим далее, что размах равен 69 [(112 - 44) + 1, или 112,5 - 43,5]. Однако реальные границы оценок не всегда являются дробными. Если возраст исчисляется от последнего (самого недавнего) дня рождения, то лица, объявившие себя 44-летними (т.е. еще не 45-летними), находятся в интервале 44,00 - 44,99... (почти, но не совсем 45,00), середина которого 44,5. Если они называют возраст относительно ближайшего дня рождения, интервал составляет 43,5 - 44,5 со средним 44. Аналогично, если они представляют себя приближающимися к 44, то интервал равен 43,00 - 43,99... со средним 43,5. Между самым "юным" из "приближающихся к 44", который только что достиг возраста 43 лет, и самым "старым" представителем "44-го последнего дня рождения", которому почти 45, будет наблюдаться разница приблизительно в два года. Спрашивая просто о возрасте без точного определения системы счета, мы не в состоянии точно интерпретировать результаты.

2. Выбор интервала группирования разрядов, представляющего собой ширину разрядов, по которым должны быть классифицированы оценки, должен производиться таким образом, чтобы разрядов было не менее 12, но и не более 15. Для этого разделим диапазон на 12 и найдем наибольший возможный класс или интервал разряда оценок. Разделим диапазон на 15 и найдем наименьший возможный интервал разряда (см. табл. 4). Так как использовать любой нецелый интервал неудобно, то наибольшее число округляется с уменьшением до 5, а наименьшее - с увеличением до 5, хотя и интервал 6 обеспечил бы 12 разрядов для этих 38 оценок.

Интервал с шириной, определяемой нечетным числом, например 5, с целочисленным средним значением, если границы разряда дробные (оканчивающиеся на 0,5), обычно предпочитают интервалу с четной шириной, но дробными средними, когда границы разряда дробные. Середина разряда 110 - 114, содержащего пять оценок: 110, 111, 112, 113 и 114, равна 112 (т.е. 110 + [(114 - 110) : 2] = 110 + 2 = 112). Другой способ определения середины интервала состоит просто в усреднении зафиксированных границ интервала: (110 + 114) : 2 = 112. Если бы использовался разряд шириной 6 с границами оценок, например 108 - 113, то середина этой группы, определяющейся четным числом, составила бы 110,5, что могло бы привести в итоге к более сложному счету. Следовательно, интервал 5 предпочтительнее интервала 6, когда границы разряда дробные.

74

3. Определение границ разрядов. Разумеется, надо образовать достаточное количество разрядов для включения самой высокой и самой низкой оценок. Для этого начинайте табулирование всегда с величины, кратной разрядному интервалу. Если самый низкий разряд начать с 40, кратного 5, он включит самую низкую оценку 44. А если начать с 45, то он не включит 44. Следующий разряд будет начинаться с 45, затем с 50 и т.д. до тех пор, пока самая высокая оценка 112 не попадет в разряд 110 - 114.

4. Табулирование. Подсчет ведется для каждой оценки против разряда, в который она попадает. Для табулирования нет необходимости в упорядочении оценок, так как последнее может потребовать больше времени, чем само табулирование. В первоначальном алфавитном списке первая оценка 90. В столбце таблицы против разряда, начинающегося с 90, для регистрации оценки делается черточка. Следующая оценка - 66. Она попадает в разряд, который начинается с 65, так что черточка делается там. Аналогично результаты подсчета помещаются в столбце против соответствующего разряда для всех прочих оценок.

В итоговой таблице не приводятся этапы, в результате которых она была получена. В простейшей форме распределения частот есть только два столбца. В первом приводятся разряды, обычно расположенные в убывающем порядке сверху вниз, а второй содержит частоты - число оценок в каждом разряде.

Когда нужно сравнить две или более выборок, обычно хорошо поместить все данные в такую же таблицу. В этом случае будет один столбец для разрядов, в который сгруппированы оценки, и по одному для каждой из сравниваемых, скажем школ или классов. В таблице 5 приведены распределения частот, обобщающие отчеты шести школ. Количество интервалов группирования меняется от 9 для школы Е до 17 для школ А и Г, хотя для некоторых интервалов нет данных.

Графическое представление распределения частот. Обычное распределение частот не дает вполне ясной картины. Существуют три общих метода графического представления распределения оценок: гистограмма, или столбиковая диаграмма, полигон распределения и сглаженная кривая.

Гистограмма - это последовательность столбцов, каждый из которых опирается на один разрядный интервал, а высота его отражает число случаев, или частоту, в этом разряде.

На рисунке 1 показана гистограмма, или столбиковая диаграмма, представляющая распределение 83 учащихся по коэффициенту интеллекта IQ (диаграмма отражает распределение показателей 16 учащихся, имеющих наибольший коэффициент IQ).

Полигон распределения. Построение полигона распределения во многом напоминает построение гистограммы. В гистограмме каждый столбец заканчивается горизонтальной линией, причем на

75

Таблица 5

Результаты тестирования знаний учащихся по математике для всех шести школ в одном городе

Оценки А Б В Г Д Е Все шесть школ
120 - 124       1     1
115 - 119              
110 - 114     1       1
105 - 109     3   2 2 7
100 - 104   3 2 2 5 3 15
95 - 99   6 4 4 4 5 23
90 - 94 5 2 3 5 6 10 31
85 - 89 4 4 1 4 4 1 18
80 - 84 2 3 6 6 4 8 29
75 - 79 10 5 4 4 1 2 26
70 - 74 6 2 4 7 6 4 29
65 - 69 9 4 3   4 1 21
60 - 64 4 5 1 2 1   13
55 - 59 1   3   1   5
50 - 54 1   1       2
45 - 49 1   1       2
40 - 44     1 2 2   5
35 - 39   1 1       2
30 - 34   2         2
25 - 29   1         1
20 - 24              
15 - 19              
10 - 14 1           1
N (число учащихся) 44 38 39 37 40 36 234

высоте, соответствующей частоте в этом разряде. А в полигоне он заканчивается точкой над серединой своего разрядного интервала на той же высоте. Далее точки соединяются отрезками прямых (рис. 2).

Сглаженная кривая. Иногда вместо гистограммы или полигона строят сглаженную кривую. Единственная разница состоит в том, что сглаженная линия проводится по точкам настолько близко, насколько это возможно, а для других двух фигур используются линии с острыми углами или зубцами (рис. 3).

Как правило, особенно для малых групп, где чаще всего встречаются неравномерности, лучше пропустить некоторые точки, чтобы получить плавную и правильную кривую; но следует позаботиться о том, чтобы оставить приблизительно одинаковое количество точек по обе стороны кривой. Тогда линия будет как можно лучше сглаживать отклонения точек.

76

Рис. 1. Гистограмма, или столбиковая диаграмма, представляющая распределение 83 IQ учащихся небольшого колледжа
Рис. 1. Гистограмма, или столбиковая диаграмма, представляющая распределение 83 IQ учащихся небольшого колледжа
Рис. 2. Полигон распределения (ломаная линия) коэффициента интеллекта 83 учащихся колледжа
Рис. 2. Полигон распределения (ломаная линия) коэффициента интеллекта 83 учащихся колледжа

Нет сомнений в том, что графическое представление педагогических данных является ценным дополнением к статистическому анализу и обобщению. График или диаграмма имеет целью привлечь внимание читателя, потому что этот способ показывает процесс в динамике. Один маленький график порой больше проясняет суть дела, чем дюжина таблиц или написанных параграфов. Действительно, статистики часто немы, таблицы нередко молчаливы, и только график громко заявляет о своей миссии. Обычно количественные данные совершенно абстрактны. Рисунок или график дает более конкретное представление о существе вопроса.

77

Рис. 3. Сглаженная кривая полигона распределения коэффициента интеллекта 83 учащихся колледжа
Рис. 3. Сглаженная кривая полигона распределения коэффициента интеллекта 83 учащихся колледжа

Вопросы и задания для самоконтроля

  1. Какие измерительные шкалы могут применяться в педагогической диагностике?
  2. Расскажите, как осуществляется процесс табулирования полученных диагностических данных.
  3. В каком виде нужно представить количественные данные как конечный результат диагностических исследований?

78

Rambler's Top100
Lib4all.Ru © 2010.