На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


Курсовик Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.

Информация:

Тип работы: Курсовик. Предмет: Математика. Добавлен: 23.07.2009. Сдан: 2009. Уникальность по antiplagiat.ru: --.

Описание (план):


2
Статистические распределения и их основные характеристики
План
    1. Вариация признаков в совокупности и значение её изучения
      2. Основные характеристики и графическое изображение вариационного ряда
      3. Показатели центра распределения
      4. Показатели колеблемости признака

1. Вариация признаков в совокупности и значение её изучения

Составной частью сводной обработки данных статистического наблюдения является построение рядов распределения. Цель его - выявление основных свойств и закономерностей стат. совокупности.

Различают два типа рядов распределения:

атрибутивный;

вариационный.

Ряды распределения, построенные по качественным признакам, называют атрибутивными. (Например, распределение население по полу, характеру труда, национальности и т.д.)

Ряды распределения, построенные по количественному признаку называются вариационными. Числовые значения признака - вариантами.

Например, себестоимость 1 кВт/ч электроэнергии по различным тепловым станциям:

Станции
1
2
3
4
5
с/с 1кВт/ч руб
0,58
0,66
0,59
0,67
0,66
Здесь представлены четыре варианты признака в пределах от 0,58 до 0,67 руб. Колебания себестоимости 1 кВт/ч электроэнергии на различных ТЭЦ обусловлены различными факторами, часто действующими в противоположных направлениях (например, снижение уд. расхода топлива ведёт к снижению себестоимости 1 кВт/ч, а повышение цен на топливо - к увеличению себестоимости). В результате совместного действия многих факторов складывается величина собственности 1 кВт/ч на отдельных ТЭЦ.
Изучение характера и степени вариации признаков и отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Данные о стоимости 1 кВт. ч электроэнергии по 5 ТЭЦ образуют так называемый первичный ряд. При наличии достаточно большого количества вариантов значений признака первичный ряд становится труднообозримым и непосредственное рассмотрение его не дает представления о распределении единиц по величине признака в совокупности. Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов ряда в возрастающем (или убывающем) порядке x1 x2… xi… xn.
В нашем примере ранжированный ряд имеет вид:
1
3
2
5
4
0,58
0,59
0,66
0,66
0,67
Рассматривая первичный ряд можно видеть, что варианты признака у отдельных единиц совокупности повторяются.
Число повторений отдельных вариантов называют частотой (обозначим ѓ)
Сумма частот, равная объему изучаемой совокупности - n.
По характеру вариации различают дискретные и непрерывные признаки.
Дискретные признаки отличаются друг от друга на некоторую конечную величину, т.е. даны в виде конкретных чисел. (Например, число детей в семье).
Непрерывные признаки могут отличаться друг от друга на сколь угодно малую величину и в определенных границах принимать любые значения. Например, зарплата рабочих, % выполнения.
Способы построения вариационного ряда для этих видов признаков различны. Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все встречающиеся варианты значений признака (xi), а затем подсчитать частоту повторений каждого варианта ѓi. (Например, распределение студентов по успеваемости и т.п.)
Ряд распределения принято оформлять в виде таблицы, например, распределение рабочих участка по квалификации.
Таблица 1.
Тарифный разряд рабочего (xi)
Число рабочих, имеющих этот разряд (ѓi)
Частости
(i)
Накопление частоты (Si)
1
2
3
4
2
1
0,05
1
3
5
0,25
6
4
8
0,40
14
5
4
0, 20
18
6
2
0,10
20
Итого
20
1,00
Таким образом, ряд первичных данных, характеризующих квалификацию двадцати рабочих, заменен коротким рядом, состоящим из 5 групп. Вместо абсолютного числа рабочих, имеющих определенный разряд, можно установить долю рабочих этого разряда.
Частоты, представленные в относительном выражении, называют частостями (выражаются в долях единиц или %, обозначаются i).
В случаях, когда число вариантов дискретного признака велика, а также при анализе вариации непрерывного признака строятся интервальные ряды распределения.
Интервал указывает пределы значений варьирующего признака и обозначаются нижней и верхней границами интервала. Такие распределения наиболее распространены в практике статистической работы.
При построении интервальных рядов необходимо прежде всего установить число групп (интервалов). Для этого нужно определить величину интервала (h). Для построения вариационного ряда с равными интервалами следует:
определить размах вариации (R) - разность между максимальным и минимальным значением признака:
R = x max - x min;
Размах вариации делится на число групп k, т.е. . Число групп приблизительно определяется по формуле Стерджесса
k 1+3,322 lg n,
где n - число изучаемых единиц совокупности. Это выражение, почти всегда дробное число, округляем до целого.
Величина интервала должна определяться в соответствии с точностью данных наблюдения: если исходные данные представлены целыми числами, то и величина интервала округляется до ближайшего целого числа.
Далее можно определить границы всех интервалов ряда распределения. Нижнюю границу I-го интервала можно принять равной минимальному значению признака.
При построении интервальных рядов для непрерывных признаков имеет место совпадение верхних границ предшествующих интервалов и нижних границ следующих за ними интервалом. В какой интервал относить единицы совокупности.
Рассмотрим пример построения ряда распределения по данным о среднегодовой стоимости основных фондов 20 предприятий главка одного министерства (млн. рублей): 3,7; 4,3; 6,7; 5,6; 5,1; 8,1; 4,6; 5,7; 6,4; 5,9; 5,2; 6,2; 6,3; 7,2; 7,9; 5,8; 4,9; 7,6; 7,0; 6,9.
Определяем количество групп вариационного ряда:
k 1+3,322 lg 20 = 1+3,322*1,3015,32=5 (групп).
Величина интервала млн. руб.
В результате группировки получим ряд распределения предприятий по среднегодовой стоимости основных фондов.
Таблица 2.
Среднегодовая стоимость ОФ, млн. руб.
Число предприятий
Накопление частоты
3,7 - 4,6
2
2
4,6 + 5,5
4
6
5,5 + 6,4
6
12
6,4 + 7,3
5
17
7,3 + 8,2
3
20
Значения признака у отдельных единиц совпала с границами интервала (3,7; 4,6 и 6,4). Так как x min = 3,7 и совпадает с нижней границей I_го интервала и включается в этот интервал, то и другие значения следует включать в интервал, нижняя граница которого совпадает с указанным значением (4,6 - включается во II_й интервал, а 6,4 - в IV-ый).
Если приведенный вариационный ряд с неравными интервалами, то для правильного представления о характере распределения необходимо рассчитать абсолютную и относительную плотности распределения.
Абсолютная плотность:

;
Относительная плотность:


Эти показатели необходимы для преобразования интервалов изменения оценки данных, собранных по различным совокупностям и по разному обработанных.
Например, по двум предприятиям известно распределение рабочих по проценту выполнения норм выработки.
Таблица 3.
Завод 1
Завод 2
Группы рабочих
Кол-во рабочих,
% к итогу
Группы рабочих
Кол-во рабочих,
% к итогу
До 90
2
До 100
8
90-100
3
100-120
40
100-110
50
120-150
20
110-120
30
150-180
15
120-140
8
180 и выше
17
140-150
5
150-160
2
ИТОГО
100
100
Воспользуемся укрупнением интервалов для перегруппировки данных.
Таблица 4.
Группы рабочих по проценту выполнения норм выработки
Количество рабочих,% к итогу
Завод 1
Завод 2
До 100
5
8
100-120
80
40
120-150
13
20
150 и выше
2
32
ИТОГО
100
100
Можно воспользоваться и другой группировкой по проценту выполнения норм выработки, например, выделить такие интервалы:
Группы рабочих
1
2
3
4
5
% выполнение нормы выработки
До 100
100-110
110-120
120-140
140-160
Для такой группировки возникает необходимость расширения ряда распределения рабочих Завода 2.
Если известна относительная плотность распределения, то частости соответствующего интервала можно определить: произведение плотности на величину интервала.
i=m0ih.
По данным таблицы 3 определяем плотности распределения группы рабочих по проценту выполнение норм выработки для интервалов:
ІІ - го: 100-120 m02=2,0 (40/20)
ІІІ - го: 120-150 m03=2/3 (20/30)
IV - го: 150-180 m04=1/2 (15/30)
Тогда количество рабочих (% к итогу) Завода 2, выполняющих норму на 140_160% определяются так:
2/310+1/210=12.
Результаты перегруппировки представлены в таблице 5.
Таблица 5.
Группы рабочих по проценту выполнения норм выработки
Количество рабочих,% к итогу
Завод 1
Завод 2
До 100
5
8
100-110
50
20
110-120
30
20
120-140
8
13
140-160
7
12
160 и выше
-
27
ИТОГО
100
100

2. Основные характеристики и графическое изображение вариационного ряда

Для целей анализа и сравнительной характеристики различных рядов распределения применяются обобщающие показатели вариационного ряда. Систему показателей рассмотрим на примере.

Допустим, что по 5 производственным участкам известны данные о распределении 100 рабочих по квалификации (табл.6).

Таблица 6.

Разряд рабочих
Число рабочих участка
I
II
III
IV
V
2
20
-
10
1
5
3
60
20
20
9
10
4
20
60
40
80
6
5
-
20
20
9
15
6
-
-
10
1
10
Итого
100
100
100
100
100
Распределения рабочих І-го и ІІ-го участков, имеют одинаковый размах вариации и характер распределения частично отличаются: величиной варьирующего признака, т.е. центром группирования.
Среднее квадратическое отклонение показывает также как расположена основная масса единиц совокупности относительно средней арифметической. В соответствии с теоремой Чебышева можно утверждать, что независимо от формы распределения 75% значений признака попадают в интервал ; а по крайней мере 89% всех значений попадают в интервал
Необходимо отметить, что если при расчете арифметической для достаточно симметричного ряда распределения м/д не оказывают существенного влияния на ее отклонение от средней арифметической, рассчитанной по первичным данным, то при расчете дисперсии этот факт приводит к появлению систематической ошибки.
В.Ф. Шеппард установил, что ошибка в дисперсии, вызванная применением сгруппированных данных при расчете составляет 1/12 квадрата величины интервала, т.е. скорректированная дисперсия равна
І группа обобщающих показателей - характеристика центра группирования в качестве которых используют: среднюю арифметическую,
моду;
медиану.
Распределение рабочих ІІ-го и ІІІ-го участков имеют один и тот же центр группирования и симметричное расположение частот вокруг него, но отличаются пределами вариации.
ІІ группа - показатели степени вариации - т.е. характеристика колеблемости признака.
Распределение рабочих ІІІ-го и IV-го участков имеют и тот же центр группирования, пределы варьирования признака, симметричный характер ѓ расположения частот, но имеют разную степень вытянутости вдоль оси ординат, которая характеризуется показателями эксцесса.
Распределение рабочих IV-го и V-го участков показывает, что они отличаются характером распределения частот относительно центра. Для IV-го участка оно симметрично, для V-го участка оно не симметрично.
Степень отклонения от симметричной формы характеризуется показателями асимметрии.
ІІІ группа показателей - показатели формы распределения.
Графическое изображение рядов расширения облегчает их анализ и позволяет судить о форме распределения. Для графического изображения дискретного ряда применяют полигон распределения. На оси абсцисс отмечают точки, соответствующие величине варианты признака. Из них восстанавливаются перпендикуляры, высота которых - частости этих вариантов. Вершины перпендикуляров соединяются отрезками прямых. Крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление от xmax и xmin.
Для графического изображения интервальных вариационных рядов применяется гистограмма.
Она строится так, что на оси абсцисс откладываются равные отрезки, которые соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (частостям) интервала.
По данным табл.1 построим полигон распределения.
f

8
7
6
5
4
3
2
1
1
2
3
4
5
6
7
x
По данным табл.2 построим гистограмму ряда распределения предприятий по стоимости основных фондов.
f
6
5
4
3
2
1
3,7
4,6
5,5
6,4
7,3
8,2
Гистограмма может быть преобразована в полигон распределения, для чего середины верхних сторон прямоугольников соединяют отрезками прямых. Две крайние точки прямоугольников замыкаются по оси абсцисс на середины интервалов, в которых частоты равны 0.
При увеличении числа наблюдений совокупности увеличивается число групп интервального ряда, что соответственно приводит к уменьшению величины интервала. При этом ломанная линия будет иметь тенденцию превращения в плавную кривую, которую называют кривой распределения. Она характеризует в обобщенном виде вариацию признака и распределение частот внутри однокачественной совокупности.
В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулянта). Построим кумулятивную кривую по данным табл.2 о распределении банков по размеру прибыли. Накопленные частоты рассчитаны в графе 3 табл.2.
При построении кумулянты интервального ряда распределения нижней границе первого интервала соответствует частота, равная 0, а верхней границе - вся частота данного интервала. Верхней границе второго интервала соответствует накопленная частота, равная сумме частот первых двух интервалов и т.д.
< и т.д.................


S
20
16

Перейти к полному тексту работы



Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.