На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Корреляционный анализ

Информация:

Тип работы: курсовая работа. Добавлен: 13.05.2012. Сдан: 2011. Страниц: 10. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Федеральное агентство по образованию РФ
Казанский государственный архитектурно-строительный университет 
 
 
 
 
 
 
 

      Кафедра экономики и предпринимательства  в строительстве 
 
 
 
 
 

 
 
 
 

КУРСОВАЯ  РАБОТА
по дисциплине «Статистика»  
 
 
 
 
 
 
 
 
 

                                                                         Выполнила: студентка гр. 11-206
                                              Саитова Л.Ф.
                                                               Проверила: Харисова Г. М.   
 
 
 
 
 

Казань 2010
 

        Содержание 

      Корреляционный  анализ
       1.1. Построение рядов распределения по факторному и результативному признакам
       1.2. Построение корреляционной таблицы
       1.3. Расчет эмпирической линии регрессии
       1.4. Расчет теоретической линии регрессии
       1.5. Построение исходной, теоретической и эмпирической линии регрессии
       1.6. Измерение тесноты связи
       1.7. Проверка правильности гипотезы о прямолинейной форме
       корреляционной  связи
       1.8. Заключение по разделу «Корреляционный  анализ»………………..
      Определение показателей вариации…………………………....             
       2.1. Вычисление групповой дисперсии…………………………………..
       2.2. Вычисление средней из групповых………………………………….
       2.3. Вычисление межгрупповой дисперсии……………………………...
       2.4. Вычисление общей дисперсии……………………………………….
       2.5. Вычисление среднеквадратического  отклонения…………   ……..
       2.6. Вычисление показателя вариации…………………………………...
       2.7. Вычисление эмпирического коэффициента  детерминации……….
       2.8. Вычисление эмпирического корреляционного  отношения   ……..
       2.9. Заключение по разделу «Определение  показателей вариации»…..
      Анализ динамических рядов………………………………………       …
       3.1 Определение данных для 3-го динамического ряда по двум исходным данным……………………………………………………………………...
       3.2. Установление вида ряда динамики………………………………… .
       3.3. Определение среднего уровня ряда динамики……………………..
       3.4. Определение показателей изменения уровня динамики: базисный и цепные абсолютные приросты, темпы роста и прироста, абсолютное значение прироста…………………………………………………………………...
       3.5. Вычисление средний абсолютный прирост……………………… ...
       3.6. Вычисление среднегодовых темпов роста и прироста……………..
       3.7. Графическое изображение показателей  динамических рядов: базисные и цепные темпы роста по трем динамическим рядам……     ………...
       3.8. Выявление основной тенденции развития одного из динамических рядов методом скользящей средней (трехчленный) ……………………….
       3.9. Аналитическое выравнивание ряда ………………………………..
       3.10. Графическое изображение скользящей прямой, прямой по исходным данным, выровненной прямой ………………………............................
      4.0. Анализ полученных показателей динамических рядов…   …….
      Список  использованной литературы                                                           

 

      Корреляционный анализ
       
Вариант 2                                    
                                              Таблица 1.1.
Накладные расходы, тыс. руб. Численность работников, чел.
  Y2   X1
    112   70
  113   76
  122   83
  153   120
  156   122
  158   112
  165   116
  168   115
  170   119
  190     126
    200   130
       
 
 
 
 
 
 
 
 
 

   1.1. Построение рядов распределения по факторному и  результативному признакам
  а) интервальные ряды распределения
  Выбираем  число интервалов:     
         Вычисляем величину интервала по формуле:
                                                              (1)
      где: - максимальное значение переменной;
                - минимальное значение переменной;
  Подставим значения в формулу (1), используя  при этом данные из таблицы 1:
  для результативного признака :     тыс. руб.
  для факторного признака чел.
  Начальная граница первого интервального  ряда равна
  Для накладных расходов  тыс. руб., тогда
                                   нижняя граница 1 интервала:  112-4,4=107,6тыс. руб.
                                   верхняя граница 1 интервала: 107,6+8,8=116,4 тыс. руб.
  Для численности работников   чел.
                                   нижняя граница 2 интервала:  70-3=67 чел.
                                   верхняя граница 2 интервала:  67+6=73 чел. 

  Интервальные  ряды для результативного  признака
и

  факторного  признака

                                                                                     Таблица 1.2.
      Y X
      107,6-116,4 67-73
      116,4-125,2 73-79
      125,2-134 79-85
      134-142,8 85-91
      142,8-151,6 91-97
      151,6-160,4 97-103
      160,4-169,2 103-109
      169,2-178 109-115
      178-186,8 115-121
      186,8-195,6 121-127
      195,6-204,4 127-133
 
  б) дискретные ряды распределения
 С помощью  таблицы 2 построим дискретные ряды распределения  по и , но для того, чтобы интервальные ряды распределения представить в дискретной форме вместо размерности интервалов принимаем их центральные значения, которые рассчитываются как средние арифметические величины начала и конца интервалов.
  Дискретный  ряд распределения  по
(накладным расходам)

  Таблица 1.3.
Центральные значения интервала Величина интервала (
)
Абсолютные  частоты (
)
Относительные частоты Плотность распределения (
)
112  
 
 
 
 
i=8,8
2 18,182 2,066
120,8 1 9,091 1,033
129,6 0 0 0
138,4 0 0 0
147,2 0 0 0
156 3 27,273 3,099
164,8 2 18,182 2,066
173,6 1 9,091 1,033
182,4 0 0 0
191,2 1 9,091 1,033
200 1 9,091 1,033
Итого:  
100%  
 
  Плотность распределения определяется по формуле:
                                                                                 (2) 

  Дискретный  ряд распределения  по
(численности работников)

  Таблица 1.4.
Центральные значения интервала Величина интервала (
)
Абсолютные  частоты (
)
Относительные частоты Плотность распределения (
)
70  
 
 
 
 
1 9,091 1,515
76 1 9,091 1,515
82 1 9,091 1,515
88 0 0 0
94 0 0 0
100 0 0 0
106 0 0 0
112 2 18,182 3,03
118 3 27,273 4,545
124 2 18,182 3,03
130 1 9,091 1,515
Итого:  
100%  
 
 
   1.2. Построение корреляционной  таблицы 

   Для построения корреляционной таблицы на поле корреляции накладывается координатная сетка, соответствующая интервальным рядам распределения по факториальному и функциональному признакам. Затем подсчитывается число точек (частот) в каждой клетке координатной сетки.
Корреляционная  таблица для зависимости 
от

    Таблица 1.5.
 
 
 
Нак- лад-ные 

рас-
ходы 

тыс.
руб.
X 
Y
Численность работников, чел.
67-73 73-79 79-85 85-91 91-97 97-103 103-109 109-115 115-121 121-127 127-133 Итого
195,6-204,4                     1 1
186,8-195,6                   1   1
178-186,8                       0
169,2-178                 1     1
160,4-169,2               1 1     2
151,6-160,4               1 1 1   3
142,8-151,6                       0
134-142,5                       0
125,2-134                       0
116,4-125,2     1                 1
107,6-116,4 1 1                   2
Итого  1 1 1 0 0 0 0 2 3 2 1
 
   Вывод: Данные расчеты позволяют сделать выводы о том, что при переходе слева на право в сторону больших значений факторного признака , соответствующие ряды распределения функционального признака смещаются снизу вверх, т.е. в сторону больших значений функции. Следовательно, накладные расходы находится в корреляционной зависимости от численности работников. 
 

        Расчет  эмпирической линии  регрессии
 
   После установления корреляционной связи, приступаем к следующему этапу статистического  моделирования – к исследованию формы связи.
   Под формулой корреляционной связи понимают тип аналитической формулы, выражающей зависимость между изучаемыми величинами.
   Необходимо  установить, какие изменяются средние  значения в связи с изменением .
   Рассчитываются  средние величины для каждого  ряда распределения по формуле средней взвешенной арифметической величины (3):
                                                                                                                     (3)
   где: - средневзвешенное значение функции;
        - центральное значение интервала  по функции;
       m – абсолютные частоты вариантов .
   Для сокращения вычислений при определении  средней арифметической можно использовать метод отсчета от условного нуля.
   Расчетная формула имеет вид
                                                         (4)
   при этом
                                                              (5)
   где: - фактические варианты ;
             - упрощенные варианты ;
            - новое начало отсчета по оси ;
            - интервал группировки по .
   Новое начало отсчета выбирается таким  образом, чтобы число наблюдений распределялось примерно поровну между  положительными и отрицательными направлениями  оси ординат.
   Так как в нашем случае число наблюдений равно 11, т.е. нечетному числу, то значения будут входить в интервал от , при этом центральным значением интервала будет равно 0.
   В нашем примере условный нуль в  шестом интервале по оси  , тогда тыс. руб., а тыс. руб.
   Результаты  расчетов представлены в таблице 1.6.
   Упрощенные  варианты умножаются на частоты соответствующих клеток  корреляционной таблицы и записываются  в верхних углах каждой клетки.
      Первая итоговая строка и итоговой столбец таблицы 1.6. выражают абсолютные частоты интервальных рядов распределения по функциональному и факторному признакам.
      Вторая итоговая строка характеризует сумму произведений, записанных в верхних углах клеток.
      Третья итоговая строка рассчитывается делением показателей второй строки на первую
      В четвертой итоговой строке показаны искомые средние , полученные по формуле (4).
 
   Расчет  эмпирической линии  регрессии для  зависимости 
от

   Таблица 1.6.
 
 
 
 
Нак лад-
ные 

рас-
ходы 

тыс.
руб.
 
X 
Y
Численность работников, чел.  
Ито- го
70 76 82 88 94 100 106 112 118 124 130
5 200                     15 1
4 191,2                   14   1
3 182,4                       0
2 173,6                 12     1
1 164,8               11 11     2
0 156               10 10 10   3
-1 147,2                       0
-2 138,4                       0
-3 129,6                       0
-4 120,8     1-4                 1
-5 112 1-5 1-5                   2
 
 
ст-ро-ки
1 Итого

1 1 1 0 0 0 0 2 3 2 1
2 ?my -5 -5 -4 0 0 0 0 1 3 4 5 ?y=-1
3
-5 -5 -4 0 0 0 0 0,5 2 2 5 -
4
112 112 120,8 156 156 156 156 160,4 173,6 173,6 200 -
 
   Показатели  четвертой итоговой строки являются основной для графического изображения выполненных расчетов на поле корреляции.
   Соединив  между собой средние значения в каждом интервале отрезками  прямых линий, получаем эмпирическую линию регрессии, по , которая показывает как в среднем изменяется  в связи с изменением .  

   Вывод: расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости межу численностью работников и накладными расходами. 
 
 

   1.4. Расчет теоретической  линии регрессии 

   Теоретическая линия регрессии представляет собой такую математически правильную кривую (либо прямую) линию, которая проходит наиболее близко к эмпирической линии регрессии, выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.
   В данном случае характер размещения точек  на корреляционном поле делает весьма вероятной гипотезу о линейной связи  у от х  
   Параметры искомой прямой ( ) находим из системы уравнений по способу наименьших квадратов:
                                                                                          (6)
   Исходная  информация для решения системы (6) получаем из таблицы 7, которая будет основана на результатах таблицы 6.
   Для получения упрощенных вариантов по факторному признаку также используем метод отсчета от условного нуля. В нашем примере примем                   чел., чел.
   Расчет  теоретической линии  регрессии для  зависимости 
от

   Таблица 1.7.
Нак лад
ные 

рас
ходы 

тыс.
руб.
 
 
 
Численность работников, чел. № столбца
  25 16 9 4 1 0 1 4 9 16 25 1 2 3 4
  -5 -4 -3 -2 -1 0 1 2 3 4 5  
 
 
 
 
X 
Y
70 76 82 88 94 100 106 112 118 124 130
5 200                     1 1 5 25 25
4 191,2                   1   1 4 16 16
3 182,4                       0 0 0 0
2 173,6                 1     1 2 4 4
1 164,8               1 1     2 2 4 8
0 156               1 1 1   3 0 0 0
1 147,2                       0 0 0 0
2 138,4                       0 0 0 0
3 129,6                       0 0 0 0
4 120,8     1                 1 -4 16 16
5 112 1 1                   2 -10 25 50
 
 
строки
1 Итого

1 1 1 0 0 0 0 2 3 2 1 n=11 -1 - 119
2 ?hi*x/ -5 -4 -3 0 0 0 0 4 9 8 5  
3 ?hi*x/2 25 16 9 0 0 0 0 8 27 32 25  
4 ?mi*yi/ -5 -5 -4 0 0   0 0 1 3 4 5  
5 ?m*y/*x/ 25 20 12 0 0 0 0 2 9 16 25  
 
   В качестве проверки правильного составления  таблицы 1.7. должно соблюдаться равенство итогов четвертой строки и второго столбца. Если это условие не соблюдается, то в расчетах допущена ошибка, которая может привести к существенным искажениям величины параметров теоретической линии регрессии.
   Если  посмотреть в таблицу, то можно увидеть, суммы четвертой итоговой строки и второго итогового столбца  одинаковы, и эта величина равна -1.
     Далее в систему уравнений (6) подставим результаты, полученные в табл. 7.  
                                                                                               (7)                                                        
   В качестве решения системы (7) примем метод Гаусса, который позволяет находить решения последовательно, исключая неизвестные. Для этого первое уравнение системы (7) делим на 11, а второе на 4 и получим:                                                                                                                                                                                                             
                                                                                                (8) 
   После преобразований получаем ответ:  

                                                           (9) 
   Параметры в системе (9) необходимо преобразовать  исходя из фактических значений и .
   Формулы перевода из упрощенных в реальные координаты:
                                                                                                                    (10)
                                                                                                     (11)
где:    - интервал группировки по ;
        - интервал группировки по ;
            - новое начало отсчета по ;
             - новое начало отсчета по . 

   По  формулам (10) и (11) находим: 
 

   Т. е. уравнение  теоретической линии регрессии  в реальных коэффициентах имеет  вид:
                                           (12)                                                                            
   В уравнении регрессии первое слагаемое  носит название свободного члена, второе слагаемое называется коэффициентом  регрессии. Он показывает, на сколько  натуральных единиц изменяется в  среднем результативный признак  при изменении факторного признака на единицу.
   Вывод: в данном случае из уравнения теоретической линии видно, что накладные доходы повышаются на 1,3% при увеличении численности работников на 1%, т.е. как было ранее замечено, оба признака имеют прямо пропорциональную связь.
   Накладные доходы, не зависящие от рассматриваемых факторов, равен 15,0152 тыс. руб.
   Для графического изображения теоретической  линии регрессии достаточно определить две точки, через которые можно  провести прямую. В данном случае возьмем две крайние точки, т.е.:
                             Таблица 1.8.
    х (чел) 70 130
    у (тыс.руб.) 106,18 184,33
 
   Вывод: если в пункте 1.7. посмотреть графическое изображение теоретической линии регрессии в виде уравнения прямой, то она еще раз подтверждает наличие корреляционной связи между изучаемыми признаками. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

1.6. Измерение тесноты связи 

   Для выяснения тесноты связи функционального  и фактического значений, нужно определить коэффициент корреляции . Для её расчета существует формула, представленная в упрощенных координатах признака и :
                                                                              (13)
   Возьмем исходную информацию из табл. 7 и, подставив  в формулу (13), найдем значение коэффициента корреляции:
                                         (14)
   Вывод: Выполненные расчеты показывают, что между накладными расходами и численностью работников существует положительная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y тоже увеличивается.
   Знак  при корреляции совпадает со знаком регрессии  , что свидетельствует о правильности произведенных вычислений. Чем ближе к 1, тем сильнее связь между факторным признаком x и функциональным признаком y . 
 

        Проверка  правильности гипотезы о прямолинейной  форме
      корреляционной  связи. 

   Для выполнения заданий 
   Прежде  чем использовать уравнение теоретической  линии необходимо проверить ее параметры ( ) на типичность. Для проверки типичности параметров уравнения регрессии используется t – критерий Стьюдента. При этом вычисляются фактические значения t – критерия:
   для параметра  :
                                                                                                           (15) 
   для параметра  :
                                                                                                      (16) 
   где:                                                                                        (17)
         - среднее квадратическое отклонение результативного признака y от выровненных значений                                                               
  или                                                               (18)
       - среднее квадратическое отклонение факторного признака x от общей средней . Вычисленные по формулам (15) и (16)  значения сравнивают с критическими t, которые определяют по таблице Стьюдента с учетом принятого уровня значимости и числом степеней свободы вариации . 

   Необходимые значения для применения формул (15) и (16) определяются в расчетной таблице 9. При вычислении    подставляем в формулу (12) значения x.
   Таблица 1.9.
X     Y      
1 70 -38,09 1450,85   112 106,18 5,82 33,87 12544
2 76 -32,09 1029,77 113 113,998 -0,998 0,996 12769
3 83 -25,09 629,51 122 123,12 -1,12 1,25 14884
4 120 11,91 141,85 153 171,3 -18,3 334,89 23409
5 122 13,91 193,49 156 173,91 -17,91 320,75 24336
6 112 3,91 15,29 158 160,88 -2,88 8,3 24964
7 116 7,91 62,57 165 166,09 -1,09 1,19 27225
8 115 6,91 47,75 168 164,79 3,21 10,31 28224
9 119 10,91 119,03 170 170 0 0 28900
10 126 17,91 320,75 190 179,12 10,88 118,37 36100
11 130 21,91 480,05 200 184,33 15,67 245,55 40000
Итого 1189 - 4487,91 1706   - 1075,45 273355
 
 
   Расчеты, при заполнении таблицы:
     чел.
    найдем подставив Х в уравнение у=15,0152+1,3024х 
 

   Теперь  переходим к расчетам по формулам (15) и (16), для этого по формулам (17) и (18) вычислим нужные значения: 
 
 
 

   По  таблице распределения Стьюдента  для K=9 и уровня значимости находим критическое значение   (из приложения 1 МУ).
                                                      (19)
   Из (19) видно, что только второй коэффициент признаются значимым.
   Для оценки значимости коэффициента корреляции r используют t – критерий Стьюдента. При линейной однофакторной связи t – критерий рассчитывается по формуле, где значение r мы возьмем из (14):
                       (20) 

     или 3,69<6,8 – это свидетельствует о значимости коэффициента корреляции и существенной связи между  накладными расходами и численностью работников.
   Следующим шагом сделаем проверку на правильность принятой гипотезы о прямолинейной форме корреляционной связи. Если
              - эмпирический коэффициент детерминации 
           - коэффициент корреляции 
 

   Вывод: из разности коэффициентов можно сделать вывод, что гипотеза о прямолинейной форме корреляционной связи правомерна.
   И так как , то дальнейший расчет не ведется. 
 

   1.8. Заключение по разделу «Корреляционный анализ» 

  По  данным в таблице 1.1. рядам мы построили  интервальные и дискретные ряды, посредствам  вторых сделали вывод: ряд распределения по накладным расходам, показывает, что для него наиболее характерными являются группа с центральным значением интервала 156 тыс. руб., так как она составляет по 27,273% всех накладных расходов.
    Если рассматривать другой ряд,  то там вывод такой: ряд распределения по численности работников показывает, что наиболее характерными являются группа с центральными значениями интервала 118, так как они составляют 27,273% всей численности работников.
   Следующим шагом было построение корреляционной таблицы с помощью которой мы пришли к выводу, что при переходе слева на право в сторону больших значений факторного признака , соответствующие ряды распределения функционального признака смещаются снизу вверх, т.е. в сторону больших значений функции. Следовательно, накладные расходы находится в корреляционной зависимости от численности работников.
   Далее последовал расчет эмпирической линии  регрессии, значения, по определяющему признаку которой мы записали в четвертой итоговой строке таблицы 1.6.. после окончания расчетов, мы сделали вывод, что расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости между накладными расходами и численностью работников.
   Затем мы совершили расчеты по определению  теоретической линии регрессии, она еще раз подтвердила наличие корреляционной связи между изучаемыми признаками. После решения системы, мы получили уравнение теоретической линии в виде:
                                 y=15,0152+1,3024x        
   С целью определить тесноту связи  между определяющим и факторным  признаком высчитали коэффициент корреляции . Он показал,  что между накладными расходами и численностью работников существует положительная корреляция, которая говорит о том, что  с увеличением факторного признака x функциональный признак y тоже увеличивается.
  Знак  при корреляции совпадает со знаком регрессии  , что свидетельствует о правильности произведенных вычислений. Чем ближе к 1, тем сильнее связь между факторным признаком x функциональным признаком y.
   В нашем  случае она весьма тесная. 
 
 

 

       2. Определение показателей  вариации 

   Прежде  чем начать определение показателей  вариации, дадим объяснение данному  термину.
   Вариация  – это различия в значении какого-либо признака у разных единиц изучаемой совокупности в один и тот же момент времени.
   Из  исходных данных, которые мы взяли  из первого раздела (Корреляционный анализ) выделим три группы по результативному  признаку y:
                                       Таблица 2.1.
     
Накладные расходы, тыс. руб. Численность работников, чел.
  Y2   X1
    112   70
  113   76
  122   83
  153   120
  156   122
  158   112
  165   116
  168   115
  170   119
  190     126
    200   130
 
     тыс. руб.
  Получаются интервалы:   112-141,33
                                             141,33-170,66
                                             170,66-199,99
     
   Группы построенные по результативному признаку
   Таблица 2.2.
1 группа 2 группа 3группа
Наклад- ные расходы,
тыс.руб.
 
Наклад- ные расходы,
тыс.руб
Наклад- ные расходы,
тыс.руб
1 112 -3,33 11,09 1 153 -8,67 75,17 1 190 -5       25
2 113 -2,33 5,43 2 156 -5,67 32,15 2 200 5 25
3 122 6,67 44,49 3 158 -3,67 13,45        
        4 165 3,33 11,09        
        5 168 6,33 40,07        
        6 170 8,33 63,4        
  346   61,01   970   235,33   390   50
 
  Для определения среднего объема накладных расходов ( ), воспользуемся формулой средней арифметической простой, которая равна сумме отдельных значений признака деленных на число этих значений, т.е:
  
 

  где:  - значения результативного признака;
         n – количество наблюдений в выборке. 

      И по данной формуле определим средние  значения результативного признака для каждой из данных групп:
       тыс. руб.
       тыс. руб.
       тыс. руб.
   В статистике очень часто используется показатель под названием дисперсия, которая представляет собой среднеквадратическое отклонение индивидуальных значений признака от средней величины. Дисперсия - неименованная величина, т.е. она не имеет единиц измерения. Она рассчитывается как для сгруппированных данных, когда имеет частоты признака , так и для несгруппированных данных.
   Если  всю статистическую совокупность разложить  на группы по какому - либо признаку, то для каждой группы можно определить следующие величины:
   - групповую дисперсию;
   - среднюю из групповых;
   - межгрупповую дисперсию. 

   2.1. Вычисление групповой дисперсии 

   Групповая дисперсия отражает случайную вариацию, обусловленную влиянием неучтенных факторов и независящую от признака фактора положенного в основание группировки.
   Она рассчитывается как для сгруппированных  данных, когда имеет частоты признака , так и для несгруппированных данных.
   Для сгруппированных данных:  
   Для несгруппированных данных:
   где:
        - значение признака;
        - среднее значение в выборке;
        - число наблюдений в выборке;
         - частоты признака.  
     

   В данном случае вычисляем групповую  дисперсию по формуле для несгруппированных (невзвешенных) данных, так как у нас не имеется частоты признака .
   Подставив данные в таблице 2.2. значения, найдем дисперсию каждой из трех групп: 
 
 

   Вывод: групповые дисперсии, вычисленные по трем группам, отражают действие всех факторов влияющих на накладные расходы. 

   2.2. Вычисление средней из групповых 

   На  основе частных дисперсий можно  определить среднюю из групповых дисперсий. В данном случае она отражает изменение накладных расходов, под действием всех факторов влияющих на него, но в среднем по всей совокупности. Среднюю из групповых дисперсий, так же как и групповая дисперсия не имеет единицы измерения.
   Среднюю из групповых вычисляем по формуле:
   

   где: f – частота
        - групповая дисперсия 

   Если  подставить все значения в данную формулу, то получим: 

   Вывод: данная величина показывает зависимость всех рядов совокупности от неучтенных факторов, которые могут воздействовать на эту совокупность. 

   2.3. Вычисление межгрупповой  дисперсии 

   Межгрупповая  дисперсия характеризует вариацию результативного признака, обусловленную  влиянием факторного признака положенного  в основу группировки, она равна среднеквадратичному отклонению групповых (частных) средних величин от общей средней величины для всей изучаемой совокупности. Она так же не имеет единицы измерения.
   Межгрупповую  дисперсию определяют по формуле:
   

   Первым  делом нужно определить общее среднее значение в выборке для всех рядов:
    тыс. руб.
   Следующим шагом будет подстановка данных в формулу и определение числового значения межгрупповой дисперсии: 
 

   Вывод: чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние факторного признака на результативный признак, т.е. на накладные расходы. Но для того, чтобы узнать долю межгрупповой дисперсии в общей, нужно определить величину последней. 

   2.4. Вычисление общей  дисперсии 

   Зная  среднюю из групповых дисперсий  и межгрупповую дисперсию, можно  определить по правилу сложения общую  дисперсию исследуемой совокупности. Общая дисперсия тоже не имеет  единицы измерения.
   

   Подставим данные в формулу и найдем численное  значение общей дисперсии 

   где:  - средняя из групповых;
        - межгрупповая дисперсия. 

    Для проверки расчетов найдем общую дисперсию  обычным способом по формуле: 

    Подставив в эту формулу значения получим 
 
 

   Вывод: так как мы вычислили общую дисперсии, то в дальнейшем можно будет определить эмпирический  коэффициент детерминации, который поможет нам в определении доли межгрупповой дисперсии в общей. 

   2.5. Вычисление среднеквадратического  отклонения 

   Мы  уже рассмотрели несколько показателей  вариации, но самым ярким показателем её является среднеквадратическое отклонение. Эта величина показывает то, насколько в среднем отклоняются конкретные варианты от их средней величины. Среднеквадратическое отклонение есть корень квадратный из общей дисперсии. Оно измеряется в тех же единицах измерения, что и изучаемый признак
                            тыс. руб.
   Вывод: среднеквадратическое отклонение показывает, что накладные расходы отклоняется от средней величины на 27,85 тыс.руб., т.е. чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает всю представляемую совокупность. 

   2.6. Вычисление показателя  вариации 

   Для сравнения участи одного итого же признака в нескольких совокупностях  с различными средними величинами используют относительный показатель вариации – коэффициент вариации. Он представляет собой выражение в процентах отношения среднеквадратического отклонения к средней величине:
   ,  18%<33%
   Вывод: измеряемая совокупность является однородной, если коэффициент вариации не превышает 33%.  
 

   2.7. Вычисление эмпирического  коэффициента детерминации 

   Данный  коэффициент представляет собой  долю межгрупповой дисперсии в общей  дисперсии. Он служит для того, чтобы, определив данную долю, можно было сделать вывод о степени влияния факторных признаков на результативный. Эмпирический коэффициент детерминации определяется по формуле: 

   Вывод: из данного выражения можно сделать вывод, что накладные расходы на 95,9 % зависит от основного факторного признака, а на 4,1% зависит от всех остальных факторов.  
 

   2.8. Вычисление эмпирического  корреляционного  отношения 

   Эмпирическое  корреляционное отношение показывает тесноту связи между накладными расходами и численностью работников, есть ничто иное, как корень квадратный из эмпирического коэффициента детерминации: 

   Вывод: эмпирическое корреляционное отношение показывает тесноту связи между накладными расходами и численностью работников, если для качественной оценки тесноты данной связи воспользуемся соотношением Чэддока:
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0, 9 0,9-0,99
сила  связи слабая умеренная Заметная тесная весьма тесная
то в  нашем случае связь весьма тесная, т.к. 0,9<0,979<0,99. 

   2.9. Заключение по  разделу «Определение  показателей вариации» 

   В первом пункте второго раздела мы вычислили групповую дисперсию  для каждой из фигурирующих групп. В  связи с этим сделали вывод: групповые  дисперсии, вычисленные по трем группам, отражают действие всех факторов влияющих на накладные расходы.
   Далее мы вычислили среднюю из групповых  дисперсий, данная величина показала зависимость всех рядов совокупности от неучтенных факторов, которые могут воздействовать на эту совокупность, оно оказалось равно величине 31,49.
   Следующим шагом вы вычислили межгрупповую дисперсию. Она показала, что чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние факторного признака на результативный признак, т.е. на накладные расходы. Но длю того, чтобы узнать долю межгрупповой дисперсии в общей, нужно определить величину последней.
   Для того, чтобы можно было определить эмпирический коэффициент детерминации, мы вычислили общую дисперсию трех групп.
   Далее мы определили среднеквадратическое отклонение, которое показало, что накладные расходы отклоняется от средней величины на 27,85 тыс.руб., т.е. чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает всю представляемую совокупность.
   В шестом пункте второго раздела мы вычислили показатель вариации.
   С помощью общей дисперсии и  межгрупповой дисперсии мы вычислили  эмпирический коэффициент детерминации, который помог определить долю межгрупповой дисперсии в общей, а это в свою очередь помогло нам определить величину воздействия факторного признака на результативный. Из данного выражения можно было сделать вывод, что накладные расходы на 95,9% зависит от основного факторного признака, а на 4,1% зависит от всех остальных факторов.
   В последнем пункте мы вычислили эмпирическое корреляционное отношение, которое показало тесноту связи между накладными расходами и численностью работников при оценки по соотношению Чэддоку.
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.