На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Анализ среднемесясячных доходов населения

Информация:

Тип работы: курсовая работа. Добавлен: 16.12.2012. Сдан: 2011. Страниц: 17. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Министерство  образования Российской Федерации
Красноярский  государственный  университет
Экономический факультет
КУРСОВАЯ  РАБОТА
 
«Применение статистических методов
для прогнозирования  среднемесячных денежных доходов населения»
 
                           
                 
                 
                 
                 
                 
                 

                Работу  выполнил: студент гр. Э-28
                Зайцев  Д. А.                                                 
                  Научный руководитель: Двинский М. Б.
 
 
 
 
 
 
 
 
 
 
    г. Красноярск 2004г.
Содержание. 

Введение.
Построение  статистической модели показателей  среднемесячных денежных доходов в расчёте на душу населения.
1. Теоретическая   часть                                                                                                                        1.1 Корреляция как частный случай статистической связи  
     1.2 Корреляционный анализ  
    1.3 Множественная и частная корреляция   
      1.4 Мультиколлинеарность    
      1.5 Регрессионные зависимости      
      1.6 Регрессионный анализ    
      1.7 Парная линейной регрессия     
      1.8 Множественная регрессия     
      1.9 Анализ вариации       
      1.10Проверка уравнения регрессии на значимость    
      1.11Вывод        
2. Практическое  применение метода корреляционно  регрессионного анализа: Статистический  анализ зависимости среднемесячных  доходов в расчёте на душу населения.          
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Введение.
Итак, для анализа на практике временных  рядов с помощью корреляционно-регрессионного анализа рассмотрим показатели государственной  статистики о социально-экономическом положении Российской Федерации в 2001-2003 годах. Данные были взяты из журнала……… год. При этом для проведения работы необходимо было выбрать из большого числа этих данных только несколько самых необходимых, теоретически предполагая зависимость между этими факторами, и провести некоторую их корректировку. Для анализа было решено в качестве результирующего показателя выбрать данные о среднемесячных денежных доходах в расчёте на душу населения. Что влияет на увеличение или, наоборот, на уменьшение этого показателя? И какая динамика прослеживается в России на ближайшие периоды?
При этом для анализа были выбраны 24 периода, то есть 2 года с ежемесячными данными (с июня 2001 по июнь2003 года).
Для     проведения исследования и установления зависимости необходимо выделить из общего числа показателей социально-экономической статистики наиболее существенные, которые могут непосредственно быть причиной рота или, наоборот, снижения денежных доходов населения. Таким образом, проведём теоретический анализ показателей, которые были взяты мной из общего числа показателей в качестве факторных переменных для дальнейшего корреляционно-регрессионного анализа.
Среднемесячная  заработная плата. Основную долю доходов работоспособного населения составляет заработная плата. 
         Средний размер  назначенной месячной пенсии. Основным источником доходов для людей достигших пенсионного возраста является пенсия.
         Численность безработного населения. Это социальное явление непосредственно связано с результирующим показателем, так как при отсутствии работы, человек лишается большой доли своего денежного дохода.  

         Цель курсовой  работы – прогнозирование величины среднемесячных денежных доходов в расчёте на душу населения на 2004 год по данным 2001, 2002, 2003гг. с использованием программы Statistica 6.0
Для этого необходимо выполнить ряд  задач:
    Исследовать динамику изменения среднемесячных денежных доходов в расчёте на душу населения во времени (2001, 2002, 2003гг.);
    Выявить наиболее важные факторы, определяющие величину среднемесячного дохода в расчёте на душу населения;
    Построить трендовую модель временного ряда среднемесячного дохода в расчёте на душу населения;
    Построить регрессионную модель на основе выявленных ранее наиболее важных факторов;
    Рассчитать прогнозные значения величины среднемесячных доходов в расчёте на душу населения на 2004 год по наилучшей из построенных моделей;
    Сравнить полученный прогноз с имеющимися статистическими данными на 2004 год;
 
 
 
 
Построение  статистической модели показателей среднемесячных денежных доходов  в расчёте на душу населения.
1. Теоретическая часть.
            1.1 Корреляция как частный случай статистической связи.
            Массовые общественные явления,  которые являются предметом изучения  экономических наук, взаимосвязаны  и взаимозависимы. Проявление закономерностей в экономике носит статистический характер, и поэтому одной из задач статистики является выявление существенных взаимосвязей между явлениями и изменениями их тесноты.
      Различают два типа связей между различными явлениями и их признаками:  функциональную и статистическую.
      Функциональная связь возможна лишь при условии, что одна из величин зависит только от другой и ни от чего более. В реальности таких связей не существует. Однако если с изменением значения одной из переменных вторая может в определенных пределах принимать любые значения с некоторыми вероятностями, но ее среднее значение или другие статистические характеристики изменяются по определенному закону - связь называется статистической. Т.е. разным значениям одной переменной соответствуют разные распределения значений другой переменной.
      Статистическая взаимосвязь может быть установлена между различными экономическими показателями, т.к. в каждом отдельном случае они рассматриваются как случайные величины.
            На 1 этапе проводится теоретический анализ взаимосвязей объекта, его показателей, формулируются конечные цели, результатом чего является формирование концепции эконометрической модели.
           На 2 этапе  осуществляется предварительная обработка информации с помощью методов математической статистики, посредством применения которой проверяются гипотезы относительно однородности выборки, независимости наблюдений и стационарности процессов. Распределение проверяется на соответствие нормальному закону, выясняются причины возникновения аномальных явлений и возможности их удаления без причинения ущерба выборке.
            3 этап - построение модели. Здесь устанавливается общий вид модельных соотношений, строится эконометрическая модель с оцененными параметрами. Для этого необходимо установить наличие, тесноту взаимосвязи случайных величин, провести оценку неизвестных параметров, проверить модель на адекватность. С этой целью используется  корреляционно-регрессионный анализ.
      Корреляционной связью называют важнейший частный случай статистической связи, при изучении которого анализируется согласованное изменение варьирующих признаков, выступающих по отношению друг к другу как факторные и признаки следствия (результативные).
      В корреляционных связях воздействие  отдельных факторов проявляется в среднем при массовом исследовании данных. Неполнота корреляционных связей объясняется тем, что из всего множества факторов, оказывающих влияние на изучаемый процесс, часть факторов выпадает из поля зрения исследования, т.к. они могут быть неизвестными, незначительными или неподдающимися количественному измерению. При наличии корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного.
      Для исследования корреляционных зависимостей между признаками решению подлежит широкий круг вопросов:
    анализ свойств моделируемой совокупности;
    установление факта наличия связи (ее направление, форма);
    измерение степени тесноты связи между признаками;
    выбор функции, наиболее адекватно описывающей связь между фактором и результатом, т.е. построение уравнения регрессии;
    оценка адекватности модели, ее экономическая интерпретация и практическое использование.
 
1.2.  Корреляционный анализ.
Для того чтобы эффективно использовать результаты корреляционного анализа, необходимо следить за выполнением определенных требований в отношении отбора данных.
Во-первых, корреляционный анализ применяется в том случае, когда данные наблюдений или экспериментов можно считать случайными величинами, и они выбраны из совокупности, которая имеет нормальное распределение. Это условие связано с применением метода наименьших квадратов (МНК) при расчете параметров корреляции: только при нормальном распределении МНК дает оценку параметров, отвечающих принципам максимального правдоподобия. На практике эта предпосылка чаще всего выполняется приближенно.
Во-вторых, данные, которые подвергаются изучению методами корреляционного анализа, должны быть однородными. Количественная оценка этого требования состоит в расчете коэффициента вариации: 100%.  Совокупность считается однородной, если V не превышает 50% для распределений близких к нормальному,  т.е. чем меньше  V, тем более типична средняя для совокупности.
Другое  важное требование - достаточное число  наблюдений. Какое именно число наблюдений достаточно для анализа связи - зависит от цели, требуемой точности и надежности параметров связи, от числа факторов, корреляции с которыми изучается. Обычно считают, что число наблюдений должно быть не менее чем в 5-6, а лучше в 10 раз больше числа факторов, тогда закон больших чисел действует в полную силу.
Существует  и требование и в отношении  факторов, вводимых в исследование. Понятно, что все множество факторов не может быть включено в рассмотрение и в этом нет необходимости, т.к. их роль и значение в формировании результативного показателя могут иметь существенные различия. Поэтому при ограничении числа факторов целесообразно использовать количественные оценки, позволяющие конкретно охарактеризовать влияние их на результативный признак. Это могут быть выборочные  парные коэффициенты корреляции, которые служат мерой линейной статистической связи между двумя случайными величинами:
                          .
            Отклонение признака-фактора от его среднего значения на величину своего среднего квадратического отклонения в среднем по совокупности приводит к отклонению признака-результата от своего среднего значения на величину r  его среднего квадратического отклонения. Этот коэффициент обладает рядом определенных свойств:
    не имеет размерности;
    изменяется от –1 до 1, соответственно  близость абсолютной величины r к 1 свидетельствует о приближении к функциональной связи, близость к 0 – об отсутствии линейной зависимости (хотя допускается существование нелинейной);
    является симметричным, т.е. ;
    определяет направление связи, при r>0 -связь прямая, при r<0 - обратная.
Однако  сама по себе величина коэффициента корреляции не является доказательством наличия  причинно-следственой связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в изменении признаков. Связано это с тем, что оценка степени тесноты связи с помощью коэффициента корреляции производится для ограниченной выборки. Особенно осторожно следует подходить к использованию в качестве меры связи коэффициентов корреляции при незначительных объемах выборки. Возникает необходимость оценки значимости коэффициента, т.е. проверки предположения, существенно ли он отличается от нуля, или это случайное отклонение, связанное с выборкой. Если r- коэффициент корреляции в генеральной совокупности, то гипотеза Н0: r=0, и альтернативная ей Н1: .Зная среднюю ошибку коэффициента регрессии и корреляции, можно вычислить вероятность того, что нулевое значение коэффициента входит в интервал возможных с учетом ошибки значений. В качестве критерия  применяют статистику, которая для выборки из нормально генеральной совокупности будет иметь t-распределение. Рассчитывают                t-статистику Стьюдента
,
которую сравнивают с табличным значением  , где a- уровень значимости, u=n-2 –число степеней свободы.  Если tрасч>tтабл, то принимаем гипотезу о наличии и существенности связи. В противном случае принимаем гипотезу об отсутствии связи. В случае, когда корреляция между фактором и откликом незначима, показатель х не включают в уравнение регрессии.
      Кроме этого, следует помнить, что для  адекватности оценивания связи между  х и у необходимо, чтобы они:  
      -были  случайными;
      -имели  совместное нормальное распределение.
Иначе имеет место ложная корреляция, т.е. на одну из величин влияет некоторый  случайный неучтенный фактор.
      Если  связь между случайными величинами значима и выборка произведена  из нормальной генеральной совокупности, то доверительный интервал истинного значения коэффициента корреляции определяют для больших выборок как:
                 , где ua- критическая граница для нормального распределения, соответствующая уровню значимости a, n- объем выборки. Для небольшого объема выборки вместо ua используют ta,n- статистику Стьюдента.
      Коэффициент корреляции достаточно точно оценивает  степень тесноты связи лишь в  случае наличия линейной зависимости. При наличии же нелинейной зависимости он недооценивает степень тесноты и может быть даже равен 0. В таких случаях мерой связи является выборочное корреляционное отношение:
             , где  - значения, полученные с помощью подстановки в уравнение парной линейной регрессии м/у у и х.
       , т.е.  корреляционное отношение оценивает наличие и силу. Кроме этого hxy?hyx , т.е. не является симметричным. Значения парного коэффициента корреляции и корреляционного отношения по модулю совпадают, если расчетные значения зависимой переменной получены по линейной регрессии. Когда связь между переменными уклоняется от линейной формы, то h и r несколько отличаются по величине, причем h всегда больше r  по модулю. 
 

      1.3.  Множественная и частная корреляция.
      В реальных экономических ситуациях  парные взаимосвязи подвергаются влиянию  со стороны других случайных величин, поэтому необходимо включать в исследование вычисление коэффициентов множественной  и частной корреляции.  Для  этого анализу подвергают корреляционную матрицу:
              
 которая  позволяет выделить статистически  значимые взаимосвязи между переменными.
      Чтобы оценить связь между i-м фактором и всем набором остальных рассчитывается выборочный множественный коэффициент корреляции:
             ,
где Q - определитель корреляционной матрицы,
      Qii - алгебраическое дополнение корреляционной матрицы.
Этим  коэффициентом фиксируется наличие  и сила связи, т.к. . Стоит отметить и то, что величина Ri выше любого парного или частного коэффициента корреляции, а присоединение каждой новой предсказывающей переменной не может уменьшить величину Ri.
      Для определения доли вариации исследуемого фактора, объясненной поведением остальных  факторов, рассчитывается выборочный коэффициент детерминации: .
      Как и в случае с парной корреляцией  необходима проверка на статистическую значимость, которая в данном случае проводится с помощью статистики Фишера.
      Гипотеза  Н0: Ri=0; Н1: Ri?0.
      Расчетное значение статистики Фишера имеет вид:
            
Сравнивая его с табличным значением  , делаем выводы: если Fр>Fт, то связь есть и она значима, в противном случае принимаем гипотезу Н0 об отсутствии связи между i-м фактором и набором р-1 факторов.
      При наличии в исследовании нескольких случайных величин на величину rxy влияние могут оказывать прочие факторы. Для устранения такого влияния необходимо получить точечную оценку между х и у (т.е. очищенную от влияния прочих факторов)- выборочный частный коэффициент корреляции
             , где 1…р  – факторы, влияние которых  отсекается.
       , т.е.  коэффициент характеризует тесноту, наличие и направление связи.
      Процедура проверки на значимость аналогична предыдущим. Используя статистику Стьюдента и принимая за гипотезу Н0 утверждение об отсутствии связи, а за гипотезу Н1- о наличии, имеем:
             , которое  сравниваем с tтабл с параметрами: a и n=n-p.
Н1 принимается в случае превышения tрасч над tтабл. Если же tрасч<tтабл, то принимаем гипотезу об отсутствии связи. Причины незначимости выборочных коэффициентов могут быть:
    недостаточный объем выборки;
    неверный выбор формы связи между случайными величинами;
    наличие не включенных в исследование факторов, но существенно воздействующих на исследуемые показатели;
    отсутствие связи вообще.
 
1.4.  Мультиколлинеарность.
Еще одной  важной предпосылкой корреляционного  анализа является независимость  включаемых в исследование факторов друг от друга, т.к. наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга. Такое явление получило название мультиколлинеарности.
Проявление  мультиколлинеарности  в явной  форме подразумевает, что между факторными признаками существует функциональная зависимость, т.е. (присутствуют линейно зависимые столбцы). Это является одной из предпосылок регрессионного анализа, который рассматривается далее. В случае мультиколлинеарности некорректным является использование МНК, т.к. оценки параметров уравнения регрессии будут содержать систематические ошибки, и оценка значимости по t-критерию не будет иметь смысла.
Следствием  мультиколлинеарности является:
    резкое падение точности параметров, получаемых с помощью МНК;
    неустойчивость выборочных характеристик;
    невозможность содержательного прогноза;
    отсутствие смысла содержательной интерпретации регрессионных зависимостей.
Наличие мультиколлинеарности можно определить по ряду признаков:
    небольшие изменения данных приводят к существенному изменению оценок параметров;
    коэффициенты уравнения регрессии имеют большие стандартные ошибки и высокий уровень значимости, при этом построенное уравнение характеризуется высоким коэффициентом детерминации и высоким совместным уровнем значимости факторных переменных;
    коэффициенты в уравнении регрессии имеют неверный знак или неправдоподобную величину.
Кроме визуальных критериев наличия мультиколлинеарности существует формальные, один из которых - критерий .
Гипотезы: Н0: мультиколлинеарности между объясняющими переменными нет;
            Н1: мультиколлинеарность есть.
Для проверки строится величина расчетного значения :
       , где Q- определитель корреляционной матрицы
Сравниваем  с табличным значением  табл( ,a). Если расч> табл, то принимаем гипотезу о наличии мультиколлинеарности.
Однако  мультиколлинеарность может быть устранена. Наиболее распространенными методами устранения являются пошаговые процедуры последовательного присоединения (удаления) факторов и смешанная процедура последовательного присоединения (удаления).
Последняя группа методов  заключается в последовательном анализе факторных переменных на этапе анализа корреляционной матрицы: если известно, что между двумя факторами есть мультиколлинеарность, один из них необходимо удалить из рассмотрения. Оставляем, как правило, наиболее адекватный с экономической точки зрения фактор, либо имеющий максимальный  rxy . 

      1.5.  Регрессионные зависимости.
Изучение  корреляционных зависимостей основывается на исследовании таких связей между переменными, при которых значения зависимой переменной изменяются в зависимости от того, какие значения принимает другая переменная, рассматриваемая как причина по отношению к зависимой. В экономике регрессионный анализ имеет достаточно широкое применение. К задачам анализа:
    установление формы зависимости;
    оценка модельной функции или уравнения регрессии;
    прогноз неизвестных значений зависимой переменной по модельному уравнению регрессии.
В случае парной регрессионной зависимости  имеем:
,
где f(x)- детерминированная составляющая регрессионной модели, которая отражает воздействие на зависимую переменную всех существенных факторов и фактически описывает поведение условного среднего у.
 e-случайная составляющая, отражающая совокупное влияние всех случайных факторов.  

      1.6.  Регрессионный анализ.
Ранее уже упоминалась одна из предпосылок регрессионного анализа (отсутствие мультиколлинеарности). Рассмотрим остальные, которые сформулированы в теореме Гаусса-Маркова:
    Зависимые переменные yi , ei- случайные величины, в то время как xi не является случайной.
    Случайная составляющая  и переменная у распределена по нормальному закону с параметрами М(ei)=0, D(ei)=D(yi)=s2
    Отдельные наблюдения уi , yj  и ei , ej  некоррелированны между собой, т.е.
 
1.7.  Парная линейная регрессия.
В случае парной линейной регрессии зависимость результирующего признака представлена от одного фактора. Теоретическое уравнение имеет вид: , где b0, b1 – параметры генерального уравнения. Выборочное уравнение имеет вид: , где b0, b1 –оценки параметров, полученные из выборки, причем b0 –величина, которая выравнивает размерность между зависимой переменной у и х, а  b1 –оценка, показывающая, на сколько изменится значение у при изменении х на еденицу. На основе имеющихся наблюдений необходимо подобрать наилучшие по определенному критерию  оценки.
Для оценивания параметров используется МНК, суть которого заключается  в минимизации  сумм квадратов отклонений фактических значений наблюдений от модельных  для нахождения такой  функции, которая  наилучшим образом соответствует эмпирическим данным:
       , где Q является функцией неизвестных величин b0 , b1
Зная уравнение , представим:

Таким образом применение МНК сводится к задаче на экстремум. Для построения оценок определяют частные производные функции Q по переменным b0 , b1 и приравнивают их к нулю. После преобразований получим следующие формулы для определения параметров:
              ;  . 

      1.8.  Множественная регрессия.
      Однако  опять же в силу сложности взаимосвязей любых общественных и экономических  явлений на практике чаще всего используют множественную регрессию. Она полнее объясняет поведение зависимой переменной и позволяет сопоставить влияние включенных в уравнение факторов.
      Для линейной формы связи множественное  уравнение регрессии  генеральной  совокупности имеет вид:
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.