На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Множественная регрессия и корреляция

Информация:

Тип работы: курсовая работа. Добавлен: 08.07.2012. Сдан: 2010. Страниц: 10. Уникальность по antiplagiat.ru: < 30%

Описание (план):


     Содержание 

 

    Введение

 
     Эконометрика - это наука, которая изучает статистические закономерности в экономике.
     Объектом  изучения эконометрики, как самостоятельного раздела математической экономики, являются экономико-математические модели, которые строятся с учетом случайных  факторов. Такие модели называются эконометрическими моделями. Исследование эконометрических моделей проводится на основе статистических данных об изучаемом объекте и с помощью методов математической статистики.
     Основными задачами эконометрики являются: получение  наилучших оценок параметров экономико-математических моделей, конструируемых в прикладных целях; проверка теоретико-экономических положений и выводов на фактическом (эмпирическом) материале; создание универсальных и специальных методов для обнаружения статистических закономерностей в экономике.
     Актуальность  проблемы: парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Например, при построении модели зависимости потребления того или иного товара от дохода исследователь предполагает, что в каждой группе дохода одинаково влияние на потребление таких факторов, как цена товара, размер семьи, ее состав.
     Вместе  с тем исследователь никогда  не может быть уверен в справедливости данного предположения. Например, для того чтобы иметь правильное представление о влиянии дохода на потребление, необходимо изучить их корреляцию при неизменном уровне других факторов. Прямой путь решения такой задачи состоит в отборе единиц совокупности с одинаковыми значениями всех других факторов, кроме дохода. Он приводит к планированию эксперимента — методу, который используется в химических, физических, биологических исследованиях.
     Экономист, в отличие от экспериментатора-естественника, лишен возможности регулировать другие факторы. Поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии:
     Множественная регрессия широко используется в решении проблем спроса, доходности акций, изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия — один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.1
     Задачами  работы являются:
     - изучение построения уравнения множественной регрессии;
     - изучение множественной корреляциии
      -включение факторов в уравнение множественной регрессии
     - проверка качества построенной модели 
     - оценка мультиколлинеарности факторов 
     - оценка гетероскедастичности
     - рассмотрение изучаемой темы  на практических примерах 
     Объект  исследования: эконометрические исследования.
     Предмет исследования: множественная регрессия  и корреляция в экономических исследованиях
     Методы:
     - теоретическое изучение материала;
     - практическое применение изученного  материала в экономических исследованиях.
 

    1. Множественная регрессия

 
    Множественная регрессия – уравнение связи  с несколькими независимыми переменными:
    
    где - зависимая переменная (результативный признак);
      - независимые переменные (факторы).
    Для построения уравнения множественной  регрессии чаще используются следующие функции2:
      линейная – 
      степенная – 
      экспонента – 
      гипербола - .
    Можно использовать и другие функции, приводимые к линейному виду.
    Для оценки параметров уравнения множественной  регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений  и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:
    
     
    Для ее решения может быть применен метод  определителей: 

     , ,…, , 

    где - определитель системы; 

     - частные определители; которые  получаются путем замены соответствующего  столбца матрицы определителя  системы данными левой части  системы. 

    Другой  вид уравнения множественной  регрессии – уравнение регрессии  в стандартизированном масштабе:
    
    где - стандартизированные переменные;
     - стандартизированные коэффициенты  регрессии. 

    К уравнению множественной регрессии  в стандартизированном масштабе применим МНК. Стандартизированные  коэффициенты регрессии ( - коэффициенты) определяются из следующей системы уравнений: 

     . 

    Связь коэффициентов множественной регрессии со стандартизированными коэффициентами описывается соотношением
    
    Параметр  определяется как .
    Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле
    
    Для расчета частных коэффициентов  эластичности применяется следующая  формула:3
    
.

    2. Множественная корреляция

    Тесноту совместного влияния факторов на результат оценивает индекс множественной  корреляции:
    

    Значение  индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:4
      
    Индекс  множественной корреляции для уравнения  в стандартизированном масштабе можно записать в виде
    
    При линейной зависимости коэффициент  множественной корреляции можно  определить через матрицу парных коэффициентов корреляции:
      

     ---- определитель матрицы парных  коэффициентов корреляции;
      ------ определитель матрицы межфакторной корреляции.
      Частные коэффициенты (или индексы)  корреляции, измеряющие влияние на y фактора при неизменном уровне других факторов, можно определить по формуле: 

      

    или по рекуррентной формуле: 
 

     . 

    Частные коэффициенты корреляции изменяются в  пределах от –1 до 1.5

    3. Включение факторов  в уравнение множественной  регрессии

     Включение в уравнение множественной регрессии  того или иного набора факторов связано, прежде всего, с представлением исследователя  о природе взаимосвязи моделируемого  показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям6:
    должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов недвижимости учитывается место нахождения недвижимости);
    не должны быть интеркоррелированы и, тем более, находиться в точной функциональной связи.
     Если  между факторами существует высокая  корреляция, то нельзя определить их изолированное  влияние на результативный показатель и параметры уравнения регрессии  оказываются неинтерпретируемыми.
     Включаемые  во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р-факторов, то для нее рассчитывается показатель детерминации R2 , который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р-факторов. Влияние других, неучтенных в модели факторов, оценивается как 1 - R2 с соответствующей остаточной дисперсией S2 .
     При дополнительном включении в регрессию  фактора (р + 1) коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:
      и (5.2)
     Если  же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор xp + 1 не улучшает модель и практически является лишним фактором. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.
     Таким образом, хотя теоретически регрессионная  модель позволяет учесть любое число  факторов, практически в этом нет  необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой — подбирают факторы, исходя из сущности проблемы; на второй — на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.
    Уравнения множественной регрессии могут включать в качестве независимых переменных качественные признаки (например, профессия, пол, образование, климатические условия, отдельные регионы и т. д.). Чтобы ввести такие переменные в регрессионную модель, их необходимо упорядочить и присвоить им те или иные значения, т. е. качественные переменные преобразовать в количественные. 
    Такого  вида сконструированные переменные принято в эконометрике называть фиктивными переменными. Например, включать в модель фактор «пол» в виде фиктивной переменной можно в следующем виде:
    
      Коэффициент регрессии при фиктивной  переменной интерпретируется как  среднее изменение зависимой  переменной при переходе от  одной категории (женский пол)  к другой (мужской пол) при неизменных значениях остальных параметров. На основе t-критерия Стьюдента делается вывод о значимости влияния фиктивной переменной, существенности расхождения между категориями.
     Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.
     По  величине парных коэффициентов корреляции может обнаруживаться лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга.

    4. Проверка качества построенной модели

    Качество  построенной модели в целом оценивает  коэффициент (индекс) детерминации. Коэффициент  множественной детерминации рассчитывается как квадрат индекса множественной корреляции: 

      

    Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле: 

    
    где n-число наблюдений;
    m – число факторов. 

    Значимость  уравнения множественной регрессии  в целом оценивается с помощью  F-критерия Фишера: 

      

    Частный F-критерий оценивает статистическую значимость присутствия каждого факторов в уравнении. В общем виде для фактора частный F-критерий определится как 

      

    Оценка  значимости коэффициентов чистой регрессии  с помощью t-критерия Стьюдента сводится к вычислению значения 

      

    где - средняя квадратичная ошибка коэффициента регрессии она может быть определена по следующей формуле: 

    

    5. Оценка мультиколлинеарности факторов

 
    При построении уравнения множественной  регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной связанности.
    Считается, что две переменные явно коллинеарны, т. е. находятся между собой в  линейной зависимости, если
      По величине парных коэффициентов  корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов.
     Наличие мультиколлинеарности факторов может  означать, что некоторые факторы  будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК).7
    Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.
    Если  бы факторы не коррелировали между  собой, то матрица парных коэффициентов  корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы были бы равны нулю. Так, для включающего три объясняющих переменных уравнения  

      
    матрица коэффициентов корреляции между  факторами имела бы определитель, равный 1:
    
    так как  и .
    Если  же, наоборот, между факторами существует полная линейная зависимость и все  коэффициенты корреляции равны 1, то определитель такой матрицы равен 0:
     .
    Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной  регрессии. И наоборот, чем ближе  к 1 определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.8
    Проверка  мультиколлинеарности факторов может  быть проведена методом испытания  гипотезы о независимости переменных . Доказано, что величина имеет приближенное распределение с степенями свободы. Если фактическое значение превосходит табличное (критическое) , то гипотеза отклоняется. Это означает, что , недиагональные ненулевые коэффициенты корреляции указывают на коллинеарность факторов. Мультиколлинеарность считается доказанной.9

    6. Оценка гетероскедастичности

 
    Для применения МНК требуется, чтобы  дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора остатки имеют одинаковую дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность.
    При нарушении гомоскедастичности мы имеем неравенства
    
    При малом объеме выборки для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта. Основная идея теста Гольдфельда-Квандта  состоит в следующем:10
    1) упорядочение  наблюдений по мере возрастания переменной ;
    2) исключение из рассмотрения  центральных наблюдений; при этом
     -число оцениваемых параметров;
    3) разделение совокупности из наблюдений на две группы (соответственно с малыми и с большими значениями фактора ) и определение по каждой из групп уравнений регрессии;
    4) определение остаточной суммы квадратов для первой и второй групп и нахождение их отношения: .
    При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять F-критерию со степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.11 

 

    Практическая  часть

    Пример  1

    По 30 территориям России имеются данные, представленные в табл. 1.
    Таблица 1
Признак Среднее значение Среднее квадратическое отклонение Линейный коэффициент  парной корреляции
Среднедневной душевой доход, руб., y
86,8 11,44 -
Среднедневная заработная плата одного работающего, руб., x1 54,9 5,86
Средний возраст безработного, лет, x2
33,5 0,58

 
    Требуется:
    1. Построить уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с b1 и b2 , пояснить различия между ними.
    2. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.
    3. Рассчитать общий и частные F-критерии Фишера. 

    Решение
    1. Линейное уравнение множественной регрессии y от х1 и х2 имеет вид: . Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: .
    Расчет b-коэффициентов выполним по формулам 

       

      

    Получим уравнение:
    
    Для построения уравнения в естественной форме рассчитаем и , используя формулы для перехода от к : 

      

      

    Значение  определим из соотношения 

    
    
    Для характеристики относительной силы влияния  и на рассчитаем средние коэффициенты эластичности:
      

    С увеличением средней заработной платы на 1% от ее среднего уровня средний душевой доход возрастает на 1,02% от своего среднего уровня; при повышении среднего возраста безработного на 1% среднедушевой доход снижается на 0,87% от своего среднего уровня. Очевидно, что сила влияния средней заработной платы на средний душевой доход оказалась больше, чем сила влияния среднего возраста безработного . К аналогичным выводам о силе связи приходим при сравнении модулей значений и : 

     .
    Различия  в силе влияния фактора на результат, полученные при сравнении  и , объясняются тем, что коэффициент эластичности исходит из соотношения средних: а -коэффициент - из соотношения средних квадратических отклонений: . 

    2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:
     ; 

     ; 

     . 

    Если  сравнить значения коэффициентов парной и частной корреляции, то приходим к выводу, что из-за слабой межфакторной связи коэффициенты парной и частной корреляции отличаются незначительно: выводы о тесноте и направлении связи на основе коэффициентов парной и частной корреляции совпадают: 
 

    . 

    Расчет  линейного коэффициента множественной  корреляции выполним с использованием коэффициентов  и : 

     . 

    Зависимость от и характеризуется как тесная, в которой 72% вариации среднего душевого дохода определяются вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно 28% от общей вариации . 

    3. Общий -критерий проверяет гипотезу о статистической значимости уравнения регрессии и показателя тесноты связи ( ): 
 

      
 

      
 

    Сравнивая и , приходим к выводу о необходимости отклонить гипотезу , так как С вероятностью делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи которые сформировали под неслучайным воздействием факторов и .
    Частные -критерии - и оценивают статистическую значимость присутствия факторов и в уравнении множественной регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора, т.е. оценивает целесообразность включения в уравнение фактора после того, как в него был включен фактор . Соответственно указывает на целесообразность включения в модель фактора после фактора :  

     =
    
    Сравнивая и приходим к выводу о целесообразности включения в модель фактора после фактора , так как . Гипотезу о несущественности прироста за счёт включения дополнительного фактора отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения фактора после фактора .
    Целесообразность  включения в модель фактора  после фактора проверяет :
     =
    Низкое  значение свидетельствует о статистической незначимости прироста за счёт включения в модель фактора (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является достаточно статистически значимой, надёжной и что нет необходимости улучшать её, включая дополнительный фактор (средний возраст безработного).

    Пример 2

     Используя статистический материал, приведенный  в таблице 1, необходимо:
         1) построить линейное уравнение множественной регрессии, пояснить экономический смысл его параметров;
         2) дать сравнительную оценку тесноты  связи факторов с результативным  признаком с помощью средних  (общих) коэффициентов эластичности;
         3) оценить статистическую значимость коэффициентов регрессии с помощью t-критерия и нулевую гипотезу о незначимости уравнения с помощью F-критерия;
         4) оценить качество уравнения посредством  определения средней ошибки аппроксимации.
 

      Таблица 1.
     Исходные данные
№ п/п Чистый доход, млн. дол. США Оборот капитала, млн. дол. США
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.