На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Построение и анализ качества регрессионной модели

Информация:

Тип работы: курсовая работа. Добавлен: 14.05.2012. Сдан: 2011. Страниц: 10. Уникальность по antiplagiat.ru: < 30%

Описание (план):


    БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ
    Экономический факультет 

    Кафедра банковской и финансовой экономики 
 
 
 
 
 
 
 
 

    Построение  и анализ качества регрессионной  модели 
 
 

    Курсовой  проект 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    студента 3 курса
    отделения «Финансы и кредит» 
 

    Научный руководитель
    Рогозин С.В. 
 
 
 
 
 
 
 
 

    Минск, 2010 г
Реферат 

В курсовой работе на предложенной совокупности данных была построена эконометрическая модель и  проведен ее анализ. Модель была проверена на адекватность (соответствие предпосылкам МНК) с помощью ряда тестов. 

Введение 

Для исследования предлагалась совокупность временных  данных по экономике Эстонии (квартальные данные 2000-2007 гг), а именно значения ВВП(GDP), экспорта товаров и услуг(Export) и эффективного обменного курса евро к национальной валюте(ExRate).
Выбор вышеперечисленных переменных экономически обоснован: между изменением показателя ВВП и валютного курса существует прямая зависимость: при росте ВВП наблюдается рост валютного курса. Также, если ВВП растет, это говорит о том, что общее состояние экономики улучшается, а, следовательно, наблюдается приток зарубежных инвестиций в экономику, рост в промышленном секторе.
Таким образом, можно с уверенность  сказать, что  между выбранными переменными существует взаимосвязь.
   Цель курсовой работы - построение эконометрической модели высокого качества и проведение ее анализа.
   В рамках поставленной цели двигаются следующие задачи:
      Построение эконометрической модели по методу наименьших квадратов;
      анализ качества модели;
      проверка модели на соответствие предпосылкам МНК.
 
В ходе исследования использовалось приложение Пакет анализа в Excel. 

Анализ  и методы 

Построим  эконометрическую модель и  проведем ее анализ согласно предложенному плану: 

1. Для  начала оценим каждую переменную в отдельности. Для этого проведем описательную статистику каждой: 
 
 
 

    А) GDP 

GDP
   
Среднее 2470,028
Стандартная ошибка 139,9444
Медиана 2273,8
Мода #Н/Д
Стандартное отклонение 791,6453
Дисперсия выборки 626702,2
Эксцесс -0,59576
Асимметричность 0,661578
Интервал 2826,4
Минимум 1374,9
Максимум 4201,3
Сумма 79040,9
Счет 32
 
Квариации=  Стандартное отклонение/ Среднее =0,320 

Коэффициент вариации для данной переменной имеет достаточно большое значение(>30%). Следовательно, изменчивость данного вариационного ряда значительна, что также можно подтвердить с помощью графика: 

 
 

По графику  видно, что с увеличением количества наблюдений( времени), растет и значение переменной. При этом нет явных  выбросов, изломов, т.е. рост достаточно равномерный.
На графике  также не наблюдается заметных отклонений, выбросов и т.д. 

    Б) Exp 

Exp
   
Среднее 1878,34375
Стандартная ошибка 104,599908
Медиана 1597,75
Мода #Н/Д
Стандартное отклонение 591,706434
Дисперсия выборки 350116,504
Эксцесс -1,12670102
Асимметричность 0,61459007
Интервал 1861,4
Минимум 1106,5
Максимум 2967,9
Сумма 60107
Счет 32
 
Квариации = 0,315015 

 

Ситуация  для второй переменной аналогична: коэффициент вариации указывает на сильную изменчивость данного ряда, а график подтверждает это.
Величина экспорта увеличивается по мере увеличения количества наблюдений, а не остается постоянной на всем промежутке. 

 В)  Rate 
 

Rate
   
Среднее 103,124063
Стандартная ошибка 1,77909505
Медиана 107,44
Мода #Н/Д
Стандартное отклонение 10,0640814
Дисперсия выборки 101,285735
Эксцесс -1,40992922
Асимметричность -0,5116764
Интервал 31,45
Минимум 85,5
Максимум 116,95
Сумма 3299,97
Счет 32
 
Квариации = 0,0976 

 

Коэффициент вариации, в отличие от предыдущих случаев, указывает на очень незначительную изменчивость ряда(< 10%). График переменной подтверждает данное утверждение.  

По результатам  описательной статистики переменных, для двух рядов(GDP, Exp) характерна высокая изменчивость, т.е. они нестабильны. В то же время, ряд Rate является неизменчивым. Вышесказанное подтверждается и с точки зрения экономической теории. Наиболее изменчивыми являются показатели экспорта и ВВП (т.к. зависят от множества факторов: предпочтений, доходов и т.д.). Обменный курс имеет относительно постоянные значения, т.к. для значительного изменения требуются такие радикальные меры как деноминация, девальвация и т.д. 

    Исследуем наличие зависимости между переменными путем построения корреляционной матрицы:
 
  GDP Exp Rate
GDP 1    
Exp 0,974371 1  
Rate 0,82368 0,757018 1
 
По результатам  данной матрицы  между всеми переменными объясняющими переменными и GDP существует очень сильная зависимость (парные коэффициенты корреляции >0,8). Значит, используя данную совокупность можно построить качественную модель.
 
    По методу наименьших квадратов построим эконометрическую модель (см. Приложение 1):
 
GDP= -1230,4 + 1,09944*Exp+ 15,8573*Rate
 (t)      -3,6848                    15,8567               3,8899 

R-квадрат = 0,96675 

Коэффициент при обменном курсе значительно  выше коэффициента при экспорте. Однако это не указывает на значимость переменных, а является последствием разных единиц измерения.
Кроме того, очевидно остаточно сильное  влияние Exp на GDP: коэффициент b1=1,099, следовательно, при изменении х на единицу y также изменяется на единицу. 

    4. С помощью Excel были получены основные статистические характеристики переменных:
                b0              b1             b2
      
(S)      333,901                   0,06934              4,07652 

(t)      -3,6848                    15,8567               3,8899 

R-квадрат = 0,96675;  

Вычислим  остальные основные характеристики регрессии, используя полученные значения: 

а) R-квадрат = 1-(RSS/TSS) = 0,96675 

б) Скорректированный R-квадрат = 1-(RSS/TSS)/((n-1)/(n-m-1)) = 0,964
(оба коэффициента детерминации совпадают с табличными значениями) 

в) статистика Дарбина-Уотсона (см. приложение 2): 

DW=?(e-e(-1))^2/?e^2= 4873762139/ 2798510921 = 0,4366 

    5. Рассчитаем 95%-ные доверительные интервалы коэффициентов: 

-1230,4- 333,91* 2,45< b0< -1230,4 + 333,91* 2,45
   b0              S               t 

-2048 < b0 < -412,3 

0,9296 < b1 < 1,269 

5,869 < b2<  25,845
      
    Проанализируем качество модели:
 
    t-статистики обоих коэффициентов указывают на очень сильную взаимосвязь с GDP(практически гарантируют наличие прямой линейной связи)(по “грубому” правилу значение обеих t-статистик > 3);
    P-значения подтверждают деланные выводы: как коэффициент b1, так и b2 значимы на любом уровне значимости (a > P?0);
    R- квадрат модели имеет очень высокое значение, т.е. Exp и Rate более, практически полностью(на 97%) объясняют поведение GDP.
    Исходя  из вышеперечисленных фактов, можно  утверждать, что качество построенной модели достаточно высокое.
    Однако, в то же время модель может не соответствовать предпосылкам МНК, а следовательно, рассчитанные значения могут оказаться завышенными либо смещенными. Поэтому следует проверить модель на адекватность. 

     7.  Для начала протестируем регрессию на наличие автокорреляции. Так как в данной работе исследуются временные ряды, то вероятность наличия этой проблемы очень высокая. Для получения точного результата используем 3 метода, результаты которых затем сравним: 

    статистика  Дарбина-Уотсона. Значение статистики уже было вычислено в 4 пункте:
DW=0,437. Остатки модели по “грубому” правилу автокоррелированы (т.к. 0,437 < 1,5).
Найдем  значения верхней и нижней границы по таблицам:
dl= 1,1
du=  1,332 
DW=0,437< dl, значит в модели однозначно присутствует положительная автокорреяция. 

    метод рядов. Определим количество положительных и отрицательных отклонений модели (см. приложение 3). Затем найдем количество рядов.
    Также предположим, что  n- объем выборки; n1- количество положительных отклонений; n2 – количество отрицательных отклонений;k- количество рядов.
По таблице  критических значений для нахождения АК по методй рядов, определим нижние и верхние границы k.
Для построенной  модели:  

n1 17
n2 15
n 32
   
k 16
 
Следовательно, k1= 11; k2=23 

Т.к. k1< k < k2, то автокорреляция остатков данной модели отсутствует. 

С) графический  метод.
Построим  график зависимости e от e(-1)):
 

Найдем, в каких четвертях сосредоточены  точки на графике: 

I 14
III 12
   
II 3
IV 0
 
 
Преобладание  точек в 1 и 3 четвертях указывает  на наличие положительной зависимости  между отклонениями в текущий и предыдущий моменты времени (т.е. положительной автокорреляции, как и по результатам статистики Дарбина-Уотсона). 

8. Проверим построенную модель на гетероскедастичность остатков. Для этого проведем тест. Парка.
Сущность  теста Парка в том, что если в модели присутствует гетероскедастичность, то вероятно существует линейная зависимость между объясняющими переменными и оценкой дисперсии отклонений.
Проведем  тест в два этапа, отдельно для  каждой переменной. Построим два уравнения, предварительно прологарифмировав переменные и остатки модели: 

Exp 

ВЫВОД ИТОГОВ      
           
Регрессионная статистика        
Множественный R 0,3391        
R-квадрат 0,115        
Нормированный R-квадрат 0,0844        
Стандартная ошибка 1,4034        
Наблюдения 32        
           
Дисперсионный анализ      
  df SS MS F Значимость F
Регрессия 1 7,4195 7,4195 3,767 0,0621
Остаток 29 57,119 1,9696    
Итого 30 64,539      
           
  Коэффициенты Стандартная ошибка t-ст P-зн  
Y-пересечение -3,374 6,5061 -0,519 0,608  
Ln(exp) 1,6806 0,8659 1,9409 0,0621  
 
Коэффициент b1 является недостаточно значимым как по значению t-статистики(<2, следовательно, присутствует слабая связь), так и при анализе P-значения (незначим на 6% уровне значимости, a<P).
Значит между остатками и переменной Exp нет связи(или очень слабая), т.е. оcтатки гомоскедастичны. 
 

Rate
ВЫВОД ИТОГОВ      
         
Регрессионная статистика      
Множественный R 0,1449955      
R-квадрат 0,0210237      
Нормированный R-квадрат -0,0127341      
Стандартная ошибка 1,4760379      
Наблюдения 32      
         
Дисперсионный анализ      
  df SS MS F
Регрессия 1 1,3568437 1,3568437 0,6227803
Остаток 29 63,181944 2,1786877  
Итого 30 64,538788    
         
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение -0,6508347 12,541201 -0,0518957 0,9589676
Ln(rate) 2,1347977 2,7051373 0,7891643 0,4364208
 
 
Коэффициент b1 в данном случае также слабо взаимосвязан с GDP. Кроме того, коэффициент статистически не значим(a=0,6<P), а следовательно гетероскедастичность не выявлена.
Таким образом, между остатками и переменными нет взаимосвязи, а, следовательно, остатки модели гомоскедастичны. 

9. Проверим  модель на отсутствие мультиколлинеарности.
Для этого  используем построенную ранее корреляционную матрицу. Частный коэффициент корреляции между объясняющими переменными высокий(>0,7),а значит в модели присутствует мультиколлинеарность. 

10. Протестируем модель, используя тест Чоу, и таким образом проверим модель на наличие точки разрыва.
 
Для начала, предположим, что разрыв наблюдается на 16 наблюдении. Разделим выборку на две части и найдем для каждой из них и для выборки в целом значение RSS(см. Приложение 5):
Затем рассчитаем по формуле F наблюдаемое:
Fн = ((RSS0-RSS1-RSS2)/(RSS1+RSS2))*((n-2(m+1))/(m+1))
RSS0 646008
RSS1 120416
RSS2 134439
   
9,97627
Fст 8,6
Fн > Fст , следовательно принимаем гипотезу о наличии точки разрыва, следовательно совокупность стоит разбивать. 

11. Можно предположить, что данное уравнение не требует корректировки путем исключения переменной (т.к. обе являются значимыми). Однако, возможно исключение все же улучшит модель.
Проверим  данное предположение с помощью  F-статистики(при этом исключим Rate, как менее значимую).
С помощью Excel построим новую модель (см. Приложение 6). 

GDP= 21,3954 + 1,30361*Export 

Проведем  анализ новой модели: значение t-статистики коэффициента b1 означает наличие очень сильной взаимосвязи(>>3); коэффициент детерминации высокий (переменная Exp более чем на 90% объясняет поведение GDP).
Таким образом, можно утверждать, что путем  исключения переменной исходная модель была улучшена. Таким образом, с первого взгляда, 2-я модель кажется также достаточно качественной.
Проверим  необходимость исключения Rate с помощью F-статистики. Для этого используем гипотезу, предполагающую, что объяснение поведения эндогенной переменной будет адекватнее у новой (короткой) регрессии.
Используя известные значения коэффициентов  детерминации, рассчитаем F-статистику: 

Fн =( ( R1^2-R2^2)/k)/(1-R^1)/(n-m-1)= 15,133
Fст = 62,3 

Т.к. Fн< Fст , то принимается нулевая гипотеза о том, что RSS обеих моделей равны, а значит исключение переменной является целесообразным. 
 

Выводы
Цель  работы (построение качественной эконометрической модели и проведение ее детального анализа) была достигнута во время написания данной работы.
Построенная модель оказалась качественной, но неадекватной, т.к. остатки модели автокоррелированы. Кроме того в ходе работы была найдена очка разрыва для модели (на 16 наблюдении). Корректировка модели путем исключения переменной оказалась необходимой, т.к. оптимальной по итогам оказалась вторая модель (зависимость GDP от Export).
При исследовании модели на предпосылки МНК, в частности на наличие автокорреляции использовались различные тесты и методы. Все  методы подтвердили наличие автокорреляции, но оптимальным по трактовке результатов и использованию оказался графический метод.

   Список  использованных источников

      - С.А Бородич. Эконометрика: Учеб. Пособие
      – экономические данные по Эстонии(2000-2007 гг)
 
Приложение 

1) 

ВЫВОД ИТОГОВ              
                 
Регрессионная статистика              
Множественный R 0,98323              
R-квадрат 0,96675              
Нормированный R-квадрат 0,96445              
Стандартная ошибка 149,252              
Наблюдения 32              
                 
Дисперсионный анализ            
  df SS MS F Значимость F      
Регрессия 2 1,9E+07 9390880 421,567 3,7E-22      
Остаток 29 646008 22276,2          
Итого 31 1,9E+07            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение -1230,4 333,901 -3,6848 0,00093 -1913,3 -547,46 -1913,3 -547,46
Exp 1,09944 0,06934 15,8567 7,9E-16 0,95763 1,24125 0,95763 1,24125
Rate 15,8573 4,07652 3,8899 0,00054 7,51985 24,1947 7,51985 24,1947
 
 
      DW- статистика
 
e e(-1) e^2 (e-e(-1))^2
18,12 53,645 328,35 1262,01
101,52 18,12 10306 6955,37
107,12 101,52 11474 31,3365
206,21 107,12 42524 9820,06
30,205 206,21 912,32 30979,1
-106,4 30,205 11330 18672,3
-117,5 -106,4 13813 122,941
-205,7 -117,5 42305 7770,62
-170,2 -205,7 28974 1257,71
-95,59 -170,2 9137,1 5569,45
-124,6 -95,59 15519 840,228
-159,5 -124,6 25424 1216,27
-61,83 -159,5 3822,8 9529,88
-23,53 -61,83 553,61 1466,9
35,19 -23,53 1238,4 3447,96
-23,9 35,19 571,09 3491,39
73,019 -23,9 5331,7 9392,74
212,27 73,019 45057 19389,8
102,26 212,27 10457 12101,8
138,55 102,26 19197 1317,34
84,58 138,55 7153,7 2913,11
175,98 84,58 30969 8354,3
166,1 175,98 27588 97,6934
131,71 166,1 17347 1182,62
177,73 131,71 31589 2118,32
156,1 177,73 24367 468,037
-89,84 156,1 8071,8 60487,6
-172,6 -89,84 29791 6848,76
-58,67 -172,6 3442,5 12979,5
-219,1 -58,67 47984 25721,4
-341,4 -219,1 116552 14968,3
-53,65 341,4 643131 280775
 
 
 
3) метод рядов 

e  
53,645 +
18,12 +
101,52 +
107,12 +
206,21 +
30,205 +
-106,4 -
-117,5 -
-205,7 -
-170,2 -
-95,59 -
-124,6 -
-159,5 -
-61,83 -
-23,53 -
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.