На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


отчет по практике Определение параметров нестационарного нелинейного уравнения регрессии

Информация:

Тип работы: отчет по практике. Добавлен: 30.11.2012. Сдан: 2011. Страниц: 10. Уникальность по antiplagiat.ru: < 30%

Описание (план):


 
 
Содержание 
 
 
 
 
 

 

ВВЕДЕНИЕ

    Специфической особенностью деятельности экономиста является работа в условиях недостатка информации и неполноты исходных данных. Анализ такой информации требует специальных методов, которые составляют один из аспектов эконометрики. Центральной проблемой эконометрики является построение эконометрической модели и определение возможностей ее использования для описания, анализа и прогнозирования реальных экономических процессов.
    Становление и развитие эконометрического метода происходили на основе так называемой высшей статистики - на методах парной и множественной регрессии, парной, частной и множественной корреляции, выделения тренда и других компонент временного ряда, на статистическом основании.
    Множественная регрессия широко используется в  решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия - один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
    Задачей данной работы является оценка адекватности и точности нелинейной нестационарной модели уравнения регрессии с использованием персональных компьютеров.
    В данной работе необходимо рассмотреть  нелинейную нестационарную модель изучаемого экономического объекта. В качестве объекта исследования представлен  производственный процесс, о котором  известны следующие статистические данные:
    1. Y(t) - ставка % рефинансирования Центробанка;
    2. X1(t) - уровень безработицы, %
    3. X2(t) - уровень инфляции, %
    Для заданного варианта совокупности предприятий  требуется найти коэффициенты нелинейной нестационарной модели уравнения множественной регрессии вида: 

                                                     ,                                            (1)
     
,

    где:
     Y(t) - ставка % рефинансирования Центробанка;
     X1(t) - уровень безработицы, %
     X2(t) - уровень инфляции, %
    Значения  величин Y(t), X1(t), Х2(t) даны в Таблице №1 "Исходные данные". Данное нелинейное уравнение требуется привести к линейному уравнению вида:
            (2) 

    Необходимо:
    определить параметры уравнения регрессии, используя замену переменной;
    проверить наличие мультиколлинеарности между факторами;
    проверить   статистическую   значимость   уравнения   в   целом   и   отдельных коэффициентов уравнения.   Это  позволит оценить  адекватность полученной модели   исследуемому    процессу   и   возможность   её   использования   для осуществления анализа и проектирования;
    проверить отсутствие гетероскедастичности и автокорреляции остатков исследуемой модели, установить адекватность и точность уравнения регрессии;
    проверить наличие аномальных наблюдений, используя метод Ирвина. 

I. Алгоритм решения.

1.1 Приведение исходного нелинейного уравнения регрессии к линейному. Проверка наличия мультиколлениарности между факторами уравнения.

 
     Введем  исходные данные и представим таблицу исходных данных как указано в методическом пособии: 
     Таблица 1
t Y(t) X1(t) X2(t)
1 37,84 20 45
2 32,28 20 25
3 33,47 18 30
4 32,66 16 30
5 30,99 19 25
6 30,21 16 25
7 26,48 14 15
8 25,62 17 12
9 25,3 13 14
10 27,95 11 15
11 24,77 12 12
12 25,43 11 15
13 29,06 9 17
14 27,21 7 18
15 26,91 8 19
16 29,54 6 20
17 29,06 4 24
18 23,82 6 12
19 24,86 3 8
20 21,95 4 6
 
    Многие  экономические процессы описываются  нелинейными уравнениями регрессии. Например, функции спроса и производственные функции. Исходя из этого, одним из недостатков линейного регрессионного анализа является то, что он может быть применен только к линейным уравнениям. В общем случае линейные уравнения выглядят так, что каждая объясняющая переменная, за исключением постоянной величины, записывается в виде произведения переменной и коэффициента:
    

    Уравнения вида у = ? + ?/х или уi = ?x? являются нелинейными.
    Уравнение является линейным в двух смыслах:
          если правая часть уравнения линейно-попеременна, если определить их в представленном виде, а не как функции, следовательно, она состоит из взвешенной суммы переменной, а параметры являются весами;
          если правая часть уравнения линейна по параметрам, так как она состоит из взвешенной суммы параметров, а переменные х в данном случае являются весами.
    Для целей линейного регрессионного анализа важное значение имеет только второй тип линейности.
    В связи с этим встает задача о возможности  привести нелинейное уравнение к  линейному виду. Рассмотрим нелинейное нестационарное уравнение:
    

    

     Y(t) - ставка % рефинансирования Центробанка;
     X1(t) - уровень безработицы, %
     X2(t) - уровень инфляции, %
    В данном случае нелинейность касается факторных переменных, но не связано  с коэффициентами уравнения. Нелинейность обычно устраняется путем замены переменных.
      Обозначим 1/x1 = Z1
                                    
    Полученное  уравнение является линейным как  по переменным, так и по параметрам. Следовательно, линейность уравнения достигается путем замены переменных. 
 

    Таблица 2
t y(t) Z1(t) Z2(t)
1 37,84 0,05 12,65149
2 32,28 0,05 8,54988
3 33,47 0,055556 9,654894
4 32,66 0,0625 9,654894
5 30,99 0,052632 8,54988
6 30,21 0,0625 8,54988
7 26,48 0,071429 6,082202
8 25,62 0,058824 5,241483
9 25,3 0,076923 5,808786
10 27,95 0,090909 6,082202
11 24,77 0,083333 5,241483
12 25,43 0,090909 6,082202
13 29,06 0,111111 6,611489
14 27,21 0,142857 6,868285
15 26,91 0,125 7,120367
16 29,54 0,166667 7,368063
17 29,06 0,25 8,320335
18 23,82 0,166667 5,241483
19 24,86 0,333333 4
20 21,95 0,25 3,301927
 
     Для нахождения матрицы коэффициентов  парной корреляции используем табличный  редактор «Excel». Выполняем команды: «Сервис» - «Анализ данных» - «Корреляция».
      Затем в диалоговом окне «Корреляция»  в поле «Входной интервал»  вводим ссылку на ячейки, содержащие анализируемые данные, включая название реквизитов. Ссылка должна состоять как минимум из двух смежных диапазонов данных, организованных в виде столбцов. В данном случае мы выделяем таблицу 2, исключая столбец «t».          
      Устанавливаем метки в окне «Метки в первой строке», так как первая строка во входном диапазоне содержит название столбцов, и «По столбцам». Выбираем параметры вывода «Новый рабочий лист». В результате проделанных действий получаем результаты анализа в виде таблицы. 

Матрица парной корреляции
  Z1(t) Z2(t) t y(t)
Z1(t) 1      
Z2(t) -0,51662 1    
t 0,857272 -0,71499 1  
y(t) -0,4927 0,963864 -0,74581 1
 
          Основная задача, стоящая при выборе факторов включаемых в корреляционную модель, заключается в том, чтобы ввести в анализ все основные факторы, влияющие на уровень изучаемого явления. Однако, введение в модель большого числа факторов нецелесообразно, правильнее отобрать только сравнительно небольшое число основных факторов, находящихся предположительно в корреляционной зависимости с выбранным функциональным показателем.
      Это можно сделать с помощью  так называемого двух стадийного  отбора. В соответствии с ним  в модель включаются все предварительно  отобранные факторы. Затем среди  них на основе специальной  количественной оценки и дополнительно качественного анализа выявляются несущественно влияющие факторы,   которые постепенно отбрасываются пока не останутся те, относительно которых можно утверждать, что имеющийся статистический материал согласуется с гипотезой об их совместном существенном влиянии на зависимую переменную при выбранной форме связи.
      Свое наиболее законченное выражение  двух стадийный отбор получил  в методике так называемого  многошагового регрессионного анализа,  при котором отсев несущественных факторов происходит на основе показателей их значимости, в частности на основе величины tф - расчетном значении критерия Стьюдента.
      Рассчитаем tф по найденным коэффициентам парной корреляции и сравним их с t критическим для 5% уровня значимости (двустороннего) и 18 степенями свободы (? = n-2).
                                         
где r – значение коэффициента парной корреляции;
      n – число наблюдений (n=20)
      При сравнении tф для каждого коэффициента с tкр = 2,101 получаем, что найденные коэффициенты признаются значимыми, т.к. tф > tкр.
  tф для ryx1 = 2, 5599;
  tф для ryx2  = 7,064206;
  tф для ryx3  = 2,40218;
  tф для rх1x2  = 4,338906;
  tф для rх1x3  = 15,35065;
  tф для rх2x3  = 4,749981 

     При отборе факторов включаемых в анализ к ним предъявляются специфические требования. Прежде всего, показатели, выражающие эти факторы должны быть количественно измеримы.
      Факторы, включаемые в модель, не должны находиться между  собой в функциональной или  близкой к ней связи. Наличие таких связей характеризуется мультиколлинеарностью.
    Мультиколлинеарность  свидетельствует о том, что некоторые  факторы характеризуют одну и  ту же сторону изучаемого явления. Поэтому  их одновременное включение в  модель нецелесообразно, так как они в определённой степени дублируют друг друга. Если нет особых предположений говорящих в пользу одного из этих факторов, следует отдавать предпочтение тому из них, который характеризуется большим коэффициентом парной (или частной) корреляции.  
    Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.
    Мультиколлинеарность  обычно приводит к вырождению матрицы  переменных и, следовательно, к тому, что главный определитель уменьшает  свое значение и в пределе становится близок к нулю. Оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.

1.2 Определение параметров уравнения регрессии.

Построение уравнения регрессии.

 
   Для нахождения коэффициентов  уравнения регрессии и статистических  критериев, характеризующих значимость  и точность найденного уравнения,  используем табличный редактор  «Ехсеl», применив команды «Сервис» - «Анализ данных» - «Регрессия».
      В диалоговом окне «Регрессия»  в поле «Входной интервал Y» вводим данные по ставкам рефинансирования Центробанка, включая название реквизита. В поле «Входной интервал X» - вводим данные по уровню безработицы и инфляции, полученных в результате замены переменной. При этом вводимые данные должны находиться в соседних столбцах. Устанавливаем «галочки» в окне «Метки», (так как первая строка входного интервала содержит заголовки) и «Уровень надежности». Затем устанавливаем переключатель: «Новый рабочий лист», и ставим «галочки» в окошке «Остатки» (для включения остатков в выходной диапазон). В результате выше перечисленных действий получаем значения коэффициентов регрессии, а также данные для анализа регрессионной модели:
        Регрессионная статистика
        Множественный R 0,975253778
        R-квадрат 0,951119932
        Нормированный R-квадрат 0,941954919
        Стандартная ошибка 0,927866659
        Наблюдения 20
 
Дисперсионный анализ      
  df SS MS F Значимость F
Регрессия 3 268,0369104 89,3456368 103,7772622 0,0000000001
Остаток 16 13,7749846 0,860936537    
Итого 19 281,811895      
 
 
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 19,04135746 1,486961643 12,80554717 0,000000001
z1(t) 12,1553273 5,393197623 2,253825681 0,038584119
z2(t) 1,462012086 0,144268764 10,13394754 0,000000023
T -0,238630408 0,088826609 -2,686474352 0,016214789
 
 
        Нижние 95% Верхние 95%
        15,88913961 22,1935753
        0,72225916 23,58839545
        1,156175971 1,767848202
        -0,426934407 -0,050326409
 
 
Вывод остатков 

Наблюдение Предсказанное y(t) Остатки
1 37,90712468 -0,067124676
2 31,67189051 0,608109485
3 33,11633369 0,353666309
4 32,96211528 -0,302115279
5 30,98798699 0,002013005
6 30,86931047 -0,659310475
7 27,1314351 -0,651435097
8 25,51044464 0,109555364
9 26,32122391 -1,021223914
10 26,65233596 1,297664036
11 25,0924781 -0,322478101
12 26,17507515 -0,745075148
13 26,95583093 2,104169068
14 27,47852343 -0,268523425
15 27,39138039 -0,481380391
16 28,02135597 1,518644029
17 30,18790311 -1,12790311
18 24,43500919 -0,615009187
19 24,40720382 0,452796178
20 22,13503867 -0,185038673
 
Соответственно  искомое уравнение регрессии  имеет вид: 
 

1.3 Анализ полученных результатов.

 
            Для проверки общего качества  уравнения регрессии используются:
R - квадрат (коэффициент множественной детерминации). Он характеризует   долю   вариации   (разброса)   зависимой   переменной (производительности труда), объясненной с помощью данного уравнения, т. е. обусловленной влиянием на нее отобранных, то есть включенных в модель факторов.
     Множественный R – коэффициент множественной корреляции, который служит основным показателем тесноты корреляционной связи. Данный коэффициент изменяется от 0 до 1.Если R=1, то связь между Y с одной стороны и аргументами х1, х3 с другой стороны является функциональной и линейной. Если R=0, то отсутствует линейная корреляционная связь, что не исключает, однако наличие в этом случае нелинейной зависимости. Во всех случаях, то есть 0<R<1, считается, что между У и х1, х3 имеется более или менее сильная корреляционная зависимость.
     Стандартная ошибка - это допустимое отклонение теоретического результатирующего фактора от фактического.
     F-критерий Фишера. Проверяется нулевая гипотеза, смысл которой заключается в том, что все коэффициенты линейной регрессии за исключением свободного члена равны нулю, и, следовательно, фактор хi не оказывает влияния на результат у. Значение F-критерия признается достоверным, если оно больше табличного, тогда нулевая гипотеза отклоняется и уравнение регрессии признается значимым. В данной задаче значимость F близка к нулю, т.е. такова вероятность принятия нулевой гипотезы.
     t-статистика Стьюдента. Оценивается  значимость коэффициентов регрессии. Эта оценка проводится путем проверки гипотезы о равенстве нулю k-го коэффициента регрессии (k = 1,2,..., m). Расчетное значение t-критерия с числом степеней свободы (n-m-1) находят путем деления k-го коэффициента регрессии на среднеквадратическое отклонение этого коэффициента, которое в свою очередь вычисляется как квадратная дисперсия остаточной компоненты и k-го диагонального элемента матрицы, обратной матрице системы нормальных уравнений относительно параметров модели. Это расчетное значение сравнивается с табличным значением критерия Стьюдента при заданном уровне значимости, и если оно больше табличного значения, коэффициент регрессии считается значимым. В противном случае соответствующий данному коэффициенту регрессии фактор следует исключить из модели, при этом качество модели не ухудшится.
     Р-значение – это вероятность принятия нулевой гипотезы по каждому коэффициенту.
     Нижние 95% и верхние 95% - это доверительный интервал для нахождения   уравнения   регрессии (границы   нахождения   значений коэффициентов регрессии).
 

II. ПРОВЕРКА ВЫПОЛНЕНИЯ УСЛОВИЙ АДЕКВАТНОСТИ МОДЕЛИ

 
Существует 4 обязательных свойства, которым должны отвечать «Остатки», чтобы найденное уравнение регрессии было адекватным:
    Случайность колебаний уровней остаточной последовательности;
    Соответствие распределения случайной компоненты нормальному закону  распределения;
    Равенство нулю математического ожидания случайной компоненты;
    Независимость значений уровней случа йной компоненты.
 
Рассмотрим  способы проверки этих свойств:
1)Для исследования случайности отклонений от уравнения регрессии находят разности ?i= yi - . В данной задаче используется критерий серий, основанный на медиане выборки. Выборка признается случайной, если для 5% уровня значимости выполняются следующие неравенства : 

Кmax < [3,3lg(n+1)] ;    ? > [1/2 (n+1-1,96vn-1)], 

Где Кmax- общая протяженность самой длинной серии, а ?- общее число серий. В работе вычислены результаты, согласно которым Кmax=3 < 4,
а ?= 13> 6. Отсюда следует, что данная модель отвечает первому свойству. 

2)Проверка второго свойства производится с помощью нахождения показателей асимметрии ? и эксцесса ?2. В качестве оценки асимметрии используются формулы: 

  ,  

, где ?1 и ?2 – выборочные характеристики асимметрии, а ?y1 и  ?y2 их среднеквадратические ошибки.
В данной работе = 1,0023, =0,326, ?y1 =0,47, ?y2 =0,76.
Если  одновременно выполняются условия | | < 1,5 ?y1 , и
<1,5 ?y1  то гипотеза о нормальном распределении принимается.  

    Если  выполняется хотя бы одно из неравенств:
    
      
,

    то  гипотеза о нормальном характере  распределения отвергается, линейная модель уравнения регрессии признается неадекватной.
    Другие  случаи требуют дополнительной проверки при помощи более сложных критериев.
    Проверка  данных неравенств показала, что не все они выполняются, поэтому  нельзя утверждать, что модель является адекватной и мы должны провести дополнительные проверки. 

3)Проверка адекватности осуществляется  на основе t- критерия Стьюдента по формуле ,
где    - среднее арифметическое значение, а S?- стандартное среднеквадратическое отклонение для этой последовательности. Т.к расчетное t = 0,000000000000108 меньше табличного, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается. 

4)Проверка независимости значений уровней случа йной компоненты производится на основе d – критерия Дарбина – Уотсона по формуле:  

     

Далее сравниваем полученное значение с критическими верхним d2 и  нижним d1 . В работе получено значение d = 2, 76. Это значение больше верхнего табличного d2 , а значит гипотеза о независимости уровней остаточной последовательности принимается. 

 


ІII.ОПРЕДЕЛЕНИЕ ТОЧНОСТИ МОДЕЛИ

 
Точность  модели характеризуется величиной  отклонения выхода модели от реального значения моделируемой переменной. Для показателя , представленного рядом значений, точность определяется как разность между значениями фактического уровня ряда и его оценкой, полученной расчетным путем с использованием моделей. При этом в качестве статистических показателей точности применяют следующие:
1)Среднее  квадратическое отклонение 
Где i = 1…n;
-фактическое значение ряда
-теоретическое значение ряда;
n- количество наблюдений;
p- количество независимых параметров.
Значение  среднего квадратического отклонения в работе = 0,875 

2)Средняя  относительная ошибка аппроксимации    
Результат, полученный в работе =0,09
3)Коэффициент  сходимости 
Результат, полученный в работе = 0,048 

4)Коэффициент  детерминации     
Результат, полученный в работе = 0,95
Коэффициент детерминации, полученный в результате расчетов равен коэффициенту детерминации из таблицы «Регрессионная статистика».
 


IV. ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА

 
    Дисперсия случайного члена уравнения регрессии  в каждом наблюдении должна быть постоянной.
    Под понятием дисперсия имеется ввиду  возможное поведение случайного члена уравнения регрессии до того как сделана выборка.
    В том случае, когда дисперсия каждого отклонения ?i неодинакова для всех значений Xi, имеет место гетероскедастичность.
    Часто появление проблемы гетероскедастичности можно предвидеть заранее, основываясь  на знании характера данных. В таких  случаях можно предпринять соответствующие действия по устранению этого эффекта на этапе спецификации модели регрессии. Это позволит уменьшить или возможно устранить необходимость формальной проверки.
    В настоящее время существует достаточно большое число тестов для обнаружения  гетероскедастичности, в которых делаются различные предположения о зависимости между дисперсией случайного члена уравнения регрессии и величиной объясняющей переменной.
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.