На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


Лекции Статистическое изучение взаимосвязи социально-экономических явлений

Информация:

Тип работы: Лекции. Добавлен: 03.07.2012. Сдан: 2011. Страниц: 26. Уникальность по antiplagiat.ru: < 30%

Описание (план):


     ГЛАВА 9
     СТАТИСТИЧЕСКОЕ  ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ  СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ 

     9.1
     ПРИЧИННОСТЬ, РЕГРЕССИЯ, КОРРЕЛЯЦИЯ
     Исследование  объективно существующих связей между  явлениями - важнейшая задача общей  теории статистики. В процессе статистического  исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения - это связь явлений и процессов, при которой изменение одного из них - причины - ведет к изменению другого - следствия.
     Причина - это совокупность условий, обстоятельств, действие которых приводит к появлению следствия. Если между явлениями действительно существуют причинно-следственные отношения, то эти условия должны обязательно реализовываться вместе с действием причин. Причинные связи носят всеобщий и многообразный характер, и для обнаружения причинно-следственных связей необходимо отбирать отдельные явления и изучать их изолированно.
     Особое  значение при исследовании причинно-следственных связей имеет выявление временнoй последовательности: причина всегда должна предшествовать следствию, однако не каждое предшествующее событие следует считать причиной, а последующее - следствием.
     В реальной социально-экономической  действительности причину и следствие  необходимо рассматривать как смежные  явления, появление которых обусловлено  комплексом сопутствующих более  простых причин и следствий. Между  сложными группами причин и следствий  возможны многозначные связи, в которых за одной причиной будет следовать то одно, то другое действие или одно действие будет иметь несколько различных причин. Чтобы установить однозначную причинную связь между явлениями или предсказать возможные следствия конкретной причины, необходима полная абстракция от всех прочих явлений в исследуемой временнoй или пространственной среде. Теоретически такая абстракция воспроизводится. Приемы абстракции часто применяются при изучении взаимосвязей между двумя признаками (парная корреляция). Но чем сложнее изучаемые явления, тем труднее выявить причинно-следственные связи между ними. Взаимное переплетение различных внутренних и внешних факторов неизбежно приводит к некоторым ошибкам в определении причины и следствия.
     Особенностью причинно-следственных связей в социально-экономических явлениях является их транзитивность, т.е. причина и следствие связаны соотношением , а не непосредственно . Однако промежуточные факторы, как правило, при анализе опускаются.
     Так, например, при использовании показателей  международной методологии расчетов фактором валовой прибыли ( ) считается валовое накопление основных и оборотных фондов ( ), но при этом допускаются такие факторы, как валовой выпуск ( ), оплата труда ( ) и т.д. Правильно вскрытые причинно-следственные связи позволяют установить силу воздействия отдельных факторов на результаты хозяйственной деятельности.
     Социально-экономические  явления представляют собой результат  одновременного воздействия большого числа причин. Следовательно, при  изучении этих явлений необходимо, абстрагируясь от второстепенных, выявлять главные, основные причины.
     На  первом этапе статистического изучения связи осуществляется качественный анализ изучаемого явления методами экономической теории, социологии, конкретной экономики.
     На  втором этапе строится модель связи на основе методов статистики: группировок, средних величин, таблиц и т. д.
     На  третьем, последнем этапе интерпретируются результаты; анализ вновь связан с качественными особенностями изучаемого явления.
     Статистика  разработала множество методов  изучения связей, выбор которых зависит от целей исследования и поставленных задач. Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки по значению для изучения взаимосвязи делятся на два класса. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, являются результативными. Связи между явлениями и их признаками классифицируются по степени тесноты связи, направлению и аналитическому выражению.
     В статистике различают функциональную связь и стохастическую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Функциональная связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности.
     Если  причинная зависимость проявляется  не в каждом отдельном случае, а  в общем, среднем при большом  числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.
     По  степени тесноты связи различают  количественные критерии оценки тесноты связи (табл. 9.1).
Таблица 9.1
Количественные  критерии оценки тесноты связи
Величина  коэффициента корреляции Характер связи
             До |±0,3| Практически отсутствует
                |±0,3|-|±0,5| Слабая
                |±0,5|-|±0,7| Умеренная
                |±0,7|-|±1,0| Сильная
     По  направлению выделяют связь прямую и обратную. При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Так, например, рост производительности труда способствует увеличению уровня рентабельности производства. В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так, с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.
     По  аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может  быть приближенно выражена уравнением прямой линии, то ее называют линейной связью; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, степенной, показательной, экспоненциальной и т. д.), то такую связь называют нелинейной или криволинейной.
     В статистике не всегда требуются количественные оценки связи, часто важно определить лишь ее направление и характер, выявить форму воздействия одних факторов на другие. Для выявления наличия связи, ее характера и направления в статистике используются методы приведения параллельных данных; аналитических группировок; графический; корреляционный, регрессионный.
     Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Сравним изменения двух величин и . С увеличением величины величина также возрастает. Поэтому связь между ними прямая, и описать ее можно или уравнением прямой, или уравнением параболы второго порядка.
1 2 3 4 5 6 7 8 9
5 6 9 10 14 17 15 20 23
     Взаимосвязь двух признаков изображается графически с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначается точкой. При отсутствии тесных связей наблюдается беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи (рис. 9.1).

     Для социально-экономических явлений  характерно, что наряду с существенными  факторами, формирующими уровень результативного признака, на него оказывают воздействие многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер и аналитически выражаются функцией вида .
     Корреляционный  метод имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).
     Корреляция  - это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.
     В статистике различаются  следующие варианты зависимостей:
    парная корреляция - связь между двумя признаками (результативным и факторным или двумя факторными);
    частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков;
    множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.
     Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя  количественную характеристику тесноты  связи между признаками, дают возможность определить «полезность» факторных признаков при построении уравнений множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.
     Первоначально исследования корреляции проводились в биологии, а позднее распространились и на другие области, в том числе на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: корреляция оценивает силу (тесноту) статистической связи, регрессия исследует ее форму. Та и другая служат для установления соотношения между явлениями, для определения наличия или отсутствия связи.
     Корреляционный  и регрессионный  анализ как общее понятие включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи (регрессионный анализ).
     Регрессионный метод заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной) и многофакторной (множественной).
     По  форме зависимости различают:
    линейную регрессию, которая выражается уравнением прямой (линейной функцией) вида: ;
    нелинейную регрессию, которая выражается уравнениями вида:
     
- парабола;

     
- гипербола и т.д.

     По  направлению связи различают:
    прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;
    обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.
     Положительную и отрицательную регрессии можно легче понять, если использовать их графическое изображение (рис. 9.2, 9.3).
 


     Для простой (парной) регрессии в условиях, когда достаточно полно установлены  причинно-следственные связи, приобретает практический смысл только последнее положение; при множественности причинных связей невозможно четко отграничить одни причинные явления от других. 

     9.2
     ОСНОВНЫЕ  ЗАДАЧИ И ПРЕДПОСЫЛКИ  ПРИМЕНЕНИЯ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО АНАЛИЗА
     Все явления и процессы, характеризующие социально-экономическое развитие и составляющие единую систему национальных счетов, тесно взаимосвязаны и взаимозависимы между собой.
     В статистике показатели, характеризующие  эти явления, могут быть связаны  либо корреляционной зависимостью, либо быть независимыми (см. табл. 9.1).
     Корреляционная  зависимость является частным случаем  стохастической зависимости, при которой  изменение значений факторных признаков  влечет за собой изменение среднего значения результативного признака.
     Корреляционная  зависимость исследуется с помощью  методов корреляционного и регрессионного анализов.
     Корреляционный  анализ изучает взаимосвязи  показателей и  позволяет оценить:
    тесноту связи между показателями с помощью парных, частных и множественных коэффициентов корреляции (раздел 9.6);
    уравнение регрессии.
     Основной  предпосылкой применения корреляционного  анализа является необходимость  подчинения совокупности значений всех факторных  и результативного ( ) признаков -мерному нормальному закону распределения или близость к нему. Если объем исследуемой совокупности достаточно большой , то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсона, Ястремского, Боярского, Колмогорова, чисел Вастергарда и т.д. Если , то закон распределения исходных данных определяется на базе построения и визуального анализа поля корреляции. При этом если в расположении точек наблюдается линейная тенденция, то можно предположить, что совокупность исходных данных подчиняется нормальному распределению.
     Целью регрессионного анализа  является оценка функциональной зависимости условного среднего значения результативного признака ( ) от факторных .
     Основной  предпосылкой регрессионного анализа является то, что только результативный признак ( ) подчиняется нормальному закону распределения, а факторные признаки могут иметь произвольный закон распределения. В анализе динамических рядов в качестве факторного признака выступает время . При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным ( ) и факторными признаками.
     Уравнение регрессии, или статистическая модель связи социально-экономических явлений, выражаемая функцией
     
,

является  достаточно адекватной реальному моделируемому  явлению или процессу, если выполняются  следующие требования к их построению:
    совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями;
    моделируемые явления должны описываться одним или несколькими уравнениями причинно-следственных связей;
    все факторные признаки должны иметь количественное (цифровое) выражение;
    объем исследуемой выборочной совокупности должен быть достаточно большим;
    причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной формами зависимости;
    параметры модели связи не должны иметь количественных ограничений;
    территориальная и временная структура изучаемой совокупности должна быть постоянной.
     Соблюдение  данных требований позволяет исследователю построить статистическую модель связи, наилучшим образом аппроксимирующую моделируемые социально-экономические явления и процессы.
     Теоретическая обоснованность моделей взаимосвязи, построенных на основе корреляционно-регрессионного анализа, обеспечивается соблюдением следующих основных условий.
    все признаки и их совместные распределения должны подчиняться нормальному закону распределения;
    дисперсия моделируемого признака ( ) должна все время оставаться постоянной при изменении величины ( ) и значений факторных признаков;
    отдельные наблюдения должны быть независимыми, т.е. результаты, полученные в 1-м наблюдении, не должны быть связаны с предыдущими и содержать информацию о последующих наблюдениях, а также влиять на них.
     Отступление от выполнения этих условий и предпосылок приводит к тому, что модель регрессии будет неадекватно отражать реально существующие связи между анализируемыми признаками.
     Одной из проблем построения уравнения  регрессии является ее размерность, т.е. определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным.
     Сокращение  размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, реализуемую быстрее и качественнее. В то же время построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс в единой системе национального счетоводства.
     Практика  выработала определенный критерий, позволяющий  установить оптимальное соотношение  между числом факторных признаков, включаемых в модель, и объемом  исследуемой совокупности. Согласно данному критерию, число факторных  признаков ( ) должно быть в 5-6 раз меньше объема изучаемой совокупности.
     Общая блок-схема реализации корреляционного  и регрессионного методов анализа  представлена на рис. 9.4.

     Приведенная последовательность реализации корреляционного и регрессионного методов анализа позволяет достаточно полно охарактеризовать и смоделировать реально существующие взаимосвязи и взаимозависимости между показателями, характеризующими развитие социально-экономических явлений и процессов.
     Построение  корреляционно-регрессионных моделей, какими бы сложными они ни были, само по себе не вскрывает полностью всех причинно-следственных связей. Основой их адекватности является предварительный качественный анализ, основанный на учете специфики и особенностей исследуемых социально-экономических явлений и процессов. 

     9.3
     ПАРНАЯ  РЕГРЕССИЯ НА ОСНОВЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ И МЕТОДА ГРУППИРОВОК
     Парная  регрессия характеризует связь между двумя признаками - результативным и факторным. Аналитическая связь между ними описывается следующими уравнениями:
      прямой 
- (9.1)
    гиперболы
-
    параболы
- и т.д.
 
     Определить  тип уравнения можно, исследуя зависимость  графически. Однако существуют более  общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если факторный признак увеличивается в арифметической прогрессии, а результативный - значительно быстрее, то используется связь параболическая или степенная.
     Оценка  параметров уравнений регрессии ( , и в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.
     Основной  принцип метода наименьших квадратов рассмотрим на следующем примере: будем считать, что две величины (два показателя) и взаимосвязаны между собой, причем находится в некоторой зависимости от . Следовательно, будет зависимой, а -независимой величинами.
     Сущность  метода наименьших квадратов заключается  в нахождении параметров модели ( , ), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
     
.

     Для прямой зависимости:
     
.

     Рассмотрим  в качестве функции параметров и , проведем математические преобразования (дифференцирование) и получим:
     

     Откуда  система нормальных уравнений для  нахождения параметров линейной парной регрессии методом наименьших квадратов примет следующий вид:
(9.2)
где - объем исследуемой совокупности (число единиц наблюдений).
     В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр (а в уравнении параболы и ) - коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
     Пример. Имеются следующие данные о показателях, характеризующих деятельность 10 аудиторско-консультационных фирм Москвы в 2001 г. (табл. 9.2).
Таблица 9.2
Расчет сумм для определения параметров парного линейного уравнения регрессии*
№ п/п Общая численность профессионалов,
чел.

Совокупная  выручка, млн. руб.
1 23 2,62 529 60,26 2,661
2 32 3,04 1024 97,28 2,967
3 50 3,15 2500 157,50 3,579
4 53 3,83 2809 202,99 3,681
5 55 3,58 3025 196,90 3,749
6 58 4,08 3364 236,64 3,851
7 59 4,09 3481 241,31 3,885
8 62 4,20 3844 260,40 3,987
9 69 4,18 4761 288,42 4,225
10 75 4,24 5625 318,00 4,429
Итого 536 37,01 30962 2 059,7 37,010
* Данные условные
     Предположим наличие линейной зависимости между  рассматриваемыми признаками.
     Система нормальных уравнений для данного  примера имеет вид
     

     

     Отсюда: ; .
     Следовательно, . Таким образом, при увеличении числа профессионалов фирмы на одного человека ее совокупная выручка увеличится в среднем на 34 тыс. руб.
     На  практике часто исследования проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в сводной корреляционной таблице. При этом анализу подвергаются сгруппированные данные и по факторному , и по результативному признакам, т.е. уравнение парной регрессии целесообразно строить на основе сгруппированных данных.
     Если  значения признаков  и заданы в определенных интервалах (аb), то для каждого интервала сначала определяют середину интервала , а затем уже коррелируют значения и и строят 2 уравнения регрессии между ними.
     Пример. Определим зависимость между величиной капитала и объемом вложений в ценные бумаги коммерческих банков РФ на 01.01.2002 г. (табл. 9.3).
     Система нормальных уравнений для определения  коэффициентов уравнения регрессии примет вид:
(9.3)
где - число анализируемых коммерческих банков;
    ; - число банков согласно распределению соответственно по факторному и результативному признакам;
    ; - значение результативного и факторного признаков по конкретной группе коммерческих банков.
     Так, для первой группы:
     
;

     
;

     
;

     
.

     Таким образом, подставив в систему  суммарные значения, получим:
     

     
;
.

     Отсюда: .
Таблица 9.3
Распределение коммерческих банков РФ по величине капитала и объему вложений в ценные бумаги на 01.01.2002 г. (данные условные)
Группы  коммерческих банков по величине капитала, млн. руб.,

Группы  коммерческих банков по объему вложений в ценные бумаги, млн. руб.,
Число коммерческих банков,

       
 
 

0-528 52,8-105,6 105,6-158,4 158,4-211,2
26,4 79,2 132,0 184,8
0,1-91,8 45,95 5 1 2 - 8 367,6 21835,44
91,8-183,5 137,65 3 5 1 1 10 1376,5 109018,80
183,5-275,2 229,35 - 3 2 1 6 1376,1 157425,84
275,2 - 366,9 321,05 - 1 2 3 6 1926,3 288174,48
Число коммерческих банков,
- 8 10 7 5 30 5046,5 576454,56
- 211,2 792,0 924,0 924,0 2851,2 - -
- 5575,68 62726,4 121968,0 170755,2 361025,28 - -
     Если  связь между признаками и криволинейная и описывается уравнением параболы второго порядка, то
     
.

     В данном случае задача сводится к определению  неизвестных параметров: , , .
     Значения  величин  и представлены двумя рядами данных:
     Если  бы все значения, полученные по данным наблюдения, лежали строго на кривой, описываемой  уравнением параболы, или для каждой из точек было бы справедливо равенство:
     
,

то не существовало бы никаких проблем. Однако на практике имеем другое:
     

где - разность между данными наблюдения и данными, полученными по уравнению связи.
     Эта разность как раз и появляется из-за ошибок упрощения, поэтому возникает проблема нахождения таких коэффициентов уравнения (регрессии), при которых ошибка была бы минимальной. Можно минимизировать сумму абсолютных отклонений (ошибок), т.е.
     
,

или минимизировать сумму кубических ошибок, и тогда  получим метод наименьших кубов:
     
,

или, наконец, минимизировать наибольшую абсолютную ошибку:
     
.

     Однако  наиболее оптимальным вариантом  является оценка ошибки по методу наименьших квадратов:
     
.

     Метод наименьших квадратов обладает тем  замечательным свойством, что делает число нормальных уравнений равным числу неизвестных коэффициентов. Приведенное уравнение параболы второго порядка имеет три неизвестных коэффициента: , , .
     Следовательно, применяя метод наименьших квадратов, мы получим уравнение:
     
.

     Для нахождения значений неизвестных коэффициентов  , , , при которых функция была бы минимальной, необходимо приравнять частные производные по этим величинам нулю, т.е.
     

     Проделав  простейшие преобразования, получим систему нормальных уравнений:
(9.4)
     Решив систему, найдем значения неизвестных  коэффициентов  , , и получим уравнение регрессии. Вычислим по уравнению регрессии теоретические значения и сравним с данными наблюдения, т.е. рассчитаем так называемую остаточную сумму квадратов (табл. 9.4).
Таблица 9.4
Расчет  остаточной суммы  квадратов
Номер наблюдения 
Значения  по данным
наблюдения Уравнения регрессии

1
2
3
.
 
     Остаточная  сумма квадратов совпадает с  минимальной возможной величиной  по методу наименьших квадратов.
     Оценка  обратной зависимости между и , когда с увеличением (уменьшением) уменьшается (увеличивается) результативный признак , может быть осуществлена на основе уравнения гиперболы:
     
.

     Систему нормальных уравнений для нахождения параметров гиперболы можно представить  следующим образом:
(9.5)
     Применение  метода наименьших квадратов объясняется  неизбежным наличием случайных ошибок в результатах опыта.
     Статистические  данные обладают ошибками упрощения, которые  возникают как  следствие:
    неполноты охвата, потому что часть единиц совокупности, полученных в результате наблюдения, не может быть использована в исследовании;
    неполноты факторов, определяющих то или иное социально-экономическое явление, в силу того, что ни в одно уравнение, или модель, нельзя включить бесконечное число аргументов (во всех случаях отбирается только часть воздействующих факторов, причем отбор носит чисто субъективный характер);
    характера выбранного уравнения связи. Как бы хорошо оно ни было обосновано, как бы теоретически адекватно ни описывало исследуемое явление, оно не может быть его точным аналогом.
     Решение вопроса о возможности использования  метода наименьших квадратов для  изучения связей между социально-экономическими явлениями зависит от свойства оценок, получаемых с помощью этого метода.
     Даже  при сравнительно небольшом числе наблюдений применение метода наименьших квадратов позволяет получить достоверные оценки.
     Метод наименьших квадратов может быть также использован в анализе  косвенных наблюдений, являющихся функциями  многих неизвестных.
     Обобщенная блок-схема построения уравнения парной регрессии представлена на рис. 9.5.
 

     9.4
     МНОЖЕСТВЕННАЯ (МНОГОФАКТОРНАЯ) РЕГРЕССИЯ
     Изучение  связи между тремя и более  связанными между собой признаками носит название множественной (многофакторной) регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т.е. требуется определить аналитическое выражение связи между результативным признаком ( ) и факторными признаками ( ), найти функцию:
(9.6)
     Построение  моделей множественной регрессии  включает несколько этапов:
    выбор формы связи (уравнения регрессии);
    отбор факторных признаков;
    обеспечение достаточного объема совокупности для получения несмещенных оценок.
     Рассмотрим  каждый из них.
     Выбор формы связи затрудняется тем, что  с использованием математического  аппарата теоретически зависимость  между признаками выражается большим  числом различных функций.
     Выбор типа уравнения осложнен тем, что  для любой формы зависимости  выбирается целый ряд уравнений, которые в определенной степени  будут описывать эти связи. Некоторые  предпосылки для выбора определенного  уравнения регрессии получают на основе анализа предшествующих аналогичных исследований или на базе анализа подобных работ в смежных отраслях знаний. Поскольку уравнение регрессии строится главным образом для объяснения и количественного выражения взаимосвязей, оно должно хорошо отражать сложившиеся между исследуемыми факторами фактические связи.
     Наиболее  приемлемым способом определения вида исходного уравнения регрессии  является метод перебора различных уравнений.
     Сущность  данного метода заключается в  том, что большое число уравнений (моделей) регрессии, отобранных для описания связей какого-либо социально-экономического явления или процесса, реализуется на ЭВМ с помощью специально разработанного алгоритма перебора с последующей статистической проверкой, главным образом, на основе -критерия Стьюдента и -критерия Фишера-Снедекора.
     Способ  перебора является достаточно трудоемким и связан с большим объемом  вычислительных работ.
     Практика  построения многофакторных моделей  взаимосвязи показывает, что все  реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:
     1) линейную:
     
;

     2) степенную:
     
;

     3) показательную:
     
;

     4)  параболическую:
     
;

     5) гиперболическую:
     
.

     Основное  значение имеют линейные модели в  силу простоты и логичности их экономической  интерпретации. Нелинейные формы зависимости  приводятся к линейным путем линеаризации.
     Важным  этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.
     Сложность формирования уравнения множественной  регрессии заключается в том, что почти все факторные признаки находятся в зависимости один от другого.
     Определение размерности модели связи, т.е. определение оптимального числа факторных признаков, является одной из основных проблем построения множественного уравнения регрессии. В то же время чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. Но построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.
     Проблема  отбора факторных  признаков для построения моделей взаимосвязи может быть решена на основе эвристических или многомерных статистических методов анализа.
     Метод экспертных оценок как эвристический метод анализа основных макроэкономических показателей, формирующих единую международную систему расчетов, основан на интуитивно-логических предпосылках, содержательно-качественном анализе (подробнее данный метод рассмотрен в главе 13). Анализ экспертной информации проводится на базе расчета и анализа непараметрических показателей связи: ранговых коэффициентов корреляции Спирмена, Кендалла и конкордации (раздел 9.8).
     Наиболее  приемлемым способом отбора факторных  признаков является метод шаговой регрессии (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым прямым методом. При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и растет величина множественного коэффициента корреляции ( ). Одновременно используется и обратный метод, т.е. исключение факторов, ставших незначимыми на основе -критерия Стьюдента. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значение коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициент регрессии не изменяется (или меняется несущественно), то данный признак существенен, и его включение в уравнение регрессии необходимо.
     Если  же при включении в модель факторного признака коэффициенты регрессии меняют не только величину, но и знаки, а множественный коэффициент корреляции не возрастает, то данный факторный признак признается нецелесообразным для включения в модель связи.
     Сложность и взаимное переплетение отдельных  факторов, обусловливающих исследуемое  экономическое явление (процесс), могут проявляться в так называемой мультиколлинеарности. Под мультиколлинеарностью понимается тесная зависимость между факторными признаками, включенными в модель.
     Наличие мультиколлинеарности между признаками приводит к следующему:
    искажению величины параметров модели, которые имеют тенденцию к завышению;
    изменению смысла экономической интерпретации коэффициентов регрессии;
    слабой обусловленности системы нормальных уравнений;
    осложнению процесса определения наиболее существенных факторных признаков.
     В решении проблемы мультиколлинеарности можно выделить несколько этапов:
    установление наличия мультиколлинеарности;
    определение причин возникновения мультиколлинеарности;
    разработку мер по ее устранению.
     Возникновение мультиколлинеарности между признаками вызвано следующими причинами:
    факторные признаки характеризуют одну и ту же сторону явления или процесса: например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;
    в качестве факторных признаков используются показатели, суммарное значение которых представляет собой постоянную величину;
    факторные признаки являются составными элементами друг друга;
    факторные признаки по экономическому смыслу дублируют друг друга.
     Одним из индикаторов определения наличия  мультиколлинеарности между признаками является превышение парным коэффициентом  корреляции величины и др.
     Устранение  мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы. Вопрос о том, какой из факторов следует отбросить, решается на основании качественного и логического анализов изучаемого явления.
     Качество  уравнения регрессии зависит  от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к  увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.
     Аналитическая форма выражения связи результативного  признака и ряда факторных называется многофакторным (множественным) уравнением регрессии, или моделью связи.
     Уравнение линейной множественной регрессии  имеет вид:
(9.7)
где - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;
- факторные признаки;
 - параметры модели (коэффициенты регрессии).
     Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и т.д.
     Методом наименьших квадратов (см. раздел 9.3) минимизируем выражение:
     
;

     
;
;
; …;
.

     Например, по параметру  :
     
.

     Сделав  соответствующие преобразования по всем значениям параметров получим:
     
,

отсюда:
     
.

     В результате таких преобразований система  нормальных уравнений с  неизвестными (по числу параметров ) имеет вид
(9.8)
     Таким образом, обобщенная блок-схема построения множественного уравнения регрессии  может быть представлена в следующем  виде (рис. 9.6).

     Одним из способов построения множественных уравнений регрессии является построение модели связи в стандартизованном масштабе.
     Оценка  влияния каждого факторного признака, включенного в уравнение регрессии, на результативный признак может быть значительно затруднена, если факторные признаки различны по своей сущности и имеют различные единицы измерения. В этих случаях для более точной оценки влияния факторных признаков на результативный используют множественные модели регрессии в стандартизованном масштабе. Модель регрессии в стандартизованном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты по формуле
,
(9.9)
где - значение признака в натуральном масштабе.
     Уравнение множественной регрессии в стандартизованном масштабе следующее:
,
(9.10)
где - стандартизованные значения признаков ;
- среднее значение стандартизованной переменной соответствующего результативного признака, полученного по уравнению регрессии;
 - стандартизованные коэффициенты регрессии.
     Параметры многофакторной модели регрессии в  стандартизованном масштабе определяются методом наименьших квадратов, рассмотренным выше.
     Представим  систему нормальных уравнений:
     
где -  значение результативного признака в стандартизованном масштабе.
     Коэффициенты  дают возможность провести сравнительную оценку силы влияния изменения каждого факторного признака на изменение результативного (моделируемого) признака.
     От  уравнения в стандартизованном  масштабе можно легко перейти  к уравнению в натуральном  масштабе. Коэффициенты получают из соотношения
,
(9.11)
а свободный  член - из выражения
.

     Пример. По следующим данным о прибыли ( ), численности работающих ( ) и стоимости основных фондов ( ) АОЗТ «Скат» определим зависимость между признаками (табл. 9.5).
     Система нормальных уравнений имеет вид
     

     

     Таким образом,
     
.

Таблица 9.5
Расчетные данные для определения  параметров уравнения  регрессии*
№ п/п Численность работающих,
чел.,

Стоимость основных
фондов,
млн. руб.,

Прибыль, тыс. руб.

1 77 5,9 1070 5 929 454,3 82 390 34,81 6313,0 1012,8
2 77 5.9 1001 5 929 454,3 77 077 34,81 5905,9 1012,8
3 81 4,9 789 6 561 396,3 63 909 24,01 3866,1 854,7
4 82 4,3 779 6 724 352,6 63 878 18,49 3349,7 817,8
5 89 3,9 606 7 921 347,1 53 934 15,21 2363,4 530,8
6 96 4,3 221 9 216 412,8 21216 18,49 950,3 237,1
Итого 502 29,2 4 466 42 280 2418,0 362 404 145,82 22 748,4 4466,0
*Данные  условные.
 
     9.5
     ОЦЕНКА  СУЩЕСТВЕННОСТИ СВЯЗИ. ПРИНЯТИЕ РЕШЕНИЙ НА ОСНОВЕ УРАВНЕНИЯ РЕГРЕССИИ
     Проверка  адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.
     Значимость  коэффициентов регрессии осуществляется с помощью  -критерия Стьюдента:
,
(9.12)
где - дисперсия коэффициента регрессии.
     Параметр модели признается статистически значимым, если
     
,

где
    уровень значимости критерия проверки гипотезы о равенстве нулю параметров, измеряющих связь, т.е. статистическая существенность связи утверждается при отклонении нулевой гипотезы об отсутствии связи;
    число степеней свободы, которое характеризует  число свободно варьирующих элементов  совокупности.
     Наиболее  сложным в этом выражении является определение дисперсии, которая может быть рассчитана двояким способом.
     Наиболее  простой способ, выработанный методикой  экспериментирования, заключается  в том, что величина дисперсии  коэффициента регрессии может быть приближенно определена по выражению
,
(9.13)
 
где
    дисперсия результативного признака;
 
    число факторных  признаков в уравнении.
     Более точную оценку величины дисперсии можно  получить по формуле:
,
(9.14)
 
где
    величина множественного коэффициента корреляции по фактору с остальными факторами.
     Проверка  адекватности всей модели осуществляется с помощью расчета -критерия и величины средней ошибки аппроксимации .
     Если  при или , то - гипотеза о несоответствии заложенных в уравнении регрессии связей реально существующим отвергается. Величина определяется по специальным таблицам на основании величины или и числа степеней свободы:
     
,
,

где
    число наблюдений;
 
    число факторных  признаков в уравнении.
     Значение  средней ошибки аппроксимации не должно превышать 12-15%.
     
,

где
    средняя ошибка аппроксимации.
     Наиболее  сложным этапом, завершающим регрессионный  анализ, является интерпретация уравнения, т.е. перевод его с языка статистики и математики на язык экономики.
     Интерпретация моделей регрессии (рис. 9.7) осуществляется методами той отрасли знаний, к  которой относятся исследуемые  явления. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков, т.е. с выяснения, как они влияют на величину результативного признака. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак со знаком минус, то с его увеличением результативный признак уменьшается. Интерпретация этих знаков полностью определяется социально-экономическим содержанием моделируемого (результативного) признака. Если его величина изменяется в сторону увеличения, то плюсовые знаки факторных признаков имеют положительное влияние. При изменении результативного признака в сторону снижения положительное значение имеют минусовые знаки факторных признаков. Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он со знаком минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает из-за допущенных ошибок при решении. Однако при анализе совокупного влияния факторов при наличии взаимосвязей между ними характер их влияния может меняться. Для того чтобы быть уверенным, что факторный признак изменил знак влияния, необходима тщательная проверка решения данной модели, так как часто знаки могут меняться в силу допущенных ошибок при сборе или обработке информации.
     При анализе адекватности уравнения  регрессии исследуемому процессу возможны следующие варианты.
    построенная модель на основе ее проверки по -критерию Фишера в целом адекватна, и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений и осуществления прогнозов;
    модель по -критерию Фишера адекватна, но часть коэффициентов регрессии незначима. В этом случае модель пригодна для принятия некоторых решений, но не для производства прогнозов;
    модель по -критерию Фишера адекватна, но все коэффициенты регрессии незначимы. В этом случае модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.
     С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности, определяемые по формуле
,
(9.15)
 
где
    коэффициент эластичности;
 
    среднее значение соответствующего факторного признака;
 
    среднее значение результативного признака;
 
    коэффициент регрессии при соответствующем  факторном признаке.
     Коэффициент эластичности показывает, на сколько  процентов в среднем изменится  значение результативного признака при изменении факторного признака на 1%.
     Пример. Рассчитаем коэффициент эластичности ( ) по исходным данным зависимости между прибылью АОЗТ «Скат» ( ), численностью работающих ( ) и стоимостью основных фондов ( ) по данным табл. 9.5.
     
;
;

     
;

     
;
;

     

     

     Это значит, что при увеличении численности  работающих на 1% прибыль АОЗТ «Скат» снизится на 4,7%, а при увеличении стоимости основных фондов на 1% прибыль  снизится на 0,05%.
     Другим  показателем экономического анализа  является частный коэффициент детерминации:
,
(9.16)
 
где
    частный коэффициент  детерминации:
 
    парный  коэффициент корреляции между результативным и -м факторным признаками;
 
    соответствующий коэффициент уравнения множественной  регрессии в стандартизованном  масштабе.
     Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией 1-го признака, входящего в множественное уравнение регрессии.
     Пример. По данным, приведенным в табл. 9.5, рассчитаем частный коэффициент детерминации для фактора - численности работающих:
     

     

     

     

     

     

     

     

     

     

     

     

     Рассчитаем  - частный коэффициент детерминации для фактора - стоимости основных фондов:
     

     

     

     

     

     

     

     

     Это свидетельствует о том, что на 99% вариация прибыли АОЗТ «Скат» объясняется  изменением численности работающих.
     Множественный коэффициент детерминации ( ) представляющий собой множественный коэффициент корреляции в квадрате; он характеризует, какая доля вариации результативного признака обусловлена изменением факторных признаков, входящих в многофакторную регрессионную модель.
     Для более точной оценки влияния каждого  факторного признака на моделируемый используют -коэффициент, определяемый по формуле
(9.17)
 
где
    коэффициент вариации соответствующего факторного признака;
 
    для фактора  - численности работающих:
     

     

     

     

     Для фактора - стоимости основных фондов:
     

     

     

     

     В целом, оценивая положительно значение уравнений регрессии как адекватных моделей связи, необходимо отметить их отрицательные свойства. Хорошую  аппроксимацию эти модели имеют только для тех значений результативного признака, которые находятся в середине ранжированного ряда индивидуальных значений признака.
     Ошибка  аппроксимации для данных значений не превышает 1-2%. На концах же исходного  ряда величина ошибки аппроксимации может достигать до 50%. На основе уравнений регрессии невозможно получить оптимальное значение моделируемого показателя. Модели на основе уравнений регрессии обладают слабыми экстраполяционными свойствами, так как не отражают тенденции развития социально-экономических явлений и процессов и годны для построения лишь краткосрочных прогнозов, носящих вероятностный характер.
     Таким образом, обобщенная блок-схема интерпретации  моделей регрессии имеет вид (рис. 9.7).

     Наиболее  полная экономическая интерпретация  моделей регрессии позволяет  выявить резервы развития и повышения  деловой активности субъектов экономики. 

     9.6
     СОБСТВЕННО-КОРРЕЛЯЦИОННЫЕ ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ СВЯЗИ. ОЦЕНКА СУЩЕСТВЕННОСТИ КОРРЕЛЯЦИИ
     Измерение тесноты и направления связи  является важной задачей изучения и  количественного измерения взаимосвязи  социально-экономических явлений. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных) факторов.
     Линейный  коэффициент корреляции был впервые введен в начале 1890-х гг. Пирсоном, Эджвортом и Велдоном и характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.
     В теории разработаны и на практике применяются различные модификации  формул для расчета данного коэффициента:

и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.