На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


реферат Методы многомерного статистического анализа

Информация:

Тип работы: реферат. Добавлен: 18.07.2012. Сдан: 2011. Страниц: 6. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Тема 9. Методы многомерного статистического  анализа. 

1. Модели латентных  переменных в социологии.
      Изучение  социальных процессов ограничиваться методами пассивного эксперимента. При  анкетировании, интервьюировании, тестировании он ограничивается регистрацией ответов-реакций на предложенные вопросы-признаки, которые, как предполагается, являются отражением скрытых социальных характеристик эмпирически наблюдаемого явления. В следствии этого, необходимым этапом в познании и понимании сущности социальных явлений является выявление этих латентных объясняющих характеристик (факторов, признаков) и их содержательная интерпретация.
      Для выявления и изучения латентных  переменных в основном используют модели факторного анализа и латентно-структурный  анализ.
    Факторный анализ – это группа методов многомерного статистического анализа, которые позволяют представить в компактной форме обобщенную информацию о структуре связей между наблюдаемыми признаками изучаемого социального объекта. Среди задач, для решения которых используются методы факторного анализа, можно выделить следующие: понижение размерности пространства признаков; классификация объектов; выявление структуры взаимосвязей в наборе признаков; преобразование исходных переменных к более удобному для интерпретации виду; построение обобщающего показателя (индекса, шкалы); осуществление типологии объектов наблюдения; преобразование данных для использования в других моделях.
    Основное  предположение факторного анализа  заключается в том, что совокупность измеренных переменных можно выразить в виде меньшего числа показателей – факторов. Таким образом, фактор представляет собой некую «модельную» характеристику объектов изучаемого множества. Данное предположение основывается на допущении, что на наблюдаемые признаки оказывает влияние (в той или иной степени) некий не наблюдаемый признак.
2. Модели факторного  анализа, возможности  использования факторного  анализа в социологии.
    Следует различать две основных модели факторного анализа: поисковую, которая нацелена на первоначальное исследование некоего сложного явления, на поиск гипотез о структуре этого явления; и направленный факторный анализ, имеющий целью проведение направленного эксперимента для подтверждения уже выдвинутой теоретической гипотезы.
    В первом случае исследователь не имеет гипотезы относительно структуры взаимосвязей между признаками. Он исходит лишь из общего для факторного анализа предположения о наличии таких взаимосвязей и о возможности выразить их с помощью небольшого числа факторов. Подбор признаков осуществляется при этом экспертно, по принципу их связи с изучаемым явлением. Такой подход является самым распространенным в современных прикладных социально-экономических исследованиях с использованием факторного анализа. Привлечение моделей факторного анализа при таком подходе может ставить целью: выдвижение гипотезы о размерности явления, выявление наиболее информативных измерителей процесса или явления — факторов, выдвижение гипотез о природе этих факторов. В случаях, когда нет гипотезы о факторной структуре, серьезную проблему представляет интерпретация факторной матрицы. Поэтому для интерпретации полученной факторной структуры часто приходится привлекать дополнительную информацию.
    При проведении направленного факторного эксперимента с целью проверки выдвинутой априорной гипотезы объекты наблюдения и признаки отбираются в соответствии с имеющейся теоретической гипотезой. Последняя может быть сформулирована в виде каких-то априорных ограничений относительно факторов или предполагаемого вида факторной матрицы. В этом случае задача сводится к выяснению вопроса, может ли полученная эмпирическим путем корреляционная матрица быть преобразована в факторную матрицу предполагаемого вида. Подход, нацеленный на проверку гипотез, характерен для более продвинутых стадий исследования. Следует заметить, что в прикладных исследованиях экономистов и социологов (в отличие от работ психологов) такой подход все ещё редок.
    Рассмотрим  несколько типичных задач с применением факторного анализа.
    - Определение размерности изучаемого сложного явления, т. е. нахождение минимального числа наиболее существенных и относительно независимых характеристик, с достаточной полнотой описывающих изучаемое явление (свободное время, социальная экология больших городов, уровень жизни, уровень экономического развития стран и др.).
    - Преимущество факторного анализа  состоит в том, что форма  выдачи результатов, а именно  матрица факторных нагрузок, дает  материал для интерпретации размерности,  т. е. позволяет судить о  том, что же представляют собой, из чего складываются основные измерения. Эта особенность факторного анализа обусловливает его использование в качестве метода выдвижения гипотез о природе и причинном характере изучаемых взаимосвязей.
    - Построение обобщенного  показателя является некоторым вариантом задачи выявления размерности. Здесь смысл обобщенного показателя — фактора заранее ясен. Задача состоит в построении шкалы для измерения этого фактора (уровень экономического развития, уровень жизни, обобщенная характеристика размера предприятия и т. д.).
    - Задачи типологии.  Часто исследователь сталкивается с необходимостью подразделить множество наблюдаемых им объектов или явлений, описанных неким набором признаков, на максимально однородные (по этим признакам) группы. Факторный анализ используется как метод разработки критериев типологии, такими критериями служат факторы. Обычно при построении таксономии в рассмотрение включают большое число признаков, чтобы полнее охватить внутренние взаимосвязи явлений. В таких случаях полезна предварительная группировка признаков, выявление и интерпретация основных факторов. Таксономия, осуществленная отдельно по каждому фактору, легче поддается интерпретации: таксоны получают компактное описание, становится возможным сравнение таксонов по средним значениям факторов. Преимущество таксономии по факторам состоит в возможности ее визуального представления (если число факторов не более трех), что весьма облегчает интерпретацию таксонов.
    - Пространственно-временные сопоставления. Анализ системы признаков весьма часто осуществляется с целью сопоставления структуры однотипных явлений. Такое сопоставление может быть временным, (структура явления анализируется по состоянию на разные периоды времени) или пространственным (рассматривается структура нескольких однотипных явлений).
    - Проверка гипотез о взаимосвязи и взаимозаменяемости признаков. В данном случае часть переменных вводится для всесторонней характеристики условий, формирующих интересующие исследователя явления, т. е. для характеристики экологического фона, тогда как только одна или несколько переменных непосредственно представляют исследуемое явление. Анализируя связь сложного явления с показателями фона, исследователь имеет возможность проверить ряд гипотез об обусловливающих это явление факторах. Кроме того, исследуется вопрос о взаимозаменяемости различных групп переменных. Исследование подобных гипотез сводится к тому, чтобы проверить, насколько совпадают группировки опрошенных, выделенные по характеру ответов на вопросы анкеты, с одной стороны, и по социально-демографическим характеристикам — с другой. Индикатором совпадения группировок является объединение признаков обоих видов в единый фактор и теснота связи признаков с факторами, т. е. абсолютная величина факторных нагрузок. Определенная степень совпадения двух этих группировок может быть принята как оценка верности выдвинутой гипотезы. 

3. Различные подходы  к определению  числа факторов.
    Основная  цель выделения первичных факторов в факторном анализе заключается в определении минимального числа общих факторов, которые удовлетворительно воспроизводят корреляции между наблюдаемыми переменными. При отсутствии ошибок измерений и случайности в выборке, а также при выполнении принципа факторной причинности, для заданной корреляционной матрицы существует точное соответствие между минимальным числом общих факторов и рангом редуцированной корреляционной матрицы. Иными словами, в случае отсутствия ошибок в соответствии факторной модели данным число общих факторов и общности могут быть вычислены сколь угодно точно с помощью исследования ранга редуцированной корреляционной матрицы. Если же выборка является случайной, то проблема усложняется и возникает задача найти критерий, с помощью которого можно было бы оценить минимально необходимое число общих факторов. Но поскольку основной критерий определения минимального числа общих факторов заключается в хорошей воспроизводимости наблюдаемых корреляций с помощью отобранных факторов, то задачу можно переформулировать следующим образом: определить правило остановки при выделении общих факторов. Эта задача сводится к определению момента, когда расхождение между вычисленными и наблюдаемыми корреляциями может быть приписано случайности выборки.
    Главный критерий отбора системы  факторов сформулировал еще Терстоун: простота, инвариантность, единственность, т.е. каждый признак отображается минимальным количеством факторов, а факторы должны как можно лучше описывать совокупность признаков.  Иногда, руководствуясь предварительной информацией, исследователь знает, сколько факторов можно выделить, и таким образом, может заранее определить число выделяемых факторов. После извлечения желаемого числа факторов их выделение прекращают.
      Кроме того, на практике наиболее часто применяются:
    критерии значимости, связанные с методами максимального правдоподобия и наименьших квадратов (наиболее часто используют критерий ?2 и метод Монте-Карло; определяется значимость отдельных собственных значений). Недостаток этого метода в том, что при больших размерах выборки (больше 200) многие факторы являются статистически значимыми, хотя с практической точки зрения, многие из них объясняют лишь небольшую долю полной дисперсии.
    оценка надежности, выполняемой расщеплением (выборку расщепляют напополам и факторный анализ выполняют для каждой половины; при этом оставляют только факторы с высокой степенью соответствия факторных нагрузок в двух подвыборках).
    различные правила, формулируемые в терминах собственных чисел:
      при определении числа факторов часто применяют правило, которое позволяет оставлять факторы с собственными числами, большими 1. Однако как показывает практика если число переменных меньше 20, то этот метод завышает число факторов.
      другой метод относится к редуцированной корреляционной матрице; согласно ему сохраняются факторы с собственными числами, большими нуля. Преимущество этого метода в том, что для корреляционной матрицы генеральной совокупности он дает более точные нижние оценки числа общих факторов. Но для выборочной корреляционной матрицы критерий обычно дает значительно большее число факторов.
      Харман предлагает прекратить выделение общих факторов, когда сумма собственных чисел превысит сумму оценок общностей.
      критерий, основанный на величине доли воспроизводимой дисперсии (число выделяемых факторов определяют так, чтобы кумулятивный процент дисперсии, выделяемой факторами, достиг удовлетворительного уровня; какой уровень дисперсии считать удовлетворительным, зависит от поставленной задачи). Заметим, что критерий «собственных чисел, больших единицы», эквивалентен данному критерию для 100/п %-го уровня.  Однако рекомендуется выделять такое число факторов, которые объясняют, по крайней мере, 60% дисперсии. Основной недостаток критерия, основанного на величине доли воспроизводимой дисерсии, состоит в определенной его субъективности. Однако он основан на легко поддающейся интерпретации статистике и в этом преимущество данного метода.
      критерий отсеивания (рассматривается графическое изображение собственных чисел корреляционной матрицы, которые наносятся на график в порядке их убывания; выделение заканчивается на том факторе, после которого исследуемая зависимость близка к почти горизонтальной прямой линии); Этот метод был предложен Каттеллом. Кайзер скептически относится к критерию отсеивания, так как на графике можно получить более чем один излом, и тогда выделение какой-либо прямой становится субъективным.
      критерий интерпретируемости и инвариантности (для исключения сомнительных результатов можно попытаться применить к одним и тем же данным комбинацию различных независимых критериев и принимать только те результаты, которые подходят ко всем критериям).
 
4. Процент объясненной дисперсии как показатель качества факторной модели.
Если предположить некоррелированными между собой  характерные и общие факторы, то суммарную дисперсию можно представить следующим образом:
                         m
dj2 = 1 = Sajp2 + dj2 ,                                                                  
                         р=1
    В правой части данного соотношения  стоят квадраты факторных нагрузок. Каждое слагаемое определяет обусловленную соответствующим фактором долю дисперсии наблюдаемого признака, т.е. вся дисперсия может быть разделена на две части:
    дисперсию, обусловленную наличием общих факторов (сумму квадратов общих факторов принято называть общностью):
             m
h2j = Sajp2,
            p=1
    дисперсию, обусловленную вариацией характерного фактора (квадрат нагрузки характерного фактора dj2 называют характерностью). Иногда удобно разбивать характерность на две части: ту, что действительно связана со спецификой изучаемых параметров, и ту, что связана с ошибками измерений. Если к заданному набору параметров добавить несколько новых, то изучение добавочных коэффициентов корреляции может привести к появлению дополнительных общих факторов. Это означает, что при рассмотрении первоначального набора параметров эти возможные связи данного параметра отражались в той доле характерности, которая связана с действительной спецификой параметра. Эта доля называется специфичностью параметра. Оставшаяся доля, связанная с несовершенством измерений, называется дисперсией ошибки или ненадежностью параметра.
Поскольку факторы  специфичности и ошибки между  собой некоррелированны, для характерности  и составляющих ее частей справедливо  соотношение:
dj2 = bj2 + ej2.
Тогда суммарная  дисперсия может быть записана в  виде:
                      m
dj2 = 1 = Sajp2 + dj2 = hj2 + bj2 + ej2.     
                     Р=1
Таким образом, суммарная дисперсия состоит  из общности (соответствует факторам F) и характерности, или иначе, суммарная дисперсия параметра состоит из общности, специфичности (соответствует факторам S) и дисперсии ошибки (соответствует факторам E). 

5. Факторный анализ  как метод понижения  размерности пространства  признаков. 
    Факторный анализ – это группа методов многомерного статистического анализа, которые позволяют представить в компактной форме обобщенную информацию о структуре связей между наблюдаемыми признаками изучаемого социального объекта. Среди задач, для решения которых используются методы факторного анализа, можно выделить следующие: понижение размерности пространства признаков; классификация объектов; выявление структуры взаимосвязей в наборе признаков; преобразование исходных переменных к более удобному для интерпретации виду; построение обобщающего показателя (индекса, шкалы); осуществление типологии объектов наблюдения; преобразование данных для использования в других моделях.
    Основное  предположение факторного анализа  заключается в том, что совокупность измеренных переменных можно выразить в виде меньшего числа показателей – факторов. Таким образом, фактор представляет собой некую «модельную» характеристику объектов изучаемого множества. Данное предположение основывается на допущении, что на наблюдаемые признаки оказывает влияние (в той или иной степени) некий не наблюдаемый признак.
    Методы  факторного анализа дают возможность  вычленить наиболее типичные соотношения  ответов и выяснить степень их однотипности, агрегировать исходные данные, выделить группы связанных  параметров, выявить общие закономерности. Сущность факторного анализа заключается в замене большого числа признаков, описывающих объекты наблюдения, меньшим числом комплексных характеристик (факторов). Основной задачей, которую решают разнообразными методами факторного анализа, является сжатие информации, комплексное описание, переход от множества значений по m элементарным признакам с объемом информации n*m к ограниченному множеству элементов матрицы факторного отображения m*r или матрицы значений латентных факторов для каждого наблюдаемого объекта размерностью n*r, где r<m. 

6. Индивидуальные значения  факторов.
    Факторный анализ позволяет сохранить индивидуальные значения факторов. Они используются  для классификации объектов (не по исходным признакам, а по  общим факторам) и для построения уравнения регрессии на  эти  обобщенные показатели.   

7. Факторы как социологические  индексы. 
    Измерение латентной переменной в эмпирических социологических исследованиях  обычно происходит следующим образом. Социолог, понимая, что "лобовой" вопрос в анкете не работает, вместо него задает респонденту серию косвенных вопросов. Каждому из этих вопросов отвечает своя наблюдаемая переменная. Типы шкал всех таких переменных обычно считаются одинаковыми - номинальными или порядковыми. В случае номинальных шкал для получения значений латентной переменной используется техника логического квадрата (куба и т.д.). В случае порядковых шкал значение латентного признака для конкретного респондента чаще всего получается в результате суммирования ответов этого респондента на указанные вопросы (т.е. суммирования значений наблюдаемых переменных).
    Латентная переменная, измеренная подобным образом, называется социологическим индексом.
    Для того, чтобы строящийся социологический  индекс был корректен, необходимо ответить на следующие вопросы:
    существует ли одномерная латентная переменная, которую мы намереваемся измерить;
    те ли наблюдаемые переменные мы выбрали;
    какова форма связи наблюдаемых переменных с латентной (для избежания простого сложения значений наблюдаемых характеристик чаще всего используют процедуру взвешивания);
    каков тип шкалы, отвечающей построенному индексу?
    Основным  элементом модели, заложенной в факторном  анализе, является априорное предположение  о наличии латентных факторов, стоящих за наблюдаемыми переменными и объясняющих связи между последними.
    Фактор – это та латентная переменная, измерение которой является нашей целью. Наблюдаемые признаки - вопросы в анкете.
    В случае существования одномерной латентной  переменной и удачного подбора наблюдаемых признаков можно считать, что наблюдаемое поведение респондента объясняется действием латентной переменной. Другими словами связи между наблюдаемыми переменными объясняются действием латентного фактора. Это, в свою очередь, уточняется с помощью аксиомы локальной независимости: фиксация значения латентной переменной приводит к распадению связей между наблюдаемыми переменными.
    Итак, наличие связи между наблюдаемыми признаками является необходимым условием существования латентной переменной (фактора) и удачности выбора отражающих ее вопросов в анкете. Если такой связи нет - мы должны или отвергнуть гипотезу о существовании той переменной, измерение которой является нашей главной целью, или скорректировать систему рассматриваемых наблюдаемых признаков таким образом, чтобы связь появилась (скажем, отбросить признаки, не связанные с другими). 

8. Вращение матрицы  факторных нагрузок.
      Вращение  применяется для того, чтобы большие  нагрузки сделать еще больше, а  маленькие – еще меньше, т.е. чтобы  можно было с большей уверенностью зачислить переменную в тот или иной фактор. При этом мы получаем новые факторы в виде специального вида линейной комбинации имеющихся факторов. Существует три различных подхода к проблеме вращения:
    графический – в этом случае исходные переменные рассматриваются как точки в факторном пространстве, координаты которых равны нагрузкам на факторы, а размерность определяется числом факторов. Вращение в этом случае заключается в проведении новых осей, которые соответствуют некоторому критерию простой, легко интерпретируемой структуры. Если в факторном пространстве наблюдаются явные скопления точек, легко отделимые друг от друга, простая структура получается в том случае, когда оси проведены через эти скопления. Но если такое разделение не очевидно или число факторов велико, графический метод неприменим.
    задание априорной целевой матрицы – цель вращения в этом случае заключается в нахождении факторного отображения, наиболее близкого к некоторой заданной матрице.
    можно задать значения нагрузок для каждой переменной, а затем проводить вращения с целью обеспечения минимального отличия полученной матрицы факторной структуры от заданной матрицы (в смысле критерия наименьших квадратов). При этом можно налагать дополнительные ограничения типа ортогональности. Этот вид вращения обычно применяется для анализа соответствия двух факторных структур.
    в качестве целевой матрицы можно использовать некоторые    функции   от   ортогонального решения. Этот подход, известный под названием промакс - метода косоугольных  вращений, основан на том, что ортогональные вращения, как правило, близки к косоугольным. Сводя некоторые меньшие нагрузки к почти нулевым, можно получить пригодную для дальнейшего анализа целевую матрицу. Затем находятся косоугольные факторы, для которых расхождение вычислительной матрицы факторной структуры с целевой — минимально.
    можно задать целевую матрицу, состоящую из нулей и единиц. Этот подход часто соответствует действительной степени информированности исследователя, когда ему известно только то, что некоторые нагрузки должны быть велики, а другие— малы.
    аналитический – в рамках данного подхода различают два вида вращений – ортогональное и косоугольное. Косоугольное вращение является более общим, чем ортогональное, так как здесь нет ограничений, связанных с некоррелированностью факторов. Преимущество косоугольного вращения состоит в том, что если в результате его выполнения получаются ортогональные факторы, можно быть уверенным, что эта ортогональность действительно им присуща, а не привнесена методом вращения. Однако на практике чаще прибегают к методам ортогонального вращения.
      Наиболее  часто используемыми методами ортогонального вращения являются:
    квартимакс, который основан на вращении осей таким образом, чтобы результирующие факторные нагрузки максимизировали выражение:
                n     m
      Q = ? ? aij .
               i=1  j=1 

      На  практике, применяя этот критерий, можно  достичь простоту интерпретации  переменных за счет простоты интерпретации  факторов. Метод квартимакс имеет  тенденцию к выделению генерального фактора.
    варимакс дает лучшее разделение факторов, так как упрощает описание столбцов факторной матрицы. Общая мера простоты задается в этом случае следующим критерием:
                             m       n            m     n
      V = 1/n2 (?n ?aij - ? (? aij2)2.
                            j=1     i=1        j=1   i=1 

    эквимакс является обобщением двух предыдущих критериев, выглядит он следующим образом:
      ?Q + ?V = Maximum,
      где ? = m/2 = ? /(? + ?).
    Существуют  два подхода к косоугольному вращению — использование вторичных осей и первичной матрицы факторного отображения.
    1. Методы, основанные  на введении вторичных  осей (если существуют разделимые скопления точек, определяемые первичными факторами, то они будут иметь почти нулевые проекции на все вторичные оси, за исключением одной).
    квартимин, сущность которого заключается в том, что если существуют разделимые скопления точек, то они будут иметь почти нулевые проекции на все вторичные оси, за исключением одной;
    коваримин, который минимизирует ковариацию квадратов проекций на вторичные оси;
облимин, являющийся результатом объединения двух предыдущих критериев.
    2. Методы, основанные  на использовании  первичной матрицы  факторного отображения.
    прямой метод облимин (позволяет задать параметр ?, большие значения которого соответствуют «наиболее» косоугольным решениям, а меньшие отрицательные значения — «наиболее» ортогональным решениям. В наиболее простом случае однофакторной модели следует положить ? = 0).
 


9. Модели многомерной  классификации в  социологии.
      Классификация рассматриваемой совокупности объектов по отдельным значениям признаков и их комбинациям – распространенная процедура анализа данных в социологическом исследовании. Как правило, цель классификации – выделение типов объектов по некоторым значимым характеристикам.
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.