На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Проверка статистических гипотез

Информация:

Тип работы: курсовая работа. Добавлен: 07.11.2012. Сдан: 2011. Страниц: 6. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Федеральное агентство по образованию Российской Федерации
Ставропольский  Государственный Университет
Кафедра математического анализа 
 
 
 
 
 

Курсовая  работа
на тему:
«Проверка статистических гипотез» 
 

                Выполнил 
                студент 4 курса ФМФ
                очной формы обучения
                специальность математика группа А
                Дерябин Максим 
                 
                 
                 
                 
                 

Ставрополь, 2011 г. 
Содержание.
 
 
 
 

 

Введение. 

     Математическая  теория проверки гипотез, в которой критерии появляются как решения точно поставленных оптимальных проблем, была создана Ю. Нейманом и Э. Пирсоном в 30-х годах XX века и с тех пор получила значительное развитие.  Статистическая гипотеза – это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных. Проверка статистической гипотезы – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
     Статистическая  проверка гипотез является одним из важнейших разделов математической статистики. Методы математической статистики позволяют проверить предположения о законе распределения некоторой случайной величины (генеральной совокупности), о значениях параметров этого закона, о наличии корреляционной зависимости между случайными величинами, определенными на множестве объектов одной и той же генеральной совокупности. Пусть по некоторым данным имеются основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача заключается в том, чтобы подтвердить или опровергнуть это предположение, используя выборочные (экспериментальные) данные. Гипотезы о значениях параметров распределения или о сравнительной величине параметров двух распределений называются параметрическими гипотезами. 
 

 

      Глава 1.  
Основные понятия теории проверки статистических гипотез.
 

     §1. Статистическая гипотеза. Статистические критерии. 

     Часто необходимо знать закон распределения  генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид A, выдвигается гипотеза: генеральная совокупность распределена по закону A. Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.
     Возможен  случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр b равен определенному значению b0, выдвигают гипотезу: b = b0. Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
     Возможны  и другие гипотезы: о равенстве  параметров двух или нескольких распределений, о независимости выборок и многие другие.
     Статистической  называют гипотезу о виде неизвестного распределения, или о параметрах известных распределении.
     Наряду  с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы целесообразно различать. Нулевой (основной) называют выдвинутую гипотезу H0. Конкурирующей (альтернативной) называют гипотезу H1, которая противоречит нулевой.
     Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
     Выдвинутая  гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов:
    ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза;
    ошибка второго рода состоит в том, что будет принята неправильная гипотеза;
     Подчеркнем, что последствия этих ошибок могут оказаться весьма различными.
     Таким образом, правильное решение может быть принято также в двух случаях:
    гипотеза принимается, причем и в действительности она правильная;
    гипотеза отвергается, причем и в действительности она неверна.
     Вероятность совершить ошибку первого рода принято обозначать через ; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости равный 0,05, то это означает, что в пяти случаях из ста есть риск допустить ошибку первого рода (отвергнуть правильную гипотезу).
     Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Статистическим критерием (или просто критерием) называют случайную величину K, которая служит для проверки нулевой гипотезы. Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин, и таким образом получают частное (наблюдаемое) значение критерия. Наблюдаемым значением Kнабл назначают значение критерия, вычисленное по выборкам. 

     §2. Критическая область и критические точки. 

     После выбора определенного критерия, множество  всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.
     Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
     Основной  принцип проверки статистических гипотез  можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.
     Поскольку критерий K, введенный в прошлом пункте, – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
     Критическими  точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы. Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
     Правосторонней  называют критическую область, определяемую неравенством K > kкр, где kкр – положительное число. Левосторонней называют критическую область, определяемую неравенством K < kкр, где kкр – отрицательное число. Односторонней называют правостороннюю или левостороннюю критическую область. Двусторонней называют критическую область, определяемую неравенствами K < k1, K > k2, где k2 > k1.
       
 
 
 

     Для определенности начнем с нахождения правосторонней критической области, которая определяется неравенством
,

kкр > 0. Видно, что для отыскания правосторонней критической области достаточно найти критическую точку.
     С этой целью задаются достаточно малой вероятностью – уровнем значимости . Затем ищут критическую точку kкр,  исходя из требования, чтобы, при условии справедливости нулевой гипотезы, вероятность того, что критерий К примет значение, большее kкр, была равна принятому уровню значимости:
 
.
(1)
Для каждого  критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию. Когда критическая точка уже найдена, вычисляют по данным выборок наблюденное значение критерия и, если окажется, что Kнабл > kкр, то нулевую гипотезу отвергают, Kнабл < kкр, то нет оснований, чтобы отвергнуть нулевую гипотезу.
     Данное  правило вытекает из того, что вероятность события K > kкр мала ( – малая вероятность), такое событие, при справедливости нулевой гипотезы, в силу принципа практической невозможности маловероятных событий, в единичном испытании не должно наступить [1]. Если все же оно произошло, т. е. наблюдаемое значение критерия оказалось больше kкр, то это можно объяснить тем, что нулевая гипотеза ложна и, следовательно, должна быть отвергнута. Таким образом, требование (1) определяет такие значения критерия, при которых нулевая гипотеза отвергается, а они и составляют правостороннюю критическую область.
     Наблюдаемое значение критерия может оказаться  большим kкр не потому, что нулевая гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента и др.). В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости .
     Пусть нулевая гипотеза принята; ошибочно думать, что тем самым она доказана. Действительно, известно, что один пример, подтверждающий справедливость некоторого общего утверждения еще не доказывает его. Поэтому считается, что в этом случае данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают оснований ее отвергнуть.
     На  практике для большей уверенности  принятия гипотезы, ее проверяют другими способами, или повторяют эксперимент, увеличив объем выборки.
     Отвергают гипотезу более категорично, чем  принимают. Действительно, известно, что достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение отвергнуть. Если оказалось, что наблюдаемое значение критерия принадлежит критической области, то этот факт и служит примером, противоречащим нулевой гипотезе, что позволяет ее отклонить.
     Отыскание левосторонней и двусторонней критических  областей сводится (так же, как и для правосторонней) к нахождению соответствующих критических точек. Левосторонняя критическая область определяется неравенством , kкр < 0. Критическую точку находят, исходя из требования, чтобы при справедливости нулевой гипотезы, вероятность того, что критерий примет значение, меньшее kкр, была равна принятому уровню значимости:
.

     Двусторонняя  критическая область определяется неравенствами K < k1, K > k2, k2 > k1. Критические точки находят, исходя из требования, чтобы, при справедливости нулевой гипотезы, сумма вероятностей того, что критерий примет значение меньшее k1, или большее k2, была равна принятому уровню значимости:
.

Ясно, что  в данном случае критические точки могут быть выбраны бесчисленным множеством способов.
     Если  же распределение критерия симметрично относительно нуля и имеются основания выбрать симметричные относительно нуля точки –kкр и kкр (kкр > 0), то

и, следовательно,
.

     Критические точки находят по соответствующим таблицам. 

     §3. Дополнительные сведения о выборе критической области. 

     Мы  строили критическую область, исходя из требования, чтобы вероятность попадания в нее критерия была равна , при условии, что нулевая гипотеза справедлива. Однако оказывается целесообразным ввести в рассмотрение вероятность попадания критерия в критическую область при условии, что нулевая гипотеза неверна и, следовательно, справедлива конкурирующая.
     Мощностью критерия называют вероятность попадания критерия в критическую область, при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.
     Пусть для проверки гипотезы принят определенный уровень значимости и выборка имеет фиксированный объем. Остается произвол в выборе критической области. Покажем, что ее целесообразно построить так, чтобы мощность критерия была максимальной.
     Убедимся, что если вероятность ошибки второго рода (принять неправильную гипотезу) равна , то мощность равна . Действительно, если – вероятность ошибки второго рода, т. е. события «принята нулевая гипотеза, причем справедлива конкурирующая», то вероятность противоположного события «отвергнута нулевая гипотеза, причем справедлива конкурирующая», т. е. мощность критерия, равна .
     Пусть мощность возрастает; следовательно, уменьшается вероятность совершить ошибку второго рода. Таким образом, чем мощность больше, тем вероятность ошибки второго рода меньше.
     Таким образом, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Выполнение этого требования обеспечит минимальную ошибку второго рода.
     Поскольку вероятность события «ошибка  второго рода допущена» равна , то вероятность противоположного события «ошибка второго рода не допущена» равна , т. е. мощности критерия. Отсюда Следует, что мощность критерия есть вероятность того, что не будет допущена ошибка второго рода.
     Ясно, что чем меньше вероятности ошибок первого и второго рода, тем критическая область «лучше». Однако, при заданном объеме выборки, уменьшить одновременно и невозможно: если уменьшать , то будет возрастать. Единственный способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объема выборок. 

 

Глава 2.  
Проверка некоторых статистических гипотез.
 

     §1. Сравнение двух дисперсий нормальных генеральных совокупностей. 

     На  практике задача сравнения дисперсий  возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т. д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т. е. наименьшую дисперсию.
     Пусть генеральные совокупности X и Y распределены нормально. По независимым выборкам объемов n1 и n2 извлеченным из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям, при заданном уровне значимости а, проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой:
.

Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, то есть что и , нулевую гипотезу можно записать так:
.

     Таким образом, требуется проверить, что математические ожидания исправленных выборочных дисперсий равны между собой. Такая задача ставится потому, что обычно исправленные дисперсии оказываются различными. Возникает вопрос: значимо (существенно) или значимо, различаются исправленные дисперсии?
     Если  окажется, что нулевая гипотеза справедлива, т. е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности, случайным отбором объектов выборки. Например, если различие исправленных выборочных дисперсий результатов измерений, выполненных двумя приборами, оказалось незначимым, то приборы имеют одинаковую точность.
     Если  нулевая гипотеза будет отвергнута, т. е. генеральные дисперсии неодинаковы, то различие исправленных дисперсий значимо и ие может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны. Например, если различие исправленных выборочных дисперсий результатов измерений, произведенных двумя приборами, оказалось значимым, то точность приборов различна.
     В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий, примем отношение большей исправленной дисперсии к меньшей, т. е. случайную величину
     
.

     Величина  F, при условии справедливости нулевой гипотезы имеет распределение Фишера-Снедекора со степенями свободы и , где n1 – объем выборки, по которой вычислена большая исправленная дисперсия, n2 объем выборки, по которой найдена меньшая дисперсия. Критическая область строится в зависимости от вида конкурирующей гипотезы. Пусть для определенности нулевая гипотеза , конкурирующая – . В этом случае строят одностороннюю, а именно правостороннюю, критическую область, исходя из требования, чтобы вероятность попадания критерия F в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости:
.

Критическую точку  находят по таблице критических точек распределения Фишера–Снедекора.
     Если  же нулевая гипотеза имеет вид  , а конкурирующая – , то строят двустороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости . 

     §2. Критерий согласия Пирсона. 

     Если  закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А.
     Проверка  гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины – критерия согласия. Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
     Имеется несколько критериев согласия: («хи квадрат») К. Пирсона, Колмогорова, Смирнова и др. Опишем применение критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство). С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. Обычно эмпирические и теоретические частоты различаются.
     Критерий  Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает, на принятом уровне значимости, ее согласие или несогласие с данными наблюдений. 

     Пусть в выборке объема получено эмпирическое распределение:
варианты xi x1 x2 xs
эмпир. частоты ni n1 n2 ns
     Допустим, что в предположении нормального распределения генеральной совокупности, вычислены теоретические частоты . При уровне значимости , требуется проверить нулевую гипотезу; генеральная совокупность распределена нормально.
     В качестве критерия проверки нулевой  гипотезы примем случайную величину
 
.
(2)
Эта величина случайная, гак как в различных  опытах она принимает различные, заранее неизвестные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (2) и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.
     Заметим, что возведением в квадрат  разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей. Делением на достигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда, когда она справедлива. Разумеется, приведенные соображения не являются обоснованием выбранного критерия, а лишь пояснением.
     Доказано, что при закон распределения случайной величины (2), независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения с k степенями свободы. Поэтому случайная величина (2) обозначена через , а сам критерий называют критерием согласия «хи квадрат». Число степеней свободы находят по равенству , где s – число групп (частичных интервалов) выборки, r – число параметров предполагаемого распределения, которые оценены по данным выборки.
     В частности, если предполагаемое распределение – нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение) поэтому и число степеней свободы . Если, например, предполагают, что генеральная cовокупность распределена по закону Пуассона, то оценивают один параметр , поэтому и .
     Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем  двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости :
.

     Таким образом, правосторонняя критическая область определяется неравенством а область принятия нулевой гипотезы – неравенством . Обозначим значение критерия, вычисленное по данным наблюдений, через и сформулируем правило проверки нулевой гипотезы.
     Правило. Для того чтобы, при заданном уровне значимости, проверить нулевую гипотезу H0: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия

и по таблице  критических точек распределения . по заданному уровню значимости , и числу степеней свободы , найти критическую точку . Если – нет оснований отвергнуть нулевую гипотезу. Если – нулевую гипотезу отвергают. 

     §3. Проверка псевдослучайных последовательностей. 

     Генератор псевдослучайных чисел – алгоритм, генерирующий последовательность чисел, элементы которой почти независимы друг от друга и подчиняются заданному распределению (обычно равномерному). Современная информатика широко использует псевдослучайные числа в самых разных приложениях – от метода Монте-Карло и имитационного моделирования до криптографии. При этом от качества используемых генераторов напрямую зависит качество получаемых результатов.
     Важным  критерием качества генератора псевдослучайных  чисел является соответствие его заданному закону распределения. Проверку данного качества вполне возможно произвести с помощью критерия Пирсона.
     Рассмотрим  для примера один из видов генераторов  псевдослучайных чисел – генератор  Фибоначчи [4]:
 
,
(3)
где , – заданные числа, означает операцию взятия остатка от деления на , – заданные фиксированные числа. Пусть для определенности , , , , . Построенная таким способом последовательность должна иметь равномерное распределение. Проверим это экспериментально.
     Отметим, что нулевой гипотезой в данном случае будет «данная последовательность имеет равномерное распределение».
     Очевидно, что последовательность (3) с заданными исходными данными способна генерировать числа от 0 до 15. Посчитаем частоты появлений каждого числа при генераций. При равномерном распределении частоты должны быть равны для каждого генерируемого числа , где – число вариант распределения. Результаты расчетов приведены в расчетной таблице 1.  

Таблица 1. Расчетная таблица проверки критерия Пирсона.

и т.д.................


x n n' (n – n') (n – n')2

Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.