На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


Контрольная Оцнювання параметрв розподлв. Незмщен, спроможн оцнки. Методи знаходження оцнок: емпричн оцнки, метод максимальної правдоподбност. Означення емпричної функцї розподлу, емпричн значення параметрв. Задача переврки статистичних гпотез.

Информация:

Тип работы: Контрольная. Предмет: Математика. Добавлен: 12.08.2010. Сдан: 2010. Уникальность по antiplagiat.ru: --.

Описание (план):


1
КОНТРОЛЬНА РОБОТА
МЕТОДИ ОЦІНЮВАННЯ ПАРАМЕТРІВ ТА ПЕРЕВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ
ЗМІСТ

1. Оцінювання параметрів розподілів. Незміщені, спроможні оцінки
2. Методи знаходження оцінок: емпіричні оцінки, метод максимальної правдоподібності
2.1. Означення емпіричної функції розподілу. Емпіричні значення параметрів
2.2 Метод максимальної правдоподібності
3. Задача перевірки статистичних гіпотез
4. Критерій 2, гіпотетичний розподіл залежить від невідомих параметрів
5. Критерій 2 як критерій незалежності
Список використаних джерел
1. Оцінювання параметрів розподілів. Незміщені, спроможні оцінки

Означення. Випадковий вектор = (1, 2, ..., n) зі значеннями в Rn будемо називати вибіркою (вибірковим вектором).

Означення. Вибірку = (1, 2, ..., n), утворену послідовністю незалежних, однаково розподілених випадкових величин 1, 2, ..., n, кожна з яких має розподіл F, називають вибіркою обсягом n з розподілу (закону) F.

Означення. Простір Rn, в якому вибірка (вибірковий вектор) набуває значень, будемо називати вибірковим простором.
Ми будемо мати справу з вибірками, розподіли (функції розподілу) яких залежать від деякого параметра . Множина можливих значень цього параметра (позначимо її ) є підмножиною скінченновимірного простору Rs.

Постановка задачі оцінювання параметрів розподілів. Нехай () = (1(), 2(), ..., n()) - реалізація вибірки = (1, 2, ..., n) з розподілом F( ; ). Розподіл F( ; ) залежить від параметра , який набуває значень з множини . Значення параметра в розподілі F( ; ) невідоме і його необхідно оцінити (визначити) за реалізацією () = (1(), 2(), ..., n()) вибірки = (1, 2, ..., n). У цьому й полягає задача оцінювання параметрів розподілів.
Для оцінювання невідомого значення параметра єдине, що нам відомо, і єдине, за допомогою чого ми можемо оцінювати (визначити) , є реалізація вибірки . Крім реалізації () вибірки ми не маємо нічого, що надавало б якусь інформацію про значення параметра . Тому оцінити (визначити) значення за реалізацією () (точно чи хоча б наближено) - це означає реалізації () вибірки поставити у відповідність значення , тобто вказати правилао, за яким реалізації вибірки ставиться у відповідність значення . Точніше (формально), це означає, що для оцінювання на вибірковому просторі - множині реалізацій вибірок - необхідно визначити (побудувати, задати) функцію h( ) зі значеннями в - множині можливих значень параметра - таку, що
h (()) дорівнює
або хоча б
h (()) наближено дорівнює .

Значення = h (()) ми й будемо використовувати як . Необхідно відзначити, що для кожної реалізації () значення = h (()), яке використовується як , буде своє, тому , як функція = () , є випадковою величиною.
Означення. Борелівську функцію h(), задану на вибірковому просторі Rn, зі значеннями в - множині можливих значень параметра - будемо називати статистикою.

Одержувати (будувати) статистики h(), такі щоб = h (()) = , тобто щоб за () можно було точно визначити , явно не вдасться вже хоча б тому, що є константою, а оцінка = h (()), як функція від вибірки (функція випадкової величини), є випадковою величиною. Тому (хочем ми того чи ні) для визначення ми будемо вимушені задовольнятися значеннями = h(), вважаючи (розглядаючи) їх за наближені значення . Зауважимо, що для одного й того ж параметра можна запропронувати багато оцінок.
У зв'язку з постановкою задачі оцінювання параметрів розподілів, як задачі одержання наближених значень = h() для виникає необхідність вміти відповідати на запитання - наскільки великою є похибка - при заміні на , інакше, як далеко можуть відхилятися значення оцінки = h (1, 2, ..., n), обчисленої за вибіркою = (1, 2, ..., n), від оцінюваної величини ?
Кількісно міру похибки при заміні на (міру розсіювання відносно ) будемо описувати величиною
M | - |2.
Серед усіх оцінок з однією і тією ж дисперсією D мінімальну міру розсіювання відносно мають оцінки, для яких М = .
Означення. Оцінку будемо називати незміщеною оцінкою параметра , якщо М = або, що те саме , M ( - ) = 0.

Наочно незміщеність оцінки параметра можна трактувати так: при багаторазовому використанні оцінки як значення для , тобто при багаторазовій заміні на , середнє значення похибки - дорівнює нулеві.
Часто ми маємо можливість розглядати не одну оцінку = h() = h (1, 2, ..., n), побудовану за вибіркою = (1, 2, ..., n), а послідовність оцінок = hn (1, 2, ..., n), n=1,2,... У цій ситуації природно говорити про асимптотичну поведінку послідовності оцінок .
Означення. Послідовність оцінок , n=1,2,..., будемо називати спроможною послідовністю оцінок параметра , якщо для кожного 0

P { | - | } 0 при n .
Означення. Послідовність оцінок , n=1, 2, ..., будемо називати асимптотично незміщеною послідовністю оцінок параметра , якщо

M ( - ) 0
або, що те саме M при n .
2. Методи знаходження оцінок: емпіричні оцінки, метод максимальної правдоподібності
2.1. Означення емпіричної функції розподілу. Емпіричні значення параметрів

Означення. Нехай 1, 2, ..., n - вибірка з неперервного розподілу F. Функцію (x), визначену на R1 рівністю

(x) = ,
будемо називати емпіричною функцією розподілу.
При кожному фіксованому x емпірична функція розподілу , як функція випадкового вектора 1, 2, ..., n, є випадковою величиною, тому також є функціею й , тобто (x) = (x; ), , x R1.
Для кожного фіксованого x емпірична функція розподілу (x) є незміщеною та спроможною оцінкою F (x).
Надалі нам буде зручно розглядати вибіркові значення 1, 2, ..., n, розташовані в порядку зростання: 1*, 2*, ..., n* Тобто, 1* - найменше серед значень 1, 2, ..., n ; 2* - друге за величиною і т.д., n *- найбільше з можливих значень.
Означення. Послідовність 1*, 2*, ..., n* будемо називати варіаційним рядом послідовності 1, 2, ..., n; а 1*, 2*, ..., n* - порядковими статистиками.

У термінах порядкових статистик емпіричну функцію розподілу можна подати у вигляді
(x) = (2.1.1)
Безпосередньо з рівності (2.1.1) одержимо, що при фіксованому значення (x) = 0 у кожній точці x проміжку ( - , 1*], оскільки число тих k, при яких k* x, дорівнює нулеві; (x) = 1 / n у кожній точці проміжку (1*, 2*] тому що число тих k, при яких k* x, дорівнює 1 і т.д., і, нарешті, (x) = 1 для кожного x з проміжку (n, + ).
Із вищесказаного випливає, що для кожного фіксованого функція (x) = (x; ) невід`ємна; стала на кожному з проміжків ( - , 1*], (k*, k+1*], k = 1, 2, …, n - 1, (n, + ) (а отже неперервна зліва); неспадна - зростає в точках k* , k = 1, 2, ..., n, стрибками величиною 1 / n.
Зауваження 1. Для вибірок 1, 2, ..., n з неперервних розподілів імовірність збігу вибіркових значень дорівнює нулеві, але оскільки ми фіксуємо результати з зазначеною точністю (наприклад, до третього знака), то внаслідок цього деякі вибіркові значення можуть збігатися. При цьому величина стрибка емпіричної функції розподілу в точці k дорівнює , де m - кількість вибіркових значень, які збігаються з k, враховуючи й k.

Зауваження 2. Розподіл, що відповідає емпіричній функції розподілу (x), будемо називати емпіричним. При кожному фіксованому це дискретний розподіл, що ставить у відповідність кожній точці k , k = 1, 2, ..., n, масу (або , якщо з k збігаються m вибіркових значень, враховуючи й k ).

За допомогою емпіричної функції розподілу можна одержувати інтуїтивно-наочні оцінки параметрів розподілу.
Нехай 1, 2, ..., n - вибірка з розподілу F( ; ), що залежить від параметра , причому параметр невідомий і його необхідно визначити за вибіркою. Припустимо, що параметр однозначно визначається розподілом (функцією розподілу F(x; ) ), тобто
= ( F(x; ) ),
де - функціонал, заданий на множині функцій розподілу. Наприклад, a = M , 2 = D (коли вони існують) є функціоналами функції розподілу F (x) випадкової величини:
a = x F (dx); 2 = (x - t F (dt))2 F (dx).
Вибірка 1, 2, ..., n визначає емпіричну функції розподілу (x). І оскільки (dx) “близька” до F(x; ) ( при кожному х є незміщеною і спроможною оцінкою F(x; ), а = (F(x; ) ), то для оцінювання параметра природно розглядати величину
= ( (x)).
У такий спосіб, наприклад, для a одержимо оцінку
= x (dx) = ,
для 2

= (x - t (dt))2 (dx) = (i )2 =
Інтеграли обчислюються як інтеграли Лебега за дискретним розподілом, зосередженим у точках 1, 2, ..., n з масою 1 / n в кожній з них.
Означення. Оцінку параметра = ( F(x; )), одержану за формулою = ( (x)), будемо називати емпіричним (вибірковим) значенням параметра .

Зокрема,
=
- емпіричне (вибіркове) середнє,
= 2

– емпірична (вибіркова) дисперсія.
Теорема 2.1 Нехай 1, 2, ..., n - вибірка з розподілу F і g(x) - борелівська функція на R1 зі значенням в R1. Якщо
G = g(x) F (dx) ,
то вибіркове значення величини G
= g(x) (dx) =
є спроможною й незміщеною оцінкою параметра G.
2.2 Метод максимальної правдоподібності

Нехай = (1, 2, ..., n) - вибірка з розподілом F( ; ) = F( ; 1, 2, …, s), що залежить від параметра = (1, 2, …, s) ? ? Rs. Параметр ? невідомий, і його необхідно оцінити за вибіркою (1, 2, ..., n).
Загальним (важливим як у теоретичному відношенні, так і в застосуваннях) методом одержання оцінок є метод максимальної правдоподібності, запропонований Фішером.
Означення. Функцією максимальної правдоподібності вибірки = (1, 2, ..., n) будемо називати функцію L() = L (1, 2, …, s) параметра ? , яка визначається рівністю L () = f (; ) = f (1,2, ..., n; ) = f (1; ) f (2; ) …. f (n; ) , ? , коли вибірковий вектор = (1, 2, ..., n) абсолютно неперервний зі щільністю f(x; ) = f (x1, x2, …,xn; ), і рівністю L () = P (; ) = Р(1,2, ..., n; ) = Р (1; ) Р (2; ) …. Р (n; ) , ? , коли вибірковий вектор = (1, 2, ..., n) дискретний з розподілом P (x; ) = = P (x1, x2, …, xn; ).

Метод максимальної правдоподібності одержання оцінок полягає в тому, що за оцінку параметра = (1, 2, …, s) приймається точка = (, , ..., ), в якій функція максимальної правдоподібності L () досягає найбільшого значення, інакше кажучи, за оцінку параметра визнається розв'язок рівняння
L () = L (),
якщо такий розв'язок існує.
Означення. Оцінкою максимальної правдоподібності будемо називати точку , в якій функція максимальної правдоподібності досягає найбільшого значення.
Інакше кажучи, оцінкою максимальної правдоподібності параметра будемо називати розв'язок рівняння L () = L ().

Зазначимо, що L () та ln L () досягають найбільшого значення в одних і тих же точках. Тому відшукувати точку, в якій L () досягає найбільшого значення, часто зручніше, роблячи це для ln L ().

Логарифм від функції максимальної правдоподібності L() називають логарифмічною функцією максимальної правдоподібності.

Якщо L() = L (1, 2, …, s) диференційовна по 1, 2, …, s , то для того, щоб розв'язати рівняння

L (, , ..., ) = L (1, 2, …, s), (2.2.1)

достатньо знайти стаціонарні точки функції ln L(1, 2, …, s), розв'язуючи рівняння

ln L (1, 2, …, s) = 0, i = 1, 2, …, s,

і, порівнюючи значення ln L(1, 2, …, s) у стаціонарних і граничних точках множини , вибрати точку = (, , ..., ), в якій функція ln L(1, 2, …, s) досягає найбільшого значення. Ця точка і буде розв'язком рівняння (2.2.1).

Рівняння

ln L (1, 2, …, s) = 0, i = 1, 2, …, s,

називають рівняннями максимальної правдоподібності.

Зауваження. Розв'язуючи рівняння максимальної правдоподібності

L () = L (), необхідно відкинути всі корені, що мають вигляд = const. Оцінки, що не залежать від вибірки 1, 2, ..., n, нас не цікавлять (оцінка - це функція вибірки).

3. Задача перевірки статистичних гіпотез

Постановка задачі перевірки статистичних гіпотез. Часто виникає необхідність у розв'язанні такої задачі: маємо стохастичний експеримент, що полягає в спостереженні випадкової величини = (1, 2, ..., n) зі значеннями в Rn або частини Rn, тобто в одержанні вибірки обсягом n. (Такі стохастичні експерименти описуються моделями типу { Rn, ?n, Pи }, Pи ? ?, ? = { Pи; ? ? Rs}, де ? - деяка параметрична сукупність розподілів.) Щодо розподілу випадкової величини = (1, 2, ..., n) (відносно розподілу вибірки ) відомо тільки те, що він належить до класу ?. З класу ? вибираємо (з тих чи інших міркувань) один із розподілів, наприклад G, і як модель випадкової величини = (1, 2, ..., n) пропонуємо розглядати { Rn, ?n, G}.

Наша мета полягає в тому, щоб за результатом = (1, 2, ..., n) експерименту (відомий він чи одержимо його потім) дійти висновку: експеримент може описуватися моделлю { Rn, ?n, G} (G може бути розподілом випадкової величини ) або експеримент не може описуватися моделлю { Rn, ?n, G} (G не може бути розподілом випадкової величини ). Зробити за результатом експерименту більш “сильний” висновок: G є розподілом випадкової величини - не можна. Оскільки один і той же результат може з'явитися при багатьох різних розподілах, а не тільки при істинному.

У теорії перевірки статистичних гіпотез прийняті такі означення.

Гіпотези щодо розподілів випадкової величини називають статистичними гіпотезами.
Вибір розподілу (чи класу розподілів) із сукупності ? будемо називати вибором основної (нульової) гіпотези щодо розподілу в моделі { Rn, ?n, Pи }, (щодо розподілу випадкової величини зі значеннями в Rn). Після вибору основної гіпотези решту гіпотез назвемо альтернативними або конкурентними відносно основної (нульової). Нульову гіпотезу будемо позначати H0. Сукупність конкурентних (альтернативних) гіпотез у нас, як правило, буде параметричною. Конкурентні гіпотези будемо позначати так: H0, ? .
Гіпотези щодо розподілів, які однозначно їх визначають, будемо називати простими гіпотезами, у противному разі - складними.
Наприклад, гіпотеза H0 : випадкова величина має розподіл
Pи(k) = Ckn k0(1 - 0)n-k, k = 0, 1, …, n,
де 0 - фіксоване, є простою. Гіпотеза H : розподілом випадкової величини є
Pи (k) = Ckn k(1 - )n-k, k = 0, 1, …, n,
де ? (1 / 4; 1 / 2), є складною.
Формулюючи задачу перевірки статистичних гіпотез, за нульову гіпотезу (для наочності та простоти) ми визнали просту гіпотезу: розподілом випадкової величини є G, де G - цілком визначений розподіл.
Зазначимо, що математична статистика не дає ніяких рекомендацій щодо вибору нульової гіпотези, цей вибір повністю визначається дослідником і залежить від поставленої задачі.
Нехай основна гіпотеза H0 полягає в тому, що розподілом випадкової величини зі значеннями в Rn є розподіл G. Необхідно перевірити гіпотезу H0, тобто дійти висновку: G може бути розподілом випадкової величини (будемо говорити “гіпотеза H0 не відхиляється”) або G не може бути розподілом випадкової величини (будемо говорити “гіпотеза H0 відхиляється”). Робити висновок про відхилення або невідхилення гіпотези H0: розподілом випадкової величини є G, ми будемо за результатами (щ) експеримент и т.д.................


Перейти к полному тексту работы



Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.