На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Статистическая обработка и статистический анализ данных по материалам статистического наблюдения

Информация:

Тип работы: курсовая работа. Добавлен: 12.09.2012. Сдан: 2011. Страниц: 9. Уникальность по antiplagiat.ru: < 30%

Описание (план):


Министерство  образования Российской Федерации
Южно-Уральский  Государственный Университет
Кафедра «Экономика и финансы» 
 
 
 
 
 
 
 

Статистическая  обработка и статистический анализ данных
по  материалам статистического наблюдения 
 

Пояснительная записка к курсовому проекту 
по курсу «Статистика»
 
 
 
 
 

                  Руководитель:
                  Лазарева Г.В. 

                  Автор проекта:
                  студент группы ЭиУ-378
                  Дмитриев  Д.Б.. 

                  Проект защищен
                  с оценкой
                  «      »                     2006 г. 
                   
                   

Челябинск 
2006

Введение

    Статистика - это отрасль человеческой деятельности, направленная на сбор, обработку и анализ данных народно-хозяйственного учета. Сама статистика является одним из видов учета. Предметом статистики является количественная сторона массовых общественных явлений в тесной связи с качественной стороной. Главная задача статистики на современном этапе состоит в обработке достоверной информации. Обработанные определенным образом данные позволяют судить о явлении, делать прогнозы. Статистические данные способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.
    В данном курсовом проекте была произведена  обработка и анализ статистических данных, полученных в результате статистического  наблюдения над показателем, характеризующим  долю денежных доходов, расходуемых  на прирост финансовых активов в 2004 г.
    Актуальность  статистического анализа вышеприведенного показателя можно обосновать, исходя из определения финансовых активов. Это кассовая наличность, депозиты в банках, вклады, чеки, страховые полисы, паи или долевые и т.п. Следовательно, результаты анализа можно использовать для расчета оборачиваемости денежных средств, развития экономики.
    Целью данного курсового проекта является освоение инструментов статистики для  дальнейшего применения в решении  управленческих задач. В качестве задач курсового проекта следует выделить следующее:
      овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
      приобретение навыков работы с большими массивами данных и навыков представления данных статистического наблюдения в удобном для восприятия, анализа и принятия решений виде;
      развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.

Содержание

 

Сводка и  группировка данных статистического  наблюдения

    В данной курсовой работе рассматривается следующий показатель: «Доля денежных доходов, расходуемых на прирост финансовых активов, % «в 2004г. Все данные взяты из Российского Статистического ежегодника.
    На  основе полученных данных выполнена  простая сводка (Приложение) по указанному показателю (далее просто показатель*). Но необходимо учитывать тот факт, что рассматривается относительная, а не абсолютная величина. Следовательно, для расчета средней величины понадобятся дополнительные данные, отображающие годовые доходы населения по регионам. Поэтому в сводку  добавлен еще одни столбец с необходимой информацией.
    Также стоит отметить, что пришлось внести исправления по некоторым позициям исходных данных. Первоначально присутствовали 5 регионов РФ, в состав которых входило 2 субъекта. Поэтому значения показателя в этих регионах были пересчитаны. Так, в состав Архангельской области входил Ненецкий автономный округ.  Доля денежных доходов, расходуемых на прирост финансовых активов, в Архангельской области составила 29, 2%, причем сюда были включены значения показателя в Ненецком автономном округе (69,7%). Для Архангельской области было вычислено значение показателя в абсолютных единицах (руб.),  затем из доходов населения по области были вычтены доходы населения в Ненецком автономном округе и рассчитано среднее значение показателя по Архангельской области.
 

Группировка с выделением регионов со значением показателя выше и ниже среднего

    Среднее значение показателя* по регионам считается  как средняя взвешенная величина, где роль весов играют годовые доходы населения. Сумма годовых доходов населения по всей Российской Федерации составила 11071919713 тыс. руб. Сумма средств, идущих на прирост финансовых активов, равна 2210034642,258 тыс. руб. Следовательно, среднее значение показателя по РФ составит 19,96%. Исходя из этих данных, строим группировку с выделением регионов со значением показателя выше и ниже среднего.  

Таблица 1 – Группировка с выделением регионов со значением показателя выше и ниже среднего
Группа Количество  регионов Среднее значение, %
Показатель  ниже среднего 27 12,6
Показатель  выше среднего 61 28,3
 
    По  данным группировки построена Диаграмма 1. Анализ диаграммы показывает, что 69% регионов (т.е. в 61 регионе) доля денежных доходов, расходуемых на прирост финансовых активов, выше, чем средний показатель по стране. При этом среднее значение показателя в первой группе (ниже среднего) в 2,25 раза ниже, чем среднее значение во второй группе.

Диаграмма 1 Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже среднего
 

Группировка с выделением регионов со значением показателя выше и ниже показателя в Челябинской  области

    В данной группировке имеет место  сравнение показателя* Челябинской области с соответствующими показателями остальных регионов РФ. Выделим две группы: регионы с показателем выше и ниже показателя Челябинской области. В итоге получим: 

Группа Количество  регионов Среднее значение, %
Показатель  ниже показателя по Челябинской области 30 13,0
Показатель  выше показателя по Челябинской области 58 29,0
 
    По  данным группировки построена Диаграмма 2.  Хотя значение показателя в Челябинской области незначительно превышает аналогичный показатель по стране,  все же есть 58 регионов,  в которых доля доходов, расходуемых на прирост финансовых активов, превышает соответствующую долю по Челябинской области. И лишь 34% (30) регионов имеют показатель ниже. Все вышеперечисленное позволяет сделать вывод о том, что Челябинская область по значению показателя* находится в конце списка регионов, и показатель большинства субъектов РФ  превышает показатель Челябинской области.

Диаграмма 2 – Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже соответствующего показателя Челябинской области  
Вариационный анализ
    Первый  этап вариационного анализа  - это  построение вариационного ряда. Так  как изучаемый признак относится  к непрерывному виду, то необходимо строить интервальный ряд.
    По  формуле Стержесса определяем длину  интервала. Полученное значение k=7,46. Следовательно, будет 8 интервалов. Минимальное значение признака равно 0,2%, а максимальное – 70,6%. За нижнюю границу первого интервала примем 0%, а за верхнюю границу последнего интервала – 72%. Такие границы, несомненно, способствуют легкости восприятия и наглядности распределения. Кроме того, эти границы достаточно близки к соответственно минимальному и максимальному значению признака.
    Вариационный ряд имеет вид (Таблица 2 – Вариационный ряд):
Таблица 2 – Вариационный ряд
Интервал (%) Частота попадания
0-9 5
9-18 16
18-27 32
27-36 18
36-45 8
45-54 2
54-63 4
63-72 3
    Графически распределение представлено на диаграмме (Диаграмма 3).

Диаграмма 3 – Распределение регионов по показателю*
    Анализ  диаграммы показывает, что распределение  не подчиняется нормальному закону. Явно выражена правосторонняя, то есть положительная, асимметрия, из чего можно сделать вывод о том, что большинство значений признака сконцентрировано слева от средней и имеет значение, меньшее, чем среднее. По гистограмме можно приблизительно определить моду, значение которой попадает в середину третьего интервала и составляет приблизительно 22%.
    Для построения кумуляты и огивы был  произведен расчет накопленных частот.
Диаграмма 4 – Кумулята и огива распределения

    Анализ  вышеприведенного графика позволяет  примерно определить медианное значение, то есть значение изучаемого признака, приходящееся на середину ранжированной  совокупности. В данном случае медиана  составляет приблизительно 23%.
    Второй  этап вариационного анализа –  расчет показателей. Для этого была оформлена дополнительная таблица (Приложение Б). В итоге получились следующие значения: 
 
 

Показатель Значение
Среднее значение 27,1
Мода 22,8
Медиана 21,91
Размах  вариации 70,4
Среднее линейное отклонение 10,86
Среднее квадратическое отклонение 14,23
Дисперсия 202,49
Относительный размах вариации 2,6
Относительное линейное отклонение 0,4
Коэффициент вариации 0,53
Коэффициент асимметрии 1,04
Таблица 3 – Показатели вариации

Структурные характеристики

    К данному типу характеристик относят  среднее значение, моду и медиану. Для оценки моды и медианы можно  использовать графики распределения  и пересечения огивы с кумулятой  соответственно.
    Среднее значение показателя* по регионам составило 27,1%. Однако индивидуальные различия единиц совокупности погашаются, неточно передается структура ряда распределения.
    Медина  равна 21,91%. То есть половина единиц совокупности имеет значение показателя ниже данного, а вторая половина – не меньше медианного. Мода же равна 22,8%. Данная характеристика указывает на наиболее часто встречающееся значение признака. Однако, поскольку ряд интервальный, следует рассматривать моду как значение, вокруг которого плотность распределения достигает своего пика. То есть вокруг этого значения сконцентрировано наибольшее количество регионов РФ. 
    Для нормального закона характерно следующее соотношение: медиана находится в интервале между модой и средним значением, при чем она ближе к средней, чем к моде. В рассматриваемой совокупности имеет место иное соотношение, а именно: Xср>Me>Mo, что обусловлено выраженной правосторонней асимметрии. Таким образом, нельзя утверждать, что распределение подчиняется вышеуказанному закону.

Характеристики  рассеяния

    Простейшим  из показателей данной группы является вариационный размах. Он равен 70,4%, что  является достаточно большим значением. Но он дает лишь самое общее представление  о размерах вариации, так как показывает, насколько отчаются друг от друга  крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.
    Более точным будет такой показатель, который  учитывает отклонение каждой из вариант  от средней величины. Среднее линейное отклонение составило 10,86%. Именно на это значение отклоняется в среднем доля доходов, идущих на пополнение финансовых активов, от своего среднего значения. Также необходимо рассчитать среднее квадратическое отклонение. Оно равно 14,23%. По свойству мажорантности средних среднее квадратическое отклонение всегда больше среднего линейного отклонения. Соотношение среднего квадратического отклонения и среднего линейного отклонения, равное 1,31, позволяет сделать вывод об отсутствии нормального распределения.
    Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины. В нашем случае она равна 202,49%.
    К относительным показателям вариации относят: относительный размах вариации (2,6), относительное линейное отклонение (0,4) и коэффициент вариации (0,53). Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Данное значение коэффициента свидетельствует о том, что степень концентрации вокруг среднего допустима.
    Относительное линейное отклонение показывает, что  доля усредненного значения абсолютных отклонений от средней величины составляет 40%.
    Относительный размах вариации отражает относительную  колеблемость крайних значений признака вокруг средней. Такое значение коэффициента говорит о том, что относительный разброс значений признака достаточно высок.

Характеристики  формы распределения  вариационного ряда

    Сюда  относятся коэффициент асимметрии и коэффициент эксцесса.
    Коэффициент асимметрии рассчитывается с помощью моментов третьего порядка. Для данной совокупности он равен 1,04. Такое значение показывает, что имеет место выраженная правосторонняя асимметрия и большинство значений признака имеет значение ниже среднего.
    Так как коэффициент асимметрии не равен  нулю, то не имеет смысла рассчитывать  показатель эксцесса. Все вышеперечисленное подтверждает гипотезу об отсутствии нормального распределения.
 

Моделирование ряда распределения

    Нормальное  распределение важно по многим причинам. Распределение многих статистик  является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы.
    Выдвинем  гипотезу о том, что распределение  в совокупности подчиняется нормальному  закону. Воспользуемся для проверки гипотезы критерием согласия Пирсона, для чего возьмем за основу вариационный ряд, составленный ранее. Для расчетов понадобятся значения средней величины (27,1), среднего квадратического отклонения (14,23) и длина интервала (9). Дополним ряд так, чтобы получилась следующая таблица:
     
X`j Интервал
t      
4,5 0 9 5 -1,59 0,1127 6 0,1667
13,5 9 18 16 -0,96 0,2516 14 0,2857
22,5 18 27 32 -0,32 0,3790 21 5,7619
31,5 27 36 18 0,31 0,3802 21 0,4286
40,5 36 45 8 0,94 0,2565 14 2,5714
49,5 45 54 2 1,57 0,1163 6 2,6667
58,5 54 63 4 2,21 0,0347 2 2,0000
67,5 63 72 3 2,84 0,0071 0 ошибка деления  на ноль
Таблица 4 –Моделирование ряла распределения
    Видно, что для последнего интервала  округленная теоретическая частота, то есть частота, которая должна быть при нормальном распределении, статистически  незначима. Для интервала 54-63 теоретическая  частота равна 2, что тоже достаточно невысокий показатель. Объединим последние три интервала в один. Получим интервал  45-72 с длиной, равной 27. Необходимо также пересчитать среднее значение и среднее квадратическое отклонение. Они равны соответственно 27 и 13,84. После объединения получится следующая таблица:
X`j Интервал
t      
4,5 0 9 5 -1,63 0,1057 6 0,1667
13,5 9 18 16 -0,98 0,2468 14 0,2857
22,5 18 27 32 -0,33 0,3778 22 4,5455
31,5 27 36 18 0,33 0,3778 22 0,7273
40,5 36 45 8 0,98 0,2468 14 2,5714
58,5 45 72 9 2,28 0,0297 5 3,2
Итого Х Х Х Х Х Х 11,4965
Таблица 5 – моделирование ряда распределения после объединения интервалов
    В данном ряду нет статистически незначимых частот, поэтому можно приступать к определению ?2. Предельное значение, определяющее условия отклонения гипотезы о нормальном характере распределения, для уровня значимости=0,05 при степени свободы=3 равно 7,815. Эмпирическое же значение равно 11,5.  Так как теоретическое значение меньше полученного на практике, то гипотеза о нормальном законе распределения отвергается. Имеет место выраженная правосторонняя асимметрия со смещением в область более низких значений.
 

Оценка параметров генеральной совокупности на основе выборочных данных

    В реальных условиях для наблюдения какого-то признака практически никогда не анализируется вся совокупность в целом. Вместо этого применяют  выборочное наблюдение, то есть статистическому  обследованию подвергаются определенным образом отобранные единицы изучаемой совокупности. Целью  выборочного наблюдения является характеристика всей совокупности единиц по обследуемой части, при условии соблюдения всех правил и принципов статистического наблюдения. Это позволяет сэкономить материальные, трудовые ресурсы, время, дает возможность более детально и подробно изучить отдельные единицы статистической совокупности и их группы.
    Для проведения выборочного наблюдения необходимо определить способ отбора и тип выборки. В данном конкретном случае считаю оптимальным применение бесповторной собственно случайной выборки методом жеребьевки, так как единицы наблюдаемой совокупности не упорядочены и с равной вероятностью могут попасть в выборку.

Выборка 54 регионов

    Из 88 регионов выберем 54. Выбранные единицы  представлены в Приложении В. 
    Рассчитаем  выборочную среднюю для совокупности. Вследствие отсутствия весов рассчитывается как простая арифметическая средняя. Она равна 27,07%.  Вычислим предельную ошибку средней с помощью коэффициента доверия  для вероятностей 0,760, 0,860, 0,880 и 0,960.  

Вероятность Предельная  ошибка
0,76 6,05
0,86 6,68
0,88 6,80
0,96 7,25
Таблица 6 – Предельные ошибки
    Необходимо  отметить, что используемая для расчета  предельной ошибки средней дисперсия  генеральной совокупности вычисляется из выборочной дисперсии путем ее умножения на величину n/(n-1), где n – размер выборочной совокупности. В нашем случае этот коэффициент равен 54/53.
    В результате получаем следующие доверительные  интервалы генеральной средней:
Вероятность Интервал
0,76 21,02 - 33,12
0,86 20,39 - 33,75
0,88 20,27 - 33,86
0,96 19,81 - 34,32
Таблица 7 – Доверительные интервалы генеральной средней

Выборка 24 региона

    Выберем 24 региона из совокупности (Приложение Г). Рассчитаем среднее значение выборки как среднюю арифметическую величину. Оно равно 29,14%.
    Так как количество единиц в выборке  меньше 30, то она относится к малым. Следовательно, расчет предельной средней  необходимо проводить по правилам малой  выборки.
    Здесь используется критерий доверия Стьюдента. Также необходимо отметить, что применяется выборочная, а не генеральная дисперсия, и коэффициент корректировки на бесповторность. Получаем следующие предельные ошибки:
Степень значимости Предельная  ошибка
0,24 3,43
0,14 4,45
0,12 4,45
0,04 6,49
Таблица 8 – предельные ошибки малой выборки
    Коэффициент корректировки на бесповторность равен 64/87. Число степеней свободы равно 23. Значение коэффициента доверия Стьюдента  выбирается по соответствующей таблице.  
 

    Доверительные интервалы в малой выборке  имеют вид:
Степень значимости Интервал
0,24 25,72 - 32,57
0,14 24,69 - 33,59
0,12 25,69 - 33,59
0,04 22,65 - 35, 63
       
    Значение  генеральной средней равно 27,1%. Для всех предложенных вероятностей оно попадает в доверительный интервал, рассчитанный как для малой, так и для большой выборки. Однако, на мой взгляд, к таким результатам привели большие значения предельных ошибок, которые в свою очередь зависят от дисперсии. Но формально можно считать обе выборки достаточно результативными.
 

Анализ динамики

    Проанализируем  динамику показателя «Среднедушевой доход  в месяц, руб.», по Центральному федеральному округу за 2000-2004 годы. Построим ряд динамики:
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.