Здесь можно найти образцы любых учебных материалов, т.е. получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ и рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


реферат Интеллектуальный анализ данных в прикладной программе STATISTIKA

Информация:

Тип работы: реферат. Добавлен: 08.12.2012. Сдан: 2012. Страниц: 9. Уникальность по antiplagiat.ru: < 30%

Описание (план):


СЕВАСТОПОЛЬСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ  ЯДЕРНОЙ ЭНЕРГИИ И ПРОМЫШЛЕННОСТИ
 
 
 
 
 
Кафедра КЭЭМ
 
 
 
 
Расчётно-графическая  работа №1
по дисциплине: «Интеллектуальный анализ данных»
Тема: Интеллектуальный анализ данных в прикладной программе
STATISTIKA.
 
 
 
 
 
 
 
 
 
СЕВАСТОПОЛЬ
2012
 
 
 
 
 
 
ЗАДАНИЯ
 
    Задание 1. Создание файлов данных.
    Задание 2.  Обработка многомерных данных в Microsoft Office Eхсеl.
    Задание 3. Кластерный анализ.
    Задание 4. Обработка  классифицируемых данных. Теория классификации.
    Задание 5. Дискриминантный анализ.
    Задание 6. Факторный анализ.
    Задание 7. Регрессионный анализ (Множественная регрессия).
     

СОДЕРЖАНИЕ
 
 
ВВЕДЕНИЕ 4
РАЗДЕЛ 1 6
ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ О ДАННЫХ И ИХ ОБРАБОТКЕ 6
1.1. Кластерный анализ 7
1.2. Теория классификации 9
1.3. Дискриминантный анализ 10
1.4. Факторный анализ 11
1.5. Регрессионный анализ 13
Выводы раздела 1 16
РАЗДЕЛ 2 17
ВЫПОЛНЕНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА 17
2.1. Создание файлов данных 17
2.2. Обработка многомерных данных в Microsoft Excel 18
2.3. Кластерный анализ 22
2.4. Обработка классифицируемых данных. Теория классификации. 23
2.5. Дискриминантный анализ. 23
2.5. Факторный анализ 25
2.7. Регрессионный анализ 26
Выводы раздела 2 29
ВЫВОД 30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 32
 


ВВЕДЕНИЕ

 
 
Актуальность темы. В настоящее время существует большое количество данных.Они представляются как необработанный материал предоставляемый, поставщиками данных и используемый потребителями для формирования информации . Данные бесконечны, и бывают как существенные так и незначащие. Чтобы понять с какими именно данными пользователь должен работать ему приходиться проделывать огромную работу, но со временем человечество изобретает все более упрощенные способы сбора и обработки данных. Так была разработана Data Mining.
Data Mining  представляет собой процесс обнаружения в сырых данных ранее неизвестных, практически полезных и доступных знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Задачи, решаемые методами Data Mining, принято разделять на описательные (англ. descriptive) и предсказательные (англ. predictive).
В описательных задачах самое главное — это  дать наглядное описание имеющихся  скрытых закономерностей, в то время  как в предсказательных задачах  на первом плане стоит вопрос о  предсказании для тех случаев, для  которых данных ещё нет.
К описательным задачам относятся:
- поиск ассоциативных правил или паттернов (образцов);
- группировка объектов, кластерный анализ;
- построение регрессионной модели.
К предсказательным задачам относятся:
- классификация объектов (для заранее заданных классов);
- регрессионный анализ, анализ временных рядов.
С помощью  интеллектуального анализа даных  можно отыскивать действительно очень ценную информацию.
 
Data mining и искусственный интеллект:
Знания, добываемые методами Data mining принято представлять в виде моделей. В качестве таких моделей выступают:
- ассоциативные правила;
- деревья решений;
- кластеры;
- математические функции.
Интеллектуальный  анализ данных представляет большую  ценность для руководителей и  аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью  методов Data Mining они могут получить ощутимые преимущества в конкурентной борьбе. В основе методов Data mining лежат математические методы обработки данных, включая и статистические методы. В промышленных решениях, нередко, такие методы непосредственно включаются в пакеты Data mining.
Цели и задачи работы. Получение практических навыков применения  современных информационных технологий, предназначенных для интеллектуального анализа данных, направленных на исследования целостного представления об анализе и интерпретации экспериментальных и статистических данных, как о процессе поиска, так и применения скрытых в них закономерностей.
 
Для достижения поставленной цели необходимо решить следующие задачи:
    Раскрыть  ряд теоретических вопросов;
    Выполнить методы статистического анализа.
 


РАЗДЕЛ 1

ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ О ДАННЫХ И ИХ ОБРАБОТКЕ

 
 
Данные-это необработанный материал предоставляемый, поставщиками данных и используемый потребителями для формирования информации на основе данных.Для того чтобы их было удобно использовать надо провести обработку данных.
Обработка данных- это процесс получения  достоверной  и ранее неизвестной  информации из баз данных, а также  использование её для дальнейшего  анализа и принятия решения.
Компьютерная  обработка данных- предполагает некоторое  математическое преобразование данных с помощью математических средств.
Одни из таких  средств является программа STATISTIKA.
Statistica (торговая марка — STATISTICA) — пакет для всестороннего статистического анализа, разработанный компанией StatSoft. В пакете STATISTICA реализованы процедуры для анализа данных (data analysis), управления данными (data management), добычи данных (data mining), визуализации данных (data visualization).
Система STATISTICA обладает широкими графическими возможностями. STATISTICA включает в себя большое количество разнообразных категорий и типов графиков (включая научные, деловые, трехмерные и двухмерные графики в различных системах координат, специализированные статистические графики — гистограммы, матричные, категорированные графики и др.). Пакет STATISTICA имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных:
Base — включает в себя обширный выбор основных статистик, широкий набор методов для разведочного анализа.
Advanced Linear/Non-Linear Models — предлагает широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д.
Multivariate Exploratory Techniques — многомерные разведочные технологии анализа STATISTICA предоставляет широкий выбор разведочных технологий, начиная с кластерного анализа до расширенных методов классификационных деревьев, в сочетании с бесчисленным набором средств интерактивной визуализации для построения связей и шаблонов
QC — Контроль качества — предоставляет широкий спектр аналитических методов управления качеством, а также контрольные карты презентационного качества, непревзойденной гибкости и разнообразия.
Neural Networks — (отдельный модуль) единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык
Data Miner — интеллектуальный анализ данных.

      Кластерный анализ


 
Кластерный  анализ [англ. cluster - гроздь, группа, скопление] - широкий класс процедур многомерного статистического анализа, позволяющих произвести автоматизированную группировку наблюдений в однородные классы - кластеры. Входным материалом для кластерного анализа служат попарные показатели различия или сходства классифицируемых объектов. В частности, это могут быть коэффициенты корреляции между переменными. В результате кластерного анализа исследователь получает разбиение объектов на классы.
Кластерный  анализ (англ. Data clustering) - задача разбиения заданной выборки объектов (ситуаций) на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя. При кластеризации и группировке целью является выявление и выделение классов. Синонимы: построение классификации, распознавание образов без учителя, автоматическая классификация без учителя, таксономия и др. Задача кластер-анализа состоит в выяснении по эмпирическим данным, насколько элементы "группируются" или распадаются на изолированные "скопления", "кластеры"(от cluster (англ.) - гроздь, скопление). Иными словами, задача - выявление естественного разбиения на классы, свободного от субъективизма исследователя, а цель - выделение групп однородных объектов, сходных между собой, при резком отличии этих групп друг от друга.
Кластерный  анализ выполняет следующие основные задачи:
Разработка  типологии или классификации.
Исследование  полезных концептуальных схем группирования  объектов.
Порождение  гипотез на основе исследования данных.
Проверка  гипотез или исследования для  определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся  данных.
Кластерный  анализ предъявляет следующие требования к данным:
    показатели не должны коррелировать между собой;
    показатели не должны противоречить теории измерений;
    распределение показателей должно быть близко к нормальному
    показатели должны отвечать требованию «устойчивости», под которой
    понимается отсутствие влияния на их значения случайных факторов
    выборка должна быть однородна, не содержать «выбросов».
Цели кластеризации
Понимание данных путём выявления  кластерной структуры. Разбиение выборки  на группы схожих объектов позволяет  упростить дальнейшую обработку  данных и принятия решений, применяя к каждому кластеру свой метод  анализа (стратегия «разделяй и  властвуй»).
Сжатие данных. Если исходная выборка избыточно большая, то можно  сократить её, оставив по одному наиболее типичному представителю  от каждого кластера.
Обнаружение новизны (англ. novelty detection). Выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров.
Таким образом, кластерный анализ выполняет сбор данных, содержащих информацию о выборке объектов, и затем разбивает объекты на однородные группы(кластеры).

       Теория классификации


 
Классификация - самый древний и самый простой научный метод. Она служит предпосылкой всех типов теоретических конструкций, включающих сложную процедуру установления причинно-следственных отношений, которые связывают классифицируемые объекты.
Классификация делится на такие виды как: вспомогательная- производится по внешнему признаку и  служит для придания объекту нужного  порядка; естественная- является результатом  и важным следствием научного явления, т.к. предполагает результаты  классифицируемых объектов.
Функции классификации предназначены для  определения того, к какой группе наиболее вероятно может быть отнесен  каждый объект. Имеется столько же функций классификации, сколько  групп. Каждая функция позволяет  вам для каждого образца и  для каждой совокупности вычислить  веса классификации
Для получения сведений, насколько хорошо работает процедура  классификации на самом деле, следует  классифицировать (априорно) различные  наблюдения, то есть, наблюдения, которые  не использовались при оценке функции  классификации.
Таким образом, классификация  предназначена для определения того, к какой группе может быть отнесен каждый объект.

      Дискриминантный анализ


 
Дискриминантный анализ - раздел вычислительной математики, представляющий основное средство решения задач Распознавания образов, инструмент статистики, который используется для принятия решения о том, какие переменные разделяют (т.е. «дискриминируют») возникающие наборы данных (так называемые «группы»). Нейронные сети могут использоваться для дискриминантного анализа.
Основная цель
Дискриминантный анализ используется для принятия решения о том, какие  переменные различают (дискриминируют) две или более возникающие  совокупности (группы).
Дискриминантный анализ (discriminant analysis) используется для  анализа данных в том случае, когда зависимая переменная категориальная, независимые переменные  интервальные.
Дискриминантный анализ преследует такие цели.
    Определение дискриминантных функций (discriminant functions) или линейных комбинаций независимых переменных, которые наилучшим образом различают (дискриминируют) категории (группы) зависимой переменной.
    Проверка существования между группами значимых различий с точки зрения независимых переменных.
    Определение предикторов, вносящих наибольший вклад в межгрупповые различия.
    Отнесение случаев к одной из групп (классификация) исходя из значений предикторов.
    Оценка точности классификации данных на группы.
Дискриминантный анализ представляет собой статистический аппарат для изучения различий между  двумя и более группами объектов по отношению к нескольким переменным одновременно. В первые был применен в сфере банковского дела, а именно в кредитном анализе.
Таким образом, дискриминантный анализ применяется для поиска переменных, позволяющих относить наблюдаемые объекты в одну или несколько наблюдаемых групп, а также для классификации наблюдений в различные группы.

      Факторный анализ


 
Факторный анализ - многомерный статистический метод, применяемый для изучения взаимосвязей между значениями переменных.
Факторный анализ позволяет решить две важные проблемы исследователя: описать объект измерения всесторонне и в  то же время компактно. С помощью  факторного анализа возможно выявление  скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.
Можно выделить 2 цели факторного анализа:
    определение взаимосвязей между переменными, (классификация переменных);
    сокращение числа переменных.
Сущностью факторного анализа является процедура  вращения факторов, то есть перераспределения  дисперсии по определённому методу.
Факторный анализ может быть:
    разведочным — он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках;
    конфирматорным, предназначенным для проверки гипотез о числе факторов и их нагрузках.
Главной проблемой факторного анализа является выделение и интерпретация главных  факторов. При отборе компонент исследователь  обычно сталкивается с существенными  трудностями, так как не существует однозначного критерия выделения факторов, и потому здесь неизбежен субъективизм интерпретаций результатов. Существует несколько часто употребляемых  критериев определения числа  факторов. Некоторые из них являются альтернативными по отношению к  другим, а часть этих критериев  можно использовать вместе, чтобы  один дополнял другой:
Критерий  Кайзера или критерий собственных  чисел. Этот критерий предложен Кайзером, и является, вероятно, наиболее широко используемым. Отбираются только факторы  с собственными значениями равными  или большими 1. Это означает, что  если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается.
Критерий  каменистой осыпи или критерий отсеивания. Он является графическим методом, впервые  предложенным психологом Кэттелом. Собственные  значения возможно изобразить в виде простого графика. Кэттел предложил  найти такое место на графике, где убывание собственных значений слева направо максимально замедляется.
Критерий  значимости. Он особенно эффективен, когда  модель генеральной совокупности известна и отсутствуют второстепенные факторы. Но критерий непригоден для поиска изменений в модели и реализуем  только в факторном анализе по методу наименьших квадратов или  максимального правдоподобия.
Критерий  доли воспроизводимой дисперсии. Факторы  ранжируются по доле детерминируемой  дисперсии, когда процент дисперсии  оказывается несущественным, выделение  следует остановить.
Критерий  интерпретируемости и инвариантности. Данный критерий сочетает статистическую точность с субъективными интересами. Согласно ему, главные факторы можно выделять до тех пор, пока будет возможна их ясная интерпретация.
Методы  факторного анализа:
    метод главных компонент
    корреляционный анализ
    метод максимального правдоподобия.
Таким образом, с помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.

      Регрессионный анализ


 
Термин "регрессия" был введён Фрэнсисом  Гальтоном в конце 19-го века. Гальтон  обнаружил, что дети родителей с  высоким или низким ростом обычно не наследуют выдающийся рост и назвал этот феномен "регрессия к посредственности". Сначала этот термин использовался  исключительно в биологическом  смысле. После работ Карла Пирсона  этот термин стали использовать и  в статистике.
Регрессия — зависимость математического  ожидания (например, среднего значения) случайной величины от одной или  нескольких других случайных величин (свободных переменных), то есть . Регрессионным  анализом называется поиск такой  функции , которая описывает эту  зависимость. Регрессия может быть представлена в виде суммы неслучайной  и случайной составляющих.
Регрессио?нный (линейный) анализ — статистический метод исследования влияния одной  или нескольких независимых переменных  на зависимую переменную . Независимые  переменные иначе называют регрессорами или предикторами, а зависимые  переменные — критериальными.
Цели  регрессионного анализа
    Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)
    Предсказание значения зависимой переменной с помощью независимой(-ых)
    Определение вклада отдельных независимых переменных в вариацию зависимой.
Регрессионный анализ нельзя использовать для определения  наличия связи между переменными, поскольку наличие такой связи  и есть предпосылка для применения анализа.
Смысл регрессионного анализа – построение функциональных зависимостей между двумя группами переменных величин Х1, Х2, … Хр и Y. При этом речь идет о влиянии  переменных Х (это будут аргументы  функций) на значения переменной Y (значение функции). Переменные Х мы будем называть факторами, а Y – откликом.
Регрессионный анализ — метод моделирования  измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей  переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной  переменной. Параметры модели настраиваются  таким образом, что модель наилучшим  образом приближает данные. Критерием  качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для  всех значений независимой переменной в качестве аргумента.
Регрессионный анализ — раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма  значений некоторой модели и случайной  величины. Относительно характера распределения  этой величины делаются предположения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок.
Таким образом, регрессионный анализ используется для прогноза, анализа временных  рядов, тестирования гипотез и выявления  скрытых взаимосвязей в данных. 

Выводы раздела 1

 
 
    Кластерный анализ выполняет сбор данных, содержащих информацию о выборке объектов, и затем разбивает объекты на однородные группы(кластеры).
    Классификация  предназначена для определения того, к какой группе может быть отнесен каждый объект.
    Дискриминантный анализ применяется для поиска переменных, позволяющих относить наблюдаемые объекты в одну или несколько наблюдаемых групп, а также для классификации наблюдений в различные группы.
    С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.
    Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных.
 


РАЗДЕЛ 2

ВЫПОЛНЕНИЕ МЕТОДОВ  СТАТИСТИЧЕСКОГО АНАЛИЗА

 

       Создание файлов данных


 
В данном подразделе требуется создать файл, содержащий таблицу статистических данных о сбросе загрязненных сточных вод в поверхностные водные объекты по субъектам Российской Федерации за 1995-2005 год.
Для этого  необходимо внести нужную таблицу в  приложение Statistica и сохранить файл данных.(см. таблица.2.1).
 
Таблица 2.1

 
 
Продолжения таблицы.2.1. (см. ниже таблица. 2.1.1).
 


Таблица.2.1.1


      Обработка многомерных данных в Microsoft Excel


 
Первоначально требуется найти минимальное (Хmin)  и максимальное (Xmax) значения по каждому фактору с помощью встроенных функций Excel: МИН() и МАКС().
После этого необходимо разбить данные факторы на  три интервала по формулам:
1 интервал (Хmin,Х1), где Х1=Хmin+;
2 интервал (Х,1Х2), где Х2=Х1+;
3 интервал (Х2,Хmax). 

Разбив данные на 3 интервала по вше перечисленным формулам получили следующий результат (см.таблица.2.2).
 
Таблица 2.2

 
Продолжение таблицы.2.2 (см.ниже таблица.2.2.1)  

Таблица.2.2.1

 
Перед началом  классификации необходимо произвести стандартизацию данных по формуле: хsi=
Реализуем стандартизацию данных.(см.таблица 2.3).
Таким образом, программа Microsoft Excel является удобным  табличным редактором, позволяющим  производить вычисления с разными  видами данных, в том числе и  статистическими данными.
 


Таблица 2.3

 
 
 


      Кластерный анализ


Кластерный  анализ позволяет разбить наши данные по классам, называемые кластерами, так, так чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров отличались. Также позволяет рассчитать среднее значение для каждого кластера.(см.рис.2.4).
 

 
Рис.2.4 Средние значения для каждого кластера.
 
Для того что бы графически изобразить получены результаты необходимо построить линейный график средних значений характеристик  районов для каждого кластера.(см.рис.2.5)
 

 
Рис.2.5 График средних для каждого кластера. 

Таким образом, кластерный анализ разбивает данные на группы схожих объектов, что позволяет  упростить их дальнейшую обработку  и принятие решений.

      Обработка классифицируемых данных. Теория классификации.


На данном этапе необходимо провести разбиение стандартизованных данных на различное число кластеров (от 1 до 10).(см.рис.2.6).
 

 
 
Рис.2.6 разбиение  на 10 кластеров.
 
Таким образом, был проведен кластерный анализ, в  ходе которого данные разбиты на 10 групп, в которых данные мало отличаются друг от друга.

2.5. Дискриминантный  анализ.

Для проведения дискриминантного анализа в стандартизированную  таблицу добавим еще один столбец (CLASTER), который будет содержать номера кластеров для каждого района соответственно. Далее необходимо выполнить дискриминантный анализ, рассчитать расстояние Махаланобиса между группами, выполнить канонический анализ.(см.рис.2.7).
 

 
Рис.2.7 Дискриминантный  анализ, расстояние Махаланобиса, канонический анализ.
После того как выполнили канонический анализ требуется построить диаграмму  рассеяния.
 

 
Рис.2.8. Диаграмма рассеяния канонических значений.
 
Необходимо  провести классификацию данных(см.рис.2.9).
 

 
Рис.2.9. Функции классификации, построенные стандартным методом.
 
Таким образом, проведя дискриминантный анализ, видно что значения статистики лямбда Уилкса лежат в интервале [0;1], что свидетельствует о хорошей дискриминации.

      Факторный анализ


 
При выполнение факторного анализа возникла следующая  ошибка не выставляются установками по умолчанию. Дело в том, что в процессе факторизации процедура выполняет поиск так называемой обратной матрицы по отношению к корреляционной. Здесь существует аналогия с привычными действительными числами: умножив число на обратное к нему число, необходимо получить единицу (например, 4 и 0.25). Однако для некоторых чисел обратных к ним не существует , ноль невозможно умножить на что-то, что даст в итоге единицу. Однако для некоторых матриц не существует обратных, а значит, провести для таких случаев факторный анализ становится невозможным.
Чаще  всего она возникает вследствие существования линейной зависимости  между переменными. Однако, в случае, когда такие зависимости перестают  быть вероятностными, алгоритмы многомерного анализа дают сбой.
Так же, если факторизовать корреляционную матрицу, приведенную в литературе, возможно столкновение с негативным влиянием округления чисел.
Таким образом, ошибка при выполнении факторного анализа  могла возникнуть  по причине  не точных данных в статистике.

2.7. Регрессионный  анализ

 
В данном задании необходимо провести регрессионный  анализ.
Регрессио?нный (линейный) анализ — статистический метод исследования влияния одной  или нескольких независимых переменных  на зависимую переменную . Независимые  переменные иначе называют регрессорами или предикторами, а зависимые  переменные — критериальными. Результат регрессионного анализа (см.рис 2.10).
 

 
Рис.2.10 Итоговая таблица регрессии.
Затем необходимо построить график остатков(см.рис.2.11).

 
Рис.2.11. График остатков
 
Далее необходимо построить корреляционное поле (см.рис.2.12).
 

 
Рис.2.12. Корреляционное  поле.
 
 


Таким образом, регрессионный анализ позволяет исследовать влияние одной или нескольких независимых переменных  на зависимую переменную. 

Выводы раздела 2

 
 
Программа Microsoft Excel является удобным табличным редактором, позволяющим производить вычисления с разными видами данных, в том числе и статистическими данными.
Кластерный  анализ разбивает данные на группы схожих объектов, что позволяет упростить  их дальнейшую обработку и принятие решений.
Данные разбиты на 10 групп, в которых данные мало отличаются друг от друга.
Проведя дискриминантный анализ, видно что  значения статистики лямбда Уилкса лежат в интервале [0;1], что свидетельствует о хорошей дискриминации.
Ошибка  при выполнении факторного анализа  могла возникнуть  по причине  не точных данных в статистике.
Регрессионный анализ позволяет исследовать влияние одной или нескольких независимых переменных  на зависимую переменную
 


ВЫВОД

 
 
Кластерный анализ выполняет  сбор данных, содержащих информацию о  выборке объектов, и затем разбивает  объекты на однородные группы(кластеры).
Классификация  предназначена  для определения того, к какой  группе может быть отнесен каждый объект.
Дискриминантный анализ применяется  для поиска переменных, позволяющих  относить наблюдаемые объекты в  одну или несколько наблюдаемых  групп, а также для классификации  наблюдений в различные группы.
С помощью факторного анализа  возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между  наблюдаемыми переменными.
Регрессионный анализ используется для прогноза, анализа временных  рядов, тестирования гипотез и выявления  скрытых взаимосвязей в данных.
Программа Microsoft Excel является удобным табличным редактором, позволяющим производить вычисления с разными видами данных, в том числе и статистическими данными.
Кластерный  анализ разбивает данные на группы схожих объектов, что позволяет упростить  их дальнейшую обработку и принятие решений.
Данные разбиты на 10 групп, в которых данные мало отличаются друг от друга.
Проведя дискриминантный анализ, видно что  значения статистики лямбда Уилкса лежат в интервале [0;1], что свидетельствует о хорошей дискриминации.
Ошибка  при выполнении факторного анализа  могла возникнуть  по причине  не точных данных в статистике.
Регрессионный анализ позволяет исследовать влияние одной или нескольких независимых переменных  на зависимую переменную. 

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

 
 
 
    Коровкин С. Д., Левенец И. А., Ратманова И. Д., Старых В. А., Щавелёв Л. В. Решение проблемы комплексного оперативного анализа информации хранилищ данных // СУБД. - 1997. - № 5-6. - С. 47-51.
    Кречетов Н., Иванов П. Продукты для интеллектуального анализа данных // ComputerWeek-Москва. - 1997. - № 14-15. - С. 32-39.
    Пржиялковский В. В. Сложный анализ данных большого объема: новые перспективы компьютеризации // СУБД. - 1996. - № 4. - С. 71-83.
    Автор: Афонин А. Ю. Макарычев П. П. Оперативный и интеллектуальный анализ данных.
    http://www.mirknig.com/knigi/programming/1181398382-operativnyy-i-intellektualnyy-analiz-dannyh.html.
    http://www.thalion.kiev.ua/idx.php/0/310/article.
 


и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.