Понедельник, 21.07.2025
Супер рефераты
Меню сайта
Наш опрос
Оцените мой сайт
Всего ответов: 1
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Форма входа
Главная » 2011 » Ноябрь » 17 » Скачать реферат, курсовой Реферат Дисперсионный анализ бесплатно
11:38

Скачать реферат, курсовой Реферат Дисперсионный анализ бесплатно

Скачать реферат, курсовой Реферат "Дисперсионный анализ" бесплатно

Этот реферат, курсовую работу на тему "Реферат "Дисперсионный анализ"" вы может совершенно бесплатно скачать с этого портала, как и другие работы. Эти работы помогут школьнику, студенту, абитуриенту. Необходимым условием при использовании Реферат "Дисперсионный анализ" и других рефератов с нашего порталаявляется их использование только в личных целях без коммерческой выгоды.



Содержание

с.

Введение…………………….……………………………………………....3

1 Дисперсионный анализ………………………………………………....4

1.1 Основные понятия дисперсионного анализа…………………..……4

1.2 Однофакторный дисперсионный анализ………………………….....6

1.3 Многофакторный дисперсионный анализ…………………….........12

2 Применение дисперсионного анализа в различных задачах и

исследованиях……………………………………………………………………...16

2.1 Использование дисперсионного анализа при изучении

миграционных процессов……………………………………………….……..….16

2.2 Принципы математико-статистического анализа данных

медико-биологических исследований……………...……………….……………17

2.3 Биотестирование почвы……………...…………………………..…...19

2.4 Грипп вызывает повышенную выработку гистамина…………..…..21

2.5 Дисперсионный анализ в химии……………………………...…..….22

2.6 Использование прямого преднамеренного внушения в

бодрствующем состоянии в методике воспитания физических качеств………23

2.7 Купирование острой психотической симптоматики у больных

шизофренией атипичным нейролептиком……………………………………….26

2.8 Снование фасонной пряжи с ровничным эффектом………….....….28

2.9 Сопутствующая паталогия при полной утрате зубов у лиц

пожилого и старческого возраста………………………………...………………29

3 Дисперсионный анализ в контексте статистических

методов…...................................................................................................................31

3.1 Векторные авторегрессии……………………………………...……..34

3.2 Факторный анализ………………………………………………….…37

3.3 Парная регрессия. Вероятностная природа регрессионных

моделей……………………………………………………………………….….…41

Заключение………………………………………………………….…..... 44

Список использованных источников………………………………....….45

Введение

Цель работы: познакомится с таким статистическим методом, как дисперсионный анализ.

Дисперсионный анализ (от латинского Dispersio – рассеивание) статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др.

Целью дисперсионного анализа является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации /1/.

При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии.

При проведении исследования рынка часто встает вопрос о сопоставимости результатов. Например, проводя опросы по поводу потребления какого-либо товара в различных регионах страны, необходимо сделать выводы, на сколько данные опроса отличаются или не отличаются друг от друга. Сопоставлять отдельные показатели не имеет смысла и поэтому процедура сравнения и последующей оценки производится по некоторым усредненным значениям и отклонениям от этой усредненной оценки. Изучается вариация признака. За меру вариации может быть принята дисперсия. Дисперсия&%23963;2 – мера вариации, определяемая как средняя из отклонений признака, возведенных в квадрат.

На практике часто возникают задачи более общего характера – задачи проверки существенности различий средних выборочных нескольких совокупностей. Например, требуется оценить влияние различного сырья на качество производимой продукции, решить задачу о влиянии количества удобрений на урожайность с/х продукции.

Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предполо­жению; если дисперсионный анализ покажет, что и математические ожидания одинаковы, то в этом смысле сово­купности однородны). Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы /2/.

1 Дисперсионный анализ

1.1 Основные понятия дисперсионного анализа

В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными уровнями факторов называют моделью I, модель со случайными факторами - моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I.

В зависимости от количества факторов, определяющих вариацию результативного признака, дисперсионный анализ подразделяют на однофакторный и многофакторный.

Основными схемами организации исходных данных с двумя и более факторами являются:

- перекрестная классификация, характерная для моделей I, в которых каждый уровень одного фактора сочетается при планировании эксперимента с каждой градацией другого фактора;

- иерархическая (гнездовая) классификация, характерная для модели II, в которой каждому случайному, наудачу выбранному значению одного фактора соответствует свое подмножество значений второго фактора.

Если одновременно исследуется зависимость отклика от качественных и количественных факторов, т.е. факторов смешанной природы, то используется ковариационный анализ /3/.

При обработке данных эксперимента наиболее разработанными и поэтому распространенными считаются две модели. Их различие обусловлено специфи­кой планирования самого эксперимента. В модели дисперсионного анализа с фик­сированными эффектами исследователь намеренно устанавли­вает строго определенные уровни изучаемого фактора. Тер­мин «фиксированный эффект» в данном контексте имеет тот смысл, что самим исследователем фиксируется количе­ство уровней фактора и различия между ними. При повторе­нии эксперимента он или другой исследователь выберет те же самые уровни фактора. В модели со случайными эффек­тами уровни значения фактора выбираются исследователем случайно из широкого диапазона значений фактора, и при повторных экспериментах, естественно, этот диапазон бу­дет другим.

Таким образом, данные модели отличаются между собой способом выбора уровней фактора, что, очевидно, в пер­вую очередь влияет на возможность обобщения полученных экспериментальных результатов. Для дисперсионного анализа однофакторных эк­спериментов различие этих двух моделей не столь существен­но, однако в многофакторном дисперсионном анализе оно может оказаться весьма важным.

При проведении дисперсионного анализа должны выполняться следующие статистические допущения: независимо от уровня фактора величины отклика имеют нормальный (Гауссовский) закон распределения и одинаковую дисперсию. Такое равенство дисперсий называется гомогенностью. Таким образом, изменение способа обработки сказывается лишь на положении случайной величины отклика, которое характеризуется средним значением или медианой. Поэтому все наблюдения отклика принадлежат сдвиговому семейству нормальных распределений.

Говорят, что техника дисперсионного анализа является "робастной". Этот термин, используемый статистиками, означает, что данные допущения могут быть в некоторой степени нарушены, но несмотря на это, технику можно использовать.

При неизвестном законе распределения величин отклика используют непараметрические (чаще всего ранговые) методы анализа.

В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Вариацию, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия &%23963;2. Она является мерой вариации частных средних по группам вокруг общей средней и определяется по формуле:

,

где k - число групп;

nj - число единиц в j-ой группе;

- частная средняя по j-ой группе;

- общая средняя по совокупности единиц.

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия&%23963;j2.

.

Между общей дисперсией &%23963;02, внутригрупповой дисперсией &%23963;2 и межгрупповой дисперсией существует соотношение:

&%23963;02 = &%23963;2.

Внутригрупповая дисперсия объясняет влияние неучтенных при группировке факторов, а межгрупповая дисперсия объясняет влияние факторов группировки на среднее значение по группе /2/.

1.2 Однофакторный дисперсионный анализ

Однофакторная дисперсионная модель имеет вид:

xij = &%23956; Fj &%23949;ij, (1)

где хij – значение исследуемой переменой, полученной на i-м уровне фактора (i=1,2,...,т) cj-м порядковым номером (j=1,2,...,n);

Fi – эффект, обусловленный влиянием i-го уровня фактора;

&%23949;ij– случайная компонента, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариацией переменой внутри отдельного уровня.

Основные предпосылки дисперсионного анализа:

- математическое ожидание возмущения &%23949;ij равно нулю для любых i, т.е.

M(&%23949;ij) = 0; (2)

- возмущения &%23949;ij взаимно независимы;

- дисперсия переменной xij (или возмущения &%23949;ij) постоянна для
любых i, j, т.е.

D(&%23949;ij) = &%23963;2; (3)

- переменная xij (или возмущение &%23949;ij) имеет нормальный закон
распределения N(0;&%23963;2).

Влияние уровней фактора может быть как фиксированным или систематическим (модель I), так и случайным (модель II).

Пусть, например, необходимо выяснить, имеются ли сущест­венные различия между партиями изделий по некоторому показа­телю качества, т.е. проверить влияние на качество одного фактора - партии изделий. Если включить в исследование все партии сырья, то влияние уровня такого фактора систематическое (модель I), а полученные выводы применимы только к тем отдельным парти­ям, которые привлекались при исследовании. Если же включить только отобранную случайно часть партий, то влияние фактора случайное (модель II). В многофакторных комплексах возможна смешанная модель III, в которой одни факторы имеют случайные уровни, а другие – фиксированные.

Пусть имеется mпартий изделий. Из каждой партии отобрано соответственно n1,n2, …, nm изделий (для простоты полагается, что n1=n2=...=nm=n). Значения показателя качества этих изделий представлены в матрице наблюдений:

x11x12 x1n

x21x22 … x2n

………………… = (xij), (i = 1,2, …, m; j = 1,2, …, n).

xm1 xm2 … xmn

Необходимо проверить существенность влияния партий из­делий на их качество.

Если полагать, что элементы строк матрицы наблюдений – это численные значения случайных величин Х1,Х2,...,Хm, выражающих качество изделий и имеющих нор­мальный закон распределения с математическими ожиданиями соответственно a1,а2,...,аm и одинаковыми дисперсиями &%23963;2, то данная задача сводится к проверке нулевой гипотезы Н0: a1=a2 =...=аm, осуществляемой в дисперсионном анализе.

Усреднение по какому-либо индексу обозначено звездочкой (или точкой) вместо индекса, тогда средний показатель качества изделий i-й партии, или групповая средняя для i-го уровня факто­ра, примет вид:

, (4)

где i* – среднее значение по столбцам;

ij– элемент матрицы наблюдений;

n – объем выборки.

А общая средняя:

. (5)

Сумма квадратов отклонений наблюдений хijот общей средней ** выглядит так:

2=2 2

22. (6)

или

Q = Q1 Q2 Q3.

Последнее слагаемое равно нулю

=0. (7)

так как сумма отклонений значений переменной от ее средней равна нулю, т.е.

2=0.

Первое слагаемое можно записать в виде:

В результате получается тождество:

Q = Q1 Q2, (8)

где - общая, или полная, сумма квадратов отклонений;

- сумма квадратов отклонений групповых средних от общей средней, или межгрупповая (факторная) сумма квадратов отклонений;

- сумма квадратов отклонений наблюдений от групповых средних, или внутригрупповая (остаточная) сумма квадратов отклонений.

В разложении (8) заключена основная идея дисперсионного анализа. Применительно к рассмат­риваемой задаче равенство (8) показывает, что общая вариа­ция показателя качества, измеренная суммой Q, складывается из двух компонент – Q1 и Q2, характеризующих изменчивость этого показателя между партиями (Q1) и изменчивость внутри партий (Q2), характеризующих одинаковую для всех партий вариацию под воздействием неучтенных факторов.

В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а так называемые средние квад­раты, являющиеся несмещенными оценками соответствую­щих дисперсий, которые получаются делением сумм квадратов отклонений на соответствующее число степеней свободы.

Число степеней свободы определяется как общее число наблюдений минус число связывающих их уравне­ний. Поэтому для среднего квадрата s12, являющегося несме­щенной оценкой межгрупповой дисперсии, число степеней свободы k1=m-1, так как при его расчете используются mгрупповых средних, связанных между собой одним уравнением (5). А для среднего квадрата s22, являющегося несмещенной оценкой внутригрупповой дисперсии, число степеней свободы k2=mn-m, т.к. при ее расчете используются все mnнаблюдений, связанных между собой mуравнениями (4).

Таким образом:

= Q1/(m-1),

= Q2/(mn-m).

Если найти математические ожидания средних квадратов и , подставить в их формулы выражение xij (1) через парамет­ры модели, то получится:

(9)

т.к. с учетом свойств математического ожидания

а

(10)

Для модели I с фиксированными уровнями фак­тора Fi(i=1,2,...,m) величины неслучайные, поэтому

M(S) =2 /(m-1) &%23963;2.

Гипотеза H0 примет вид Fi = F*(i = 1,2,...,m), т.е. влияние всех уровней фактора одно и то же. В случае справедливости этой гипотезы

M(S)= M(S)= &%23963;2.

Для случайной модели II слагаемое Fiв выражении (1) – величина случайная. Обозначая ее дисперсией

получим из (9)

(11)

и, как и в модели I

M(S)=&%23963;2.

В таблице 1.1 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 1.1 – Базовая таблица дисперсионного анализа

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Средний квадрат

Математическое ожидание среднего квадрата

Межгрупповая

m-1

= Q1/(m-1)

Внутригрупповая

mn-m

= Q2/(mn-m)

M(S)= &%23963;2

Общая

mn-1

Гипотеза H0 примет вид &%23963;F2 =0. В случае справедливости этой гипотезы

M(S)= M(S)=&%23963;2.

В случае однофакторного комплекса как для модели I, так и модели IIсредние квадраты S2 и S2, являются несмещенными и независимыми оценками одной и той же дисперсии &%23963;2.

Следовательно, проверка нулевой гипотезы H0 свелась к проверке существенности различия несмещенных выборочных оценок S и Sдисперсии &%23963;2.

Гипотеза H0 отвергается, если фактически вычисленное зна­чение статистики F=S/Sбольше критического F&%23945;:K1:K2, опреде­ленного на уровне значимости &%23945; при числе степеней свободы k1=m-1 и k2=mn-m, и принимается, если F < F&%23945;:K1:K2 .

F- распределение Фишера (для x > 0) имеет следующую функцию плотности (для = 1, 2, ...; = 1, 2, ...):

где - степени свободы;

Г - гамма-функция.

Применительно к данной задаче опровержение гипотезы H0 означает наличие существенных различий в качестве изделий различных партий на рассматриваемом уровне значимости.

Для вычисления сумм квадратов Q1, Q2, Qчасто бывает удобно использовать следующие формулы:

(12)

(13)

(14)

т.е. сами средние, вообще говоря, находить не обязательно.

Таким образом, процедура однофакторного дисперсионного анализа состоит в проверке гипотезы H0 о том, что имеется одна группа однородных экспериментальных данных против альтернативы о том, что таких групп больше, чем одна. Под однородностью понимается одинаковость средних значений и дисперсий в любом подмножестве данных. При этом дисперсии могут быть как известны, так и неизвестны заранее. Если имеются основания полагать, что известная или неизвестная дисперсия измерений одинакова по всей совокупности данных, то задача однофакторного дисперсионного анализа сводится к исследованию значимости различия средних в группах данных /1/.

1.3 Многофакторный дисперсионный анализ

Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного ана­лиза (в варианте ее компьютерного использования) несом­ненно более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие /3/.

Общая схема двухфакторного эксперимента, данные ко­торого обрабатываются дисперсионным анализом имеет вид:


Рисунок 1.1 – Схема двухфакторного эксперимента

Данные, подвергаемые многофакторному дисперсионному анализу, часто обозначают в соответствии с количеством факторов и их уровней.

Предположив, что в рассматриваемой задаче о каче­стве различных mпартий изделия изготавливались на разных t станках и требуется выяснить, имеются ли существенные раз­личия в качестве изделий по каждому фактору:

А - партия из­делий;

B- станок.

В результате получается переход к задаче двухфакторного дисперсионного анализа.

Все данные представлены в таблице 1.2, в кото­рой по строкам - уровни Aiфактора А, по столбцам — уровни Bjфактора В, а в соответствующих ячейках, табли­цы находятся значения показателя качества изделий xijk(i=1,2,...,m; j=1,2,...,l; k=1,2,...,n).

Таблица 1.2 – Показатели качества изделий

B1

B2

Bj

Bl

A1

x11l,…,x11k

x12l,…,x12k

x1jl,…,x1jk

x1ll,…,x1lk

A2

x21l,…,x21k

x22l,…,x22k

x2jl,…,x2jk

x2ll,…,x2lk

Ai

xi1l,…,xi1k

xi2l,…,xi2k

xijl,…,xijk

xjll,…,xjlk

Am

xm1l,…,xm1k

xm2l,…,xm2k

xmjl,…,xmjk

xmll,…,xmlk

Двухфакторная дисперсионная модель имеет вид:

xijk=&%23956; Fi Gj Iij &%23949;ijk, (15)

где xijk - значение наблюдения в ячейке ij с номером k;

&%23956; - общая средняя;

Fi - эффект, обусловленный влиянием i-го уровня фактора А;

Gj - эффект, обусловленный влиянием j-го уровня фактора В;

Iij - эффект, обусловленный взаимодействием двух факто­ров, т.е. отклонение от средней по наблюдениям в ячейке ijот суммы первых трех слагаемых в модели (15);

&%23949;ijk - возмущение, обусловленное вариацией переменной внутри отдельной ячейки.

Предполагается, что &%23949;ijk имеет нормальный закон распределения N(0; с2), а все математические ожидания F*,G*, Ii*, I*jравны нулю.

Групповые средние находятся по формулам:

- в ячейке:

,

по строке:

по столбцу:

общая средняя:

В таблице 1.3 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 1.3 – Базовая таблица дисперсионного анализа

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Средние квадраты

Межгрупповая (фактор А)

m-1

Межгрупповая (фактор B)

l-1

Взаимодействие

(m-1)(l-1)

Остаточная

mln - ml

Общая

mln - 1

Проверка нулевых гипотез HA, HB, HAB об отсутствии влияния на рассматриваемую переменную факторов А, B и их взаимодействия AB осуществляется сравнением отношений , , (для модели I с фиксированными уровнями факторов) или отношений , , (для случайной модели II) с соответствующими табличными значениями F – критерия Фишера – Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями производится также как и в модели II, а факторов со случайными уровнями – как в модели I.

Если n=1, т.е. при одном наблюдении в ячейке, то не все нулевые гипотезы могут быть проверены так как выпадает компонента Q3 из общей суммы квадратов отклонений, а с ней и средний квадрат , так как в этом случае не может быть речи о взаимодействии факторов.

Далее

Если у вас есть аналогичные работы Реферат "Дисперсионный анализ" сообщите нам об этом. Также нам будет интересны рефераты, дипломные работы по теме Реферат "Дисперсионный анализ", а также курсовые работы. Присылайте их нам, помогите в учебе другим людям.
Скачайте и откройте один из архивов. После этого вам будет доступен для скачивания файл: Скачать реферат, курсовой Реферат Дисперсионный анализ бесплатно . Если файл не скачивается, воспользуйтесь дополнительной ссылкой и распакуйте следующий архив.
Скачать реферат, курсовой Реферат Дисперсионный анализ бесплатно
Зеркало: Скачать реферат, курсовой Реферат Дисперсионный анализ бесплатно
Зеркало 2: Скачать реферат, курсовой Реферат Дисперсионный анализ бесплатно
Файл: Скачать реферат, курсовой Реферат Дисперсионный анализ бесплатно - был проверен антивирусом Kaspersky Antivirus . Вирусов не обнаружено!

Просмотров: 365 | Добавил: admin87 | Рейтинг: 0.0/0
Похожие материалы:
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Поиск
Календарь
«  Ноябрь 2011  »
Пн Вт Ср Чт Пт Сб Вс
 123456
78910111213
14151617181920
21222324252627
282930
Архив записей
Супер рефераты © 2025
Сделать бесплатный сайт с uCoz