Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Дисперсионный анализ
На результаты исследований зачастую оказывают большое влияние целый ряд факторов, обусловливающих изменчивость значений исследуемой величины. Приведенные выше методы статистической обработки дают возможность оценить только общую изменчивость изучаемой величины без оценки влияния на степень варьирования изучаемого свойства отдельных факторов (влияние скорости приложения нагрузки, влажности материала, вида добавок, их количества и др.). Пусть генеральные совокупности X 1, X 2, …, Xn распределены нормально и имеют одинаковую, хотя и неизвестную, дисперсию; математические ожидания также неизвестны, но могут быть различными. Требуется при заданном уровне значимости по выборочным средним проверить нулевую гипотезу М (X 1) = М (X 2) =... = М (Xn)о равенстве всех математических ожиданий. То есть, требуется установить, значимо или незначимо различаются выборочные средние. Казалось бы, для сравнения нескольких средних их можно очень просто сравнить попарно. Однако с возрастанием числа средних возрастает и наибольшее различие между ними: среднее меньше наименьшего из средних или среднее больше наибольшего из средних полученных до нового опыта. По этой причине для сравнения нескольких средних или каких-либо других свойств двух или нескольких выборок пользуются другим методом, который основан на сравнении дисперсий и поэтому назван дисперсионным анализом. Дисперсионный анализ при обработке результатов испытаний позволяет их общую вариацию разложить на систематическую (факторную дисперсию), обусловленную влиянием изучаемых факторов; и случайную, обусловленную влиянием случайных, неучтенных факторов. Оценка достоверности систематической вариации по сравнению со случайной и составляет сущность дисперсионного анализа. Для суждения о степени достоверности систематической вариации вычисленное по экспериментальным данным отношение мер варьирования между систематической и случайной вариациями сравнивается с соответствующим табличным отношением. Если вычисленное по экспериментальным данным отношение мер варьирования равно или больше соответствующего табличного отношения, то влияние изучаемого фактора считается доказанным с той или иной степенью вероятности. Если оно меньше табличного, то нет оснований приписывать исследуемому фактору какое-либо существенное влияние на результат. На практике дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор F, который имеет п уровней F 1, F 2,..., Fп, на изучаемую величину X. Например, если требуется выяснить какая добавка наиболее эффективна для повышения водонепроницаемости бетона, то фактор F – добавка, а его уровни – количество добавки. Если различие между этими дисперсиями значимо, то факторы оказывают существенное влияние на X; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются так же значимо. Когда же удается установить наиболее существенный фактор (вид добавки), то для уточнения наиболее результативного уровня (количества добавки) производят дополнительное попарное сравнение средних. То есть после установления влияния изучаемых факторов на результат переходят к оценке влияния отдельных их вариантов и сочетаний. Дисперсионный анализ необходим прежде всего при оценке работы технологической линии по приготовлению железобетонных изделий, когда требуется установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предположению). Если дисперсионный анализ покажет, что математические ожидания одинаковы, то в этом случае совокупности однородны. Однородные совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы. Например, для контроля качества бетона изделий готовят и испытывают по 3 образца-кубика из отдельного замеса бетонной смеси. В течение смены выполняют несколько таких определений, результаты которых сводят в выборку. Дисперсии же генеральных совокупностей, соответствующих этим выборкам, равны между собой, т. е. , так как по сути генеральная совокупность одна и та же (например совокупность результатов испытаний образцов бетона в течение года работы). Если ритм работы технологической линии и параметры используемых материалов не нарушаются, следует ожидать, что характеристики рассеяния результатов испытаний прочности образцов в выборках начала и конца месяца будут невелики. При дисперсионном анализе принимают нормальное распределение и различные критерии. Критериями для сравнения выборок служит равенство двух выборочных дисперсий, равенство двух выборочных средних и однородность (равенство) ряда выборочных дисперсий. Критерий равенства двух дисперсий. Дисперсии двух выборок сравнивают, используя F -критерий. Для этого вычисляют отношение большей дисперсии к меньшей . (5.1) Поскольку проверяется гипотеза равенства генеральных дисперсий, желательно, чтобы это отношение было как можно ближе к единице. Число степеней свободы принимают соответственно а где п – количество значений в выборке. Критерий равенства двух дисперсий справедлив при Fэксп < Fp (). Критерий равенства двух средних. Средние значения случайной величины в выборках сравнивают используя t -критерий. Когда т. е. выполняется условие F -критерия, вычисляют общую дисперсию двух выборок и экспериментальное значение нормированного показателя по формулам: , (5.2)
. (5.3) Критерий равенства справедлив, если . Величину доверительной вероятности выбирают в пределах 0, 90–0, 99. Число степеней свободы f определяют из условия . Когда гипотеза равенства дисперсий не выполняется, производят приближенную проверку по формуле . (5.4) Число f степеней свободы при этом определяют из выражения
(5.5) где . (5.6)
Критерий равенства средних справедлив при , т. е. при таких условиях нет существенного различия между средними. Пример 5.1. Сравним результаты испытаний двух партий бетонных образцов. В первой партии ( = 29 образцов) средний предел прочности = 40, 1 МПа, = 8, 2 МПа. Во второй партии ( = 13 образцов) – Вычисление отношения дисперсий . Значения определим из табл. 5 прил. 2, приняв а При уровне значимости , а при . В обоих случаях . Таким образом, с любой величиной достоверности можно утверждать, что имеет место равенство дисперсий, выборки представительны и достаточно хорошо воспроизводят генеральную совокупность. В связи с выполнением критерия вычислим общую дисперсию двух выборок тогда По табл. 5 прил. 2 определяем величину для , при , при . Таким образом, вероятность того, что выборочные средние равны и /- представляют генеральную совокупность Р (–1, 68 < t < +1, 68) = 0, 90 или Р (–2, 02 < t < +2, 02) = 0, 95,
что является достаточно высоким уровнем вероятности. Следовательно, если , то нет существенного различия Критерий однородности ряда дисперсий. Однородность (равенство) ряда выборочных дисперсий в случае равенства числа измерений случайной величины в выборках оценивают по критерию Кохрена
, (5.7)
где – наибольшая выборочная дисперсия; – число выборок. Если , то критерий однородности ряда дисперсий справедлив.
Пример 5.2. При определении предела прочности получены следующие , пяти партий бетона: 2, 5; 2, 8; 3, 2; 2, 4; 2, 7. Ошибки во всех случаях подсчитывались по 20 измерениям. Рассмотрим воспроизводимость определения прочности. Найдём .
По табл. 5 прил. 2 методом интерполяции находим при уровне значимости р = 0, 05, для m = 5 и n – 1 = 19 = 0, 3558. Таким образом, G max < и гипотеза однородности дисперсий принимается с достоверностью Р = 1 – р = 0, 95. Однофакторный дисперсионный анализ. Основная идея дисперсионного анализа при оценке влияния качественного фактора F на изучаемую величину x 1состоит в «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на x 1. В этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются также значимо.
Когда установлено, что фактор существенно влияет на x и требуется выяснить, какой из уровней оказывает наибольшее воздействие, дополнительно производят попарное сравнение средних. В более сложных случаях исследуют воздействие нескольких факторов на нескольких постоянных или случайных уровнях и вычисляют влияние отдельных уровней и их комбинаций (многофакторный анализ). Ограничимся пока простейшим случаем однофакторного анализа, когда на X воздействует один фактор F, который встречается в Сведём все наблюдения в табл. 5.1. Таблица 5.1 Результаты наблюдений
О влиянии исследуемого фактора судят по F -отношению для дисперсий и . Дисперсия обусловлена колебаниями хi внутри вариантов, т. е. , (5.8) где N – общее число измерений. Вторая дисперсия характеризует дисперсию средних значений внутри варианта к общему среднему, т. е. отображают колебания средних (5.9) в отдельных вариантах относительно общей средней для всей совокупности. Отношение дисперсий со степенями своды и сравнивают с табличными значениями . При исследуемый фактор считают значимым. Пример 5.3. Выполним дисперсионный анализ для определения влияния на прочность бетона в течение месяца недельных режимов работы технологической линии по изготовлению железобетонных изделий. Результаты измерений прочности приведены в табл. 5.2, а промежуточных расчетов – в табл. 5.3. Таблица 5.2 Результаты испытаний прочности
Таблица 5.3 Таблица промежуточных результатов
Пользуясь данными табл. 5.3 определяем дисперсию . Дисперсию находим по преобразованному выражению , (5.10) . Экспериментальное значение критерия Fэксп =1, 78: 0, 043 = 41. Табличное значение критерия для числа степеней свободы большей дисперсии = 20 – 4 = 16 и меньшей дисперсии = 4 – 1 = 3 находим по табл. прил. 2 F (16, 3) = 8, 7 для р = 0, 05. Так как Fэксп > , то опытные данные отрицают «нуль-гипотезу» о равенстве дисперсий. Это означает, что изменение прочности в течение недельного периода работы технологической линии не случайно, и технологический процесс требует совершенствования.
|