Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка объемом . Наблюдаемое значение называют вариантой, , где – вариационныйряд, – размах вариационного ряда, Число наблюдений варианты – частота, – относительная частота. Построим по выборке таблицу из двух строк: в верхней строке указаны в порядке возрастания наблюдаемые значения, а в нижней – соответствующие им частоты или относительные частоты. Эта таблица называется таблицей статистического распределения выборки.
или
При большом числе наблюдений над непрерывной случайной величиной обычно прибегают к группировке данных: область на оси , куда попали значения , разбивают на 5-15 интервалов (не обязательно одинаковой длины). Соответствие между вариантами, записанными в порядке возрастания, и относительными частотами, задаваемое таблицей статистического распределения выборки, называется статистическим (эмпирическим) распределением выборки. Пример 2. Имея выборку: 2, 6, 12, 6, 6, 2, 6, 12, 12, 6, 6, 6, 12, 12, 6, 12, 2, 6, 12, 6 (), записать вариационный ряд и составить таблицу статистического распределения выборки. Решение. Вариационный ряд: 2, 2, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 12, 12, 12, 12, 12, 12, 12. Статистическое распределение выборки:
Контроль: 0, 15 + 0, 50 + 0, 35 = 1.● Для наглядного представления статистического распределения пользуются графическим изображением вариационных рядов. а) Полигон частот – ломаная, отрезки которой соединяют точки , , …, (для дискретных распределений). б) Гистограмма – ступенчатая фигура, составленная из прямоугольников, основания которых – интервалы значений, высоты пропорциональны (только для интервального ряда). в) Кумулята – ломаная, соединяющая верхние концы перпендикуляров, высота которых пропорциональна накопленной частоте. На оси могут откладываться частоты или проценты. Вид графика от этого не изменится. Если строить прямоугольники высоты , где – длина интервала, то гистограмма будет изображать эмпирическую плотность, а суммарная площадь всех прямоугольников будет равна 1. Такая гистограмма позволяет сравнивать выборки равных объемов. Значение , где имеет наибольшее значение, т.е. эмпирическая вероятность которого максимальна, называется модой. Для интервального ряда мода находится внутри интервала, у которого максимально. Для ее вычисления пользуются формулой линейной интерполяции. Медиана – такая точка, что половина принимаемых значений лежит слева от нее, а половина справа (это середина распределения). Для дискретного вариационного ряда медиана равна , если – четно и , если – нечетно. Для интервального ряда медиана – это точка, в которой площадь гистограммы делится пополам.
|