Скачать 2.12 Mb.
|
^ Существуют разные графические способы представления статистических распределений выборок или статистических рядов. Любое наглядное изображение статистических данных способствует лучшему пониманию их общих закономерностей. Вначале рассмотрим традиционный способ графического изображения вариационного ряда. Для этого возьмем прямоугольную систему координат. По определению вариационный ряд состоит из пар чисел вида: ![]() ![]() ![]() где значения xi являются вариантами выборки, а ![]() ![]() ![]() ![]() и соединяем их последовательно отрезками прямых. Определение 1.17 Полигоном частот вариационного ряда называется ломаная линия, состоящая из отрезков прямых, последовательно соединяющих точки с координатами (xi; mi) , где xi пробегает все варианты выборки, а mi – их соответствующие частоты, i = 1,2, …,k . ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Рисунок 1.7 – Полигон частот вариационного ряда Пример 1.9 Построим полигон частот для вариационного ряда из примера 1.6, представляющего результаты исследования посещаемости библиотеки студентами. Для этого мы отмечаем точки (0;5), (1;6), (2;7), (3;2), (4;3), (5;2) и последовательно соединяем их. ![]() Рисунок 1.8 – Полигон частот данных посещаемости библиотеки студентами ■ Если частоты вариант заменить соответствующими относительными частотами, то получится полигон относительных частот. Определение 1.18 Полигоном относительных частот вариационного ряда называется ломаная линия, состоящая из отрезков прямых, последовательно соединяющих точки с координатами ![]() ![]() ![]() Пример 1.10 Построим полигон относительных частот для вариационного ряда примера 1.6. Для этого в системе координат отмечаем точки (0; 0,20), (1; 0,24), (2; 0,28), (3; 0,08), (4; 0,12), (5; 0,08) и соединяем их последовательно. y ![]() Рисунок 1.9 – Полигон относительных частот данных посещаемости библиотеки студентами ■ Интервальный статистический ряд удобно представлять графически в виде плоской ступенчатой диаграммы, которая называется гистограммой. ^ статистического ряда строится следующим образом. В прямоугольной системе координат на оси абсцисс отмечаются интервалы данного статистического ряда. Затем на каждом интервале, как на основании, рисуется прямоугольник, высота которого равна частоте этого интервала. Пример 1.11 Построим гистограмму частот статистического ряда из примера 1.7 о возрасте пациентов поликлиники. y ![]() Рисунок 1.10 – Гистограмма частот данных о возрасте пациентов поликлиники ■ Иногда более полезным может оказаться другой вид гистограммы, которая называется гистограммой относительных частот статистического ряда. Чтобы её получить, на каждом интервале статистического ряда строится прямоугольник, площадь которого равна относительной частоте этого интервала. Из формулы площади прямоугольника легко получается выражение для его высоты: ![]() где ![]() ![]() При изображении гистограммы удобно выбирать такой масштаб, в котором длина интервалов ![]() ![]() Пример 1.12 Построим гистограмму относительных частот статистического ряда из примера 1.7. y ![]() Рисунок 1.11 – Гистограмма относительных частот данных о возрасте пациентов поликлиники ■ Подчеркнем, что форма гистограммы существенно определяется статистическим рядом. Но любой статистический ряд является обобщением определенной выборки значений некоторой случайной величины. Следовательно, форма гистограммы определенным образом характеризует не только статистическое распределение выборки, но и распределение исследуемой случайной величины. Напомним, что в теории вероятностей закон распределения непрерывной случайной величины X определяется формулой плотности распределения вероятностей, обозначаемой через ![]() Отметим важное свойство гистограммы. Высота прямоугольника каждого интервала гистограммы относительных частот является приближенным значением плотности распределения вероятностей исследуемой случайной величины на этом интервале: ![]() Таким образом, верхнюю ступенчатую границу гистограммы можно считать статистическим аналогом кривой плотности распределения непрерывной случайной величины. Гистограмма на каждом интервале показывает средние плотности распределения вероятностей. Если середины верхних оснований прямоугольников гистограммы соединить прямолинейными отрезками, то получится полигон распределения частот. Очевидно, что при увеличении числа испытаний и при уменьшении длины интервалов ступенчатая ломаная, ограничивающая гистограмму сверху, будет более соответствовать кривой плотности распределения. Итак, если мы сгладим верхнюю ступенчатую ломаную гистограммы плавной кривой, то получим наглядное представление о кривой плотности распределения вероятностей исследуемой случайной величины. Таким образом гистограмма является удобным способом представления сгруппированных данных. Пример 1.13 Построим гистограмму относительных частот статистического ряда по данным примера 1.8 о высотах городских зданий и покажем приближенный график плотности распределения вероятностей. y x ![]() Рисунок 1.12 – Гистограмма относительных частот данных высот зданий города ■ Сформулируем ещё одно свойство гистограммы, тесно связанное с предыдущим. ^ Итак, гистограмма и полигон частот дают возможность реально увидеть в общих чертах закономерности распределения исследуемой генеральной совокупности. Заметим, что полигон частот имеет большее преимущество при сравнении двух разных распределений. В любом случае на первоначальном этапе графические формы представления статистических данных являются важным рабочим методом статистики. ^ В теории вероятностей рассматриваются и изучаются вероятностные законы распределения случайных величин. Как правило, любое вероятностное распределение случайной величины задается в аналитическом виде каким-либо математическим выражением. В математической статистике рассматриваются статистические распределения. Ранее мы говорили о близости понятия статистического ряда с понятием статистического распределения выборки. На практике часто возникает задача нахождения аналитического выражения, которое, хотя бы приближенно, представляло бы неизвестную теоретическую функцию распределения исследуемой случайной величины. В математической статистике рассматривается аналог этой функции. ^ 1, x2, …xn – выборка значений случайной величины Х, то эмпирической функцией распределения называется функция действительного аргумента x ? (- ∞; ∞), обозначаемая через ![]() Таким образом, ![]() ![]() где n – это объем выборки значений случайной величины Х, а nx – это количество выборочных значений, удовлетворяющих неравенству Х < x, x ? (- ∞; ∞). Так как относительная частота значений случайной величины Х, удовлетворяющих неравенству Х < x, в выборке объема n стремится к вероятности выполнения этого неравенства, то при n → ∞ имеем, что ![]() ![]() Таким образом эмпирическая функция распределения стремится к теоретической функции распределения. Чем больше объём выборки, тем точнее оценивается теоретическое распределение выборочными данными. Данный вывод обосновывается следующей теоремой В. И. Гливенко, которая считается фундаментальной теоремой математической статистики. ^ ![]() ![]() ![]() ![]() Аналитическое выражение эмпирической функции распределения хорошо находится по данным вариационного ряда. Для этого определяются значения функции для всех вариант выборки. Пример 1.14 Найдем эмпирическую функцию распределения по данным вариационного ряда из примера 1.6 о посещаемости университетской библиотеки. Таблица 1.8 – Вариационный ряд данных посещаемости библиотеки
Объём данной выборки n = 25. По определению 1.19 находим значения эмпирической функции распределения для всех вариант ![]() ![]() ![]() ![]() ![]() ![]() для x > 5 ![]() Объединим полученные результаты и найдем выражение для ![]() ![]() y Построим графическое изображение данной функции. ![]() Рисунок 1.13 – График эмпирической функции распределения посещаемости библиотеки студентами ■ Интервальный статистический ряд скрывает конкретные выборочные значения случайной величины. Поэтому точные значения эмпирической функции распределения можно определить только на границах интервалов, внутри интервалов при отсутствии полной информации о выборочных данных значения эмпирической функции распределения можно определить только приближенно. В том случае, когда исследуется непрерывная случайная величина, то в системе координат отмечаются найденные значения эмпирической функции распределения на границах интервалов и полученные точки последовательно соединяются плавной линией. В результате получается приближенный график эмпирической функции распределения. Пример 1.15 Построим эмпирическую функцию распределения по данным статистического ряда из примера 1.8 обследования высот городских зданий. Ранее мы получили следующий статистический ряд:
Объём исследуемой выборки n = 40. Вычислим значения эмпирической функции распределения на границах интервалов. ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() y По соответствующим точкам (5;0), (10; 0,050), (15; 0,125), (20; 0,250), (25, 0,400), (30; 0,600), (35; 0,775), (40; 0,920), (45; 0,975), (50;1) построим приближенный график эмпирической функции распределения. x ![]() Рисунок 1.14 – График эмпирической функции распределения высот зданий города ■ Эмпирическая функция распределения обладает всеми свойствами теоретической функции распределения. |
Учебно-методический комплекс по дисциплине «Теория вероятностей и... Рабочая программа дисциплины «Теория вероятностей и математическая статистика» для студентов | Факультет математический (название факультета) Кафедра экономической... Учебная программа составлена на основе типовой программы «Теория вероятностей и математическая статистика» утвержденной Министерством... |
Текст лекций по курсу «Теория вероятностей и математическая статистика»... Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку... | Литература Боровков А. А. Теория вероятностей. М.: Наука, 1986 Ознакомление студентов с основными принципами теории вероятностей и примерами их приложений, дальнейшее формирование у студентов... |
Текст лекций по курсу «Теория вероятностей и математическая статистика»... Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку... | Сложение и умножение вероятностей Занятие № «Основные аксиомы теории вероятностей. Вычисление вероятностей события» |
Теория вероятностей и математическая статистика Цель дисциплины Цель дисциплины изучение основ теории вероятностей, формирование у студентов знаний, умений и навыков построения и анализа математических... | Методические указания для подготовки к входному компьютерному тестированию... Данные методические указания содержат тематический план курса «Математика» по разделу теория вероятностей и математическая статистика,... |
Пособие №3 Теория вероятностей Основным понятием теории вероятностей... Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых... | Пособие №3 Теория вероятностей Основным понятием теории вероятностей... Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых... |