В. И. Харламова теория вероятностей и


НазваниеВ. И. Харламова теория вероятностей и
страница5/15
Дата публикации18.07.2013
Размер2.12 Mb.
ТипДокументы
referatdb.ru > Математика > Документы
1   2   3   4   5   6   7   8   9   ...   15

^ 1.7 Графическое представление статистических данных
Существуют разные графические способы представления статистических распределений выборок или статистических рядов. Любое наглядное изображение статистических данных способствует лучшему пониманию их общих закономерностей.

Вначале рассмотрим традиционный способ графического изображения вариационного ряда. Для этого возьмем прямоугольную систему координат. По определению вариационный ряд состоит из пар чисел вида:

, , … , ,

где значения xi являются вариантами выборки, а являются соответствующими частотами, i = 1, 2, ... , k. В данной системе координат отмечаем k точек с соответствующими координатами:

, , … , ,

и соединяем их последовательно отрезками прямых.
Определение 1.17 Полигоном частот вариационного ряда называется ломаная линия, состоящая из отрезков прямых, последовательно соединяющих точки с координатами (xi; mi) , где xi пробегает все варианты выборки, а mi – их соответствующие частоты, i = 1,2, …,k .

















х

Рисунок 1.7 – Полигон частот вариационного ряда

Пример 1.9 Построим полигон частот для вариационного ряда из примера 1.6, представляющего результаты исследования посещаемости библиотеки студентами.

Для этого мы отмечаем точки (0;5), (1;6), (2;7), (3;2), (4;3), (5;2) и последовательно соединяем их.



Рисунок 1.8 – Полигон частот данных

посещаемости библиотеки студентами



Если частоты вариант заменить соответствующими относительными частотами, то получится полигон относительных частот.

Определение 1.18 Полигоном относительных частот вариационного ряда называется ломаная линия, состоящая из отрезков прямых, последовательно соединяющих точки с координатами где пробегает все варианты выборки, а – их соответствующие относительные частоты, i = 1, 2, … , k .
Пример 1.10 Построим полигон относительных частот для вариационного ряда примера 1.6.

Для этого в системе координат отмечаем точки (0; 0,20), (1; 0,24), (2; 0,28), (3; 0,08), (4; 0,12), (5; 0,08) и соединяем их последовательно.

y


Рисунок 1.9 – Полигон относительных частот данных

посещаемости библиотеки студентами


Интервальный статистический ряд удобно представлять графически в виде плоской ступенчатой диаграммы, которая называется гистограммой.

^ Гистограмма частот статистического ряда строится следующим образом. В прямоугольной системе координат на оси абсцисс отмечаются интервалы данного статистического ряда. Затем на каждом интервале, как на основании, рисуется прямоугольник, высота которого равна частоте этого интервала.
Пример 1.11 Построим гистограмму частот статистического ряда из примера 1.7 о возрасте пациентов поликлиники.


y


Рисунок 1.10 – Гистограмма частот данных

о возрасте пациентов поликлиники



Иногда более полезным может оказаться другой вид гистограммы, которая называется гистограммой относительных частот статистического ряда. Чтобы её получить, на каждом интервале статистического ряда строится прямоугольник, площадь которого равна относительной частоте этого интервала. Из формулы площади прямоугольника легко получается выражение для его высоты:

, i = 1, 2, …, k ,

где – относительная частота i-го интервала, а – это длина i-го интервала.

При изображении гистограммы удобно выбирать такой масштаб, в котором длина интервалов равна 1. Тогда высоты прямоугольников равны соответствующим относительным частотам: hi = , i = 1,2, …, k. Это упрощает построение гистограммы. В дальнейшем будем считать, что длина каждого интервала равна 1.
Пример 1.12 Построим гистограмму относительных частот статистического ряда из примера 1.7.


y

x
Рисунок 1.11 – Гистограмма относительных частот данных

о возрасте пациентов поликлиники


Подчеркнем, что форма гистограммы существенно определяется статистическим рядом. Но любой статистический ряд является обобщением определенной выборки значений некоторой случайной величины. Следовательно, форма гистограммы определенным образом характеризует не только статистическое распределение выборки, но и распределение исследуемой случайной величины. Напомним, что в теории вероятностей закон распределения непрерывной случайной величины X определяется формулой плотности распределения вероятностей, обозначаемой через .

Отметим важное свойство гистограммы.
Высота прямоугольника каждого интервала гистограммы относительных частот является приближенным значением плотности распределения вероятностей исследуемой случайной величины на этом интервале:

.

Таким образом, верхнюю ступенчатую границу гистограммы можно считать статистическим аналогом кривой плотности распределения непрерывной случайной величины. Гистограмма на каждом интервале показывает средние плотности распределения вероятностей. Если середины верхних оснований прямоугольников гистограммы соединить прямолинейными отрезками, то получится полигон распределения частот. Очевидно, что при увеличении числа испытаний и при уменьшении длины интервалов ступенчатая ломаная, ограничивающая гистограмму сверху, будет более соответствовать кривой плотности распределения. Итак, если мы сгладим верхнюю ступенчатую ломаную гистограммы плавной кривой, то получим наглядное представление о кривой плотности распределения вероятностей исследуемой случайной величины. Таким образом гистограмма является удобным способом представления сгруппированных данных.
Пример 1.13 Построим гистограмму относительных частот статистического ряда по данным примера 1.8 о высотах городских зданий и покажем приближенный график плотности распределения вероятностей.


y

x


Рисунок 1.12 – Гистограмма относительных частот данных

высот зданий города


Сформулируем ещё одно свойство гистограммы, тесно связанное с предыдущим.
^ Площадь гистограммы относительных частот, построенной на интервалах единичной длины, равна 1.
Итак, гистограмма и полигон частот дают возможность реально увидеть в общих чертах закономерности распределения исследуемой генеральной совокупности. Заметим, что полигон частот имеет большее преимущество при сравнении двух разных распределений. В любом случае на первоначальном этапе графические формы представления статистических данных являются важным рабочим методом статистики.

^ 1.8 Эмпирическая функция распределения
В теории вероятностей рассматриваются и изучаются вероятностные законы распределения случайных величин. Как правило, любое вероятностное распределение случайной величины задается в аналитическом виде каким-либо математическим выражением. В математической статистике рассматриваются статистические распределения. Ранее мы говорили о близости понятия статистического ряда с понятием статистического распределения выборки. На практике часто возникает задача нахождения аналитического выражения, которое, хотя бы приближенно, представляло бы неизвестную теоретическую функцию распределения исследуемой случайной величины. В математической статистике рассматривается аналог этой функции.

^ Определение 1.19 Если x1, x2, …xn – выборка значений случайной величины Х, то эмпирической функцией распределения называется функция действительного аргумента x ? (- ∞; ∞), обозначаемая через , равная относительной частоте выборочных значений, меньших числа x .

Таким образом,

= ,

где n – это объем выборки значений случайной величины Х, а nx – это количество выборочных значений, удовлетворяющих неравенству Х < x, x ? (- ∞; ∞).

Так как относительная частота значений случайной величины Х, удовлетворяющих неравенству Х < x, в выборке объема n стремится к вероятности выполнения этого неравенства, то при n → ∞ имеем, что

= → P(X < x) = Fх(x).

Таким образом эмпирическая функция распределения стремится к теоретической функции распределения. Чем больше объём выборки, тем точнее оценивается теоретическое распределение выборочными данными. Данный вывод обосновывается следующей теоремой В. И. Гливенко, которая считается фундаментальной теоремой математической статистики.

^ Теорема 1.1 Если и теоретическая и эмпирическая функции распределения для выборки объема n, то для любого ε > 0

P( | Fх(x) – | < ε) = 1.

Аналитическое выражение эмпирической функции распределения хорошо находится по данным вариационного ряда. Для этого определяются значения функции для всех вариант выборки.
Пример 1.14 Найдем эмпирическую функцию распределения по данным вариационного ряда из примера 1.6 о посещаемости университетской библиотеки.

Таблица 1.8 – Вариационный ряд данных посещаемости

библиотеки

Число посещений

0 1 2 3 4 5






5 6 7 2 3 2



0,20 0,24 0,28 0,08 0,12 0,08


Объём данной выборки n = 25. По определению 1.19 находим значения эмпирической функции распределения для всех вариант

;

;

;

;

;

;

для x > 5 .

Объединим полученные результаты и найдем выражение для .




y
Построим графическое изображение данной функции.



Рисунок 1.13 – График эмпирической функции распределения

посещаемости библиотеки студентами


Интервальный статистический ряд скрывает конкретные выборочные значения случайной величины. Поэтому точные значения эмпирической функции распределения можно определить только на границах интервалов, внутри интервалов при отсутствии полной информации о выборочных данных значения эмпирической функции распределения можно определить только приближенно. В том случае, когда исследуется непрерывная случайная величина, то в системе координат отмечаются найденные значения эмпирической функции распределения на границах интервалов и полученные точки последовательно соединяются плавной линией. В результате получается приближенный график эмпирической функции распределения.
Пример 1.15 Построим эмпирическую функцию распределения по данным статистического ряда из примера 1.8 обследования высот городских зданий.

Ранее мы получили следующий статистический ряд:

Высота зданий

5–10

10–15

15–20

20–25

25–30

30–35

35–40

40–45

45–50






2

3

5

6

8

7

5

3

1



0,050

0,075

0,125

0,150

0,200

0,175

0,125

0,075

0,025


Объём исследуемой выборки n = 40. Вычислим значения эмпирической функции распределения на границах интервалов.

; ; ;

; ;

; ; ;

; .


y
По соответствующим точкам (5;0), (10; 0,050), (15; 0,125), (20; 0,250), (25, 0,400), (30; 0,600), (35; 0,775), (40; 0,920), (45; 0,975), (50;1) построим приближенный график эмпирической функции распределения.

x



Рисунок 1.14 – График эмпирической функции распределения

высот зданий города



Эмпирическая функция распределения обладает всеми свойствами теоретической функции распределения.
1   2   3   4   5   6   7   8   9   ...   15

Похожие рефераты:

Учебно-методический комплекс по дисциплине «Теория вероятностей и...
Рабочая программа дисциплины «Теория вероятностей и математическая статистика» для студентов
Факультет математический (название факультета) Кафедра экономической...
Учебная программа составлена на основе типовой программы «Теория вероятностей и математическая статистика» утвержденной Министерством...
Текст лекций по курсу «Теория вероятностей и математическая статистика»...
Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку...
Литература Боровков А. А. Теория вероятностей. М.: Наука, 1986
Ознакомление студентов с основными принципами теории вероятностей и примерами их приложений, дальнейшее формирование у студентов...
Текст лекций по курсу «Теория вероятностей и математическая статистика»...
Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку...
Сложение и умножение вероятностей
Занятие № «Основные аксиомы теории вероятностей. Вычисление вероятностей события»
Теория вероятностей и математическая статистика Цель дисциплины
Цель дисциплины изучение основ теории вероятностей, формирование у студентов знаний, умений и навыков построения и анализа математических...
Методические указания для подготовки к входному компьютерному тестированию...
Данные методические указания содержат тематический план курса «Математика» по разделу теория вероятностей и математическая статистика,...
Пособие №3 Теория вероятностей Основным понятием теории вероятностей...
Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых...
Пособие №3 Теория вероятностей Основным понятием теории вероятностей...
Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых...

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
referatdb.ru
referatdb.ru
Рефераты ДатаБаза