В. И. Харламова теория вероятностей и


НазваниеВ. И. Харламова теория вероятностей и
страница7/15
Дата публикации18.07.2013
Размер2.12 Mb.
ТипДокументы
referatdb.ru > Математика > Документы
1   2   3   4   5   6   7   8   9   10   ...   15

^ 2 Числовые характеристики выборочного

распределения

2.1 Мода и медиана
Оптимально сгруппированные и визуально представленные статистические данные, тем не менее, не позволяют увидеть и обосновать глубокие закономерности исследуемых явлений. Для проведения статистического анализа необходимы определенные числовые характеристики, которые наилучшим образом отражают полученные результаты экспериментов. Поэтому вычисление простых и понятных показателей, обобщающих наиболее существенные свойства статистических данных, является одним из основных методов математической статистики. Традиционно для обобщения большого количества экспериментальных данных используются определенные так называемые средние выборочные показатели. Рассмотрим наиболее известные типы средних. В любой совокупности выборочных данных естественно выделяется значение, которое появляется чаще других.

^ Определение 2.1 Если в выборке x1, x2, …, xn есть одно выборочное значение, имеющее наибольшую частоту, то оно называется модой данной выборки.

Для обозначения моды используется символ Х.
Пример 2.1 Рассмотрим выборочные данные о размерах обуви двадцати женщин.

Таблица 2.1 – Вариационный ряд данных размеров обуви

Размер

35 36 37 38 39 40






1 3 7 5 3 1


В данной выборке преобладает 37-й размер обуви, поэтому мода этой выборки равна 37, то есть Х.


Выборка не имеет моды, когда в ней нет единственного элемента с наибольшей частотой. Если в выборке несколько значений повторяются больше других одинаково часто, то выборка называется мультимодальной (бимодальной, тримодальной и т. д.). Для определения моды надо знать частоту каждого выборочного значения. В случае, когда мы имеем только интервальный статистический ряд, то из всех интервалов можно выделить модальный интервал, который содержит самые повторяемые значения выборки. Если длина каждого интервала статистического ряда равна , то для вычисления моды выполняется следующая процедура.

^ Алгоритм вычисления моды статистического ряда

Условие: длина каждого интервала статистического ряда одинакова.

  1. Определяется модальный интервал статистического ряда.

Будем считать, что именно i-й интервал имеет наибольшую частоту, то есть является модальным. Вместе с ним также рассматриваются предыдущий ()-й интервал и последующий -й интервал .

^ 2. Для каждого из этих интервалов находятся соответствующие частоты:

.

  1. Значение моды вычисляется по формуле:

.

Подчеркнем, что – это нижняя граница модального интервала, – частота предшествующего ему интервала, – частота последующего интервала, – длина каждого интервала.
Пример 2.2 Найдем моду статистического ряда по данным примера 1.7 о возрасте пациентов клиники.

Таблица 2.2 – Данные исследования возраста пациентов поликлиники

Возраст

10–20

20–30

30–40

40–50

50–60

60–70

70–80

80–90






17

24

35

48

57

42

21

6

Очевидно, что наибольшую частоту имеет пятый интервал [50; 60), для которого . Частота предыдущего интервала , частота последующего интервала , длина каждого интервала = 10. Тогда мода вычисляется по формуле:



Учитывая, что выборочные данные характеризуют возраст пациентов в годах, округляем найденное значение:

.

Таким образом, чаще других обращаются в поликлинику пациенты в возрасте от 50 до 60 лет, причем в этой группе наиболее проблемный возраст составляет 53,75 года.



Мода – одна из немногих характеристик, которая используется при анализе не только количественных, но и качественных данных.
Пример 2.3 Рассмотрим данные анкетирования 40 посетителей автосалона о предпочитаемом ими цвете автомобиля:

Таблица 2.3 – Результаты анкетирования о любимом цвете автомобиля

Цвет

белый черный красный синий зеленый серый другие






10 8 6 4 3 5 4


В этой выборке модой является белый цвет, имеющий наиболь- шую частоту.



Понятие моды используется главным образом в прикладных исследованиях тогда, когда возникает необходимость выявления в выборке большого объема наиболее преобладающих вариант. Такие ситуации часто встречаются при изучении потребительского спроса, качественного состава продукции массового производства, результатов опроса населения и в других случаях. Но так как мода не всегда существует, то в аналитической статистике это понятие используется крайне редко.

Результаты многочисленных исследований показывают, что значительная часть выборочных данных имеет тенденцию собираться вокруг некоторого центра. Это свойство обобщается введением следующего понятия медианы.

^ Определение 2.2 Пусть все выборочные данные x1, x2, …, xn расположены в порядке возрастания с сохранением повторяющихся значений. Если n – нечетное число, то медианой этой выборки называется число X, равное выборочному значению , стоящему на -м месте. Если n – четное число, то медиана Х равна полусумме выборочных значении и , стоящих соответственно на -м и -м местах:

Х при нечётном n; X = при чётном n.

Другими словами, если объем выборки является нечетным числом, то медиана Х равна единственному выборочному значению, расположенному в самой середине упорядоченной выборки. Если же объем выборки является четным числом, то посередине выборки находятся два соседних значения. В этом случае медиана равна сумме этих значений, деленной на 2.
Пример 2.4 Ниже приводятся две выборки данных о количестве новых слов, выученных каждым из девяти учеников одной группы и каждым из десяти учеников другой группы в течение одного урока английского языка.

I группа: 1, 3, 3, 4, 4, 5, 6, 7, 8.

II группа: 1, 2, 2, 3, 3, 5, 5, 6, 6, 7.

Обе выборки записаны в порядке возрастания их значений. Объем первой выборки n = 9 является нечетным числом, поэтому посередине находится одно пятое значение , которое и является медианой этой выборки:

Xмед(I) = 4.

Посередине второй выборки находятся два значения 3 и 5, поэтому

Х.

Значит, эти выборки имеют равные медианы Xмед = 4.



Медиана делит выборку на две части, каждая из которых содержит одинаковое количество элементов. Первая часть состоит из выборочных значений, расположенных до медианы. Их величина не может быть больше величины медианы. Вторую часть составляют выборочные значения, расположенные после медианы. Их величина не может быть меньше величины медианы. Например, медиана Х из предыдущего примера показывает, что половина учеников каждой группы за урок выучила не более 4-х новых английских слов, а вторая половина запомнила не менее 4-х слов. Таким образом, медиана является определенным граничным значением исследуемой случайной величины, показывающим, что в половине всех испытаний получаются выборочные значения, не превосходящие медиану, а в половине испытаний получаются значения, практически превосходящие медиану по величине. Фактически медиана выборки характеризует структуру и конфигурацию составляющих элементов исследуемой совокупности.

Теперь рассмотрим способ нахождения медианы по сгруппированным данным.

^ Таблица 2.4 – Произвольный статистический ряд

Интервалы значений X








































Алгоритм вычисления медианы статистического ряда
Условие: длина каждого интервала статистического ряда равна .

^ 1. Прежде всего, определяется так называемый медианный интервал. Для этого вычисляется число , равное половине всего количества выборочных значений. Затем последовательно складываются частоты первого, второго и так далее интервалов до тех пор, пока не получится сумма, которая либо равна , либо чуть больше . Интервал, соответствующий последней прибавленной частоте, и будет являться медианным. Допустим, что сумма частот первых s интервалов не меньше числа , то есть

,

но сумма частот нижних s – 1 интервалов меньше , то есть

.

Тогда именно s-й интервал является медианным.

^ 2. Далее медиана статистического ряда вычисляется по формуле:

Х.

Подчеркнем, что – это нижняя граница медианного интервала, n – объем всей выборки, – сумма частот всех интервалов, расположенных ниже медианного, – частота медианного интервала, – длина каждого интервала.
Пример 2.5 Найдем медиану статистического ряда по данным о возрасте пациентов поликлиники.

Таблица 2.5 – Данные исследования о возрасте пациентов поликлиники

Возраст

10–20

20–30

30–40

40–50

50–60

60–70

70–80

80–90






17

24

35

48

57

42

21

6

Объем всей выборки n = 250, поэтому = 125. Последовательно складываем частоты пока не получим сумму, равную или большую 125:

17 + 24 + 35 + 48 = 124, но

17 + 24 + 35 + 48 + 57 = 181.

Сумма частот первых четырех интервалов меньше 125, а сумма частот пяти интервалов больше 125, поэтому именно пятый интервал [50; 60) является медианным. Вычислим медиану по данной формуле:

Х

или

Х.

Это значение медианы показывает, что возраст половины пациентов в данной выборке не больше 50 лет и 2 месяцев.



Пример 2.6 Найдем медиану статистического ряда из примера 1.8, представляющего данные о высоте зданий.
1   2   3   4   5   6   7   8   9   10   ...   15

Похожие рефераты:

Учебно-методический комплекс по дисциплине «Теория вероятностей и...
Рабочая программа дисциплины «Теория вероятностей и математическая статистика» для студентов
Факультет математический (название факультета) Кафедра экономической...
Учебная программа составлена на основе типовой программы «Теория вероятностей и математическая статистика» утвержденной Министерством...
Текст лекций по курсу «Теория вероятностей и математическая статистика»...
Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку...
Литература Боровков А. А. Теория вероятностей. М.: Наука, 1986
Ознакомление студентов с основными принципами теории вероятностей и примерами их приложений, дальнейшее формирование у студентов...
Текст лекций по курсу «Теория вероятностей и математическая статистика»...
Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку...
Сложение и умножение вероятностей
Занятие № «Основные аксиомы теории вероятностей. Вычисление вероятностей события»
Теория вероятностей и математическая статистика Цель дисциплины
Цель дисциплины изучение основ теории вероятностей, формирование у студентов знаний, умений и навыков построения и анализа математических...
Методические указания для подготовки к входному компьютерному тестированию...
Данные методические указания содержат тематический план курса «Математика» по разделу теория вероятностей и математическая статистика,...
Пособие №3 Теория вероятностей Основным понятием теории вероятностей...
Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых...
Пособие №3 Теория вероятностей Основным понятием теории вероятностей...
Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых...

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
referatdb.ru
referatdb.ru
Рефераты ДатаБаза