Скачать 2.12 Mb.
|
^ распределения 2.1 Мода и медиана Оптимально сгруппированные и визуально представленные статистические данные, тем не менее, не позволяют увидеть и обосновать глубокие закономерности исследуемых явлений. Для проведения статистического анализа необходимы определенные числовые характеристики, которые наилучшим образом отражают полученные результаты экспериментов. Поэтому вычисление простых и понятных показателей, обобщающих наиболее существенные свойства статистических данных, является одним из основных методов математической статистики. Традиционно для обобщения большого количества экспериментальных данных используются определенные так называемые средние выборочные показатели. Рассмотрим наиболее известные типы средних. В любой совокупности выборочных данных естественно выделяется значение, которое появляется чаще других. ^ 1, x2, …, xn есть одно выборочное значение, имеющее наибольшую частоту, то оно называется модой данной выборки. Для обозначения моды используется символ Х ![]() Пример 2.1 Рассмотрим выборочные данные о размерах обуви двадцати женщин. Таблица 2.1 – Вариационный ряд данных размеров обуви
В данной выборке преобладает 37-й размер обуви, поэтому мода этой выборки равна 37, то есть Х ![]() ■ Выборка не имеет моды, когда в ней нет единственного элемента с наибольшей частотой. Если в выборке несколько значений повторяются больше других одинаково часто, то выборка называется мультимодальной (бимодальной, тримодальной и т. д.). Для определения моды надо знать частоту каждого выборочного значения. В случае, когда мы имеем только интервальный статистический ряд, то из всех интервалов можно выделить модальный интервал, который содержит самые повторяемые значения выборки. Если длина каждого интервала статистического ряда равна ![]() ^ Условие: длина каждого интервала статистического ряда одинакова.
Будем считать, что именно i-й интервал ![]() ![]() ![]() ![]() ![]() ^ ![]()
![]() Подчеркнем, что ![]() ![]() ![]() ![]() Пример 2.2 Найдем моду статистического ряда по данным примера 1.7 о возрасте пациентов клиники. Таблица 2.2 – Данные исследования возраста пациентов поликлиники
Очевидно, что наибольшую частоту имеет пятый интервал [50; 60), для которого ![]() ![]() ![]() ![]() ![]() Учитывая, что выборочные данные характеризуют возраст пациентов в годах, округляем найденное значение: ![]() Таким образом, чаще других обращаются в поликлинику пациенты в возрасте от 50 до 60 лет, причем в этой группе наиболее проблемный возраст составляет 53,75 года. ■ Мода – одна из немногих характеристик, которая используется при анализе не только количественных, но и качественных данных. Пример 2.3 Рассмотрим данные анкетирования 40 посетителей автосалона о предпочитаемом ими цвете автомобиля: Таблица 2.3 – Результаты анкетирования о любимом цвете автомобиля
В этой выборке модой является белый цвет, имеющий наиболь- шую частоту. ■ Понятие моды используется главным образом в прикладных исследованиях тогда, когда возникает необходимость выявления в выборке большого объема наиболее преобладающих вариант. Такие ситуации часто встречаются при изучении потребительского спроса, качественного состава продукции массового производства, результатов опроса населения и в других случаях. Но так как мода не всегда существует, то в аналитической статистике это понятие используется крайне редко. Результаты многочисленных исследований показывают, что значительная часть выборочных данных имеет тенденцию собираться вокруг некоторого центра. Это свойство обобщается введением следующего понятия медианы. ^ 1, x2, …, xn расположены в порядке возрастания с сохранением повторяющихся значений. Если n – нечетное число, то медианой этой выборки называется число X ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Х ![]() ![]() ![]() Другими словами, если объем выборки является нечетным числом, то медиана Х ![]() Пример 2.4 Ниже приводятся две выборки данных о количестве новых слов, выученных каждым из девяти учеников одной группы и каждым из десяти учеников другой группы в течение одного урока английского языка. I группа: 1, 3, 3, 4, 4, 5, 6, 7, 8. II группа: 1, 2, 2, 3, 3, 5, 5, 6, 6, 7. Обе выборки записаны в порядке возрастания их значений. Объем первой выборки n = 9 является нечетным числом, поэтому посередине находится одно пятое значение ![]() Xмед(I) = 4. Посередине второй выборки находятся два значения 3 и 5, поэтому Х ![]() Значит, эти выборки имеют равные медианы Xмед = 4. ■ Медиана делит выборку на две части, каждая из которых содержит одинаковое количество элементов. Первая часть состоит из выборочных значений, расположенных до медианы. Их величина не может быть больше величины медианы. Вторую часть составляют выборочные значения, расположенные после медианы. Их величина не может быть меньше величины медианы. Например, медиана Х ![]() Теперь рассмотрим способ нахождения медианы по сгруппированным данным. ^
Алгоритм вычисления медианы статистического ряда Условие: длина каждого интервала статистического ряда равна ![]() ^ Для этого вычисляется число ![]() ![]() ![]() ![]() ![]() но сумма частот нижних s – 1 интервалов меньше ![]() ![]() Тогда именно s-й интервал ![]() ^ Х ![]() Подчеркнем, что ![]() ![]() ![]() ![]() Пример 2.5 Найдем медиану статистического ряда по данным о возрасте пациентов поликлиники. Таблица 2.5 – Данные исследования о возрасте пациентов поликлиники
Объем всей выборки n = 250, поэтому ![]() 17 + 24 + 35 + 48 = 124, но 17 + 24 + 35 + 48 + 57 = 181. Сумма частот первых четырех интервалов меньше 125, а сумма частот пяти интервалов больше 125, поэтому именно пятый интервал [50; 60) является медианным. Вычислим медиану по данной формуле: Х ![]() или Х ![]() Это значение медианы показывает, что возраст половины пациентов в данной выборке не больше 50 лет и 2 месяцев. ■ Пример 2.6 Найдем медиану статистического ряда из примера 1.8, представляющего данные о высоте зданий. |
Учебно-методический комплекс по дисциплине «Теория вероятностей и... Рабочая программа дисциплины «Теория вероятностей и математическая статистика» для студентов | Факультет математический (название факультета) Кафедра экономической... Учебная программа составлена на основе типовой программы «Теория вероятностей и математическая статистика» утвержденной Министерством... |
Текст лекций по курсу «Теория вероятностей и математическая статистика»... Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку... | Литература Боровков А. А. Теория вероятностей. М.: Наука, 1986 Ознакомление студентов с основными принципами теории вероятностей и примерами их приложений, дальнейшее формирование у студентов... |
Текст лекций по курсу «Теория вероятностей и математическая статистика»... Именно азартные игры дали стимул для построения математических моделей игровых ситуаций. Эти модели представляли возможность игроку... | Сложение и умножение вероятностей Занятие № «Основные аксиомы теории вероятностей. Вычисление вероятностей события» |
Теория вероятностей и математическая статистика Цель дисциплины Цель дисциплины изучение основ теории вероятностей, формирование у студентов знаний, умений и навыков построения и анализа математических... | Методические указания для подготовки к входному компьютерному тестированию... Данные методические указания содержат тематический план курса «Математика» по разделу теория вероятностей и математическая статистика,... |
Пособие №3 Теория вероятностей Основным понятием теории вероятностей... Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых... | Пособие №3 Теория вероятностей Основным понятием теории вероятностей... Относительной частотой появления события называется отношение числа появления данного события к общему числу проведённых одинаковых... |