0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Интервальный вариационный ряд и его характеристики

Интервальный вариационный ряд и его характеристики

п.1. Построение интервального вариационного ряда по данным эксперимента

Интервалы, (left.left[a_,a_iright.right))(left.left[a_<0>,a_1right.right))(left.left[a_<1>,a_2right.right)).(left.left[a_,a_kright.right))
Частоты, (f_i)(f_1)(f_2).(f_k)

Здесь k — число интервалов, на которые разбивается ряд.

Скобка (lfloor rfloor) означает целую часть (округление вниз до целого числа).

Скобка (lceil rceil) означает округление вверх, в данном случае не обязательно до целого числа.

Алгоритм построения интервального ряда
На входе: все значения признака (left, j=overline<1,N>)
Шаг 1. Найти размах вариации (R=x_-x_)
Шаг 2. Найти оптимальное количество интервалов (k=1+lfloorlog_2 Nrfloor)
Шаг 3. Найти шаг интервального ряда (h=leftlceilfracrightrceil)
Шаг 4. Найти узлы ряда: $ a_0=x_, a_i=1_0+ih, i=overline <1,k>$ Шаг 5. Найти частоты (f_i) – число попаданий значений признака в каждый из интервалов (left.left[a_,a_iright.right)).
На выходе: интервальный ряд с интервалами (left.left[a_,a_iright.right)) и частотами (f_i, i=overline<1,k>)

Заметим, что поскольку шаг h находится с округлением вверх, последний узел (a_kgeq x_).

Например:
Проведено 100 измерений роста учеников старших классов.
Минимальный рост составляет 142 см, максимальный – 197 см.
Найдем узлы для построения соответствующего интервального ряда.
По условию: (N=100, x_=142 см, x_=197 см).
Размах вариации: (R=197-142=55) (см)
Оптимальное число интервалов: (k=1+lfloor 3,322cdotlg ⁡100rfloor=1+lfloor 6,644rfloor=1+6=7)
Шаг интервального ряда: (h=lceilfrac<55><5>rceil=lceil 7,85rceil=8) (см)
Получаем узлы ряда: $ a_0=x_=142, a_i=142+icdot 8, i=overline <1,7>$

(left.left[a_,a_iright.right)) cм(left.left[142;150right.right))(left.left[150;158right.right))(left.left[158;166right.right))(left.left[166;174right.right))(left.left[174;182right.right))(left.left[182;190right.right))(left[190;198right])

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i1234567
(left.left[a_,a_iright.right)) cм(left.left[142;150right.right))(left.left[150;158right.right))(left.left[158;166right.right))(left.left[166;174right.right))(left.left[174;182right.right))(left.left[182;190right.right))(left[190;198right])
(f_i)4711343383

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

(x_i)146154162170178186194
(w_i)0,040,070,110,340,330,080,03
(S_i)0,040,110,220,560,890,971

Построим гистограмму и полигон:


Построим кумуляту и эмпирическую функцию распределения:


Эмпирическая функция распределения (относительно середин интервалов): $ F(x)= begin 0, xleq 146\ 0,04, 146lt xleq 154\ 0,11, 154lt xleq 162\ 0,22, 162lt xleq 170\ 0,56, 170lt xleq 178\ 0,89, 178lt xleq 186\ 0,97, 186lt xleq 194\ 1, xgt 194 end $

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

(x_i)146154162170178186194
(w_i)0,040,070,110,340,330,080,031
(x_iw_i)5,8410,7817,8257,8058,7414,885,82171,68

$ X_=sum_^k x_iw_i=171,68approx 171,7 text <(см)>$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: begin x_o=166, f_m=34, f_=11, f_=33, h=8\ M_o=x_o+frac><(f_m-f_)+(f_m+f_)>h=\ =166+frac<34-11><(34-11)+(34-33)>cdot 8approx 173,7 text <(см)>end На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: begin x_o=166, w_m=0,34, S_=0,22, h=8\ \ M_e=x_o+frac<0,5-S_>h=166+frac<0,5-0,22><0,34>cdot 8approx 172,6 text <(см)>end begin \ X_=171,7; M_o=173,7; M_e=172,6\ X_lt M_elt M_o end Ряд асимметричный с левосторонней асимметрией.
При этом (frac<|M_o-X_|><|M_e-X_|>=frac<2,0><0,9>approx 2,2lt 3), т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Например:
Для распределения учеников по росту получаем:

$x_i$146154162170178186194
(w_i)0,040,070,110,340,330,080,031
(x_iw_i)5,8410,7817,8257,8058,7414,885,82171,68
(x_i^2w_i) — результат852,641660,122886,84982610455,722767,681129,0829578,08

$ D=sum_^k x_i^2 w_i-X_^2=29578,08-171,7^2approx 104,1 $ $ sigma=sqrtapprox 10,2 $

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

Например:
Для распределения учеников по росту получаем: begin S^2=frac<100><99>cdot 104,1approx 105,1\ sapprox 10,3 end Коэффициент вариации: $ V=frac<10,3><171,7>cdot 100text<%>approx 6,0text<%>lt 33text <%>$ Выборка однородна. Найденное значение среднего роста (X_)=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака (left, j=overline<1,N>)
Шаг 1. Построить интервальный ряд с интервалами (left.right[a_, a_ileft.right)) и частотами (f_i, i=overline<1,k>) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти (x_i,w_i,S_i,x_iw_i,x_i^2w_i)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

1) Построим интервальный ряд. В наборе данных: $ x_=18, x_=38, N=30 $ Размах вариации: (R=38-18=20)
Оптимальное число интервалов: (k=1+lfloorlog_2⁡ 30rfloor=1+4=5)
Шаг интервального ряда: (h=lceilfrac<20><5>rceil=4)
Получаем узлы ряда: $ a_0=x_=18, a_i=18+icdot 4, i=overline <1,5>$

(left.left[a_,a_iright.right)) лет(left.left[18;22right.right))(left.left[22;26right.right))(left.left[26;30right.right))(left.left[30;34right.right))(left.left[34;38right.right))

Считаем частоты для каждого интервала. Получаем интервальный ряд:

(left.left[a_,a_iright.right)) лет(left.left[18;22right.right))(left.left[22;26right.right))(left.left[26;30right.right))(left.left[30;34right.right))(left.left[34;38right.right))
(f_i)171264

2) Составляем расчетную таблицу:

(x_i)2024283236
(f_i)17126430
(w_i)0,0330,2330,40,20,1331
(S_i)0,0330,2670,6670,8671
(x_iw_i)0,6675,611,26,44,828,67
(x_i^2w_i)13,333134,4313,6204,8172,8838,93

3) Строим полигон и кумуляту


Эмпирическая функция распределения: $ F(x)= begin 0, xleq 20\ 0,033, 20lt xleq 24\ 0,267, 24lt xleq 28\ 0,667, 28lt xleq 32\ 0,867, 32lt xleq 36\ 1, xgt 36 end $ 4) Находим выборочную среднюю, моду и медиану $ X_=sum_^k x_iw_iapprox 28,7 text <(лет)>$ На полигоне модальным является 3й интервал (самая высокая точка).
Данные для расчета моды: begin x_0=26, f_m=12, f_=7, f_=6, h=4\ M_o=x_o+frac><(f_m-f_)+(f_m+f_)>h=\ =26+frac<12-7><(12-7)+(12-6)>cdot 4approx 27,8 text <(лет)>end
На кумуляте медианным является 3й интервал (преодолевает уровень 0,5).
Данные для расчета медианы: begin x_0=26, w_m=0,4, S_=0,267, h=4\ M_e=x_o+frac<0,5-S_>>h=26+frac<0,5-0,4><0,267>cdot 4approx 28,3 text <(лет)>end Получаем: begin X_=28,7; M_o=27,8; M_e=28,6\ X_gt M_egt M_0 end Ряд асимметричный с правосторонней асимметрией.
При этом (frac<|M_o-X_|><|M_e-X_|> =frac<0,9><0,1>=9gt 3), т.е. распределение сильно асимметрично.

5) Находим выборочную дисперсию и СКО: begin D=sum_^k x_i^2w_i-X_^2=838,93-28,7^2approx 17,2\ sigma=sqrtapprox 4,1 end
6) Исправленная выборочная дисперсия: $ S^2=fracD=frac<30><29>cdot 17,2approx 17,7 $ Стандартное отклонение (s=sqrtapprox 4,2)
Коэффициент вариации: (V=frac<4,2><28,7>cdot 100text<%>approx 14,7text<%>lt 33text<%>)
Выборка однородна. Найденное значение среднего возраста (X_=28,7) лет можно распространить на всю генеральную совокупность (пользователей коворкинга).

Статья в тему:  Анализ речи кинга у меня есть мечта. Мартин Лютер Кинг: У меня есть мечта
Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector