Слаботочка Книги

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 [60] 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83

Возможным вычислить распределение максимальных разностей F{D). Значение Z)=0 маловероятно, так как в этом случае Pi{Ay)=p2(Ay). Большие значения D также маловероятны, так как предполагается, что обе выборки извлекаются из одной и той же генеральной совокупности (отметим, что даже />тах=100% теоретически возможно при нулевой гипотезе), но где-то между крайними значениями расположены более вероятные значения D. Если вместо ввести z=g{Ay), которая монотонно возрастает с ростом Ау, то могут быть два случая.

1. При взаимно-однозначном преобразовании Ро{Ау) перейдет в распределение 0(2:), т. е.

оЯ {z) =Pq (Ay) dAf/fdz. (7.3)

Можно получить любое распределение oPiz), которое потребуется, если применить соответствующее преобразование z~g{Ay).

2. Распределения Pi{Ay) и Р2{Ау) взаимно-однозначно преобразуются к выборочным распределениям iP{z) и 2P{z), соответствующим генеральной совокупности с распределением oP{z). Так как z монотонно возрастает сростом Ау, устанавливаем, что,хотя Pi{Ay) и Pz{Ay), возможно, и отличаются от iPiz) и 2(2), обе пары выборочных распределений будут иметь одинаковые значения D! Другими словами, если найдено распределение F{D) для генеральной совок]>шности с распределением Ро{Ау), то распределение вероятностей для D остается справедливым и для любой другой генеральной совокупности, например для совокупности с распределением оР{). Критерий Колмогорова - Смирнова предполагает только, что значения переменной Ау можно упорядочивать. Иначе говоря, этот критерий не зависит от статистики для Ау. (Критерий Колмогорова - Смирнова является непараметрическим.)

7.4.2. Подобие пар гистограмм

Пусть объемы двух выборок обозначены через Si и 52; для данного случая 5i=S2=1000. Если и Si, и S2 превышают 40, как в данном случае, то критерий Колмогорова-Смирнова очень просто использовать. Вычисления значений функции F{D) приводят к соотношениям, ко-186



торые будут Здесь приведены (Смирнов, 1948) Пусть 90% означает некоторое значение D, которое превышает точно 90% всех значений D, т. е. (Dggo) = 90Vo-

Тогда

ооо. = Ь22/- (7.4)

Для 5, = 5,= 1000 /)go /=5,45Vo.

Когда наблюдаемое значение D меньше Dg., то это подтверждает гипотезу, что соответствующие выборки извлечены из одной и той же генеральной совокупности. Требование D<Dq , является наиболее строгим, обычно используемым в статистических исследованиях для принятия гипотезы Яр.

Пусть Z)g-c/--некоторое значение D, которое превышает точно 950/0 всех значений Р, т. е Р Тогда

C s%f=1.36/- (7.5)

Для s,=S2= 1000 Dg5 /c= 6,070/0. Таким же образом можно определить D, и Ь:

с.%=1>6з/-1±. (7.6)

о.../=1.95/. (7.7)

Для = 1000 /)ggy = 7,30Vo. £>99.9о/ == 8,7Р/о-

После этих предварительных шагов можно сделать вывод о том, насколько же на самом деле совпадают пары гистограмм, полученных разными методами.

Пары гистограмм, представленные на рис. 7.1-7.5, имеют такие значения показателя D: 4,9, 2,8, 3,0, 5,1 и 2,2%, причем все они меньше Dggo/ 5,45°/о, и это

является свидетельством того, что пулевая гипотеза Я* справедлива. Если подойти более формально, то следует сказать, что нулевая гипотеза Яо принимается при уровне значимости а=0,102). Значение D для гисто-

Эта статья опубликована то-пько на английском языке. {Прим. пер.).

Уровень значимости равен вероятности отклонения гипотезы Яо, если она верна. {Прим. пер.).



грамм на рис. 7.7 составляет 5,97о. При 950/ -6,07% для случая, представленного на рис. 7.7, нулевая гипотеза должна быть отвергнута при уровне значимости критерия а=0,10, но в то же время ее следует принять при уровне значимости а=0,05.

Для гистограмм на рис. 7.6 значение D оказывается большим: Z)=9,4%. Если учесть, что Dg = 8,71 /о. то

нулевая гипотеза в этом случае должна быть отвергнута даже при уровне значимости а=0,001.

В результате анализа каждой пары гистограмм на рис. 7.1-7.5 можно заключить, что они существенно совпадают друг с другом независимо от метода их построения. Гистограммы на рис. 7.6 оказываются совершенно различными; прпчииы такого различия пояснены в заключительной части § 7.3.

7.5. КРИТЕРИЙ КОЛМОГОРОВА-СМИРНОВА ДЛЯ ОДНОЙ ВЫБОРКИ

Критерий Колмогорова - Смирнова для одной выборки является критерием согласия, когда рассматривается вопрос о степени согласия определенного теоретического распределения вероятностей и распределения совокупности N выборочных значений Р{Х). Критерий Колмогорова - Смирнова в этом случае служит для выяснения того, принадлежат ли выборочные значения генеральной совокупности с заданным теоретическим распределением, причем он полностью аналогичен критерию Колмогорова - Смирнова для сравнения двух выборок, рассмотренному в § 7.4. Снова задают кумулятивное распределение S{X), которое должно быть справедливым для используемого теоретического распределения вероятностей, S{X) представляет долю наблюдений, для которых ожидаются результаты меньше чем X. Далее строят кумулятивное эмпирическое распределение для выборочных наблюдений; Р{Х), как и ранее, представляет отношение числа наблюдений К, по величине не превышающих X, к общему числу наблюдений N; P{X)=KIN. Для нулевой гипотезы Но, утверждающей, что выборка извлечена из генеральной совокупности с распределением S{X), можно считать, что для каждого значения X Р{Х) и S{X) будут достаточно близкими, а поэтому разности между S{X) и Р{Х) малы и находятся в пределах, обусловленных наличием случайных ошибок, 188




1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 [60] 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83
Яндекс.Метрика