При проверке нулевой гипотезы возможны следующие ошибки ошибка

 План:

1.      Статистические гипотезы. Основные понятия.

2.      Гипотезы о законе распределения.

3.      Гипотезы о числовом значении генерального
среднего и дисперсии.

1.     
Статистические гипотезы. Основные понятия.

Статистическая гипотеза  это утверждение о виде неизвестного
распределения или параметрах известного распределения. Статистические гипотезы
проверяются по результатам выборки статистическими методами в ходе эксперимента
(эмпирическим путем) с помощью статистических критериев.

В тех случаях, когда
известен закон, но неизвестны значения его параметров (дисперсия или
математическое ожидание) в конкретной ситуации, статистическую гипотезу
называют параметрической.

Например, предположение
об ожидаемом среднем доходе по акциям или разбросе дохода являются
параметрическими гипотезами.

Когда закон
распределения генеральной совокупности не известен, но есть основания
предположить, каков его конкретный вид, выдвигаемые гипотезы о виде его
распределения называются непараметрическими.

Например, можно
выдвинуть гипотезу, что число дневных продаж в магазине или доход населения
подчинены нормальному закону распределения.

По содержанию статистические гипотезы можно классифицировать:

1.                     
Гипотезы о типе вероятностного закона
распределения случайной величины, характеризующего явление или процесс.

2.                     
Гипотезы об однородности двух или более
обрабатываемых выборок. Изучаемое свойство исследуется  с помощью двух или более генеральных
совокупностей. Гипотеза в этом случае может заключаться в следующем: исследуемые
выборочные характеристики различаются между собой статистически значимо или
нет.

3.                     
Гипотезы о свойствах числовых значений
параметров исследуемой генеральной совокупности. Больше ли значения параметров
некоторого заданного номинала или меньше и т.д.

4.                     
Гипотезы о вероятностной зависимости двух
или более признаков, характеризующих различные свойства рассматриваемого
явления или процесса. При этом определяется характер этой зависимости.

Гипотезы бывают простые (содержащие одно предположение) и сложные (содержащие несколько предположений).

Выдвинутую гипотезу называют основной или нулевой и обозначают H0
. Противоречащую ей гипотезу называют альтернативной или конкурирующей и обозначают
H1.

Под статистическим
критерием
понимают однозначно определенное правило, устанавливающее
условие, при котором проверяемая гипотеза отвергается либо не отвергается.

Пример:

Увеличение числа заболевших некоторым
заболеванием дает возможность выдвинуть гипотезу о наличии эпидемии. Для сравнения
доли заболевших в обычных и экстремальных условиях используются статистические
данные, на основании которых делается вывод о том, является ли данное массовое
заболевание эпидемией. Предполагается, что существует некоторый критерий-
уровень доли заболевших, критический для этого заболевания, который
устанавливается по ранее имевшимся случаям.

Различают три вида критериев:

1.                     
Параметрические критерии
критерии значимости, которые служат для проверки гипотез о параметрах
распределения генеральной совокупности при известном виде распределения.

2.                     
Критерии согласия
позволяют проверить гипотезы о соответствии распределений генеральной
совокупности известной теоретической модели.

3.                     
Непараметрические критерии
используются в гипотезах, когда не требуется знаний о конкретном виде
распределения.

Проверка
параметрических гипотез проводится на основе критериев значимости., а
непараметрических- критериев согласия.

Задача проверки
статистических гипотез сводится к исследованию генеральной совокупности по
выборке. Множество возможных значений элементов выборки может быть разделено на
два непересекающихся подмножества- критическую область и область принятия
гипотезы.

Областью принятия гипотезы или областью допустимых значений Iдоп

называют совокупность значений критерия,
при которых эту гипотезу принимают.

Критической областью
Iкр называют множество значений критерия, при
котором гипотезу отвергают.

Наблюдаемые значения критерия (статистика) 
Kнабл

называют такое значение критерия, которое
находится по данным выборки.

Границы критической области, отделяющие ее от
области принятия гипотезы, называют критическими точками и обозначают

Kкр.

Для определения
критической области задается уровень значимости

 
некая малая вероятность попадания критерия в критическую область.

Уровень значимости— вероятность принятия
конкурирующей гипотезы, тогда как справедлива основная.

С помощью уровня
значимости определяются границы критической области.

Основной принцип проверки статистических гипотез
состоит в следующем: если наблюдаемое значение статистики критерия попадает (не
попадает) в критическую область, то гипотеза H0
 

отвергается (принимается), а гипотеза H1 

принимается (отвергается) в качестве одного из
возможных решений с формулировкой «гипотеза

H0 противоречит (не противоречит) выборочным
данным на уровне значимости

».

В зависимости от
содержания альтернативной гипотезы осуществляется выбор критической области:
левосторонней, правосторонней, двусторонней. Если смысл исследования заключается
в доказательстве конкретного изменения наблюдаемого параметра (его уменьшения
или увеличения), то говорят об односторонней критической области. Если смысл
исследования- выявить различия в изучаемых параметрах, но характер их
отклонения от контрольных (или теоретических) не известен, то говорят о
двусторонней критической области.

Однако, принятие той
или иной гипотезы не дает оснований утверждать, что она верна. Результат
проверки статистической гипотезы лишь устанавливают на определенном уровне
значимости ее соответствие (несоответствие) результатам эксперимента.

При проверке
статистических гипотез возможны следующие ошибки:

1.     
Отвергнута правильная
H0, а принята неправильная  гипотеза
H1ошибка
первого рода
.

2.    Отвергнута правильная альтернативная
гипотеза 

H1 и
принята неправильная нулевая гипотеза  H0


ошибка второго рода.

Заметим, что уровень значимости 
есть вероятность ошибки первого рода. Ошибка первого рода называется 

-риском. Обычно они задаются
некоторыми конкретными значениями: 0,05; 0,01; 0,005; 0,001. Ошибки второго
рода называются
-риском, а вероятность ее
допустить обозначается

(вероятность того, что принята гипотеза 
H0
, когда на самом деле справедлива
альтернативная гипотеза H1

.

Можно доказать, что с
уменьшением ошибок первого рода одновременно увеличиваются ошибки второго рода
и наоборот. Поэтому, на практике пытаются подбирать значения параметров

и  
опытным путем в целях минимизации суммарного
эффекта от возможных ошибок. При принятии управленческих решений для
одновременного уменьшения ошибок первого и второго рода самым действенным
средством является увеличение объема выборки, что согласуется с законом больших
чисел.

На бытовом уровне
ошибки второго рода могут иметь более трагические последствия, чем ошибки
первого рода.

2. Гипотеза о законе распределения. Критерий согласия Пирсона (
X2
-критерий).

Критериями согласия называют критерии, в
которых гипотеза определяет закон распределения либо полностью, либо с
точностью до небольшого числа параметров.

Причины расхождения
результатов эксперимента и теоретических характеристик могут быть вызваны малым
объемом выборки, неудачным способом группировки наблюдений, ошибками в
выборе  гипотезы о виде распределения
генеральной совокупности и др.

Рассмотрим
универсальный критерий согласия Пирсона. Проверка гипотезы о том, что
эмпирическая частота мало отличается от соответствующей теоретической частоты,
осуществляется с помощью величины
X2

меры расхождения между ними.

Для произвольной
выборки, когда распределение непрерывно или число различных вариант велико, все
пространство наблюдаемых вариант делят на конечное число непересекающихся
областей, в каждой из которых подсчитывают наблюдаемую частоту и теоретическую
вероятность.

Для применения критерия
согласия Пирсона необходимо:

1.                      Вычислить значение статистики по формуле:
, где 
pi –вероятность
принятия значения 

xi, ni.
— эмпирическая частота для
соответствующего

xi. n— объем выборки. s— число вариант выборки.

2.                     
 По
соответствующей таблице распределения Пирсона найти критическое значение
, где k = s
r
– 1 – число степеней свободы,
s
число различных вариант или интервалов группировки,
r— число неизвестных параметров
предполагаемого теоретического распределения,

— выбранный уровень значимости. Это
значит, что строится правосторонний интервал.

3.                     
Если
 ,
то основная гипотеза отвергается, в противном случае- принимается, т.е. чем
больше отклонение, тем меньше согласованы теоретическое и эмпирическое
распределение. Поэтому принято использовать только правостороннюю критическую
область.

Расчетная таблица имеет вид:

Интервалы

Середины
i-го
интервала xi

Эмпирические
частоты ni

Вероятности pi

Теоретические
частоты npi

Пример:

По таблице
эмпирического распределения изменения в процентах темпа роста акций проверьте
гипотезу о нормальном распределении выборки.

Интервалы

(-2;
-1)

(-1;
0)

(0;
1)

(1;
2)

Итого

ni

7

14

18

11

50

pi

0,157

0,341

0,341

0,157

1

Решение:

Гипотезу о нормальном
распределении проверим по критерию Пирсона.

Интервалы

Эмпирические
частоты ni

Вероятности pi

Теоретические
частоты npi

(-2;
-1)

7

0,157

7,85

0,7225

0,092

(-1;
0)

14

0,341

17,05

9,3025

0,546

(0;
1)

18

0,341

17,05

0,9025

0,053

(1;
2)

11

0,157

7,85

9,925

1,264

Итого

=1,955

По таблице найдем
при =0,05 
и
k = sr – 1 = 4 – 2 – 1 = 1. s = 4 – число
интервалов.
r
= 2- число параметров теоретического (нормального) распределения.

Имеем . Т.к. 1,955 < 3,841, то
, т.е. гипотеза о нормальном
распределении подтверждается.

3.      Гипотезы о числовом значении генерального
среднего и дисперсии.

Установление двусторонней критической
области на уровне значимости

 для
проверки гипотезы соответствует отысканию соответствующего доверительного
интервала с надежностью

.

Рассмотрим условия применения некоторых
статистических гипотез.

Тип гипотезы H0

Границы критической области на уровне значимости

Статистика наблюдений

О числовом значении
генерального среднего  нормального
распределения
M(X) = m =
, с известным среднеквадратическим
отклонением.

О числовом значении
генерального среднего  нормального
распределения
M(X) = m =
m0, с неизвестной среднеквадратическим
отклонением

Распределение
Стьюдента

О числовом значении
дисперсии нормального распределения

, или

Распределение Пирсона

Пример:

Результаты исследований в течение 35 лет
показали, что среднее изменение доходности векселей равно 5,5 %. Полагая, что
изменение доходности подчиняется нормальному закону распределения с
среднеквадратическим отклонением равным 2 %, на уровне значимости

, решите: можно ли принять 6 %  в качестве нормативного процента
(математического ожидания) изменения доходности.

Решение:

По условию задачи
нулевая гипотеза

. Так как
, то в качестве альтернативной гипотезы
возьмем гипотезу:

, которой соответствует левосторонняя
критическая область с интервалом
.

Найдем границы
критической области:

По таблице значений
функции Ф(х) найдем

, т.е. левосторонняя критическая область
лежит в интервале
.

Найдем статистику
наблюдений:

 .

Имеем:, нет основания отвергать нулевую
гипотезу. Значит, в качестве нормативного процента можно принять 6 %.

Пример:

Точность работы
программы проверяют по дисперсии контролируемого количества символов в коде,
которая не должна превышать 0,1. По выборке из 15 сообщений вычислена
исправленная оценка дисперсии   0,22. При
уровне значимости 0,05 проверьте, обеспечивает ли программа необходимую
точность.

Решение:

Имеем: n = 15, s2 = 0,22
,  ,
.

Сформулируем гипотезу о
числовом значении дисперсии:


H0программа обеспечивает необходимую точность
;

H1
программа не обеспечивает необходимую точность

.

Определим статистику: .

Найдем границы
критической области:

.

Поскольку 30,8 >
23,7; 

, принимаем гипотезу H1, т.к.
H0 противоречит опытным данным. Вывод: программа
не обеспечивает необходимую точность.

Финансовые аналитики часто сталкиваются с конкурирующими идеями о том, как работают финансовые рынки. Некоторые из этих идей развиваются через личные исследования или опыт работы с рынками; другие появляются благодаря взаимодействию с коллегами; и многие другие появляются в результате публикаций в профессиональной литературе по финансам и инвестициям.

Но как может аналитик определить насколько истинны или ложны те или иные идеи?

Когда мы можем свести идею или предположение к определенному утверждению о значении величины, такому как среднее значение совокупности, идея становится статистически проверяемым утверждением или гипотезой.

Аналитик может захотеть исследовать такие вопросы, как:

  • Отличается ли средняя доходность данного взаимного фонда от средней эталонной доходности?
  • Изменится ли волатильность доходности акции, после того как эта акция будет добавлена в рыночный индекс акций?
  • Влияет ли разница между ценами продажи и покупки акции, связанная с числом дилеров, на рынок этой акции?
  • Поддерживают ли данные национального рынка облигаций прогноз, полученный на основе экономической теории о временной структуре процентных ставок (связь между доходностью и сроком погашения)?

Для решения этих вопросов, мы используем концепцию и методы проверки статистических гипотез.

Проверка статистических гипотез (англ. ‘hypothesis testing’) является частью статистического вывода, и представляет собой процесс принятия суждений о более крупной группе (совокупности) на основе небольшой фактически наблюдаемой группе (выборке).

Концепции и методы проверки гипотез обеспечивают объективные средства для оценки того, подтверждают ли имеющиеся доказательства гипотезу. После статистической проверки гипотезы мы должны иметь четкое представление о вероятности того, верна ли гипотеза или нет.

Проверка статистических гипотез была мощным инструментом в научном развитии инвестиций. Как написал Роберт Л. Кан (Robert L. Kahn) из Института социальных исследований (Анн-Арбор, штат Мичиган):

«Мельница науки перемалывает только тогда, когда гипотезы и данные находятся в непрерывном и тесном контакте».

Основные акценты этого чтения сосредоточены на основах проверки гипотез и проверке гипотез, касающихся среднего значения и дисперсии, — двух величин, весьма часто использующихся в инвестициях.

Сначала мы приведем обзор процедуры проверки гипотез. Затем обратимся проверке гипотез о среднем, гипотез о разнице между средними и среднем значении разности. В следующем разделе этого чтения, мы рассмотрим проверку гипотез о дисперсии и различиях между дисперсиями, а также проверку гипотез о значении коэффицента корреляции.

В завершение мы рассмотрим непараметрические методы статистического вывода.


Проверка гипотезы, как мы уже упоминали, является частью области статистики, известной как статистический вывод. Традиционно область статистического вывода имеет два направления: статистическая оценка и проверка гипотез.

Статистическая оценка отвечает вопрос:

«Чему равно значение этого параметра (например, среднего значения по совокупности)?»

Ответ на этот вопрос дается в виде доверительного интервала, построенного вокруг точечной оценки. В случае со средним значением, мы строим доверительный интервал для среднего значения совокупности вокруг выборочного среднего, полученного в результате точечной оценки.

Например, предположим, что выборочное среднее равно 50 и 95-процентный доверительный интервал для среднего населения составляет (50 pm 10) (доверительный интервал составляет от 40 до 60). Если доверительный интервал правильно построен, то есть 95-процентная вероятность того, что интервал от 40 до 60 содержит среднее значение совокупности.

Мы обсуждали построение и интерпретацию доверительных интервалов в чтении о выборочном методе и статистической оценке.

Вторая ветвь статистического вывода, проверка гипотез, имеет несколько иную направленность.

Проверка статистических гипотез отвечает на вопрос:

«Равно ли значение параметра (например, среднего значения по совокупности) 45 (или другому конкретному значению)?»

Утверждение «среднее совокупности равно 45» является гипотезой. Статистическая гипотеза (англ. ‘hypothesis’) определяется как утверждение об одной или нескольких совокупностях.

Этот раздел посвящен концепции проверки гипотез. Процесс проверки гипотезы является частью строгого подхода к получению знаний, известного как научный метод (англ. ‘scientific method’).

Научный метод начинается с наблюдений и формулировки теории организации и объяснения наблюдений. Мы судим о правильности теории по ее способности давать точные прогнозы — например, предсказывать результаты новых наблюдений.

Чтобы быть проверяемой, теория должна быть способна делать предсказания, ошибочность которых можно показать.

Если прогнозы верны, мы продолжаем поддерживать теорию, как возможно правильное объяснение наших наблюдений. Когда в результатах наблюдений важна оценка риска, как в области финансов, мы можем попытаться сделать объективное, основанное на вероятности, суждение о том, поддерживают ли новые данные прогноз.

Проверка статистических гипотез играет ключевую роль, когда важна оценка риска.

В своей ежедневной работе финансовый аналитик может сталкиваться с вопросами, на которые он может дать ответы различного качества.

Когда аналитик правильно формулирует проверяемую гипотезу, проверяет ее и составляет отчет о проверке гипотезы, он следует нормам научного метода.

Конечно, логика аналитика, экономическое обоснование, источники информации, и, возможно, другие факторы также оказывают определенное влияние на качество ответа на заданный вопрос.

См. работу Freeley и Steinberg (2008) для обсуждения влияния критического мышления на мотивированное принятие решений.

Мы начнем изучение проверки гипотез со следующего списка из семи шагов.

Этапы проверки статистических гипотез.

Этапы проверки гипотезы заключаются в следующем:

  1. Формулировка гипотезы.
  2. Определение соответствующей тестовой статистики (статистики критерия) и ее распределения вероятностей.
  3. Определение уровня значимости.
  4. Формулировка правила принятия решения.
  5. Сбор данных и расчет тестовой статистики.
  6. Принятие статистического решения.
  7. Принятие экономического или инвестиционного решения.

Этот список этапов основан на списке из работы Daniel и Terrell (1995).

Мы расскажем о каждом из этих этапов, используя в качестве иллюстрации проверку гипотезы о премии за риск для американских акций. Описанный процесс представляет собой традиционный подход к проверке гипотез.

В завершении мы рассмотрим часто используемую альтернативу этих шагов — подход, основанный на p-значении.

1 этап. Формулировка гипотезы.

Первым шагом в проверке гипотезы является формулировка гипотезы. Мы всегда формулируем две гипотезы: нулевую гипотезу (или нуль), обозначаемую как (H_0), и альтернативную гипотезу, обозначаемую как (H_a).

Определение нулевой гипотезы.

Нулевая гипотеза — это гипотеза, которую нужно проверить. Например, мы могли бы предположить, что среднее по совокупности премии за риск для американских акций меньше или равно нулю.

Нулевая гипотеза (нуль, англ. ‘null hypothesis’) — это утверждение, которое считается истинным, если только используемая для проверки гипотезы выборка не дает убедительные доказательства того, что нулевая гипотеза неверна. Когда такие доказательства присутствуют, мы переходим к альтернативной гипотезе.

Определение альтернативной гипотезы.

Альтернативная гипотеза (альтернатива или конкурирующая гипотеза, англ. ‘alternative hypothesis’) — это гипотеза, которая принимается, когда нулевая гипотеза отвергается. Наша альтернативная гипотеза заключается в том, что среднее по совокупности премии за риск для американских акций больше нуля.

Предположим, что наш вопрос касается значения параметра совокупности (theta), по отношению к одному возможному значению параметра, (theta_0) (они читаются, соответственно, как «тета» и «тета ноль»).

Греческие буквы, такие как (sigma), зарезервированы для параметров совокупности. Римские курсивные буквы, например, (s), используются для выборочных статистик.

Примерами параметра совокупности являются среднее по совокупности (mu) и дисперсия совокупности (sigma^2). Мы можем сформулировать три различные пары нулевых и альтернативных гипотез и обозначить их согласно утверждению альтернативной гипотезы.

Формулировки гипотез.

Мы можем сформулировать нулевые и альтернативные гипотезы тремя различными способами:

  • 1-я формулировка: (H_0: theta = theta_0) (нулевая гипотеза) и (H_a: theta neq theta_0) (альтернативная гипотеза  «не равно»).
  • 2-я формулировка: (H_0: theta leq theta_0) (нулевая гипотеза) и (H_a: theta > theta_0) (альтернативная гипотеза  «больше чем»).
  • 3-я формулировка: (H_0: theta geq theta_0) (нулевая гипотеза) и (H_a: theta < theta_0) (альтернативная гипотеза «меньше, чем»).

В нашем примере с американскими акциями, (theta = mu_{RP} ), что представляет собой среднее по совокупности премии за риск для американских акций. Кроме того, (theta_0 = 0 ), и мы используем вторую из указанных выше трех пар гипотез.

1-я формулировка представляет собой двустороннюю проверку гипотезы (англ. ‘ two-sided hypothesis test’ или ‘two-tailed hypothesis test’): Мы отвергаем нуль в пользу альтернативы, если данные свидетельствуют о том, что параметр совокупности либо меньше, либо больше, чем (theta_0 ).

В отличие от этого, 2-я и 3-я формулировки являются односторонней проверкой гипотезы (англ. ‘one-sided hypothesis test’ или ‘one-tailed hypothesis test’).

В формулировках 2 и 3 мы отвергаем нуль только тогда, когда данные свидетельствуют о том, что параметр совокупности соответственно, либо больше, либо меньше, чем (theta_0 ). Альтернативная гипотеза имеет только одну сторону.

Обратите внимание, что в каждом из описанных выше случаев, мы формулируем нулевые и альтернативные гипотезы так, что они учитывают все возможные значения параметра. В формулировке 1, например, параметр или равен гипотетическому значению (theta_0 ) (по нулевой гипотезе) или не равен гипотетическому значению (theta_0 ) (по альтернативной гипотезе).

Эти два утверждения логически исчерпывают все возможные значения параметра.

Несмотря на то, что формулировать гипотезы можно различными способами, мы всегда проводим проверку нулевой гипотезы в точке равенства, (theta = theta_0 ). Если нуль это (H_0: theta = theta_0), (H_0: theta leq theta_0) или (H_0: theta geq theta_0), мы на самом деле проверяем (theta = theta_0 ). Логика проста.


Предположим, что гипотетическое значение параметра равно 5.

Рассмотрим нулевую гипотезу (H_0: theta leq 5), с альтернативной гипотезой «больше чем» (H_a: theta > 5) .

Если у нас есть достаточно доказательств, чтобы отклонить (H_a: theta = 5) в пользу (H_a: theta > 5), то у нас, безусловно, также есть достаточные доказательства, чтобы отвергнуть гипотезу о том, что параметр (theta) равен некоторому меньшему значению, например, 4.5 или 4.

Напомним, что расчет для проверки нулевой гипотезы является одинаковым для всех трех формулировок. Различия в трех формулировках мы увидим в ближайшее время, — они заключаются в определении того, следует ли отклонить нулевую гипотезу.

Как мы выбираем нулевые и альтернативные гипотезы?

Вероятно, наиболее распространенными являются альтернативные гипотезы «не равно». Мы отвергаем нуль, поскольку данные свидетельствуют о том, что параметр больше или меньше, чем (theta_0).

Иногда, однако, у нас могут быть условия, имеющие вид «ожидаем», «подозреваем» или «надеемся на то, что», которые означают, что мы хотим найти благоприятные доказательства.

Часть этого обсуждения выбора гипотез взята из работы Bowerman, O’Connell и Murphree (2016).

В этом случае, мы можем сформулировать альтернативную гипотезу, как утверждение о том, что это условие является истинным. При этом нулевой гипотезой будет утверждение о том, что это условие не истинно. Если данные подтверждают отклонение нуля и принятие альтернативы, то мы статистически подтвердили наши ожидания того, что было истиной.

Например, экономическая теория предполагает, что инвесторы требуют положительную премию за риск по акциям (премия за риск определяется как ожидаемая доходность акций за вычетом безрисковой ставки).

Следуя принципу с формулировки альтернативы в виде условия «надеемся на то, что», сформулируем следующие гипотезы:

  • (H_0:) Среднее по совокупности премии за риск для американских акций меньше или равно 0.
  • (H_a:) Среднее по совокупности премии за риск для американских акций положительно.

Обратите внимание, что альтернативные гипотезы «больше чем» и «меньше чем» отражают убеждения исследователя сильнее, чем альтернативная гипотеза «не равно».

Для того, чтобы подчеркнуть свое нейтральное отношение к гипотезам, исследователь может иногда выбрать альтернативную гипотезу «не равно», когда выбор односторонней альтернативной гипотезы также разумен.

2 этап. Определение тестовой статистики и ее распределения вероятностей.

Второй этап проверки гипотез заключается в определении соответствующей тестовой статистики и ее распределения вероятностей.

Определение тестовой статистики.

Тестовая статистика, тест-статистика или статистика критерия (т.е. статистика, лежащая в основе критерия, англ. ‘test statistic’) является величиной, рассчитанной на основе выборки, значение которой является основанием для принятия решения о том, следует ли отклонить нулевую гипотезу.

Средоточием нашего статистического решения является значение тестовой статистики. Очень часто (во всех случаях, которые мы рассмотрим в этом чтении) тестовая статистика имеет следующий вид:

( Large stBf{Тестовая}{статистика} = { stRm{Выборочная}{статистика} — stRm{Значение параметра}{совокупности при $H_0$} over  text{Стандартная ошибка выборочной статистики}} ) (Формула 1)

Для нашей премии за риск, например, интересующий параметр совокупности — это средняя по совокупности премия за риск (mu_{RP}). Мы обозначаем гипотетическое значение среднего по совокупности населения для (H_0) как (mu_0). Переформулировав гипотезу с использованием символов, мы проверяем нуль (H_0: mu_{RP} leq mu_0 ) и альтернативу (H_a: mu_{RP} > mu_0 ).

Однако, поскольку в соответствии с нулем мы проверяем условие ( mu_0 = 0), то мы пишем (H_0: mu_{RP} leq 0 ) и (H_a: mu_{RP} > 0 ).

Выборочное среднее обеспечивает оценку среднего по совокупности. Таким образом, мы можем использовать выборочное среднее премии за риск ( overline X_{RP}), рассчитанное на основе исторических данных, в качестве выборочной статистики в Формуле 1.

Стандартное отклонение выборочной статистики, известное как «стандартная ошибка» статистики, является знаменателем в Формуле 1.

В этом примере выборочной статистикой является выборочное среднее. Для выборочного среднего ( overline X ), рассчитанного по выборке, отобранной из совокупности со стандартным отклонением ( sigma ), стандартная ошибка определяется по одной из двух формул:

(large dst
sigma_{overline X} = {sigma over sqrt n} )
(Формула 2)

если нам известно стандартное отклонение совокупности (sigma), или

(large dst
s_{overline X} = {s over sqrt n} )
(Формула 3)

когда мы не знаем стандартное отклонение совокупности и нам необходимо использовать стандартное отклонение выборки (s) оценки стандартной ошибки.

В этом примере, поскольку мы не знаем стандартное отклонение совокупности, порождающей доходность, мы используем Формулу 3.

Таким образом, тестовая статистика определяется по формуле:

( large dst
{overline X_{RP} — mu_0 over s_{overline X}} = {overline X_{RP} — 0 over s big / sqrt n }  )

Заменяя (mu_0) на 0, мы используем тот уже отмеченный факт, что мы тестируем любую нулевую гипотезу в точке равенства, а также тот факт, что здесь (mu_0 = 0).

Итак, мы определили тестовую статистику, чтобы проверить нулевую гипотезу.

Какому распределению вероятностей она соответствует?

В этом чтении мы будет использовать четыре распределения вероятности для тестовых статистик:

  • t-распределение Стьюдента (для t-теста);
  • Стандартное нормальное или z-распределение (для z-теста);
  • Распределение хи-квадрат (( chi^2 )) (для хи-квадрат теста); а также
  • F-распределение (для F-теста).

Мы обсудим детали этих вариантов позже, но предположим, что мы можем провести z-тест, основанный на центральной предельной теореме, потому что наша выборка американских акций имеет много наблюдений.

Центральная предельная теорема говорит о том, что выборочное распределение выборочного среднего будет приблизительно нормальным со средним (mu) и дисперсией (sigma^2 / n), когда выборка имеет большой размер.

Выборка, которую мы будем использовать для этого примера, содержит 118 наблюдений.

В итоге, тестовая статистика для проверки гипотезы о средней премии за риск равна ( overline X_{RP} big / s_{overline X}).

Мы можем выполнить z-тест, поскольку мы можем правдоподобно предположить, что тестовая статистика следует стандартному нормальному распределению.

3 этап. Определение уровня значимости.

Третьим этапом проверки гипотез является определение уровня значимости. Когда тестовая статистика рассчитана, возможны два действия:

  1. Мы отвергаем нулевую гипотезу или
  2. Мы не отвергаем нулевую гипотезу.

Выбор действия основан на сравнении вычисленной тестовой статистики с заданным возможным значением или значениями. Значения, которые мы выбираем, основаны на выбранном уровне значимости. Уровень значимости отражает то, какие основанные на выборке доказательства нам необходимы, чтобы отвергнуть нуль.

По аналогии с судом, необходимая доказательная база может меняться в зависимости от характера гипотез и серьезности последствий совершения ошибки.

Возможны четыре результата при проверке нулевой гипотезы:

  1. Мы отвергаем ложную нулевую гипотезу. Это правильное решение.
  2. Мы отвергаем истинную нулевую гипотезу. Это называется ошибкой I рода (англ. ‘Type I error’).
  3. Мы не отвергаем ложную нулевую гипотезу. Это называется ошибкой II рода (англ. ‘Type II error’).
  4. Мы не отвергаем истинную нулевую гипотезу. Это правильное решение.

Проиллюстрируем эти результаты в Таблице 1.

Таблица 1. Ошибки I и II рода при проверке гипотез.

Решение

Ситуация

(H_0) Истина

(H_0) Ложь

(H_0) не отвергается

Правильное решение

Ошибка II рода

(H_0) отвергается (принимается (H_a))

Ошибка I рода

Правильное решение

Когда мы принимаем решение при проверке гипотезы, мы рискуем допустить ошибку I или II рода. Это взаимоисключающие ошибки:

  • Если мы ошибочно отвергаем нуль, мы можем допустить только ошибку I рода.
  • Если мы ошибочно не отвергаем нуль, мы можем допустить только ошибку II рода.

Вероятность ошибки I рода при проверке гипотезы обозначается греческой буквой альфа: (alpha). Эта вероятность также известна как уровень значимости проверки (англ. ‘level of significance’).

Например, уровень значимости 0.05 для проверки означает, что есть 5-процентная вероятность отклонения истинной нулевой гипотезы.

Вероятность ошибки II рода обозначается греческой буквой бета: (beta).

Управление вероятностью ошибок двух типов предполагает компромисс. При прочих равных, если мы уменьшаем вероятность ошибки I рода, задав меньший уровень значимости (скажем, 0.01, а не 0.05), мы увеличиваем вероятность совершить ошибку II рода, потому что мы отвергаем нуль реже, в том числе, когда он является ложным.

Единственным способом уменьшить вероятность ошибок обоих типов одновременно является увеличение размера выборки (n).

Количественный компромисс между двумя типами ошибок на практике, как правило, невозможен, потому что вероятность ошибки II рода очень трудно определить количественно.


Рассмотрим пример с парой гипотез: (H_0: theta leq 5) и (H_a: theta > 5).

Поскольку каждое истинное значение (theta) больше 5 делает нулевую гипотезу ложной, каждое значение (theta) больше 5 имеет различную (beta) (вероятность ошибки II рода).

В отличие от этого, нам достаточно только констатировать вероятность ошибки I рода при (theta = 5). Таким образом, как правило, мы указываем только вероятность ошибки I рода, когда выполняем проверку гипотезы.

В то время как уровень значимости проверки является вероятностью ошибочно отвергнуть нулевую гипотезу, то мощностью критерия или мощностью проверки (англ. ‘power of a test’) является вероятность правильного отклонения нулевой гипотезы — то есть вероятность отвергнуть нуль, если он ложный.

Мощность критерия, на самом деле, равна 1 минус вероятность ошибки II рода.

Когда при проведении проверки имеется более одной статистики критерия, мы должны предпочесть самую мощную из них, при прочих равных условиях.

Тем не менее, у нас не всегда есть информация об относительной мощности критерия для конкурирующих статистик критерия.

В итоге, стандартный подход к проверке гипотез включает только определение уровня значимости (вероятности ошибки I рода). Наиболее целесообразно устанавливать этот уровень значимости до расчета тестовой статистики (статистики критерия). Если мы указываем его после вычисления тестовой статистики, на нас может повлиять результат расчета, что умаляет объективность проверки.

Мы можем использовать три наиболее распространенных уровня значимости для проведения проверки гипотезы: 0.10, 0.05 и 0.01.

Если мы можем отклонить нулевую гипотезу на уровне значимости 0.10, то у нас есть доказательства того, что нулевая гипотеза неверна.

Если мы можем отклонить нулевую гипотезу на уровне значимости 0.05, то у нас есть убедительные доказательства того, что нулевая гипотеза неверна.

И если мы можем отклонить нулевую гипотезу на уровне значимости 0.01, то у нас есть очень убедительные доказательства того, что нулевая гипотеза неверна.

Для нашего примера с премией за риск, мы установим уровень значимости 0.05.

4 этап. Формулировка правила принятия решения.

Четвертый этап проверки гипотезы заключается в формулировке правила принятия решения (англ. ‘decision rule’).

Общий принцип формулируется просто.

Когда мы проверяем нулевую гипотезу, если мы находим, что рассчитанное значение статистики критерия (тестовой статистики) является экстремальным или более экстремальным, чем заданное значение или значения, определенные установленным уровнем значимости (alpha), то мы отвергаем нулевую гипотезу. Мы говорим, что результат является статистически значимым (англ. ‘statistically significant’).

В противном случае, мы не отвергаем нулевую гипотезу, и говорим, что результат не является статистически значимым. Значение или значения, с которым мы сравниваем вычисленную статистику критерия, чтобы принять наше решение, являются точками отклонения (критическими значениями) для проверки гипотезы.

Термин «точка отклонения» (англ. ‘rejection point’) является описательным синонимом для более традиционного термина «критическое значение» (англ. ‘critical value’).

Определение критического значения для статистики критерия.

Критическое значение или точка отклонения (англ. ‘critical value’) для тестовой статистики (статистики критерия) представляет собой значение, с которой сравнивается вычисленная тестовая статистика, чтобы решить, следует ли отклонять или не отклонять нулевую гипотезу.

Для односторонней проверки, мы указываем критическое значение, используя символ для тестовой статистики с индексом (alpha), обозначающим заданную вероятность ошибки I рода, например, (z_alpha).

Для двусторонней проверки, мы указываем критическое значение (z_{alpha/2}).

Для того, чтобы проиллюстрировать применение критических значений, предположим, что мы используем z-тест и выбрали уровень значимости 0.05.


Для проверки пары гипотез (H_0: theta = theta_0) и (H_a: theta neq theta_0), существуют два критических значения, — одно отрицательное и одно положительное.

Для двухсторонней проверки при уровне значимости 0.05, суммарная вероятность ошибки I рода должна быть равна 0.05. Таким образом, 0.05 / 2 = 0.025 вероятности должно быть в каждом хвосте распределения тестовой статистики при нулевой гипотезе.

Следовательно, двумя критическими значениями будут (z_{0.025} = 1.96) и (-z_{0.025} = -1.96). Пусть (z) является вычисленным значением тестовой статистики. Мы отвергаем нуль, если находим, что (z < -1.96) или (z > 1.96). И мы не отвергаем нуль, если (-1.96 leq z leq 1.96).


Для проверки пары гипотез (H_0: theta leq theta_0) и (H_a: theta > theta_0) при уровне значимости 0.05, критическим значением будет (z_{0.05} = 1.645). Мы отвергаем нулевую гипотезу, если (z > 1.645). Значение стандартного нормального распределения таково, что 5% результатов лежат правее точки (z_{0.05} = 1.645).


Для проверки пары гипотез (H_0: theta geq theta_0) и (H_a: theta < theta_0), критическим значением будет (-z_{0.05} = -1.645). Мы отвергаем нулевую гипотезу, если (z < -1.645).


График 2 иллюстрирует проверку (H_0: mu = mu_0) и (H_a: mu neq mu_0) при уровне значимости 0.05 с использованием z-теста.

Термин «область принятия гипотезы» (англ. ‘acceptance region’) является традиционным названием для множества значений тестовой статистики, при которых мы не отвергаем нулевую гипотезу.

Традиционное название, однако, неточное. Мы должны избегать использования таких фраз, как «принять нулевую гипотезу», потому что такое утверждение подразумевает неоправданно большую степень убежденности в нуле, когда мы не отвергаем его.

Аналогия с некоторыми судами (например, в Соединенных Штатах) заключается в том, что если присяжные не выносят вердикт о виновности (альтернативная гипотеза), наиболее точным будет сказать, что жюри не удалось отклонить нулевую гипотезу о невиновности обвиняемого (что следует из принципа презумпции невиновности).

По обеим сторонам от области принятия решения находятся области отклонения или критические области (англ. ‘rejection region’ или ‘critical region’).

Если нулевая гипотеза заключается в том, что ( mu = mu_0 ) истинно, тестовая статистика имеет 2.5-процентный шанс попадания в левую критическую область и 2.5-процентный шанс попадания в правую критическую область.

Любое вычисленное значение тестовой статистики, которое попадает в любую из этих двух областей, заставляет нас отвергнуть нулевую гипотезу при уровне значимости 0.05. Критические значения 1.96 и -1.96 рассматриваются как разделительные линии между областями принятия и отклонения гипотезы.

График 2. Критические значения при уровне значимости 0.05, для двусторонней проверки среднего по совокупности с использованием z-теста. График 2. Критические значения при уровне значимости 0.05, для двусторонней проверки среднего по совокупности с использованием z-теста.

График 2 дает хорошую возможность подчеркнуть взаимосвязь между доверительными интервалами и проверкой гипотез. 95-процентный доверительный интервал для среднего по совокупности (mu), основанного на выборочном среднем (overline X), задается диапазоном от (overline X — 1.96s_{overline X}) до (overline X + 1.96s_{overline X}), где (s_{overline X}) является стандартной ошибкой выборочного среднего (Формула 3).

Так же, как и при проверке гипотезы, мы можем использовать этот доверительный интервал, основанный на стандартном нормальном распределении, когда у нас есть большая выборка.

Альтернативная проверка гипотезы и доверительный интервал используют t-распределение. Мы рассмотрим эти концепции в следующем разделе.

Теперь рассмотрим одно из условий для отклонения нулевой гипотезы:

( dst {overline X — mu_0 over s_{overline X}} > 1.96)

Здесь (mu_0) является гипотетическим значением среднего по совокупности. Условие гласит, что отклонение гипотезы является оправданным, если тестовая статистика превышает 1.96.

Умножив обе стороны неравенства на  (s_{overline X}), мы получим ( overline X — mu_0 > 1.96 s_{overline X}), или после преобразования, ( overline X — 1.96 s_{overline X} > mu_0), что можем также записать в виде ( mu_0 < overline X — 1.96 s_{overline X}).

Это выражение означает, что если гипотетическое среднее по совокупности (mu_0), меньше нижнего предела 95-процентного доверительного интервала, основанного на выборочном среднем, мы должны отвергнуть нулевую гипотезу при уровне значимости 5% (тестовая статистика попадает в критическую область справа).

Теперь мы можем взять другое условие для отклонения нулевой гипотезы:

( dst {overline X — mu_0 over s_{overline X}} < -1.96)

и, используя алгебру, как и ранее, мы преобразуем его к виду:

( dst mu_0 > overline X — 1.96 s_{overline X})

Если гипотетическое среднее по совокупности больше, чем верхний предел 95-процентного доверительного интервала, мы отвергаем нулевую гипотезу при уровне значимости 5% (тестовая статистика попадает в критическую область слева).

Таким образом, уровень значимости в двусторонней проверке гипотезы можно интерпретировать точно так же, как доверительный интервал (1 — alpha).

Таким образом, когда гипотетическое значение параметра совокупности для нулевой гипотезы находится вне соответствующего доверительного интервала, то нулевая гипотеза отвергается. Мы могли бы использовать доверительные интервалы для проверки гипотез, но на практике финансовые аналитики, как правило, этого не делают.

Вычисление тестовой статистики (одно число, по сравнению с двумя числами для обычного доверительного интервала) более эффективно. Также, на практике аналитики редко сталкиваются с односторонними доверительными интервалами.

Кроме того, только вычислив тестовую статистику, мы можем получить p-значение, полезный показатель значимости результатов (мы обсудим p-значение далее).


Вернемся к нашей проверке премии за риск.

Мы сформулировали гипотезы (H_0: mu_{RP} leq 0) и (H_a: mu_{RP} > 0). Мы определили тестовую статистику как ( overline X_{RP} / s_{overline X}) и определили, что она следует стандартному нормальному распределению.

Таким образом, мы выполняем односторонний z-тест.

Мы определили уровень значимости 0.05. Для этого одностороннего z-теста, критическая точка при уровне значимости 0.05 составляет 1.645. Мы отвергаем нуль, если вычисленная z-статистика больше, чем 1.645.

График 3 иллюстрирует эту проверку.

График 3. Критическое значение при уровне значимости 0.05. Односторонняя проверка среднего по совокупности с использованием z-теста. График 3. Критическое значение при уровне значимости 0.05. Односторонняя проверка среднего по совокупности с использованием z-теста.

5 этап. Сбор данных и расчет тестовой статистики.

Пятый шаг в проверке гипотез заключается в сборе данные и расчете тестовой статистики. Качество наших выводов зависит не только от уместности статистической модели, но и от качества данных, которые мы используем при проведении проверки.

В первую очередь мы должны проверить данные на наличие ошибок измерений. Нам также необходимо учесть другие проблемы, в том числе систематическую ошибку выборки и систематическую ошибку временного периода.

Систематическая ошибка выборки — это смещение выборки, связанное с систематическим исключением некоторых элементов совокупности в соответствии с определенным признаком.

Одним из типов систематической ошибки выборки является систематическая ошибка выжившего. Например, если мы определим нашу выборку, как облигации взаимных фондов США, которые продолжают деятельность в настоящее время, и мы сделаем выборку доходности только по этим фондам, мы будем систематически исключать фонда, которые не выжили (прекратили деятельность) к настоящему моменту.

Прекратившие деятельность фонды, скорее всего, в среднем хуже оставшихся фондов. В результате, эффективность фондов, рассчитанная на основе этой выборки, может быть смещена вверх.

Систематическая ошибка временного периода связана с вероятностью того, что когда мы используем выборку из временных рядов, наш статистический вывод может быть чувствительным к начальным и конечным датам периода выборки.

В нашей гипотезе о премии за риск мы имеем дело с американскими акциями. Согласно Dimson, Marsh и Staunton (2018) за период с 1900 по 2017 год включительно (118 ежегодных наблюдений), среднеарифметическая премия за риск для американских акций по отношению к доходности облигаций (overline X_{RP}) составила 7.5% в год.

Выборочное стандартное отклонение годовой премии за риск составило 19.5%. Используя Формулу 3, найдем стандартную ошибку выборочного среднего:

( dst s_{overline X} = s big / sqrt n = 19.5% / sqrt {118} ) = 1.795%.

Тестовая статистика равна:

( dst z = overline X_{RP} big / s_{overline X}) = 7.5%/1.795% = 4.18.

6 этап. Принятие статистического решения.

Шестой этап проверки гипотезы означает принятие статистического решения.

В нашем примере, поскольку тестовая статистика (z = 4.18) больше критического значения 1.645, мы отвергаем нулевую гипотезу в пользу альтернативной гипотезы о том, что премия за риск для американских акций является положительной.

Первые шесть шагов являются статистическими шагами. Наше итоговое решение принимается с использованием статистического решения.

7 этап. Принятие экономического или инвестиционного решения.

Седьмой и заключительный шаг в проверке гипотез заключается в принятии экономического или инвестиционного решения. Экономическое или инвестиционное решение принимает во внимание не только статистические решения, но и все соответствующие экономические вопросы.

На шестом этапе, мы нашли убедительные статистические доказательства того, что премия за риск для американских акций является положительной. Величина расчетной премии за риск, 7.5% в год, является также очень значимой экономически.

Исходя из этих соображений, инвестор может принять решение инвестировать часть средств в американские акции. Ряд нестатистических соображений, таких как толерантность инвестора к риску и его финансовое положение, может также повлиять на процесс принятия решений.


Предшествующее обсуждение поднимает проблему, которая часто возникает на этом этапе принятия решений. Мы часто находим, что небольшие различия между переменной величиной и ее гипотетическим значением являются статистически значимыми, но не значимыми экономически.

Например, мы можем проверить инвестиционную стратегию и отклонить нулевую гипотезу о том, что средняя доходность стратегии равна нулю на основе большой выборки.

Формула 1 показывает, что чем меньше стандартная ошибка выборочной статистики (делитель в формуле), тем больше значение тестовой статистики и тем больше шанс на то, что нулевая гипотеза будет отклонена, при прочих равных условиях. Стандартная ошибка уменьшается по мере увеличения размера выборки (n), так что при очень больших выборках, мы можем отклонить нулевую гипотезу.

Мы можем обнаружить, что, хотя стратегия обеспечивает статистически значимую положительную среднюю доходность, результаты не являются экономически значимыми, если учесть транзакционные издержки, налоги и риски.

Даже если мы приходим к выводу, что результаты стратегии являются экономически значимыми, мы должны изучить логику того, почему стратегия могла бы работать в будущем, прежде чем реализовывать ее фактически. Такие соображения нельзя включить в проверку гипотезы.

Перед тем как завершить тему процесса проверки гипотез, мы должны обсудить важный альтернативный подход, называемый подходом проверке гипотез с. Аналитики и исследователи часто включают в отчеты о проверке гипотез p-значение (также называемое предельным уровнем значимости, англ. ‘marginal significance level’).

Определение p-значения.

P-значение (p-уровень значимости или p-критерий, англ. ‘p-value’) является наименьшим уровнем значимости, при котором может быть отвергнута нулевая гипотеза.

Для значения тестовой статистики 4.18 в проверке гипотезы о премии за риск, с помощью функции электронной таблицы для стандартного нормального распределения, мы вычисляем р-значение 0.000015. Мы можем отклонить нулевую гипотезу на этом уровне значимости.

Чем меньше р-значение, тем сильнее доказательства против нулевой гипотезы и в пользу альтернативной гипотезы. P-значение для двухсторонней проверки того, что параметр равен нулю, часто генерируется автоматически с помощью статистических и эконометрических программ.

Мы можем использовать электронные таблицы для расчета p-значения. В Microsoft Excel, например, мы можем использовать функции TTEST, NORMSDIST, CHIDIST и FDIST для расчета р-значений для f-тестов, z-тестов, хи-квадрат тестов, и F-тестов, соответственно.

Мы можем использовать р-значение в рамках процедуры проверки гипотез, представленной выше, в качестве альтернативы критическим значениям.

Если р-значение меньше нашего заданного уровня значимости, мы отвергаем нулевую гипотезу. В противном случае, мы не отвергаем нулевую гипотезу.

Используя p-значение таким образом, мы приходим к такому же выводу, что и при использовании критических значений. Например, поскольку 0.000015 меньше 0.05, мы отвергаем нулевую гипотезу в проверке гипотезы о премии за риск.

P-значение, тем не менее, обеспечивает более точную информацию о силе доказательств, чем подход с использованием критических значений. P-значение 0.000015 указывает на то, что нулевая гипотеза отвергается на гораздо меньшем уровне значимости, чем 0.05.

Если один исследователь рассматривает вопрос, используя уровень значимости 0.05, а другой исследователь использует уровень значимости 0.01, читатель может столкнуться с проблемой, сравнивая полученные результаты.

Эта проблема породила подход к представлению результатов проверки гипотез, при котором указываются p-значения и не указывается спецификация уровня значимости (этап 3). Интерпретация статистических результатов остается на усмотрение пользователя исследования. Этот подход к представлению результатов иногда называют подходом к проверке гипотез с использованием р-значения.

Davidson и MacKinnon (1993) оспорили достоинство этого подхода:

«Подход с использование p-значения по не обязательно заставит нас принять решение о нулевой гипотезе. Если мы получим p-значение равное, скажем, 0.000001, мы почти наверняка захотим отклонить нуль.

Но если мы получим p-значение равное, скажем, 0.04, или даже 0.004, мы не обязаны отклонять его. Мы можем просто отбросить результат прочь, как информацию, которая ставит под сомнение нулевую гипотезу, но сама по себе не убедительна.

Мы считаем, что это несколько агностическое отношение к статистическим проверкам, в которых p-значения рассматриваются просто как части информации, которую мы можем использовать, но можем и не использовать». (Стр. 80)

Содержание:

Проверка статистических гипотез:

Статистической гипотезой называется гипотеза, которая относится к виду функции распределения, к параметрам функции распределения, к числовым характеристикам случайной величины и т.д., и которую можно проверить на основе опытных данных. Например, предположение о том, что отклонение истинного размера детали от расчетного имеет нормальный закон распределения, является статистической гипотезой. Предположение о наличии жизни на Марсе статистической гипотезой не является, так как оно не выражает какого-либо утверждения о законе распределения или иных характеристиках случайной величины.

Пример статистической гипотезы

Рассмотрим упрощенный пример. Пусть выдвинута гипотеза о том, что плотность вероятности Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Есть возможность произвести только одно наблюдение. В этом случае выборочным пространством служит числовая ось. Из рис. 3.6.1 видно, что значения случайной величины из отрезка Проверка статистических гипотез - определение и вычисление с примерами решения имеют относительно большую плотность вероятности и попадание наблюдаемого значения в этот отрезок не противоречит гипотезе. Напротив, значения вне этого отрезка в соответствии с гипотезой маловероятны, и реализация одного из этих значений говорит не в пользу гипотезы. В этом упрощенном примере важно следующее: выборочное пространство Проверка статистических гипотез - определение и вычисление с примерами решения мы разбили на две части. Одну из них, точки вне отрезка Проверка статистических гипотез - определение и вычисление с примерами решения, обозначим через Проверка статистических гипотез - определение и вычисление с примерами решения и назовем критической областью. Если наблюдение попадает в Проверка статистических гипотез - определение и вычисление с примерами решения, то гипотезу отвергаем, а если не попадет, то будем считать гипотезу не противоречащей опытным данным или правдоподобной.

В случае выборки объема Проверка статистических гипотез - определение и вычисление с примерами решения по тому же принципу разбивают выборочное пространство на две части. Одну их них, выборки самые маловероятные при данной гипотезе, обозначают через Проверка статистических гипотез - определение и вычисление с примерами решения и называют критической областью. В случае попадания выборки в критическую область гипотезу отвергают. В противном случае признают гипотезу не противоречащей опытным данным. Если говорить о проверке гипотез с точки зрения статистических решающих функций, то, приписав каждой выборке определенное решение, принять или отвергнуть гипотезу, мы тем самым разбиваем выборочное пространство на две части: область принятия гипотезы и критическую область.

Статистическим критерием называют правило, указывающее, когда статистическую гипотезу следует принять, а когда отвергнуть. Построение статистического критерия сводится к выбору в выборочном пространстве критической области Проверка статистических гипотез - определение и вычисление с примерами решения, при попадании выборки в которую гипотеза отвергается. Обычно в критическую область включают самые маловероятные при данной гипотезе выборки.

Даже при верной гипотезе наблюдения могут сложиться неблагоприятно, в итоге выборка может попасть в критическую область и гипотеза будет отвергнута. Вероятность такого исхода Проверка статистических гипотез - определение и вычисление с примерами решения мала, так как к критической области отнесены самые маловероятные при данной гипотезе выборки. Вероятность Проверка статистических гипотез - определение и вычисление с примерами решения можно рассматривать как вероятность ошибки, когда гипотеза отвергается. Эту вероятность называют уровнем значимости критерия. Критерии для проверки гипотезы о законе распределения случайной величины обычно называют критериями согласия.

Статистический критерий в описанном виде может быть сложным, и трудно будет установить, принадлежит ли выборка критической области или нет. Поэтому предпочитают на выборочном пространстве задать некоторую функцию, которая каждой выборке ставит в соответствие определенное число. Значения функции, которые соответствуют критической области, естественно считать критическими значениями. Проверка гипотезы тогда сводится к вычислению по выборке значения этой функции и проверке, является ли оно критическим. Есть функции, не зависящие от вида проверяемой гипотезы. Одна из таких функций дает знаменитый критерий «хи-квадрат».

Критерий согласия «хи-квадрат»

Пусть выдвинута гипотеза о законе распределения случайной величины X. Требуется проверить, насколько эта гипотеза правдоподобна. Для этого разобьем множество возможных значений случайной величины на Проверка статистических гипотез - определение и вычисление с примерами решения разрядов Проверка статистических гипотез - определение и вычисление с примерами решения Для непрерывной случайной величины роль разрядов играют интервалы значений, для дискретной – отдельные возможные значения или группы таких значений. В соответствии с выдвинутой гипотезой каждому разряду соответствует определенная вероятностьПроверка статистических гипотез - определение и вычисление с примерами решения

Например, если выдвинута гипотеза, что случайная величина X имеет функцию распределения Проверка статистических гипотез - определение и вычисление с примерами решения а в качестве Проверка статистических гипотез - определение и вычисление с примерами решения выбраны интервалы Проверка статистических гипотез - определение и вычисление с примерами решения тоПроверка статистических гипотез - определение и вычисление с примерами решения

Нужно проверить, согласуется ли наша гипотеза с опытными данными.

Идея проверки гипотезы состоит в сравнении теоретических вероятностей разрядов (3.6.1) с фактически наблюдаемыми частотами попадания в эти разряды. Для этого производится Проверка статистических гипотез - определение и вычисление с примерами решения независимых наблюдений случайной величины и определяется число попаданий в каждый из разрядов. Пусть в Проверка статистических гипотез - определение и вычисление с примерами решенияй разряд попало Проверка статистических гипотез - определение и вычисление с примерами решения наблюдений. Если гипотеза верна и каждому разряду действительно соответствует вероятность (3.6.1), то при большом числе наблюдений в силу закона больших чисел частоты Проверка статистических гипотез - определение и вычисление с примерами решения будут приблизительно равны теоретическим вероятностям Проверка статистических гипотез - определение и вычисление с примерами решения Тогда величинаПроверка статистических гипотез - определение и вычисление с примерами решения

где Проверка статистических гипотез - определение и вычисление с примерами решения – некоторые коэффициенты, должна быть малой.

Если же гипотеза ложная, то при больших Проверка статистических гипотез - определение и вычисление с примерами решения частоты разрядов будут близки к вероятностям, отличным от Проверка статистических гипотез - определение и вычисление с примерами решения и величина (3.6.2) будет относительно большой. Значит, по величине (3.6.2) можно судить о том, насколько гипотеза согласуется с опытными данными. Критическую область составят те выборки, для которых эта величина велика.

Английский статистик К. Пирсон (1900 г.) показал, что при выборе коэффициентов  Проверка статистических гипотез - определение и вычисление с примерами решения случайная величина Проверка статистических гипотез - определение и вычисление с примерами решения

имеет распределение, которое не зависит от выдвинутой гипотезы и определяется функцией плотности вероятностиПроверка статистических гипотез - определение и вычисление с примерами решения

где Проверка статистических гипотез - определение и вычисление с примерами решения – число, называемое числом степеней свободы. Число Проверка статистических гипотез - определение и вычисление с примерами решения равно разности между числом разрядов и числом связей, наложенных на величины Проверка статистических гипотез - определение и вычисление с примерами решения. Связью называется всякое соотношение, в которое входят величины Проверка статистических гипотез - определение и вычисление с примерами решения.

При данной гипотезе и фиксированном числе наблюдений величина Проверка статистических гипотез - определение и вычисление с примерами решения зависит от Проверка статистических гипотез - определение и вычисление с примерами решения Каждому Проверка статистических гипотез - определение и вычисление с примерами решения соответствует свое слагаемое, но не все Проверка статистических гипотез - определение и вычисление с примерами решения могут изменяться свободно, так как они связаны соотношением Проверка статистических гипотез - определение и вычисление с примерами решения Значит, величина Проверка статистических гипотез - определение и вычисление с примерами решения вместе с величинами Проверка статистических гипотез - определение и вычисление с примерами решения однозначно определяют величину Проверка статистических гипотез - определение и вычисление с примерами решения которая поэтому свободно меняться не может. Число степеней свободы соответствует числу свободно меняющихся величин Проверка статистических гипотез - определение и вычисление с примерами решения . На Проверка статистических гипотез - определение и вычисление с примерами решения могут быть наложены и другие связи. Если всего связей Проверка статистических гипотез - определение и вычисление с примерами решения то независимо меняющихся величин Проверка статистических гипотез - определение и вычисление с примерами решения будет Проверка статистических гипотез - определение и вычисление с примерами решения. Связь Проверка статистических гипотез - определение и вычисление с примерами решения налагается всегда. Другие связи могут возникнуть, например, если при выдвижении гипотезы с помощью величин Проверка статистических гипотез - определение и вычисление с примерами решения оцениваются параметры предполагаемого закона распределения. Чем больше Проверка статистических гипотез - определение и вычисление с примерами решения, тем сильнее график Проверка статистических гипотез - определение и вычисление с примерами решения вытянут вдоль горизонтальной оси (рис. 3.6.2).

Проверка статистических гипотез - определение и вычисление с примерами решения

Составлены специальные таблицы (см. прил., табл. П4), в которых для любого Проверка статистических гипотез - определение и вычисление с примерами решения и заданной вероятности Проверка статистических гипотез - определение и вычисление с примерами решения указаны такие значения Проверка статистических гипотез - определение и вычисление с примерами решения чтоПроверка статистических гипотез - определение и вычисление с примерами решения

На рис. 3.6.2 заштрихованная площадь равна Проверка статистических гипотез - определение и вычисление с примерами решения. Вероятность Проверка статистических гипотез - определение и вычисление с примерами решения можно понимать, как вероятность того, что в силу чисто случайных причин, за счет наблюдения тех, а не других значений случайной величины, мера расхождения между гипотезой и результатами наблюдений будет больше или равна Проверка статистических гипотез - определение и вычисление с примерами решения Эти вероятности можно использовать для проверки гипотезы о законе распределения случайной величины следующим образом.

Предположим, что гипотеза верна. Выберем вероятность Проверка статистических гипотез - определение и вычисление с примерами решения настолько малой, чтобы ее можно было считать вероятностью практически невозможного события. Для выбранного Проверка статистических гипотез - определение и вычисление с примерами решения и числа степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решенияиз таблицы распределения величины Проверка статистических гипотез - определение и вычисление с примерами решения находим Проверка статистических гипотез - определение и вычисление с примерами решения Если гипотеза верна, то значения Проверка статистических гипотез - определение и вычисление с примерами решения являются практически невозможными, их следует отнести к критической области.

Итак, построена критическая область: Проверка статистических гипотез - определение и вычисление с примерами решения. В предположении, что гипотеза верна, на основе опытных данных вычисляется Проверка статистических гипотез - определение и вычисление с примерами решения. Обозначим это вычисленное значение через Проверка статистических гипотез - определение и вычисление с примерами решения Если Проверка статистических гипотез - определение и вычисление с примерами решения, то произошло событие, которое практически невозможно при верной гипотезе. Это дает повод в гипотезе усомниться и объяснить такое большое значение Проверка статистических гипотез - определение и вычисление с примерами решения неудачным выбором гипотезы, поскольку расхождения между Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения случайными признать нельзя. При Проверка статистических гипотез - определение и вычисление с примерами решения гипотеза отвергается.

Если же окажется, что Проверка статистических гипотез - определение и вычисление с примерами решения то расхождение между гипотезой и опытными данными можно объяснить случайностями выборки. В этом случае можно заключить, что гипотеза не противоречит опытным данным, или что гипотеза правдоподобна. Это, конечно, не означает, что гипотеза верна. Скромность вывода в последнем случае можно объяснить тем, что согласующиеся с гипотезой факты гипотезы не доказывают, а делают ее лишь правдоподобной. В то же время всего один факт, противоречащий гипотезе, ее отвергает.

Замечание 1. Хотя и маловероятно, чтобы Проверка статистических гипотез - определение и вычисление с примерами решения при верной гипотезе превзошло уровень Проверка статистических гипотез - определение и вычисление с примерами решения но это все-таки может случиться и верная гипотеза будет отвергнута. Вероятность такого события равна Проверка статистических гипотез - определение и вычисление с примерами решения и ее можно рассматривать как вероятность ошибки, как вероятность отвергнуть гипотезу, когда она верна. Напомним, что вероятность ошибки, когда гипотеза отвергается, называют уровнем значимости критерия. Не следует думать, что чем меньше уровень значимости, тем лучше. При слишком малых Проверка статистических гипотез - определение и вычисление с примерами решения критерий ведет себя перестраховочно и бракует гипотезу только при кричаще больших значениях Проверка статистических гипотез - определение и вычисление с примерами решения

Замечание 2. Каждый разряд вносит в величину Проверка статистических гипотез - определение и вычисление с примерами решения вклад, равный Проверка статистических гипотез - определение и вычисление с примерами решения где Проверка статистических гипотез - определение и вычисление с примерами решения – среднее число попаданий в данный разряд, если гипотеза верна. При малых значениях Проверка статистических гипотез - определение и вычисление с примерами решения велика роль каждого отдельного наблюдения. Например, если Проверка статистических гипотез - определение и вычисление с примерами решения в этот разряд попало одно 205 наблюдение, то вклад в Проверка статистических гипотез - определение и вычисление с примерами решения этого разряда равен Проверка статистических гипотез - определение и вычисление с примерами решения При Проверка статистических гипотез - определение и вычисление с примерами решения этот вклад будет равен всего лишь Проверка статистических гипотез - определение и вычисление с примерами решения В итоге при малом Проверка статистических гипотез - определение и вычисление с примерами решения от попадания или непопадания в этот разряд наблюдаемого значения существенно зависит окончательный вывод. Чтобы снизить роль отдельных наблюдений, обычно рекомендуется сделать разбивку на разряды так, чтобы все Проверка статистических гипотез - определение и вычисление с примерами решения были достаточно большими. На практике это сводится к требованию иметь в каждом разряде не менее пяти – десяти наблюдений. Для этого разряды, содержащие мало наблюдений, рекомендуется объединять с соседними разрядами.

Пример №1

Были исследованы 200 изготовленных деталей на отклонение истинного размера от расчетного. Сгруппированные данные исследований приведены в виде статистического ряда: Проверка статистических гипотез - определение и вычисление с примерами решения

Требуется по данному статистическому ряду построить гистограмму. По виду гистограммы выдвинуть гипотезу о типе закона распределения отклонений. Подобрать параметры закона распределения (равные их оценкам на основе опытных данных). Построить на том же графике функцию плотности вероятности, соответствующую выдвинутой гипотезе. С помощью критерия согласия проверить согласуется ли выдвинутая гипотеза с опытными данными. Уровень значимости взять, например, равным 0,05.

Решение. Для того чтобы получить представление о виде закона распределения изучаемой величины, построим гистограмму. Для этого над каждым интервалом построим прямоугольник, площадь которого численно равна частоте попадания в интервал (рис. 3.6.3).Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

По виду гистограммы можно выдвинуть предположение о том, что исследуемая случайная величина имеет нормальный закон распределения. Параметры нормального закона (математическое ожидание и дисперсию) оценим на основе опытных данных, считая в качестве представителя каждого интервала его середину:

Проверка статистических гипотез - определение и вычисление с примерами решения

Итак, выдвинем гипотезу, что исследуемая случайная величина имеет нормальный закон распределения Проверка статистических гипотез - определение и вычисление с примерами решения т.е. имеет функцию плотности вероятности

Проверка статистических гипотез - определение и вычисление с примерами решения

График Проверка статистических гипотез - определение и вычисление с примерами решения удобно строить с помощью таблицы функции Проверка статистических гипотез - определение и вычисление с примерами решения (см. прил., табл. П1):

Проверка статистических гипотез - определение и вычисление с примерами решения

Например, точка максимума и точки перегиба имеют ординаты соответственноПроверка статистических гипотез - определение и вычисление с примерами решения

График функции Проверка статистических гипотез - определение и вычисление с примерами решения приведен на рис. 3.6.3.

Вычислим меру расхождения между выдвинутой гипотезой и опытными данными, т.е. величину Проверка статистических гипотез - определение и вычисление с примерами решения. Для этого сначала вычислим вероятности, приходящиеся на каждый интервал в соответствии с гипотезой:Проверка статистических гипотез - определение и вычисление с примерами решения

Аналогично: Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

Вычисление Проверка статистических гипотез - определение и вычисление с примерами решения удобно вести, оформляя запись в виде таблицы. Проверка статистических гипотез - определение и вычисление с примерами решения

Итак, мера расхождения между гипотезой и опытными данными равна Проверка статистических гипотез - определение и вычисление с примерами решения

Построим критическую область для уровня значимости Проверка статистических гипотез - определение и вычисление с примерами решения Число степеней свободы для Проверка статистических гипотез - определение и вычисление с примерами решения равно двум. Так как число интервалов равно пяти, а на величины Проверка статистических гипотез - определение и вычисление с примерами решения наложены три связи: Проверка статистических гипотез - определение и вычисление с примерами решения Проверка статистических гипотез - определение и вычисление с примерами решения В итоге Проверка статистических гипотез - определение и вычисление с примерами решения Для заданного уровня значимости Проверка статистических гипотез - определение и вычисление с примерами решения и числа степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения находим из таблицы распределения Проверка статистических гипотез - определение и вычисление с примерами решения (см. прил., табл. П4) критическое значение Проверка статистических гипотез - определение и вычисление с примерами решения

Критическая область для проверки гипотезы имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения Значение Проверка статистических гипотез - определение и вычисление с примерами решения в критическую область не входит. Вывод: гипотеза опытным данным не противоречит. Меру расхождения Проверка статистических гипотез - определение и вычисление с примерами решения можно объяснить случайностями выборки.

Ответ. Гипотеза опытным данным не противоречит.

Пример №2

В виде статистического ряда приведены сгруппированные данные о времени безотказной работы 400 приборов.Проверка статистических гипотез - определение и вычисление с примерами решения

Согласуются ли эти данные с предположением, что время безотказной работы прибора имеет функцию распределения Проверка статистических гипотез - определение и вычисление с примерами решения? Уровень значимости взять, например, равным 0,02.

Решение. Вычислим вероятности, приходящиеся в соответствии с гипотезой на интервалы:

Проверка статистических гипотез - определение и вычисление с примерами решения

Вычислим Проверка статистических гипотез - определение и вычисление с примерами решения.

Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

Число степеней свободы равно трем, так как на четыре величины Проверка статистических гипотез - определение и вычисление с примерами решения наложена только одна связь Проверка статистических гипотез - определение и вычисление с примерами решения Для трех степеней свободы и уровня значимости Проверка статистических гипотез - определение и вычисление с примерами решения находим из таблицы распределения «хи-квадрат» (см. прил., табл. П4) критическое значение Проверка статистических гипотез - определение и вычисление с примерами решения Значение Проверка статистических гипотез - определение и вычисление с примерами решения входит в критическую область. Вывод: гипотеза противоречит опытным данным. Гипотезу отвергаем и вероятность того, что мы при этом ошибаемся, равна 0,02.

Ответ. Гипотеза опытным данным противоречит.

Пример №3

Монету подбросили 50 раз. Герб выпал 32 раза. С помощью критерия «хи-квадрат» проверить, согласуются ли эти результаты с предположением, что подбрасывали симметричную монету.

Решение. Выдвинем гипотезу, что монета была симметричной. Это означает, что вероятность выпадения герба при каждом броске равна 1/2. В описанном опыте герб выпал 32 раза и 18 раз выпала цифра. Вычисляем Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

Число степеней свободы для Проверка статистических гипотез - определение и вычисление с примерами решения равно Проверка статистических гипотез - определение и вычисление с примерами решения так как слагаемых два, а связь на величины Проверка статистических гипотез - определение и вычисление с примерами решения наложена одна: Проверка статистических гипотез - определение и вычисление с примерами решения Для числа степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения и уровня значимости, например, равного Проверка статистических гипотез - определение и вычисление с примерами решения находим из таблицы распределения «хи-квадрат» (см. прил., табл. П4), что Проверка статистических гипотез - определение и вычисление с примерами решения Это означает, что при уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения критическую область для величины Проверка статистических гипотез - определение и вычисление с примерами решения составляют значения Проверка статистических гипотез - определение и вычисление с примерами решения Вычисленное значение Проверка статистических гипотез - определение и вычисление с примерами решения попадает в критическую область, гипотеза отвергается. Вероятность того, что мы при таком выводе ошибаемся, равна 0,05.

Ответ. Предположение о симметричности монеты не согласуется с опытными данными.

Пример №4

Для каждого из 100 телевизоров регистрировалось число выходов из строя в течение гарантийного срока. Результаты представлены в виде статистического ряда:Проверка статистических гипотез - определение и вычисление с примерами решения

Согласуются ли эти данные с предположением о том, что число выходов из строя имеет пуассоновский закон распределения?

Решение. Если случайная величина Х – число выходов из строя телевизора, имеет пуассоновский закон распределения, тоПроверка статистических гипотез - определение и вычисление с примерами решения

где параметр Проверка статистических гипотез - определение и вычисление с примерами решения неизвестен.

Оценим параметр из опытных данных. В законе распределения Пуассона параметр Проверка статистических гипотез - определение и вычисление с примерами решения равен математическому ожиданию случайной величины. Оценкой математического ожидания служит среднее арифметическое:Проверка статистических гипотез - определение и вычисление с примерами решения

Итак, выдвигаем гипотезу, что изучаемая случайная величина имеет закон распределения

Проверка статистических гипотез - определение и вычисление с примерами решения

Для проверки выдвинутой гипотезы зададим уровень значимости, например, равный 0,02. Последние три разряда, содержащие мало наблюдений, можно объединить. В итоге имеем три разряда и число степеней свободы равно Проверка статистических гипотез - определение и вычисление с примерами решения так как на величины Проверка статистических гипотез - определение и вычисление с примерами решения наложены две связи: Проверка статистических гипотез - определение и вычисление с примерами решения Из таблицы распределения «хи-квадрат» (см. прил., табл. П4) для заданного Проверка статистических гипотез - определение и вычисление с примерами решения и числа степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения находим, что критическая область имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения

Вычислим теперь Проверка статистических гипотез - определение и вычисление с примерами решения. В соответствии с выдвинутой гипотезой разряды имеют вероятности:

Проверка статистических гипотез - определение и вычисление с примерами решения

Вычисление Проверка статистических гипотез - определение и вычисление с примерами решения произведем, фиксируя промежуточные результаты в таблице.Проверка статистических гипотез - определение и вычисление с примерами решения

Вычисленное значение в критическую область не входит. Вывод: гипотеза о пуассоновском законе распределения изучаемой случайной величины опытным данным не противоречит.

Ответ. Гипотеза не противоречит опытным данным.

Пример №5

В течение пяти рабочих дней недели на контактный телефон фирмы поступило соответственно 69, 50, 59, 75, 47 звонков. Можно ли считать при уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения что интенсивность звонков не зависит от дня недели?

Решение. Сначала построим критическую область. Общее количество звонков равно 300. Число степеней свободы равно Проверка статистических гипотез - определение и вычисление с примерами решения, так как разрядов пять, а связей одна Проверка статистических гипотез - определение и вычисление с примерами решения По таблице распределения «хи- квадрат» находим для Проверка статистических гипотез - определение и вычисление с примерами решения что критическое значение Проверка статистических гипотез - определение и вычисление с примерами решения Итак, критическая область имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения

Выдвинем гипотезу, что интенсивность звонков не зависит от дня недели, т.е. с вероятностью 1/5 каждый вызов может поступить в любой рабочий день недели.

В предположении, что гипотеза верна, вычислим значение Проверка статистических гипотез - определение и вычисление с примерами решения. Вычисление удобно оформить в виде таблицы.Проверка статистических гипотез - определение и вычисление с примерами решения

Сумма элементов последнего столбца дает Проверка статистических гипотез - определение и вычисление с примерами решения Вывод: гипотеза опытным данным не противоречит.

Ответ. Гипотеза опытным данным не противоречит.

Проверка гипотезы о независимости двух случайных величин

Постановка задачи. Можно ли по результатам наблюдений двух случайных величин сделать вывод об их зависимости или независимости. В приложениях эта задача имеет следующую постановку. Пусть каждый элемент генеральной совокупности обладает двумя признаками A и B, признак A имеет градации (или уровни) Проверка статистических гипотез - определение и вычисление с примерами решения признак B различается по уровням Проверка статистических гипотез - определение и вычисление с примерами решения Возникает вопрос, связаны ли друг с другом эти признаки?

Естественно считать, что A и B независимы, если при выборе любого элемента генеральной совокупности независимы события «признак A принимает значение Проверка статистических гипотез - определение и вычисление с примерами решения» и «признак B принимает значение Проверка статистических гипотез - определение и вычисление с примерами решения» при всех Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения. Формально это означает, что

 Проверка статистических гипотез - определение и вычисление с примерами решения

для всех Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения. Проверить непосредственно выполнение соотношения (3.6.4) нет возможности, так как значения входящих в него вероятностей неизвестны.

Пусть у взятых наугад Проверка статистических гипотез - определение и вычисление с примерами решения членов генеральной совокупности определены величины признаков A и B. По этим результатам можно найти Проверка статистических гипотез - определение и вычисление с примерами решения – число наблюдений пары значений признаков Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения. Тогда общее число наблюдений значений признака Проверка статистических гипотез - определение и вычисление с примерами решения равноПроверка статистических гипотез - определение и вычисление с примерами решения

Аналогично, число наблюдений признака Проверка статистических гипотез - определение и вычисление с примерами решения равноПроверка статистических гипотез - определение и вычисление с примерами решения

Обычно результаты наблюдений оформляют в виде таблицы, которую называют таблицей сопряженности признаков.

Таблица сопряженности признаков:

Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

Введем обозначения для вероятностей. ПоложимПроверка статистических гипотез - определение и вычисление с примерами решения

Необходимо проверить гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения для всех парПроверка статистических гипотез - определение и вычисление с примерами решения Проверка статистических гипотез - определение и вычисление с примерами решения

Если наблюдений много (хотя бы несколько десятков), то по теореме БернуллиПроверка статистических гипотез - определение и вычисление с примерами решения

Критерий основан на сравнении наблюдаемых чисел появления комбинаций признаков с числами появлений, которые должны были бы быть, если бы признаки были независимы и не подвергались различным случайностям.

Поскольку вероятность наступления двух независимых событий равна произведению вероятностей этих событий, то за оценку вероятности совместного появления событий Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения можно принять произведение Проверка статистических гипотез - определение и вычисление с примерами решения (обе эти дроби – оценки соответствующих вероятностей). Тогда теоретическое число наблюдений пары Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения должно быть равнымПроверка статистических гипотез - определение и вычисление с примерами решения

Эту величину можно назвать теоретическим числом появлений пары Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения. При верной гипотезе величины Проверка статистических гипотез - определение и вычисление с примерами решения не должны значительно отличаться от Проверка статистических гипотез - определение и вычисление с примерами решения О степени расхождения между ними можно судить по величинеПроверка статистических гипотез - определение и вычисление с примерами решения

Если гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения о независимости верна, то при Проверка статистических гипотез - определение и вычисление с примерами решения величина Проверка статистических гипотез - определение и вычисление с примерами решения имеет распределение «хи-квадрат» с Проверка статистических гипотез - определение и вычисление с примерами решения степенями свободы. Число степеней свободы определяется из следующих соображений. Всего слагаемых  Проверка статистических гипотез - определение и вычисление с примерами решения На них накладываются связи. Прежде всего,

Проверка статистических гипотез - определение и вычисление с примерами решения

Определяя Проверка статистических гипотез - определение и вычисление с примерами решения мы воспользовались Проверка статистических гипотез - определение и вычисление с примерами решения равенствами (3.6.5), но в силу  Проверка статистических гипотез - определение и вычисление с примерами решения фактически независимых слагаемых будет Проверка статистических гипотез - определение и вычисление с примерами решения Из тех же соображений в равенствах (3.6.6) только Проверка статистических гипотез - определение и вычисление с примерами решения слагаемое является независимым. Поэтому число степеней свободы

Проверка статистических гипотез - определение и вычисление с примерами решения

В таблице распределения Проверка статистических гипотез - определение и вычисление с примерами решения по заданному уровню значимости Проверка статистических гипотез - определение и вычисление с примерами решения и числу степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения находим Проверка статистических гипотез - определение и вычисление с примерами решения такое, что Проверка статистических гипотез - определение и вычисление с примерами решения Критическая область для проверки гипотезы имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения Остается вычислить фактическое значение Проверка статистических гипотез - определение и вычисление с примерами решения. Если оно попадает в критическую область, то гипотеза отвергается, при этом вероятность ошибочности этого вывода равна Проверка статистических гипотез - определение и вычисление с примерами решения. Если вычисленное значение Проверка статистических гипотез - определение и вычисление с примерами решения не входит в критическую область, то гипотеза опытным данным не противоречит.

Пример №6

Данные о сдаче экзамена 246 студентами сгруппированы в зависимости от места окончания студентом средней школы.Проверка статистических гипотез - определение и вычисление с примерами решения

Можно ли по этим данным заключить, что успеваемость студентов практически не зависит от места получения ими среднего образования? (Уровень значимости взять, например, равным 0,05.)

Решение. Предположим, что успеваемость студентов не зависит от места получения среднего образования (это гипотеза, которую предстоит проверить). Число степеней свободы равно Проверка статистических гипотез - определение и вычисление с примерами решения Для уровня значимости Проверка статистических гипотез - определение и вычисление с примерами решения и числа степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения из таблицы распределения «хи-квадрат» (см. прил., табл. П4) находим критическое значение Проверка статистических гипотез - определение и вычисление с примерами решения Критическую область Проверка статистических гипотез - определение и вычисление с примерами решения составляют значения Проверка статистических гипотез - определение и вычисление с примерами решения. Вычислим фактическое значение Проверка статистических гипотез - определение и вычисление с примерами решения по формуле (3.6.7):

Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

Вычисленное значение Проверка статистических гипотез - определение и вычисление с примерами решения т.е. не является критическим. Расхождения в данных по успеваемости можно объяснить случайными факторами (случайный отбор студентов, случайности при выборе билета на экзамене и т.д.).

Ответ. Предположение о независимости успеваемости студентов от места получения ими среднего образования не противоречит опытным данным.

Проверка параметрических гипотез

Критерий для проверки гипотезы формируют за счет отнесения к критической области выборок, которые при данной гипотезе наименее вероятны. Но может оказаться, что одинаково маловероятных выборок при данной гипотезе больше, чем это необходимо для формирования критерия данного уровня значимости. Тогда трудно решить какие именно выборки следует включать в критическую область. Этих трудностей можно избежать, если вместе с проверяемой гипотезой рассматривать и альтернативные гипотезы.

Пусть случайная величина Х имеет функцию распределения Проверка статистических гипотез - определение и вычисление с примерами решения тип которой известен. Значение параметра Проверка статистических гипотез - определение и вычисление с примерами решения неизвестно, но для Проверка статистических гипотез - определение и вычисление с примерами решения определено множество допустимых значений Проверка статистических гипотез - определение и вычисление с примерами решения Обычно гипотеза об истинном значении параметра Проверка статистических гипотез - определение и вычисление с примерами решения сводится к утверждению, что Проверка статистических гипотез - определение и вычисление с примерами решения принадлежит некоторому множеству Проверка статистических гипотез - определение и вычисление с примерами решения Например, в качестве w может быть названо одно из допустимых значений.

Определение. Параметрической статистической гипотезой Проверка статистических гипотез - определение и вычисление с примерами решения называется утверждение, что Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения что Проверка статистических гипотез - определение и вычисление с примерами решения

Гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения называют нулевой гипотезой и считают, что она истинна, если действительно Проверка статистических гипотез - определение и вычисление с примерами решения При Проверка статистических гипотез - определение и вычисление с примерами решения нулевую гипотезу называют ложной.

Гипотеза, однозначно определяющая вероятностное распределение, называется простой. В противном случае гипотезу называют сложной. Например, гипотеза о симметричности и однородности игрального кубика проста, так как однозначно определяет вероятности всех исходов при подбрасывании кубика. Гипотеза о том, что ошибка измерений имеет нормальный закон распределения, является сложной, так как при разных значениях параметров получаются разные нормальные законы распределения.

Простая параметрическая гипотеза против простой альтернативы может быть описана указанием одной точки Проверка статистических гипотез - определение и вычисление с примерами решения в Проверка статистических гипотез - определение и вычисление с примерами решенияи одной точки Проверка статистических гипотез - определение и вычисление с примерами решения в Проверка статистических гипотез - определение и вычисление с примерами решения

Параметрическую гипотезу проверяют по обычной схеме. Производят Проверка статистических гипотез - определение и вычисление с примерами решения наблюдений случайной величины, в результате которых получают некоторые результаты Проверка статистических гипотез - определение и вычисление с примерами решения В выборочном пространстве Проверка статистических гипотез - определение и вычисление с примерами решения формируется критическая область Проверка статистических гипотез - определение и вычисление с примерами решения при попадании выборки в которую гипотеза отвергается. Но выбор критической области при наличии альтернативной гипотезы имеет свои особенности.

При любом критерии проверки статистической гипотезы по результатам наблюдений возможны ошибки двух типов: ошибка первого рода возникает при отклонении гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения, когда она верна, а ошибка второго рода совершается, если принимается ложная гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения.

Обозначим через Проверка статистических гипотез - определение и вычисление с примерами решения вероятность того, что выборка Проверка статистических гипотез - определение и вычисление с примерами решения попадет в критическую область, если значение параметра равно Проверка статистических гипотез - определение и вычисление с примерами решения. Эта вероятность как функция параметра называется функцией мощности критерия Проверка статистических гипотез - определение и вычисление с примерами решения. При каждом Проверка статистических гипотез - определение и вычисление с примерами решения эта функция показывает с какой вероятностью статистический критерий Проверка статистических гипотез - определение и вычисление с примерами решения отклоняет гипотезу, если на самом деле Х имеет функцию распределения Проверка статистических гипотез - определение и вычисление с примерами решения

Заметим, что Проверка статистических гипотез - определение и вычисление с примерами решения при Проверка статистических гипотез - определение и вычисление с примерами решения равна вероятности ошибки первого рода. Величина Проверка статистических гипотез - определение и вычисление с примерами решения при Проверка статистических гипотез - определение и вычисление с примерами решения равна вероятности ошибки второго рода. Это вероятность непопадания в критическую область, т.е. вероятность принятия гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения: Проверка статистических гипотез - определение и вычисление с примерами решения, когда эта гипотеза ложная.

Разным критериям для проверки гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения сопутствуют разные вероятности Проверка статистических гипотез - определение и вычисление с примерами решения. Естественно желание сделать обе эти вероятности минимально возможными. Но обычно уменьшение одной из них влечет увеличение другой. Необходимо компромиссное решение, которое достигается следующим образом. Выбирают вероятность практически невозможного события в качестве уровня значимости Проверка статистических гипотез - определение и вычисление с примерами решения. Это и есть вероятность ошибки первого рода. Критическую область формируют так, чтобы при заданном уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения, вероятность ошибки второго рода была как можно меньше.

Учет ошибок первого и второго рода позволяет сравнивать между собой критерии. Пусть Проверка статистических гипотез - определение и вычисление с примерами решения – два критерия для проверки гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения, имеющие одинаковые уровни значимости Проверка статистических гипотез - определение и вычисление с примерами решения. Если при этомПроверка статистических гипотез - определение и вычисление с примерами решения

и

Проверка статистических гипотез - определение и вычисление с примерами решения

то критерий Проверка статистических гипотез - определение и вычисление с примерами решения называют более мощным, чем Проверка статистических гипотез - определение и вычисление с примерами решения. Из определения видно, что Проверка статистических гипотез - определение и вычисление с примерами решения имеет большую вероятность отвергнуть ложную гипотезу при одинаковой с Проверка статистических гипотез - определение и вычисление с примерами решения вероятности ошибки первого рода. Если Проверка статистических гипотез - определение и вычисление с примерами решения мощнее любого другого критерия, имеющего уровень значимости a, то Проверка статистических гипотез - определение и вычисление с примерами решения называют наиболее мощным критерием.

Пусть необходимо проверить гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения. Для определенности рассмотрим непрерывную случайную величину Х с функцией плотности вероятности Проверка статистических гипотез - определение и вычисление с примерами решения где параметр Проверка статистических гипотез - определение и вычисление с примерами решения неизвестен. Если наблюдения независимы, то выборочная точка Проверка статистических гипотез - определение и вычисление с примерами решения будучи многомерной случайной величиной, имеет функцию плотности вероятностиПроверка статистических гипотез - определение и вычисление с примерами решения

Согласно сформулированным требованиям относительно ошибок первого и второго рода, критическую область следует выбрать так, чтобы при заданном Проверка статистических гипотез - определение и вычисление с примерами решения вероятность

Проверка статистических гипотез - определение и вычисление с примерами решения

и при этом вероятность

 Проверка статистических гипотез - определение и вычисление с примерами решения

была наибольшей.

Такую задачу впервые решили в начале тридцатых годов прошлого века Ю. Нейман и Э. Пирсон, и полученный ими результат носит их имя. Для формулировки этого результата понадобится понятие взаимной абсолютной непрерывности функций, которое состоит в том, что в каждой точке функции или обе равны нулю, или обе нулю не равны.

Лемма Неймана–Пирсона

Если Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения взаимно абсолютно непрерывны, то для любого Проверка статистических гипотез - определение и вычисление с примерами решения можно указать Проверка статистических гипотез - определение и вычисление с примерами решения что точки выборочного пространства, в которых

Проверка статистических гипотез - определение и вычисление с примерами решения

образуют критическую область Проверка статистических гипотез - определение и вычисление с примерами решения для которой Проверка статистических гипотез - определение и вычисление с примерами решения При этом Проверка статистических гипотез - определение и вычисление с примерами решения будет наиболее мощным критерием для проверки гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения

Замечание. Для дискретных величин в неравенстве (3.6.8) роль Проверка статистических гипотез - определение и вычисление с примерами решения играет вероятность именно тех результатов наблюдений, которые получены, т.е Проверка статистических гипотез - определение и вычисление с примерами решения

Пример №7

Известно, что при тщательном перемешивании теста изюмины распределяются в нем примерно по закону Пуассона, т.е. вероятность наличия в булочке Проверка статистических гипотез - определение и вычисление с примерами решения изюмин равна приблизительно Проверка статистических гипотез - определение и вычисление с примерами решения где Проверка статистических гипотез - определение и вычисление с примерами решения – среднее число изюмин, приходящихся на булочку. При выпечке булочек полагается по стандарту на 1000 булочек 9000 изюмин. Имеется подозрение, что в тесто засыпали изюмин меньше, чем полагается по стандарту. Для проверки выбирается одна булочка и пересчитываются изюмины в ней.

Построить критерий для проверки гипотезы о том, что Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения Вероятность ошибки первого рода взять приблизительно 0,02.

Решение. Для проверки гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативыПроверка статистических гипотез - определение и вычисление с примерами решенияпо лемме Неймана–Пирсона в критическую область следует включить те значения Проверка статистических гипотез - определение и вычисление с примерами решения, для которых

Проверка статистических гипотез - определение и вычисление с примерами решения

где С – некоторая постоянная.

Тогда Проверка статистических гипотез - определение и вычисление с примерами решения Логарифмирование этого неравенства приводит к неравенству Проверка статистических гипотез - определение и вычисление с примерами решения. Так как Проверка статистических гипотез - определение и вычисление с примерами решения то Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

Итак, в критическую область следует включить значения Проверка статистических гипотез - определение и вычисление с примерами решения где значение Проверка статистических гипотез - определение и вычисление с примерами решения зависит от ошибки первого рода. При Проверка статистических гипотез - определение и вычисление с примерами решения по формуле Пуассона получаем вероятности:

 Проверка статистических гипотез - определение и вычисление с примерами решения

Отсюда следует, что если включить в критическую область значения для числа изюмин Проверка статистических гипотез - определение и вычисление с примерами решения то вероятность ошибки первого рода будет равна Проверка статистических гипотез - определение и вычисление с примерами решения Итак, если изюмин в булке окажется три или меньше гипотезу следует отвергнуть в пользу ее альтернативы.

Заметим, что при добавлении в критическую область значения Проверка статистических гипотез - определение и вычисление с примерами решения вероятность ошибки первого рода останется достаточно малой Проверка статистических гипотез - определение и вычисление с примерами решения

Ответ. Проверка статистических гипотез - определение и вычисление с примерами решения

Пример №8

Изготовитель утверждает, что в данной большой партии изделий только 10% изделий низкого сорта. Было отобрано наугад пять изделий и среди них оказалось три изделия низкого сорта. С помощью леммы Неймана–Пирсона построить критерий и проверить гипотезу о том, что процент изделий низкого сорта действительно равен 10 Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы, что процент низкосортных изделий больше 10 Проверка статистических гипотез - определение и вычисление с примерами решения Вероятность ошибки первого рода выбрать 0,01. Какова вероятность ошибки второго рода, если Проверка статистических гипотез - определение и вычисление с примерами решения?

Решение. Согласно проверяемой гипотезе Проверка статистических гипотез - определение и вычисление с примерами решения при альтернативном значении 1 Проверка статистических гипотез - определение и вычисление с примерами решения По лемме Неймана–Пирсона в критическую область следует включить те значения k, для которых

 Проверка статистических гипотез - определение и вычисление с примерами решения

где С – некоторая постоянная.

После сокращения на Проверка статистических гипотез - определение и вычисление с примерами решения неравенство приводится к видуПроверка статистических гипотез - определение и вычисление с примерами решения

Прологарифмируем обе части неравенстваПроверка статистических гипотез - определение и вычисление с примерами решения

или

Проверка статистических гипотез - определение и вычисление с примерами решения

Так как Проверка статистических гипотез - определение и вычисление с примерами решения то выражение в скобке неотрицательно. Поэтому 

Проверка статистических гипотез - определение и вычисление с примерами решения

Значит, в критическую область следует включить те из значений Проверка статистических гипотез - определение и вычисление с примерами решения которые больше некоторого Проверка статистических гипотез - определение и вычисление с примерами решения зависящего от уровня значимости (от вероятности ошибки первого рода). Для определения Проверка статистических гипотез - определение и вычисление с примерами решения в предположении, что гипотеза верна, вычисляем вероятности: Проверка статистических гипотез - определение и вычисление с примерами решения

Если к критической области отнести значения Проверка статистических гипотез - определение и вычисление с примерами решения то вероятность ошибки первого рода будет равна Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

В условиях задачи оказалось, что среди пяти проверенных три изделия бракованных. Значение Проверка статистических гипотез - определение и вычисление с примерами решения входит в критическую область. Гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения отвергаем в пользу альтернативы. Вероятность того, что мы это делаем ошибочно, меньше 0,01.

Вероятностью ошибки второго рода называется вероятность принять ложную гипотезу. Гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения будет принята при Проверка статистических гипотез - определение и вычисление с примерами решения Если вероятность изготовления бракованного изделия на самом деле равна Проверка статистических гипотез - определение и вычисление с примерами решения то вероятность принять ложную гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения равна Проверка статистических гипотез - определение и вычисление с примерами решения

Вероятность ошибки второго рода велика потому, что критерий построен на скудном статистическом материале (всего пять наблюдений!).

Ответ. При уровне значимости 0,01 нулевую гипотезу отвергаем.

Пример №9

Количество первосортных изделий в крупной партии не должно быть менее 90%. Для проверки выбрали наугад 100 изделий. Среди них оказалось только 87 изделий первого сорта. Можно ли считать при вероятности ошибки первого рода, равной 0,05, что в данной партии менее 90 % первосортных изделий?

Решение. Построим критическую область для проверки гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения и посмотрим, попадает ли значение 87 в критическую область. Из леммы Неймана–Пирсона следует (см. рассуждения в примере 3.19 только с учетом неравенства Проверка статистических гипотез - определение и вычисление с примерами решения), что существует такое Проверка статистических гипотез - определение и вычисление с примерами решения, что меньшее или равное k0 число первосортных изделий следует отнести к критической области. Так как независимых опытов проделано много (Проверка статистических гипотез - определение и вычисление с примерами решения), то можно воспользоваться интегральной теоремой Муавра–Лапласа, согласно которой

Проверка статистических гипотез - определение и вычисление с примерами решения

Откуда, с учетом нечетности функции Лапласа, имеем Проверка статистических гипотез - определение и вычисление с примерами решения или Проверка статистических гипотез - определение и вычисление с примерами решения Из таблицы функции Лапласа (см. прил., табл. П2) 227 находим, что Проверка статистических гипотез - определение и вычисление с примерами решения Поэтому Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения Так как Проверка статистических гипотез - определение и вычисление с примерами решения – целое число, то 0 k = 85. Итак, критическую область для проверки нулевой гипотезы составляют значения Проверка статистических гипотез - определение и вычисление с примерами решения Число 87 в критическую область не попадает. Нет оснований сомневаться в том, что в данной партии не менее 90% первосортных изделий.

Ответ. Наличие в выборке менее 90% первосортных изделий можно объяснить случайностями выборки.

Пример №10

Случайная величина Х имеет нормальный закон распределения Проверка статистических гипотез - определение и вычисление с примерами решения причем значение дисперсии Проверка статистических гипотез - определение и вычисление с примерами решения известно. Получены Проверка статистических гипотез - определение и вычисление с примерами решения – результаты Проверка статистических гипотез - определение и вычисление с примерами решения независимых наблюдений случайной величины. Построить критерий для проверки гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения полагая вероятность ошибки первого рода Проверка статистических гипотез - определение и вычисление с примерами решения

Решение. Так как наблюдения независимы, то Проверка статистических гипотез - определение и вычисление с примерами решения-мерная случайная величина Проверка статистических гипотез - определение и вычисление с примерами решения имеет плотность вероятности, равную произведению плотностей вероятности своих компонент: Проверка статистических гипотез - определение и вычисление с примерами решения

Поэтому по лемме Неймана–Пирсона к критической области должны быть отнесены те выборки, для которыхПроверка статистических гипотез - определение и вычисление с примерами решения

После логарифмирования неравенства получаемПроверка статистических гипотез - определение и вычисление с примерами решения

откуда 

Проверка статистических гипотез - определение и вычисление с примерами решения

Так как по условию Проверка статистических гипотез - определение и вычисление с примерами решения то

 Проверка статистических гипотез - определение и вычисление с примерами решения

Итак, в критическую область следует включать выборки, для которых  Проверка статистических гипотез - определение и вычисление с примерами решения Свяжем значение Проверка статистических гипотез - определение и вычисление с примерами решения с величиной ошибки первого рода. Так как нормальный закон устойчив, то сумма Проверка статистических гипотез - определение и вычисление с примерами решения имеет тоже нормальный закон распределения Проверка статистических гипотез - определение и вычисление с примерами решения Если гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения верна, то значение С3 можно найти из условияПроверка статистических гипотез - определение и вычисление с примерами решения

Отсюда Проверка статистических гипотез - определение и вычисление с примерами решения Это означает, что аргумент функции Лапласа отрицателен. В силу нечетности функции Лапласа имеем Проверка статистических гипотез - определение и вычисление с примерами решения По таблице функции Лапласа находим, что Проверка статистических гипотез - определение и вычисление с примерами решения Поэтому Проверка статистических гипотез - определение и вычисление с примерами решения Значит, Проверка статистических гипотез - определение и вычисление с примерами решения Итак, если сумма Проверка статистических гипотез - определение и вычисление с примерами решения окажется меньше величины Проверка статистических гипотез - определение и вычисление с примерами решения то гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения следует отвергнуть в пользу альтернативной гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения

Ответ. Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка гипотезы о значении медианы

Пусть Х непрерывная случайная величина, а m – значение ее медианы, т.е. Проверка статистических гипотез - определение и вычисление с примерами решения Проделано n независимых наблюдений над случайной величиной. Можно ли считать по их результатам Проверка статистических гипотез - определение и вычисление с примерами решения что значение медианы равно m0 против альтернативы, что значение медианы равно m1 (для определенности пусть Проверка статистических гипотез - определение и вычисление с примерами решения )?

Предположим, что значение m действительно равно m0 (т.е. верна нулевая гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения ) и рассмотрим последовательность величин Проверка статистических гипотез - определение и вычисление с примерами решения

Если гипотеза верна, то Проверка статистических гипотез - определение и вычисление с примерами решения Подсчитаем число положительных разностей Проверка статистических гипотез - определение и вычисление с примерами решения в нашей выборке и обозначим его через S.

Величину S можно представить в виде Проверка статистических гипотез - определение и вычисление с примерами решения при Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения при Проверка статистических гипотез - определение и вычисление с примерами решения Заметим, что случайная величина Проверка статистических гипотез - определение и вычисление с примерами решения принимает два значения 0 и 1 с вероятностями Проверка статистических гипотез - определение и вычисление с примерами решения каждое, если гипотеза верна. Поэтому при верной нулевой гипотезе величина S имеет биномиальное распределение:Проверка статистических гипотез - определение и вычисление с примерами решения

Очевидно, что при медиане равной Проверка статистических гипотез - определение и вычисление с примерами решения вероятность Проверка статистических гипотез - определение и вычисление с примерами решения Проверка статистических гипотез - определение и вычисление с примерами решения В итоге задача сводится к проверке гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения против альтернативы Проверка статистических гипотез - определение и вычисление с примерами решения

Согласно лемме Неймана–Пирсона для любого Проверка статистических гипотез - определение и вычисление с примерами решения существует такая постоянная величина С > 0 , что значения k, для которых Проверка статистических гипотез - определение и вычисление с примерами решения

образуют критическую область наиболее мощного критерия. Так же как и в примере 3.19 легко показать, что в критическую область следует относить в первую очередь самые маленькие значения k. Остается только найти наибольшее k, для которого Проверка статистических гипотез - определение и вычисление с примерами решения, где Проверка статистических гипотез - определение и вычисление с примерами решения – вероятность ошибки первого рода.

Пример №11

По результатам независимых наблюдений случайной величины Проверка статистических гипотез - определение и вычисление с примерами решения Проверка статистических гипотез - определение и вычисление с примерами решения Проверка статистических гипотез - определение и вычисление с примерами решения исследователь в отношении медианы m отверг гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения и принял альтернативную гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения Какова вероятность ошибки первого рода при таком выводе?

Решение. Ошибка первого рода совершается, когда отвергается верная гипотеза. Предположим, что нулевая гипотеза верна и медиана m действительно равна 3,5. Только в трех наблюдениях результаты превосходят 3,5. Как было показано выше, при альтернативе Проверка статистических гипотез - определение и вычисление с примерами решения в критическую область следует включать в первую очередь малые значения k. Значение k = 3 было отнесено исследователем к критической области. В предположении, что гипотеза верна имеемПроверка статистических гипотез - определение и вычисление с примерами решения

Откуда  Проверка статистических гипотез - определение и вычисление с примерами решения.

Ответ. Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка гипотезы о равенстве математических ожиданий

Пусть над случайной величиной X проделано n независимых наблюдений, в которых получены результаты Проверка статистических гипотез - определение и вычисление с примерами решения а над величиной Y проделано m независимых наблюдений и получены значения Проверка статистических гипотез - определение и вычисление с примерами решения Предположим, что известны дисперсии Проверка статистических гипотез - определение и вычисление с примерами решения но неизвестны математические ожидания Проверка статистических гипотез - определение и вычисление с примерами решения Пусть, кроме того, каждая серия состоит из достаточно большого числа наблюдений (хотя бы несколько десятков в каждой серии). Построим критерий для проверки по результатам наблюдений гипотезы о том, что Проверка статистических гипотез - определение и вычисление с примерами решения

Предположим, что гипотеза верна. Так как серии опытов достаточно велики, то для средних арифметических имеем приближенные равенстваПроверка статистических гипотез - определение и вычисление с примерами решенияЕсли гипотеза верна, то Проверка статистических гипотез - определение и вычисление с примерами решения и величина Проверка статистических гипотез - определение и вычисление с примерами решения должна быть относительно малой. Напротив, большие значения этой величины плохо согласуются с гипотезой. Поэтому критическую область составят те серии наблюдений, для которых Проверка статистических гипотез - определение и вычисление с примерами решения где С – некоторая постоянная величина.

Свяжем эту постоянную C с уровнем значимостиПроверка статистических гипотез - определение и вычисление с примерами решения Согласно центральной предельной теореме каждая из величин Проверка статистических гипотез - определение и вычисление с примерами решенияраспределена приблизительно нормально, как сумма большого числа одинаково распределенных независимых случайных величин с ограниченными дисперсиями. С учетом того, что Проверка статистических гипотез - определение и вычисление с примерами решения можно утверждать, что Проверка статистических гипотез - определение и вычисление с примерами решения имеет распределение Проверка статистических гипотез - определение и вычисление с примерами решения a Проверка статистических гипотез - определение и вычисление с примерами решения – распределение Проверка статистических гипотез - определение и вычисление с примерами решения Из факта устойчивости нормального закона распределения можно заключить, что при верной гипотезе Проверка статистических гипотез - определение и вычисление с примерами решения тоже имеет нормальный закон распределения с параметрами Проверка статистических гипотез - определение и вычисление с примерами решения и Проверка статистических гипотез - определение и вычисление с примерами решения

Запишем для нормального закона распределения Проверка статистических гипотез - определение и вычисление с примерами решения стандартную формулу (????):

Проверка статистических гипотез - определение и вычисление с примерами решения

или 

Проверка статистических гипотез - определение и вычисление с примерами решения

По заданному Проверка статистических гипотез - определение и вычисление с примерами решения из таблицы функции Лапласа (см. прил., табл. П2) найдем такое Проверка статистических гипотез - определение и вычисление с примерами решения чтобы Проверка статистических гипотез - определение и вычисление с примерами решения или Проверка статистических гипотез - определение и вычисление с примерами решения Тогда при Проверка статистических гипотез - определение и вычисление с примерами решения правая часть равенства (3.6.9) будет равна Проверка статистических гипотез - определение и вычисление с примерами решения. Поэтому при уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения критическую область для проверки гипотезы о равенстве двух математических ожиданий составят те серии наблюдений, для которых Проверка статистических гипотез - определение и вычисление с примерами решения

Замечание 1. Если дисперсии неизвестны, то большое число наблюдений в каждой серии позволяет достаточно точно оценить дисперсии по этим же опытным данным:

Проверка статистических гипотез - определение и вычисление с примерами решения

Пример №12

Среднее арифметическое результатов 25 независимых измерений некоторой постоянной величины равно 90,1. В другой серии из 20 независимых измерений получено среднее арифметическое, равное 89,5. Дисперсия ошибок измерения в обоих случаях одинакова и равна Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения  Можно ли считать, что измерялась одна и та же постоянная величина?

Решение. Выдвигаем гипотезу, что в каждой из серий измерялась одна и та же постоянная величина. Зададимся, например, уровнем значимости Проверка статистических гипотез - определение и вычисление с примерами решения По таблице значений функции Лапласа (см. прил., табл. П2) находим, что Проверка статистических гипотез - определение и вычисление с примерами решения

Тогда критическая область для проверки гипотезы определяется неравенством Проверка статистических гипотез - определение и вычисление с примерами решения Так как в нашем случае Проверка статистических гипотез - определение и вычисление с примерами решения то сомневаться в том, что измерялась одна и та же постоянная величина, оснований нет. Расхождения в значениях средних арифметических можно объяснить ошибками измерений.

Ответ. Предположение о равенстве математических ожиданий не противоречит опытным данным.

Пример №13

По двум независимым выборкам объемов Проверка статистических гипотез - определение и вычисление с примерами решения = 10 и Проверка статистических гипотез - определение и вычисление с примерами решения = 15, извлеченным из нормальных генеральных совокупностей X и Y, найдены оценки дисперсий: Проверка статистических гипотез - определение и вычисление с примерами решения При уровне значимости α = 0,05 проверить гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения D(X)=D(Y) при конкурирующей гипотезе Проверка статистических гипотез - определение и вычисление с примерами решения D(X)>D(Y).
 

Решение. 1) По данным выборки вычисляем

Проверка статистических гипотез - определение и вычисление с примерами решения

2) По табл. П 2.7 (см. приложение 2), учитывая значения 

Проверка статистических гипотез - определение и вычисление с примерами решения

находим число:   Проверка статистических гипотез - определение и вычисление с примерами решения

3) Сравниваем: так как 1,99 < 2,65, т.е. Проверка статистических гипотез - определение и вычисление с примерами решения, то нет основания отвергать гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения
Ответ: гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения : D(X)=D(Y) принимается.

Пример №14

По двум независимым выборкам объемов Проверка статистических гипотез - определение и вычисление с примерами решения=10 и Проверка статистических гипотез - определение и вычисление с примерами решения=15, извлеченным из нормальных генеральных совокупностей X и Y, найдены оценки дисперсий: Проверка статистических гипотез - определение и вычисление с примерами решения При уровне значимости α = 0,1 проверить гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения D(X)=D(Y) при конкурирующей гипотезе Проверка статистических гипотез - определение и вычисление с примерами решения D(X)≠D(Y).
 

Решение. 1) По данным выборки вычисляем

Проверка статистических гипотез - определение и вычисление с примерами решения

2) По табл. П 2.7 (см. приложение 1), учитывая значения 

Проверка статистических гипотез - определение и вычисление с примерами решения

находим число:   Проверка статистических гипотез - определение и вычисление с примерами решения

3) Сравниваем: так как 1,99 < 2,65, т.е. Проверка статистических гипотез - определение и вычисление с примерами решения , то нет основания отвергать гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения.

Ответ: гипотеза H0 : D(X)=D(Y) принимается.

Пример №15

По трем независимым выборкам объемов Проверка статистических гипотез - определение и вычисление с примерами решения = 10 и Проверка статистических гипотез - определение и вычисление с примерами решения = 15 и Проверка статистических гипотез - определение и вычисление с примерами решения = 20, извлеченным из нормальных генеральных совокупностей X, Y и  Z найдены оценки дисперсий: Проверка статистических гипотез - определение и вычисление с примерами решения При уровне значимости α = 0,05 проверить гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения : D(X)=D(Y)=D(Z).
 

Решение. 1) По данным выборок вычисляем: 

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

2) По табл.  П 2.5 (см. приложение 2), учитывая значения 

Проверка статистических гипотез - определение и вычисление с примерами решения

находим число

Проверка статистических гипотез - определение и вычисление с примерами решения

3) Сравниваем: так как 2,06 < 6,0 , т.е. Проверка статистических гипотез - определение и вычисление с примерами решения , следовательно нет основания отвергать нулевую гипотезу.
Ответ: гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения : D(X) = D(Y) =D(Z)  принимают.

Пример №16

По двум независимым выборкам объемов Проверка статистических гипотез - определение и вычисление с примерами решения=10 и Проверка статистических гипотез - определение и вычисление с примерами решения=16, извлеченным из нормальных генеральных совокупностей X и Y, найдены оценки математических ожиданий Проверка статистических гипотез - определение и вычисление с примерами решения и исправленные выборочные дисперсии  Проверка статистических гипотез - определение и вычисление с примерами решения. Проверить нулевую гипотезу:   Проверка статистических гипотез - определение и вычисление с примерами решения :
M(X) = M(Y) при конкурирующей гипотезе  Проверка статистических гипотез - определение и вычисление с примерами решения : M(X) ≠ M(Y) и уровне значимости α = 0,01.
 

Решение  1) Так как Проверка статистических гипотез - определение и вычисление с примерами решения то предварительно проверим гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения D(X)=D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Проверка статистических гипотез - определение и вычисление с примерами решения: D(X)>D(Y). Для этого поступаем по аналогии с решением 1 задачи.

а) По данным выборки вычисляем

Проверка статистических гипотез - определение и вычисление с примерами решения

б) По табл. П 2.7 (см. приложение 2), учитывая значения 

Проверка статистических гипотез - определение и вычисление с примерами решения

находим число:

Проверка статистических гипотез - определение и вычисление с примерами решения

в) Сравниваем: так как 1,44 < 3,89, т.е.  Проверка статистических гипотез - определение и вычисление с примерами решения , то гипотеза о равенстве генеральных дисперсий принимается, то есть различие между    Проверка статистических гипотез - определение и вычисление с примерами решения= 0,62 и Проверка статистических гипотез - определение и вычисление с примерами решения= 0,43 считаем незначительным.

2) Проверим гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения  :  M(X) = M(Y) о равенстве средних при конкурирующей гипотезе
Проверка статистических гипотез - определение и вычисление с примерами решения
а) Найдем по табл.  П 2.6 (см. приложение 2) значение Проверка статистических гипотез - определение и вычисление с примерами решения по заданному α = 0,01 и числу k = 10 + 16 – 2 = 24 :
Проверка статистических гипотез - определение и вычисление с примерами решения
б) Найдем число Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

в) Сравнить числа  Проверка статистических гипотез - определение и вычисление с примерами решения так как Проверка статистических гипотез - определение и вычисление с примерами решения и гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения  :  M(X) = M(Y) о равенстве средних принимается.
Ответ: гипотеза  Проверка статистических гипотез - определение и вычисление с примерами решения  :  M(X) = M(Y) принимается.

Пример №17

По двум независимым выборкам объемов Проверка статистических гипотез - определение и вычисление с примерами решения=10 и Проверка статистических гипотез - определение и вычисление с примерами решения=16, извлеченным из нормальных генеральных совокупностей X и Y, с дисперсиями Проверка статистических гипотез - определение и вычисление с примерами решения вычислены оценки математических ожиданий  Проверка статистических гипотез - определение и вычисление с примерами решения
При уровне значимости α = 0,05 проверить гипотезу  Проверка статистических гипотез - определение и вычисление с примерами решения : M(X) = M(Y)  и конкурирующей гипотезе Проверка статистических гипотез - определение и вычисление с примерами решения : M(X) ≠ M(Y).
 

Решение. Воспользуемся замечанием 6. 1) Вычислим:

Проверка статистических гипотез - определение и вычисление с примерами решения

2) Находим Проверка статистических гипотез - определение и вычисление с примерами решения из уравнения

Проверка статистических гипотез - определение и вычисление с примерами решения

используя табл. П 2.2 (см. приложение 2).
Следовательно,

Проверка статистических гипотез - определение и вычисление с примерами решения

3) Сравниваем: так как 2,19 > 1,96, т.е. Проверка статистических гипотез - определение и вычисление с примерами решения , то гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения отвергают.
Значит, различие генеральных математических ожиданий значительное.
Ответ: гипотеза  Проверка статистических гипотез - определение и вычисление с примерами решения  :  M(X) = M(Y) отвергается, т.е. M(X) ≠ M(Y).

Определение статистической гипотезы

Определение: Статистической гипотезой называется гипотеза о виде неизвестного распределения или о параметрах известного распределения. Выдвинутую гипотезу называется основной (нулевой) и обозначается Проверка статистических гипотез - определение и вычисление с примерами решенияПротиворечащую ей называется конкурирующей (альтернативной) и обозначается Проверка статистических гипотез - определение и вычисление с примерами решения

Гипотеза называется простой, если она содержит только одно предположение. Сложная гипотеза состоит из простых.

Проверка статистических гипотез - определение и вычисление с примерами решения -ошибка первого рода (вероятность отвергнуть правильную гипотезу).

Проверка статистических гипотез - определение и вычисление с примерами решения -ошибка второго рода (вероятность принять неверную нулевую гипотезу). При увеличении Проверка статистических гипотез - определение и вычисление с примерами решения возрастает и Проверка статистических гипотез - определение и вычисление с примерами решения И наоборот. Единственный способ одновременного уменьшения Проверка статистических гипотез - определение и вычисление с примерами решения — увеличение количества испытаний. Величина Проверка статистических гипотез - определение и вычисление с примерами решения носит название мощности критерия.

Статистический критерий проверки основной гипотезы Н0

Статистический критерий проверки основной гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения

 Определение. Для проверки основной гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения используют специально подобранную случайную величину, точное или приближенное распределение которое известно. Эта случайная величина называется статистическим критерием или просто критерием Проверка статистических гипотез - определение и вычисление с примерами решения 

Проверка статистических гипотез - определение и вычисление с примерами решения

Определение. Областью принятия гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения называется совокупность значений критерия, при которых гипотезу принимают. Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают. Точки, отделяющие область принятия гипотезы от критической области, называется критическими точками. Критическая область может быть:

Проверка статистических гипотез - определение и вычисление с примерами решения

Выбор одного из этих случаев определяется видом конкурирующей гипотезы.

Проверка статистических гипотез - определение и вычисление с примерами решения

Основные шаги при проверке статистических гипотез:

1) выдвигаем Проверка статистических гипотез - определение и вычисление с примерами решения

2) выдвигаем Проверка статистических гипотез - определение и вычисление с примерами решения

3) задаем Проверка статистических гипотез - определение и вычисление с примерами решения — уровень значимости

4) строим статистический критерий

5) строим критическую область

6) считаем наблюдаемое значение критерия и сравниваем с критическими точками

7) если наблюдаемое значение попадает в область принятия гипотезы, то нет причины отвергать Проверка статистических гипотез - определение и вычисление с примерами решения если наблюдаемое значение попадает в критическую область, то Проверка статистических гипотез - определение и вычисление с примерами решения отвергается на заданном уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка гипотезы о виде распределения случайной величины. Критерий согласия Пирсона

Пусть Проверка статистических гипотез - определение и вычисление с примерами решения— генеральная совокупность (случайная величина) с неизвестной функцией распределения Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения— выборка (результаты измерений;  Проверка статистических гипотез - определение и вычисление с примерами решения

1) Проверка статистических гипотез - определение и вычисление с примерами решения выборка сделана из генеральной совокупности Проверка статистических гипотез - определение и вычисление с примерами решения с функцией распределения Проверка статистических гипотез - определение и вычисление с примерами решения

2) Проверка статистических гипотез - определение и вычисление с примерами решения функция распределения Проверка статистических гипотез - определение и вычисление с примерами решения отлична от Проверка статистических гипотез - определение и вычисление с примерами решения

3) задаем Проверка статистических гипотез - определение и вычисление с примерами решения — уровень значимости

4) строим статистический критерий

Разобьем область, которой принадлежат результаты измерений, на Проверка статистических гипотез - определение и вычисление с примерами решенияпромежутков Проверка статистических гипотез - определение и вычисление с примерами решения одинаковой длины Проверка статистических гипотез - определение и вычисление с примерами решения

Пусть

Проверка статистических гипотез - определение и вычисление с примерами решения — количество значений Проверка статистических гипотез - определение и вычисление с примерами решения из числа наблюдаемых, которые принадлежат Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения — вероятность того, что значения Проверка статистических гипотез - определение и вычисление с примерами решения принадлежат промежутку Проверка статистических гипотез - определение и вычисление с примерами решениявычисленная в предположении справедливости нулевой гипотезы; 

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения — относительная частота попадания значений Проверка статистических гипотез - определение и вычисление с примерами решения из числа наблюдаемых  промежуток Проверка статистических гипотез - определение и вычисление с примерами решения

Тогда

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения — эмпирическая функция распределения.

За меру отклонения истинной функции распределения Проверка статистических гипотез - определение и вычисление с примерами решения от эмпирической Проверка статистических гипотез - определение и вычисление с примерами решения возьмем следующую случайную величину Проверка статистических гипотез - определение и вычисление с примерами решения

Теорема Пирсона:

Какова бы ни была Проверка статистических гипотез - определение и вычисление с примерами решения при Проверка статистических гипотез - определение и вычисление с примерами решения распределение величины Проверка статистических гипотез - определение и вычисление с примерами решения стремится к распределению хи-квадрат с Проверка статистических гипотез - определение и вычисление с примерами решения степенями свободы.

Замечание. Если в процессе проверки гипотезы приходится производить оценку параметров распределения, то количество степеней свободы  Проверка статистических гипотез - определение и вычисление с примерами решенияуменьшается на количество неизвестных параметров.

Проверка статистических гипотез - определение и вычисление с примерами решения -статистический критерий для проверки нулевой гипотезы

5)    строим критическую область

Критическая область — правосторонняя

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения квантиль распределения хи-квадрат с Проверка статистических гипотез - определение и вычисление с примерами решения степенями свободы.

6) считаем наблюдаемое значение критерия Проверка статистических гипотез - определение и вычисление с примерами решения и сравниваем его с критическим Проверка статистических гипотез - определение и вычисление с примерами решения

7) Вывод: если Проверка статистических гипотез - определение и вычисление с примерами решения то нет оснований отвергнуть нулевую гипотезу на выбранном уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения в противном случае Проверка статистических гипотез - определение и вычисление с примерами решения отвергается на заданном уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения

Пример №18

По выборке объема Проверка статистических гипотез - определение и вычисление с примерами решения проверить гипотезу о нормальном распределении генеральной совокупности.
Проверка статистических гипотез - определение и вычисление с примерами решения

В качестве параметров нормального распределения выберем их точечные оценки: Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения
1) Проверка статистических гипотез - определение и вычисление с примерами решения генеральная совокупность Проверка статистических гипотез - определение и вычисление с примерами решения имеет нормальное распределение с параметрами Проверка статистических гипотез - определение и вычисление с примерами решения
2) Проверка статистических гипотез - определение и вычисление с примерами решения распределение Проверка статистических гипотез - определение и вычисление с примерами решения отлично от Проверка статистических гипотез - определение и вычисление с примерами решения
3) Проверка статистических гипотез - определение и вычисление с примерами решения
4) строим статистический критерий

Проверка статистических гипотез - определение и вычисление с примерами решения

Замечание: если для какого-либо интервала не выполняется условие Проверка статистических гипотез - определение и вычисление с примерами решения то этот интервал объединяется с соседним интервалом.

1,384 — наблюдаемое значение статистического критерия Проверка статистических гипотез - определение и вычисление с примерами решения
5) строим критическую область

Проверка статистических гипотез - определение и вычисление с примерами решения квантиль распределения хи-квадрат с Проверка статистических гипотез - определение и вычисление с примерами решения степенями свободы порядка 1-Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения число неизвестных параметров распределения, которые пришлось оценивать. Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

7) Вывод: нет оснований отвергнуть нулевую гипотезу на уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения

Критерий Колмогорова — Смирнова

в классическом виде является более мощным, чем критерий Пирсона; используется для проверки гипотезы о соответствии эмпирического любому теоретическому непрерывному распределению Проверка статистических гипотез - определение и вычисление с примерами решения с заранее известными параметрами: применим для негруппированных данных или для группированных в случае малой ширины интервала. 

Проверка статистических гипотез - определение и вычисление с примерами решения _ выборка (результаты измерений; Проверка статистических гипотез - определение и вычисление с примерами решения

1) Проверка статистических гипотез - определение и вычисление с примерами решения выборка сделана из генеральной совокупности Проверка статистических гипотез - определение и вычисление с примерами решения с функцией распределения Проверка статистических гипотез - определение и вычисление с примерами решения

2) Проверка статистических гипотез - определение и вычисление с примерами решения функция распределения Проверка статистических гипотез - определение и вычисление с примерами решения отлична от Проверка статистических гипотез - определение и вычисление с примерами решения

3) Проверка статистических гипотез - определение и вычисление с примерами решения — уровень значимости

4)    строим статистический критерий

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения — статистика критерия Колмогорова

5)    строим критическую область

Критическая область — правосторонняя; критические значения Проверка статистических гипотез - определение и вычисление с примерами решения  составляют: Проверка статистических гипотез - определение и вычисление с примерами решенияПроверка статистических гипотез - определение и вычисление с примерами решения

6) сравниваем наблюдаемое значение критерия Проверка статистических гипотез - определение и вычисление с примерами решения с критическим Проверка статистических гипотез - определение и вычисление с примерами решения

7) Вывод: если Проверка статистических гипотез - определение и вычисление с примерами решения то нет оснований отвергнуть нулевую гипотезу на выбранном уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения в противном случае Проверка статистических гипотез - определение и вычисление с примерами решения отвергается на заданном уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка гипотез о параметрах известного распределения генеральной совокупности

Проверка гипотез о параметрах нормально распределенной генеральной совокупности 

 Проверка статистических гипотез - определение и вычисление с примерами решения — выборка

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Пример №19

На завод поступила партия станков. По результатам исследования 13 станков найдена исправленная выборочная дисперсия размера изготовления станками деталей Проверка статистических гипотез - определение и вычисление с примерами решения Требуется ли дополнительная наладка станка, если допустимая характеристика рассеяния контролируемого размера деталей Проверка статистических гипотез - определение и вычисление с примерами решения -уровень значимости)

Решение:

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения нет основания отвергнуть Проверка статистических гипотез - определение и вычисление с примерами решения на уровне значимости 0,01, следовательно подналадка не нужна.

Проверка гипотез о параметре Проверка статистических гипотез - определение и вычисление с примерами решения биномиального распределения.

(сравнение относительной частоты с гипотетической вероятностью Проверка статистических гипотез - определение и вычисление с примерами решения появления события в отдельном испытании)

Проверка статистических гипотез - определение и вычисление с примерами решения выборка;

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

В электронных таблицах Excel для проверки гипотез о параметрах нормально распределенных генеральных совокупностей по результатам экспериментов есть специальные тесты, упрощающие процедуру вычислений.

Двухвыборочный Проверка статистических гипотез - определение и вычисление с примерами решения-тест для средних служит для проверки гипотезы о различии между средними математическими ожиданиями двух нормальных распределений с известными дисперсиями.

Двухвыборочный Проверка статистических гипотез - определение и вычисление с примерами решения-тест с одинаковыми (различными) дисперсиями используется для проверки гипотезы о равенстве средних двух нормально распределенных генеральных совокупностей.

Парный двухвыборочный Проверка статистических гипотез - определение и вычисление с примерами решения-тест используется для проверки гипотезы о равенстве средних в том случае, если обе выборки сделаны из одной и той же генеральной совокупности (например, в разные моменты времени, до и после какого-либо воздействия).

Двухвыборочный  Проверка статистических гипотез - определение и вычисление с примерами решения — тест для дисперсий служит для проверки гипотез о равенстве дисперсий двух нормальных распределений.

Пример №20

На предприятии провели выборочный опрос работающих об их средней заработной плате за предыдущий год. Данные опроса представлены в табл. 1.

Проверка статистических гипотез - определение и вычисление с примерами решения

С  помощью  критерия  Пирсона  проверить  гипотезу  о  том,  что средняя заработная  плата  по  всему  предприятию  распределена  по нормальному закону с уровнем значимости Проверка статистических гипотез - определение и вычисление с примерами решения
 

Решение. Найдем функцию распределения признака  Проверка статистических гипотез - определение и вычисление с примерами решения  в генеральной совокупности,  применяя  формулу Проверка статистических гипотез - определение и вычисление с примерами решения
Для  этого  предварительно  вычислим  среднюю  выборочную  и  исправленную статическую дисперсию  Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

За функцию распределения признака  Проверка статистических гипотез - определение и вычисление с примерами решения  в генеральной совокупности принимается Проверка статистических гипотез - определение и вычисление с примерами решения

Выполним разбиение области значений случайной величины Проверка статистических гипотез - определение и вычисление с примерами решения на  интервалы Проверка статистических гипотез - определение и вычисление с примерами решения таким  образом, чтобы частоты были больше или равны 5. Разбиение представлено в табл. 2.

Проверка статистических гипотез - определение и вычисление с примерами решения

Для расчета теоретического ряда частот необходимо предварительно вычислить значения вероятностей Проверка статистических гипотез - определение и вычисление с примерами решения по формуле

Проверка статистических гипотез - определение и вычисление с примерами решения

и применить формулу для вычисления теоретических частот:

Проверка статистических гипотез - определение и вычисление с примерами решения

где — Проверка статистических гипотез - определение и вычисление с примерами решения

Например.

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

Значение функции Проверка статистических гипотез - определение и вычисление с примерами решения вычисляется по табл. П2 (часть 1) значений функции Лапласа. Результаты вычислений представим в табл. 3.

Проверка статистических гипотез - определение и вычисление с примерами решения

Значения Проверка статистических гипотез - определение и вычисление с примерами решения вычислим по формуле Проверка статистических гипотез - определение и вычисление с примерами решения

Так как два параметра распределения признака в генеральной совокупности находились на основании выборки, то функцию Проверка статистических гипотез - определение и вычисление с примерами решения можно приближенно считать распределенной по закону Проверка статистических гипотез - определение и вычисление с примерами решения степенями свободы (здесь число интервалов Проверка статистических гипотез - определение и вычисление с примерами решения поскольку оценивались два параметра закона распределения). При уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения границей критической области будет Проверка статистических гипотез - определение и вычисление с примерами решения (по табл. П5). Так как Проверка статистических гипотез - определение и вычисление с примерами решения то гипотеза Проверка статистических гипотез - определение и вычисление с примерами решения о нормальном распределении генеральной совокупности принимается.

Следует отметить, что на практике все шире начинают применять критерии согласия не столько для проверки согласия экспериментальных данных с некоторой гипотетической функцией, сколько для подбора наилучшей функции распределения, хотя выбор подходящего закона должен основываться прежде всего на понимании механизма изучаемого явления.

Пример №21

Наблюдалось следующее распределение по минутам числа появлений на остановке автобуса, имеющего пятиминутный интервал движения.
Проверка статистических гипотез - определение и вычисление с примерами решения

Проверить гипотезу о равномерном законе распределения.

Решение. 1. Вычисляем по данному вариационному ряду вероятности Проверка статистических гипотез - определение и вычисление с примерами решения попадания Проверка статистических гипотез - определение и вычисление с примерами решения в интервал по формуле

Проверка статистических гипотез - определение и вычисление с примерами решения

2. Для проверки гипотезы о том, что число появлений автобуса на остановке есть случайная величина, распределенная по равномерному закону, вычисляем критерии Проверка статистических гипотез - определение и вычисление с примерами решения для чего составим таблицу.

Проверка статистических гипотез - определение и вычисление с примерами решения

Контроль: Проверка статистических гипотез - определение и вычисление с примерами решения Вычисления произведены правильно.

3. Определяем Проверка статистических гипотез - определение и вычисление с примерами решения по заданному уровню значимости Проверка статистических гипотез - определение и вычисление с примерами решения и числу степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения то есть Проверка статистических гипотез - определение и вычисление с примерами решения

4.Так как Проверка статистических гипотез - определение и вычисление с примерами решения то нет оснований отклонить гипотезу о равномерном распределении Проверка статистических гипотез - определение и вычисление с примерами решения на отрезке [0; 5].

Пример №22

Рассмотрим вариационный ряд.

Проверка статистических гипотез - определение и вычисление с примерами решения

1. Если построить гистограмму частостей, то ее вид будет напоминать экспоненциальную кривую. Поэтому произведем «выравнивание» статистических данных по показательному закону. Запишем его дифференциальную функцию:

Проверка статистических гипотез - определение и вычисление с примерами решения

Для нахождения точечной оценки параметра Проверка статистических гипотез - определение и вычисление с примерами решения вначале вычислим Проверка статистических гипотез - определение и вычисление с примерами решениязаменив каждый интервал его серединой:

Проверка статистических гипотез - определение и вычисление с примерами решения

Тогда Проверка статистических гипотез - определение и вычисление с примерами решения Следовательно, дифференциальная функции предполагаемого показательного закона распределения имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения

2. Для проверки соответствия эмпирических данных с предполагаемым показательным законом распределения применим критерий согласия Проверка статистических гипотез - определение и вычисление с примерами решения

3. Вычислим вероятности попадания случайной величины Проверка статистических гипотез - определение и вычисление с примерами решения в частичные интервалы Проверка статистических гипотез - определение и вычисление с примерами решения по формуле

Проверка статистических гипотез - определение и вычисление с примерами решения

Для нахождения Проверка статистических гипотез - определение и вычисление с примерами решения построим вспомогательную таблицу.

Проверка статистических гипотез - определение и вычисление с примерами решения

4. Найдем в таблице критических точек Проверка статистических гипотез - определение и вычисление с примерами решения распределения по уровню значимости Проверка статистических гипотез - определение и вычисление с примерами решения и числу степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решениякритическое значение Проверка статистических гипотез - определение и вычисление с примерами решения

5. Так как Проверка статистических гипотез - определение и вычисление с примерами решения то нет оснований для отклонения гипотезы об экспоненциальном законе распределения.

Пример №23

Из продукции цеха случайно отобрано 200 выборок по 5 деталей. Регистрировалось число бракованных деталей. В итоге получен вариационный ряд:

Проверка статистических гипотез - определение и вычисление с примерами решения

Требуется, используя критерий Пирсона при уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения проверить гипотезу о том, что дискретная случайная величина Проверка статистических гипотез - определение и вычисление с примерами решения (число бракованных деталей) распределена по биноминальному закону.

1. Найдем частость Проверка статистических гипотез - определение и вычисление с примерами решения и применим ее в качестве оценки вероятности того, что наудачу взятая деталь окажется бракованной.

По формуле Бернулли Проверка статистических гипотез - определение и вычисление с примерами решения найдем вероятности Проверка статистических гипотез - определение и вычисление с примерами решения того, что интересующее нас событие появится в Проверка статистических гипотез - определение и вычисление с примерами решения испытаниях ровно Проверка статистических гипотез - определение и вычисление с примерами решения раз.

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

2. Для проверки нулевой гипотезы выдвигаем критерий Проверка статистических гипотез - определение и вычисление с примерами решения

где Проверка статистических гипотез - определение и вычисление с примерами решения — число групп выборки, оставшихся после объединения.

3. Вычисляем Проверка статистических гипотез - определение и вычисление с примерами решения При составлении расчетной таблицы для сравнения эмпирических и теоретических частот с помощью критерия Пирсона мы объединим эмпирические частоты Проверка статистических гипотез - определение и вычисление с примерами решения После объединения число групп выборки Проверка статистических гипотез - определение и вычисление с примерами решения

4. Находим Проверка статистических гипотез - определение и вычисление с примерами решения один параметр (вероятность Проверка статистических гипотез - определение и вычисление с примерами решения оценивался по выборке, то есть Проверка статистических гипотез - определение и вычисление с примерами решения поэтому при определении числа степеней свободы

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения значит, нет основании отклонить нулевую гипотезу о биноминальном законе распределения.

Пример №24

Проведено наблюдение за числом вызовов телефонной станции. С этой целью в течение 100 случайно выбранных 5-секундных интервалов времени регистрировалось число вызовов. Получен следующий вариационный ряд:

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверить, используя критерий Проверка статистических гипотез - определение и вычисление с примерами решения гипотезу о том, что распределение числа вызовов согласуется с законом Пуассона. Уровень значимости принять Проверка статистических гипотез - определение и вычисление с примерами решения

Вероятность ровно Проверка статистических гипотез - определение и вычисление с примерами решения вызовов в течение Проверка статистических гипотез - определение и вычисление с примерами решения случайно выбранных отрезков времени вычисляется по формуле Пуассона:

Проверка статистических гипотез - определение и вычисление с примерами решения

1. Найдем точечную оценку параметра Проверка статистических гипотез - определение и вычисление с примерами решения генеральной совокупности:

Проверка статистических гипотез - определение и вычисление с примерами решения

Таким образом, функция вероятностей предполагаемого закона Пуассона имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения

2.Применим критерии Проверка статистических гипотез - определение и вычисление с примерами решения

3. Находим Проверка статистических гипотез - определение и вычисление с примерами решения Для этого все необходимые вычисления приводим в табл. 7.

Проверка статистических гипотез - определение и вычисление с примерами решения

Контроль: Проверка статистических гипотез - определение и вычисление с примерами решения Вычисления произведены верно.

4. По таблице П5 по заданному уровню значимости и числу степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения найдем Проверка статистических гипотез - определение и вычисление с примерами решения

5. Так как Проверка статистических гипотез - определение и вычисление с примерами решения то нет оснований для отклонения гипотезы о том, что закон распределения числа вызовов на телефонной станции является законом Пуассона.

Итак, мы рассмотрели критерий Проверка статистических гипотез - определение и вычисление с примерами решения при помощи которого проверяли гипотезу о согласии данных выборки с конкретным теоретическим законом распределения для любой случайной величины как непрерывной, так и дискретной.

Пример №25

Менеджер кредитного отдела нефтяной компании выясняет, является ли среднемесячный баланс владельцев кредитных карточек, равным 75 у.е. Аудитор случайным образом отобрал 100 счетов и нашел, что среднемесячный баланс владельцев составил 83,4 у.е. с выборочным стандартным отклонением, равным 23,65 у.е. Определить на 5%-м уровне значимости, может ли этот аудитор утверждать, что средний баланс отличен от 75 у.е.

Решение. 1. Исходя из условия задачи, сформулируем гипотезы: 

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения — неизвестно. Уровень значимости Проверка статистических гипотез - определение и вычисление с примерами решения

2. Для проверки гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения применим критерий

Проверка статистических гипотез - определение и вычисление с примерами решения

с двусторонней критической областью.

3. Вычислим Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

5. Так как Проверка статистических гипотез - определение и вычисление с примерами решения то нулевая гипотеза отклоняется. Значит, среднемесячный баланс владельцев карточек отличен от 75 у.е.

Пример №26

По двум независимым выборкам, объемы которых Проверка статистических гипотез - определение и вычисление с примерами решенияизвлеченным из нормальных генеральных совокупностей, найдены выборочные средние: Проверка статистических гипотез - определение и вычисление с примерами решения генеральные дисперсии известны: Проверка статистических гипотез - определение и вычисление с примерами решения Требуется при уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения проверить нулевую гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения при конкурирующей гипотезе: Проверка статистических гипотез - определение и вычисление с примерами решения

Решение. Найдем наблюдаемое значение критерия:

Проверка статистических гипотез - определение и вычисление с примерами решения

По условию конкурирующая гипотеза имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения поэтому критическая область — двусторонняя.

Найдем правую критическую точку из равенства

Проверка статистических гипотез - определение и вычисление с примерами решения

По таблице П2, часть 1, функции Лапласа находим Проверка статистических гипотез - определение и вычисление с примерами решения Так как Проверка статистических гипотез - определение и вычисление с примерами решения то нулевую гипотезу отвергаем, т. е. выборочные средние различаются значимо.

Пример №27

Менеджер предприятия решил выяснить, существует ли разница в производительности труда рабочих дневной и вечерней смены. Случайно организованная выборка 10 рабочих дневной смены показала, что средний выпуск продукции составил 74,3 ед./ч, а выборочная дисперсия оказалась равной Проверка статистических гипотез - определение и вычисление с примерами решения Выборка же 10 рабочих вечерней смены выявила, что средний выпуск продукции равнялся Проверка статистических гипотез - определение и вычисление с примерами решения На 1%-м уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения определить, существует ли разница в производительности труда рабочих вечерней и дневной смены.

Решение. Так как выборочные дисперсии различны, проверим предварительно нулевую гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения равенстве генеральных дисперсий, пользуясь критерием Фишера-Снедекора

Проверка статистических гипотез - определение и вычисление с примерами решения

Найдем отношение большей исправленной дисперсии к меньшей: Проверка статистических гипотез - определение и вычисление с примерами решения Дисперсия 20 больше дисперсии 17,8; дисперсия 18 больше дисперсии 16. Поэтому в качестве альтернативной примем гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения В этом случае критическая область правосторонняя. По таблице П7 критических точек распределения Фишера-Снедекора по уровню значимости Проверка статистических гипотез - определение и вычисление с примерами решения и числам степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения находим

Проверка статистических гипотез - определение и вычисление с примерами решения

Так как Проверка статистических гипотез - определение и вычисление с примерами решения — нет оснований отклонить нулевую гипотезу о равенстве генеральных дисперсий, поскольку предположение о равенстве генеральных дисперсий выполняется, сравним средние. Итак:

Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения (так как Проверка статистических гипотез - определение и вычисление с примерами решения — имеем правостороннюю критическую область.

2. В качестве критерия проверки нулевой гипотезы примем случайную величину Проверка статистических гипотез - определение и вычисление с примерами решения

Проверка статистических гипотез - определение и вычисление с примерами решения

4. Находим Проверка статистических гипотез - определение и вычисление с примерами решения по таблице П6 критических точек распределения Стьюдента Проверка статистических гипотез - определение и вычисление с примерами решения

Так как Проверка статистических гипотез - определение и вычисление с примерами решения то нет оснований отклонить гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения т. е.

не существует разницы в производительности труда рабочих дневной и вечерней смены, а имеющие место различия случайны, незначимы.

Пример №28

Из двух партий изделий, изготовленных на двух одинаково настроенных станках, извлечены малые выборки, объемы которых Проверка статистических гипотез - определение и вычисление с примерами решения Получены следующие результаты:

Проверка статистических гипотез - определение и вычисление с примерами решения Требуется при уровне значимости Проверка статистических гипотез - определение и вычисление с примерами решения проверить гипотезу Проверка статистических гипотез - определение и вычисление с примерами решения при альтернативной гипотезе Проверка статистических гипотез - определение и вычисление с примерами решения Предполагается, что случайные величины Проверка статистических гипотез - определение и вычисление с примерами решенияраспределены нормально.

Решение. Рассматриваемый в этом параграфе критерий предполагает, что генеральные дисперсии одинаковы, но исправленные дисперсии различны, поэтому вначале нужно сравнить дисперсии, используя критерий Фишера-Сиедекора. Сделаем это, приняв в качестве альтернативной гипотезы Проверка статистических гипотез - определение и вычисление с примерами решения Найдем наблюдаемое значение критерия: Проверка статистических гипотез - определение и вычисление с примерами решения Пo таблице П7 критических точек распределения Фишера-Снедекора находим Проверка статистических гипотез - определение и вычисление с примерами решения Так как Проверка статистических гипотез - определение и вычисление с примерами решения — дисперсии различаются незначимо и, следовательно, можно считать, что допущение о равенстве генеральных дисперсий выполняется.

Сравним средние, для чего вычислим наблюдаемое значение критерия Стьюдента:

Проверка статистических гипотез - определение и вычисление с примерами решения

По условию, альтернативная гипотеза имеет вид Проверка статистических гипотез - определение и вычисление с примерами решения поэтому критическая область двусторонняя. По уровню значимости Проверка статистических гипотез - определение и вычисление с примерами решения и числу степеней свободы Проверка статистических гипотез - определение и вычисление с примерами решения находим по таблице критических точек распределения Стьюдента критическую точку Проверка статистических гипотез - определение и вычисление с примерами решения

Так как Проверка статистических гипотез - определение и вычисление с примерами решения — нет оснований отвергнуть гипотезу о равенстве средних.

Таким образом, средние размеры изделий существенно не различаются.

  • Регрессионный анализ
  • Корреляционный анализ
  • Статистические решающие функции
  • Случайные процессы
  • Доверительный интервал для вероятности события
  • Проверка гипотезы о равенстве вероятностей
  • Доверительный интервал для математического ожидания
  • Доверительный интервал для дисперсии

Процедура проверки нулевой гипотезы в
общем случае включает следующие этапы:

1. задается допустимая вероятность
ошибки первого рода (Ркр=0,05)или 5 %

2. выбирается статистика критерия (Т)

3. ищется область допустимых значений
Ткрит.-опред по статис. таблицу

4. по исходным данным вычисляется
значение статистики Т эмп.

5. если Т эмп(статистика критерия)
принадлежит области принятия нулевой
гипотезы( Тэмп<Ткрит), то нулевая
гипотеза принимается. Т О делается
заключение, что исходные данные не
противоречат нулевой гипотезе), а в
противном случае нулевая гипотеза
отвергается и принимается альтернативная
гипотеза. Это основной принцип проверки
всех статистических гипотез.

В современных статистических пакетах
используются не стандартные уровни, а
уровни значимости, подсчитываемые в
процессе работы с соответствующим
статистическим методом.

При проверке статистических гипотез с
помощью статистических пакетов, программа
выводит на экран вычисленное значение
уровня значимости Р и подсказку о
возможности принятия или неприятия
нулевой гипотезы.

Рассчитанный и показанный уровень на
экране необходимо сравнить с допустимой
вероятностью ошибки первого рода. Чем
меньше вычисл. значение тем более
исходные данные противоречат нулевой
гипотезе.

(если вычисленное значение Р превосходит
выбранный уровень Ркр,

то принимается нулевая гипотеза, а в
противном случае — альтернативная
гипотеза).

Число степеней свободы(К) – число
свободно варьируемых наблюдений после
опред интересующего параметра.(из книги
-число опытов, по которым рассчитан
данный параметр, минус количество
одинаковых значений, найденных по этим
опытам независимо друг от друга.)

Мощность критерия (Ф) – вероятность
отклонения неверной нулевой гипотезы,
т.е. вероятность попадания критерия в
критическую область (вероятность
правильного решения).

Чем больше Ф, тем вероятность ошибки
2-го рода меньше, т.е Ф хар-ет его способность
избежать ошибки 2 рода.

=ошибка первого рода- можно отвергнуть
нулевую гипотезу, когда она на самом
деле верна.

=ошибка второго рода -можно принять
нулевую гипотезу, когда она на самом
деле не верна.

Если Р больше 0,1-принимается Но

Р ≤0,1 – сомнения в истинности Но,неопред-ть.

Р ≤0,05 – значимость,отклон. Но

Р≤0,01 – высокая значимость, отклонение
Но.

18.Уровень значимости, репрезентативность. Примеры.

Уровень значимости – это вероятность
ошибки первого рода при принятии решения
(вероятность ошибочного отклонения
нулевой гипотезы).

Альтернативные гипотезы принимаются
тогда и только тогда, когда опровергается
нулевая гипотеза. Это бывает в случаях,
когда различия, скажем, в средних
арифметических экспериментальной и
контрольной групп настолько значимы
(статистически достоверны), что риск
ошибки отвергнуть нулевую гипотезу и
принять альтернативную не превышает
одного из трех принятых уровней значимости
статистического вывода:

=первый уровень — 5% (р=5%); где допускается
риск ошибки в выводе в пяти случаях из
ста теоретически возможных таких же
экспериментов при строго случайном
отборе испытуемых для каждого эксперимента;

=второй уровень — 1%, т. е. соответственно
допускается риск ошибиться только в
одном случае из ста;

=третий уровень — 0,1%, т. е. допускается
риск ошибиться только в одном случае
из тысячи.

Последний уровень значимости предъявляет
очень высокие требования к обоснованию
достоверности результатов эксперимента
и потому редко используется. В
педагогических исследованиях, не
нуждающихся в очень высоком уровне
достоверности, представляется разумным
принять 5% уровень значимости.

При проверке статистических гипотез
возможны ошибки (ошибочные суждения)
двух видов:

=ошибка первого рода- можно отвергнуть
нулевую гипотезу, когда она на самом
деле верна.

=ошибка второго рода -можно принять
нулевую гипотезу, когда она на самом
деле не верна.

Ошибка, состоящая в принятии нулевой
гипотезы, когда она ложна, качественно
отличается от ошибки, состоящей в
отвержении гипотезы, когда она истинна.
Эта разница очень существенна вследствие
того, что различна значимость этих
ошибок.

Пример 1. В результате, прежде чем
выпускать в продажу вновь произведенную
партию лекарства, ее подвергают
исследованию на токсичность биологическими
методами. Малые дозы лекарства вводятся
некоторому количеству подопытных
животных, например, мышей, и результат
регистрируют. Если лекарство токсично,
то все или почти все животные гибнут. В
противном случае норма выживших велика.

Исследование лекарства может привести
к одному из возможных способов действия:
выпустить партию в продажу (а1), вернуть
партию поставщику для доработки или,
может быть, для уничтожения (а2).

Сначала рассмотрим случай, когда
применяется действие а1, в то время когда
предпочтительнее а2. Лекарство опасно
для пациента, в то время как оно признано
безопасным. Ошибка этого вида может
вызвать смерть пациентов, употребляющих
этот препарат. Это ошибка первого рода,
так как нам важнее ее избежать.

Однако случайное отвержение совершенно
безопасного лекарства, очевидно, менее
нежелательно, чем, пусть даже изредка
происходящие гибели пациентов. Отвержение
нетоксичной партии лекарства – ошибка
второго рода.

На всяк случай.

Если Р больше 0,1-принимается Но

Р ≤0,1 – сомнения в истинности Но,неопред-ть.

Р ≤0,05 – значимость,отклон. Но

Р≤0,01 – высокая значимость, отклонение
Но.

Одной из основных задач статистического
анализа является получение по имеющейся
выборке достоверных сведений о
интересующих исследователя характеристиках
генеральной совокупности. Поэтому
важным требованием к выборке является
ее репрезентативность, то есть правильная
представимость в ней пропорций генеральной
совокупности.

Репрезентативность выборки- свойство
выборки представлять изучаемые явления
достаточно полно с точки зрения
изменчивости генерал совокупности.

Достижению репрезентативности может
способствовать такая организация
эксперимента, при которой элементы
выборки извлекаются из генеральной
совокупности случайным образом.В силу
закона больших чисел можно утверждать,
что выборка будет репрезентативной,
если ее осуществить случайно: каждый
объект выборки отобран случайно из
генеральной совокупности, если все
объекты имеют одинаковую вероятность
попасть в выборку.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

2.1.1. Основные понятия о статистической гипотезе

Полученные
в экспериментах выборочные данные
всегда ограничены и носят в значительной
степени случайный характер. Именно
поэтому для анализа таких данных и
используется математическая статистика,
позволяющая обобщать закономерности,
полученные на выборке, и распространять
их на всю генеральную совокупность.

Однако,
в связи с действием случайных причин,
оценка параметров генеральной
совокупности, сделанная на основании
экспериментальных (выборочных) данных,
всегда будет сопровождаться погрешностью,
и поэтому подобного рода оценка должна
рассматриваться как предположительное,
а не как окончательное утверждение.
Подобные предположения о свойствах и
параметрах генеральной совокупности
носят название статистических гипотез.

Сущность
проверки статистической гипотезы
заключается в том, чтобы установить,
согласуются ли экспериментальные
данные и выдвинутая гипотеза, допустимо
ли отнести расхождение между гипотезой
и результатом статистического анализа
экспериментальных данных за счет
случайных причин?

Рассмотрим
простой пример. Подбросим монету 10 раз.
Если монета не имеет дефектов формы,
то количество выпадений герба и цифры
должно быть примерно одинаковым. Таким
образом, возможны гипотезы:


монета правильная и частота выпадений
герба и цифры примерно одинакова,


монета деформирована и чаще выпадает
герб,


монета деформирована и чаще выпадает
цифра.

Но
нам надо выразить понятия «правильная»
или «деформированная» монета в
математических параметрах. В качестве
параметра выбираем вероятность Р
выпадения герба. Тогда приведенные выше
гипотезы можно записать (в порядке
упоминания) так:


Р = ½,


Р > ½,


Р < ½.

При
проведении эксперимента надо ответить
на вопрос, какая же из приведенных
гипотез верна?

При
проверке статистических гипотез
используется два понятия: нулевая
гипотеза (ее обозначают Н0) и альтернативная
гипотеза (обозначение Н1). Как правило,
принято считать, что нулевая гипотеза
Н0 – это гипотеза о сходстве, а
альтернативная Н1 – гипотеза о различии.
Таким образом, принятие нулевой гипотезы
свидетельствует об отсутствии различий,
а альтернативной – о наличии различий.

Для
нашего примера в качестве нулевой
(будем называть ее основной) гипотезы
Н0 принимаем – монета правильная, а
качестве альтернативной гипотезы Н1 –
монета деформированная. Альтернативных
гипотез может быть несколько. В нашем
случае их две (больше и меньше ½).

2.1.2. Ошибки при проверке статистических гипотез

Обозначим
через N множество всевозможных
результатов наблюдений (выборок) m.
Выделим в N область n , исходя из следующих
соображений: если гипотеза Н0 верна,
то наступление события m ∈
n маловероятно. Это записывается так:

Р
{ m ∈
n/Но} = α ,

где
α – малое число, близкое к нулю.

Иными
словами, вероятность Р события m ∈
n при условии, что верна гипотеза Н0,
равна α. Если это событие все же произошло,
то гипотеза Н0 отвергается. При этом
сохраняется небольшая вероятность
(учитывая, что α мало, но не равно нулю),
что гипотеза Н0 отвергается, хотя она
верна. Такая ошибка называется ошибкой
первого рода. Ее вероятность равна α.

Возможна
и ошибка второго рода β, которая состоит
в том, что гипотеза Н0 принимается, хотя
она неверна, а верна альтернативная
гипотеза Н1.

Р
{m ∈
n/Н1} = β.

Разберем
порядок проверки статистических гипотез
на примере. Допустим, что проводится
приемочный контроль партии продукции.
Известно, что в партии могут содержаться
дефектные изделия. Поставщик полагает,
что доля дефектных изделий составляет
не более 3%, а заказчик считает, что
качество изготовления изделий низкое
и доля дефектных изделий значительна
и составляет 20%. Между поставщиком и
заказчиком достигнута следующая
договоренность: партия продукции
принимается, если в выборке из 10 изделий
будет обнаружено не более одного
дефектного изделия.

Требуется
в процессе решения примера сформулировать:


нулевую (основную) и альтернативную
гипотезы,


определить критическую область и
область принятия нулевой гипотезы,


определить, в чем состоят ошибки первого
и второго рода, и найти их вероятность.

Если
смотреть на ситуацию с точки зрения
заказчика (потребителя), учитывая, что
заказчик всегда прав, то нулевой гипотезой
Н0 следует принять гипотезу, что
продукция содержит 20% брака. Альтернативная
гипотеза Н1 соответствует версии
поставщика – 3% брака.

Поскольку
отбирается 10 изделий, то множество
возможных результатов (наличие дефектного
изделия) составит N = (0,1,2,3…10), так как в
выборке может оказаться и 0, и 10 дефектных
изделий. По условиям поставок, принятым
и заказчиком, и поставщиком, гипотеза
заказчика Н0 считается:

− отвергнутой,
если число дефектов находится в области
n = {0,1};

− принятой,
если число дефектов находится в области
n = {2,3,4…10}.

Область
результатов выборки, при попадании в
которую принятая гипотеза отвергается,
называется критической. В нашем
случае это – область n = {0,1}.

Напомним,
что ошибка первого рода возникает тогда,
когда гипотеза Н0 отвергается, хотя
она верна. Для нашего примера это
означает, что партия изделий принимается
(закупается), хотя в ней 20% дефектных
изделий. Ошибка второго рода для
нашего примера возникает тогда, когда
нулевая гипотеза принимается (т.е.
партия бракуется), в то время как верна
альтернативная гипотеза (дефектных
изделий всего 3%). Найдем вероятность
этих ошибок.

Сначала
заметим, что число дефектных изделий m
является биномиальной, случайной
величиной. Если допустить, что гипотеза
Н0 верна то в выборке N=10 этому
соответствует 2 случая: m =0 и m = 1. Тогда
биномиальная величина имеет вид Bi
(10;2). Найдем вероятность каждого из двух
событий:

Р(m
= 0) = (0,8)10
=
0,107,

Р(m
= 1) = 10·(0,8)9·0,2
= 0,268.

Тогда
ошибка первого рода α будет равна сумме
этих вероятностей:

α
= Р (m ≤ 1) = Р (m=0/Н0) + Р (m =1/Н0) = 0,375.

Если
верна гипотеза Н1, то вероятность
выбрать дефектное изделие составляет
по условию примера 0,03 (3%). Ошибка
второго рода произойдет, если из 10
изделий в выборке окажутся дефектных
2 и более. В этом случае биномиальная
величина имеет вид Bi (10;0,03). Тогда для
событий m ≤ 1 вероятность составит:

Р(m=0)
= (0,97)10
=
0,737,

Р(m=1)
= 10·(0,97)0,03
= 0,228.

Таким
образом, вероятность альтернативных
событий (m > 1) составит величину ошибки
второго рода β:

β
= Р(m>1/Н1) = 1 – Р(m ≤ 1/Н1) = 1 – Р(m =0/Н1) –
Р(m=1/Н1) = =1 – 0,737 – 0,228 = 0,035.

Из
сравнения ошибок α и β можно заключить,
что оговоренная процедура по приему
партии выгодна скорее поставщику, чем
потребителю (заказчику).

Соседние файлы в папке УК работы

  • #
  • #
  • #

    11.08.201936.84 Кб25ЛР 6 УК1.xlsx

  • #

    11.08.201919.67 Кб23ЛР 6 УК2.xlsx

  • #

    11.08.201941.03 Кб24лр7.xlsx

  • #

    11.08.201977.53 Кб25лр8.xlsx

 План:

1.      Статистические гипотезы. Основные понятия.

2.      Гипотезы о законе распределения.

3.      Гипотезы о числовом значении генерального
среднего и дисперсии.

1.     
Статистические гипотезы. Основные понятия.

Статистическая гипотеза  это утверждение о виде неизвестного
распределения или параметрах известного распределения. Статистические гипотезы
проверяются по результатам выборки статистическими методами в ходе эксперимента
(эмпирическим путем) с помощью статистических критериев.

В тех случаях, когда
известен закон, но неизвестны значения его параметров (дисперсия или
математическое ожидание) в конкретной ситуации, статистическую гипотезу
называют параметрической.

Например, предположение
об ожидаемом среднем доходе по акциям или разбросе дохода являются
параметрическими гипотезами.

Когда закон
распределения генеральной совокупности не известен, но есть основания
предположить, каков его конкретный вид, выдвигаемые гипотезы о виде его
распределения называются непараметрическими.

Например, можно
выдвинуть гипотезу, что число дневных продаж в магазине или доход населения
подчинены нормальному закону распределения.

По содержанию статистические гипотезы можно классифицировать:

1.                     
Гипотезы о типе вероятностного закона
распределения случайной величины, характеризующего явление или процесс.

2.                     
Гипотезы об однородности двух или более
обрабатываемых выборок. Изучаемое свойство исследуется  с помощью двух или более генеральных
совокупностей. Гипотеза в этом случае может заключаться в следующем: исследуемые
выборочные характеристики различаются между собой статистически значимо или
нет.

3.                     
Гипотезы о свойствах числовых значений
параметров исследуемой генеральной совокупности. Больше ли значения параметров
некоторого заданного номинала или меньше и т.д.

4.                     
Гипотезы о вероятностной зависимости двух
или более признаков, характеризующих различные свойства рассматриваемого
явления или процесса. При этом определяется характер этой зависимости.

Гипотезы бывают простые (содержащие одно предположение) и сложные (содержащие несколько предположений).

Выдвинутую гипотезу называют основной или нулевой и обозначают H0
. Противоречащую ей гипотезу называют альтернативной или конкурирующей и обозначают
H1.

Под статистическим
критерием
понимают однозначно определенное правило, устанавливающее
условие, при котором проверяемая гипотеза отвергается либо не отвергается.

Пример:

Увеличение числа заболевших некоторым
заболеванием дает возможность выдвинуть гипотезу о наличии эпидемии. Для сравнения
доли заболевших в обычных и экстремальных условиях используются статистические
данные, на основании которых делается вывод о том, является ли данное массовое
заболевание эпидемией. Предполагается, что существует некоторый критерий-
уровень доли заболевших, критический для этого заболевания, который
устанавливается по ранее имевшимся случаям.

Различают три вида критериев:

1.                     
Параметрические критерии
критерии значимости, которые служат для проверки гипотез о параметрах
распределения генеральной совокупности при известном виде распределения.

2.                     
Критерии согласия
позволяют проверить гипотезы о соответствии распределений генеральной
совокупности известной теоретической модели.

3.                     
Непараметрические критерии
используются в гипотезах, когда не требуется знаний о конкретном виде
распределения.

Проверка
параметрических гипотез проводится на основе критериев значимости., а
непараметрических- критериев согласия.

Задача проверки
статистических гипотез сводится к исследованию генеральной совокупности по
выборке. Множество возможных значений элементов выборки может быть разделено на
два непересекающихся подмножества- критическую область и область принятия
гипотезы.

Областью принятия гипотезы или областью допустимых значений Iдоп

называют совокупность значений критерия,
при которых эту гипотезу принимают.

Критической областью
Iкр называют множество значений критерия, при
котором гипотезу отвергают.

Наблюдаемые значения критерия (статистика) 
Kнабл

называют такое значение критерия, которое
находится по данным выборки.

Границы критической области, отделяющие ее от
области принятия гипотезы, называют критическими точками и обозначают

Kкр.

Для определения
критической области задается уровень значимости

 
некая малая вероятность попадания критерия в критическую область.

Уровень значимости— вероятность принятия
конкурирующей гипотезы, тогда как справедлива основная.

С помощью уровня
значимости определяются границы критической области.

Основной принцип проверки статистических гипотез
состоит в следующем: если наблюдаемое значение статистики критерия попадает (не
попадает) в критическую область, то гипотеза H0
 

отвергается (принимается), а гипотеза H1 

принимается (отвергается) в качестве одного из
возможных решений с формулировкой «гипотеза

H0 противоречит (не противоречит) выборочным
данным на уровне значимости

».

В зависимости от
содержания альтернативной гипотезы осуществляется выбор критической области:
левосторонней, правосторонней, двусторонней. Если смысл исследования заключается
в доказательстве конкретного изменения наблюдаемого параметра (его уменьшения
или увеличения), то говорят об односторонней критической области. Если смысл
исследования- выявить различия в изучаемых параметрах, но характер их
отклонения от контрольных (или теоретических) не известен, то говорят о
двусторонней критической области.

Однако, принятие той
или иной гипотезы не дает оснований утверждать, что она верна. Результат
проверки статистической гипотезы лишь устанавливают на определенном уровне
значимости ее соответствие (несоответствие) результатам эксперимента.

При проверке
статистических гипотез возможны следующие ошибки:

1.     
Отвергнута правильная
H0, а принята неправильная  гипотеза
H1ошибка
первого рода
.

2.    Отвергнута правильная альтернативная
гипотеза 

H1 и
принята неправильная нулевая гипотеза  H0


ошибка второго рода.

Заметим, что уровень значимости 
есть вероятность ошибки первого рода. Ошибка первого рода называется 

-риском. Обычно они задаются
некоторыми конкретными значениями: 0,05; 0,01; 0,005; 0,001. Ошибки второго
рода называются
-риском, а вероятность ее
допустить обозначается

(вероятность того, что принята гипотеза 
H0
, когда на самом деле справедлива
альтернативная гипотеза H1

.

Можно доказать, что с
уменьшением ошибок первого рода одновременно увеличиваются ошибки второго рода
и наоборот. Поэтому, на практике пытаются подбирать значения параметров

и  
опытным путем в целях минимизации суммарного
эффекта от возможных ошибок. При принятии управленческих решений для
одновременного уменьшения ошибок первого и второго рода самым действенным
средством является увеличение объема выборки, что согласуется с законом больших
чисел.

На бытовом уровне
ошибки второго рода могут иметь более трагические последствия, чем ошибки
первого рода.

2. Гипотеза о законе распределения. Критерий согласия Пирсона (
X2
-критерий).

Критериями согласия называют критерии, в
которых гипотеза определяет закон распределения либо полностью, либо с
точностью до небольшого числа параметров.

Причины расхождения
результатов эксперимента и теоретических характеристик могут быть вызваны малым
объемом выборки, неудачным способом группировки наблюдений, ошибками в
выборе  гипотезы о виде распределения
генеральной совокупности и др.

Рассмотрим
универсальный критерий согласия Пирсона. Проверка гипотезы о том, что
эмпирическая частота мало отличается от соответствующей теоретической частоты,
осуществляется с помощью величины
X2

меры расхождения между ними.

Для произвольной
выборки, когда распределение непрерывно или число различных вариант велико, все
пространство наблюдаемых вариант делят на конечное число непересекающихся
областей, в каждой из которых подсчитывают наблюдаемую частоту и теоретическую
вероятность.

Для применения критерия
согласия Пирсона необходимо:

1.                      Вычислить значение статистики по формуле:
, где 
pi –вероятность
принятия значения 

xi, ni.
— эмпирическая частота для
соответствующего

xi. n— объем выборки. s— число вариант выборки.

2.                     
 По
соответствующей таблице распределения Пирсона найти критическое значение
, где k = s
r
– 1 – число степеней свободы,
s
число различных вариант или интервалов группировки,
r— число неизвестных параметров
предполагаемого теоретического распределения,

— выбранный уровень значимости. Это
значит, что строится правосторонний интервал.

3.                     
Если
 ,
то основная гипотеза отвергается, в противном случае- принимается, т.е. чем
больше отклонение, тем меньше согласованы теоретическое и эмпирическое
распределение. Поэтому принято использовать только правостороннюю критическую
область.

Расчетная таблица имеет вид:

Интервалы

Середины
i-го
интервала xi

Эмпирические
частоты ni

Вероятности pi

Теоретические
частоты npi

Пример:

По таблице
эмпирического распределения изменения в процентах темпа роста акций проверьте
гипотезу о нормальном распределении выборки.

Интервалы

(-2;
-1)

(-1;
0)

(0;
1)

(1;
2)

Итого

ni

7

14

18

11

50

pi

0,157

0,341

0,341

0,157

1

Решение:

Гипотезу о нормальном
распределении проверим по критерию Пирсона.

Интервалы

Эмпирические
частоты ni

Вероятности pi

Теоретические
частоты npi

(-2;
-1)

7

0,157

7,85

0,7225

0,092

(-1;
0)

14

0,341

17,05

9,3025

0,546

(0;
1)

18

0,341

17,05

0,9025

0,053

(1;
2)

11

0,157

7,85

9,925

1,264

Итого

=1,955

По таблице найдем
при =0,05 
и
k = sr – 1 = 4 – 2 – 1 = 1. s = 4 – число
интервалов.
r
= 2- число параметров теоретического (нормального) распределения.

Имеем . Т.к. 1,955 < 3,841, то
, т.е. гипотеза о нормальном
распределении подтверждается.

3.      Гипотезы о числовом значении генерального
среднего и дисперсии.

Установление двусторонней критической
области на уровне значимости

 для
проверки гипотезы соответствует отысканию соответствующего доверительного
интервала с надежностью

.

Рассмотрим условия применения некоторых
статистических гипотез.

Тип гипотезы H0

Границы критической области на уровне значимости

Статистика наблюдений

О числовом значении
генерального среднего  нормального
распределения
M(X) = m =
, с известным среднеквадратическим
отклонением.

О числовом значении
генерального среднего  нормального
распределения
M(X) = m =
m0, с неизвестной среднеквадратическим
отклонением

Распределение
Стьюдента

О числовом значении
дисперсии нормального распределения

, или

Распределение Пирсона

Пример:

Результаты исследований в течение 35 лет
показали, что среднее изменение доходности векселей равно 5,5 %. Полагая, что
изменение доходности подчиняется нормальному закону распределения с
среднеквадратическим отклонением равным 2 %, на уровне значимости

, решите: можно ли принять 6 %  в качестве нормативного процента
(математического ожидания) изменения доходности.

Решение:

По условию задачи
нулевая гипотеза

. Так как
, то в качестве альтернативной гипотезы
возьмем гипотезу:

, которой соответствует левосторонняя
критическая область с интервалом
.

Найдем границы
критической области:

По таблице значений
функции Ф(х) найдем

, т.е. левосторонняя критическая область
лежит в интервале
.

Найдем статистику
наблюдений:

 .

Имеем:, нет основания отвергать нулевую
гипотезу. Значит, в качестве нормативного процента можно принять 6 %.

Пример:

Точность работы
программы проверяют по дисперсии контролируемого количества символов в коде,
которая не должна превышать 0,1. По выборке из 15 сообщений вычислена
исправленная оценка дисперсии   0,22. При
уровне значимости 0,05 проверьте, обеспечивает ли программа необходимую
точность.

Решение:

Имеем: n = 15, s2 = 0,22
,  ,
.

Сформулируем гипотезу о
числовом значении дисперсии:


H0программа обеспечивает необходимую точность
;

H1
программа не обеспечивает необходимую точность

.

Определим статистику: .

Найдем границы
критической области:

.

Поскольку 30,8 >
23,7; 

, принимаем гипотезу H1, т.к.
H0 противоречит опытным данным. Вывод: программа
не обеспечивает необходимую точность.

Все, что вам нужно знать о проверке гипотез — часть I


  Перевод


  Ссылка на автора

Статистика — это все о данных, но одни данные не интересны. Это интерпретация данных, которые нас интересуют …

Область Data Science развивается как никогда раньше. Многие компании в настоящее время ищут профессионалов, которые могут просеять свои данные о добыче золота и помочь им эффективно принимать быстрые бизнес-решения. Это также дает возможность многим работающим профессионалам переключить свою карьеру на область Data Science.

Имея этот ИИ, Data Science окружает многих студентов колледжей и хочет продолжить свою карьеру в области Data Science. И эта шумиха вокруг Data Science правильно провозглашена Томасом Х. Давенпортом и Д.Дж. Патил в одной из статей Harvard Business Review,

«Data Scientist: самая сексуальная работа XXI века»

В современном мире аналитики модели машинного обучения в строительстве стали сравнительно простыми (благодаря более надежным и гибким инструментам и алгоритмам), но фундаментальные концепции по-прежнему сбивают с толку. Одним из таких понятий является проверка гипотез.

В этом посте я пытаюсь прояснить основные понятия проверки гипотез с помощью иллюстраций.


Что такое проверка гипотез? Чего мы пытаемся достичь? Зачем нам нужно проверять гипотезы? Мы должны знать ответы на все эти вопросы, прежде чем мы продолжим.

Статистика это все о данных. Данные сами по себе не интересны. Это интерпретация данных, которые нас интересуют. ИспользованиеПроверка гипотезымы пытаемся интерпретировать или делать выводы о населении, используя выборочные данные.Проверка гипотезоценивает два взаимоисключающих утверждения о совокупности, чтобы определить, какое утверждение лучше всего подтверждается данными выборки. Всякий раз, когда мы хотим заявить о распределении данных или о том, отличается ли один набор результатов от другого набора результатов в прикладном машинном обучении, мы должны полагаться на статистические проверки гипотез.

Есть два возможных результата: если результат подтверждает гипотезу, то вы произвели измерение. Если результат противоречит гипотезе, то вы сделали открытие — Энрико Ферми

Давайте посмотрим на терминологию, которую мы должны знать вПроверка гипотезы

1. Параметр и статистика:

параметрявляется кратким описанием фиксированной характеристики или показателя целевой группы населения. Параметр обозначает истинное значение, которое будет получено при проведении переписи, а не выборки.

Пример:Среднее (μ), дисперсия (σ²), стандартное отклонение (σ), пропорция (π)

Население: Население — это совокупность объектов, которые мы хотим изучить / протестировать. Коллекция объектов может быть города, студенты, фабрики и т. Д. Это зависит от изучения под рукой.

В реальном мире сложно получить полную информацию о населении. Следовательно, мы выбираем выборку из этой совокупности и получаем те же статистические показатели, упомянутые выше. И эти меры называются выборочной статистикой. Другими словами,

статистикаявляется кратким описанием характеристики или меры выборки. Выборочная статистика используется в качестве оценки параметра совокупности.

Пример:Среднее значение выборки (x̄), дисперсия выборки (S²), стандартное отклонение выборки (S), пропорция выборки (п)

Фото от CliffsNotes

2. Распределение выборки:

Распределение выборки — это распределение вероятностей статистики, полученной с помощью большого числа выборок, взятых из определенной совокупности.

Пример:Предположим, что простая выборка из пяти больниц должна быть взята из населения 20 больниц. Возможны следующие варианты: (20, 19, 18, 17, 16) или (1,2,4,7,8) или любая из 15 504 (с использованием комбинаций 20C)) различных образцов размера 5.

В целом среднее значение распределения выборки будет приблизительно эквивалентно среднему значению для населения, т.е. E (x̄) = μ

Чтобы узнать больше о распределении выборки, пожалуйста, проверьте это ниже видео:

Видео из ханской академии

3. Стандартная ошибка (SE):

Стандартная ошибка (SE) очень похожа на стандартное отклонение. Оба являются мерами распространения. Чем выше число, тем больше разбросаны ваши данные. Проще говоря, два термина по сути равны, но есть одно важное отличие. Пока стандартная ошибка используетстатистика(пример данных) использование стандартного отклоненияпараметры(данные о населении)

Стандартная ошибка говорит вам, насколько далеко ваша выборочная статистика (например, среднее значение выборки) отклоняется от фактического среднего значения населения. Чем больше размер вашей выборки, тем меньше SE. Другими словами, чем больше размер выборки, тем ближе среднее значение выборки к среднему значению популяции.

Чтобы узнать больше о стандартной ошибке (SE), пожалуйста, смотрите видео ниже

Теперь давайте рассмотрим следующий пример, чтобы лучше понять остальные концепции.


4. (а) Нулевая гипотеза (H₀):

Заявление, в котором не ожидается никакой разницы или эффекта. Если нулевая гипотеза не отклонена, никакие изменения не будут внесены.

Слово «ноль» в данном контексте означает, что общепринятый факт, что исследователи аннулируют. Это не означает, что само утверждение является нулевым! (Возможно, этот термин следует называть «недействительной гипотезой», поскольку это может вызвать меньше путаницы)

4. (б). Альтернативная гипотеза (H₁):

Утверждение, что ожидается некоторое различие или эффект. Принятие альтернативной гипотезы приведет к изменению мнений или действий. Это противоположность нулевой гипотезы.

Чтобы узнать больше о нулевых и альтернативных гипотезах, пожалуйста, посмотрите это видео ниже


5. (а). Односторонний тест:

Односторонний тест — это тест статистической гипотезы, в котором критическая область распределения является односторонней, так что она либо превышает определенное значение, либо меньше, но не одновременно. Если тестируемый образец попадает в одностороннюю критическую область, альтернативная гипотеза будет принята вместо нулевой гипотезы.

Односторонний тест также известен как направленная гипотеза или направленный тест.

Критический регион:Критическая область — это область значений, которая соответствует отклонению нулевой гипотезы на некотором выбранном уровне вероятности.

5. (б). Двусторонний тест:

Двухсторонний тест — это метод, в котором критическая область распределения является двусторонней, и он проверяет, является ли выборка больше или меньше определенного диапазона значений. Если тестируемый образец попадает в одну из критических областей, альтернативная гипотеза принимается вместо нулевой гипотезы.

По соглашению, двусторонние тесты используются для определения значимости на уровне 5%, то есть каждая сторона распределения сокращается на 2,5%.


6. Тестовая статистика:

тестовая статистикаизмеряет, насколько близко образец пришел к нулевой гипотезе. Его наблюдаемое значение изменяется случайным образом от одной случайной выборки к другой выборке. Тестовая статистика содержит информацию о данных, которые имеют значение для принятия решения о том, следует ли отклонить нулевую гипотезу или нет.

Различные тесты гипотез используют разные статистические тесты, основанные на вероятностной модели, принятой в нулевой гипотезе. Общие тесты и их тестовая статистика включают в себя:

Изображение из https://support.minitab.com

В общем, выборочные данные должны предоставить достаточные доказательства, чтобы отвергнуть нулевую гипотезу и сделать вывод, что эффект существует в популяции. В идеале, проверка гипотезы не позволяет отклонить нулевую гипотезу, когда эффект отсутствует в популяции, и отвергает нулевую гипотезу, когда эффект существует.


К настоящему времени мы понимаем, что вся проверка гипотез работает на основе имеющегося образца. Мы можем прийти к другому выводу, если образец будет изменен. Есть два типа ошибок, которые относятся к неверным выводам о нулевой гипотезе.

7. (а). Ошибка типа I:

Тип-IОшибка возникает, когда результаты выборки приводят к отклонению нулевой гипотезы, когда она на самом деле верна.Тип-Iошибки эквивалентны ложным срабатываниям.

Тип-Iошибки можно контролировать. Значение альфа, которое связано суровень значимостичто мы выбрали, имеет прямое отношение кТип-Iошибки.

7. (б). Ошибка типа II:

Тип-IIошибка возникает, когда на основании результатов выборки нулевая гипотеза не отклоняется, если она фактически ложна.Тип-IIошибки эквивалентны ложным негативам.


Уровень значимости (α):

Вероятность сделатьТип-Iошибка, и это обозначаетсяальфа (α), Альфа это максимальная вероятность того, что у нас естьТип-Iошибка. Для уровня достоверности 95% значение альфа составляет 0,05. Это означает, что существует 5% вероятность того, что мы отвергнем истинную нулевую гипотезу.


P-значение:

р-значениеиспользуется во всей статистике, от t-тестов до простого регрессионного анализа до моделей на основе дерева, почти во всех моделях машинного обучения. Мы все используемP-значениеопределить статистическую значимость в тесте гипотезы. Несмотря на то чтоР-значениескользкая концепция, которую люди часто неправильно интерпретируют.

P-значениеоцените, насколько хорошо выборочные данные подтверждают аргумент защитника дьявола о том, что нулевая гипотеза верна. Он измеряет, насколько совместимы ваши данные с нулевой гипотезой. Насколько вероятен эффект, наблюдаемый в ваших данных выборки, если нулевая гипотеза верна?

Другими словами, если нулевая гипотеза верна,Р-значениевероятность получения результата как экстремального или более экстремального, чем результат выборки, только по случайной случайности

Высокие значения P:Ваши данные, скорее всего, с истинным нулем

Низкие значения P:Ваши данные вряд ли с истинным нулем

Пример: Предположим, что вы проверяете следующую гипотезу на уровне значимости (α) 5%, и вы получаете значение p как 3%, и ваша выборочная статистикаИксзнак равно25

H₀: μ = 20

H₁: μ> 20

Интерпретация р-значения выглядит следующим образом:

Мы видели выше, чтоαтакже известен как совершениеТип-Iошибка. Когда мы говорим, αзнак равно5%, мы можем отклонить нашу нулевую гипотезу 5 из 100 раз, даже если это правда. Теперь, когда нашиР-значение3%, что меньшеα(мы определенно ниже порога совершенияТип-Iошибка),означает получение выборочной статистики как можно более экстремальной (x̄>знак равно25) учитывая, что H₀ истинно, очень меньше. Другими словами, мы не можем получить нашу выборочную статистику, если предположим, что H₀ истинно. Следовательно, мы отвергаем H₀ и принимаем H₁. Предположим, вы получаетеР-значениекак 6%, т. е. вероятность получения выборочной статистики как можно более экстремальной, тем выше, учитывая, что нулевая гипотеза верна. Таким образом, мы не можем отказаться от H₀, по сравнению сαмы не можем рисковатьТип-Iошибка больше, чем согласованный уровень значимости. Следовательно, мы не можем отвергнуть нулевую гипотезу и отвергнуть альтернативную гипотезу.

Теперь, когда мы поняли основную терминологию вПроверка гипотезы,Теперь давайте рассмотрим этапы проверки гипотез и приведем пример с примером.

Например, крупный универмаг рассматривает возможность введения услуги интернет-магазина. Новая услуга будет введена, если более 40 процентов интернет-пользователей совершают покупки через Интернет.

Шаг 1: сформулируйте гипотезы:

Подходящий способ сформулировать гипотезы:

H₀: π ≤ 0,40

H₁: π> 0,40

Если нулевая гипотеза H₀ отклонена, то будет принята альтернативная гипотеза H₁ и введена новая услуга интернет-покупок. С другой стороны, если мы не сможем отклонить H₀, то новая услуга не должна быть введена, пока не будут получены дополнительные доказательства. Этот тест нулевой гипотезы являетсяодин хвостТест, потому что альтернативная гипотеза выражается направленно: доля интернет-пользователей, которые используют Интернет для покупок, превышает 0,40.

Шаг 2: Выберите подходящий тест:

Чтобы проверить нулевую гипотезу, необходимо выбрать соответствующий статистический метод. Для этого примераZстатистика, которая соответствует стандартному нормальному распределению, будет уместной.

z = (p-π) / σₚ, где σₚ = sqrt (π (1-π) / n)

Шаг 3: Выберите уровень значимости, α:

Мы поняли чтоУровень значимостиотносится кТип-Iошибка. В нашем примере ошибка Типа I произошла бы, если бы мы пришли к выводу, основываясь на выборочных данных, что доля клиентов, предпочитающих новый тарифный план, была больше 0,40, тогда как на самом деле она была меньше или равна 0,40.

Ошибка типа II возникла бы, если бы мы пришли к выводу, основываясь на выборочных данных, что доля клиентов, предпочитающих новый тарифный план, была меньше или равна 0,40, тогда как фактически она была больше 0,40.

Необходимо сбалансировать два типа ошибок. В качестве компромисса α часто устанавливается на 0,05; иногда это 0,01; другие значения α редки. Мы рассмотрим 0,05 для нашего примера.

Шаг 4: Соберите данные и рассчитайте статистику теста:

Размер выборки определяется после учета требуемого значения α и других качественных соображений, таких как бюджетные ограничения для сбора данных выборки. Для нашего примера, скажем, 30 пользователей были опрошены, а 17 указали, что они использовали Интернет для покупок.

Таким образом, значение пропорции выборки составляетр = 17/30 = 0,567.

Значениеσₚ = SQRT ((0,40) (0,60) / 30) = 0,089.

Тестовая статистикаZможно рассчитать как

г = (р-π) / σₚ = (0.567-0.40) /0.089=1.88

Шаг 5: Определите вероятность (или критическое значение):

Используя стандартные нормальные таблицы из приведенного выше, вероятность полученияZзначение 1,88 составляет 0,96995, т.е.Р (z≤1.88) = 0,96995,Но мы хотели вычислить вероятность справа отz (потому что мы заинтересованы в получении значения вероятности, которое попадает в область отклонения или критическую область),то есть1-0.96995знак равно0,03005, Эта вероятность прямо сопоставима с(поскольку α совершает ошибку Типа I, а рассчитанное нами значение вероятности также попадает в критическую область)

Если вы хотите понять, как искать значения вероятностей для данных z-оценок, посмотрите видео ниже:

В качестве альтернативы, критическое значениег,который даст область справа от критического значения 0,05, находится между 1,64(при 1,64 вероятность составляет 0,94950)и 1,65(при 1,65 вероятность равна 0 95053)и равен 1,645(вероятность равна 0,95, то есть слева от нормального распределения, что означает, что справа она равна 0,05),

Обратите внимание, что при определении критического значения статистики теста, область в хвосте за критическим значением либоα или α / 2.этоαдля одностороннего теста иα / 2для двустороннего теста. Наш пример — односторонний тест.

Если вы хотите понять, как искать критическое значениеα,Пожалуйста, посмотрите видео ниже:

Шаг 6 и 7: сравните вероятность (или критическое значение) и примите решение:

Вероятность, связанная с вычисленным или наблюдаемым значением статистики теста, составляет 0,03005. Это вероятность полученияР-значение0,567 (доля образца =п)когда π = 0,40. Это меньше уровня значимости 0,05. Следовательно, нулевая гипотеза отвергается.

В качестве альтернативы рассчитывается значение тестовой статистикиг = 1,88лежит в области отклонения, за пределами значения 1,645. Снова, тот же самый вывод отклонить нулевую гипотезу сделан.

Обратите внимание, что два способа проверки нулевой гипотезы эквивалентны, но математически противоположны в направлении сравнения. Если вероятность, связанная с вычисленным или наблюдаемым значением тестовой статистики (TSCAL), равнаменьше, чемНа уровне значимости (α) нулевая гипотеза отвергается. Однако, если абсолютное значение рассчитанного значения статистики тестабольше чемабсолютное значение критического значения тестовой статистики (TSCR), нулевая гипотеза отклоняется. Причина этого смещения знака состоит в том, что чем больше абсолютное значение TSCAL, тем меньше вероятность получения более экстремального значения тестовой статистики при нулевой гипотезе.

если вероятность TSCAL <уровень значимости (α), то отклонить H₀.

Но, если | TSCAL | > | TSCR |, затем отклонить H₀

Шаг 8: Вывод:

В нашем примере мы заключаем, что есть свидетельства того, что доля интернет-пользователей, совершающих покупки через Интернет, значительно превышает 0,40. Следовательно, рекомендация для универмага будет заключаться в том, чтобы ввести новый сервис интернет-магазинов.

Этот пример относится к одному образцу теста пропорций. Тем не менее, существует несколько типов тестов, которые зависят от знаний о населении и рассматриваемой проблемы.

Например, у нас есть t-тест, Z-тест. Тест хи-квадрат, тест Манна-Уитни, тест Вилкоксона и т. Д.

На этом я хотел бы завершить часть I «Все, что вам нужно знать о проверке гипотез». Я буду обсуждать параметрические и непараметрические тесты и какой тест использовать в каком сценарии в части II. До тех порСчастливого обучения…

Спасибо за чтение!

Пожалуйста, поделитесь своим мнением в разделе комментариев ниже.

Ссылки:

  1. Маркетинговые исследования — прикладная ориентация Naresh K Malhotra и Satyabhushan Dash
  2. https://www.cliffsnotes.com/study-guides/statistics/sampling/populations-samples-parameters-and-statistics
  3. https://www.statisticshowto.datasciencecentral.com
  4. https://www.khanacademy.org
  5. https://blog.minitab.com

Ошибки I и II рода при проверке гипотез, мощность

Общий обзор

Принятие неправильного решения

Мощность и связанные факторы

Проверка множественных гипотез

Общий обзор

Большинство проверяемых гипотез сравнивают между собой группы объектов, которые испытывают влияние различных факторов.

Например, можно сравнить эффективность двух видов лечения, чтобы сократить 5-летнюю смертность от рака молочной железы. Для данного исхода (например, смерть) сравнение, представляющее интерес (напри­мер, различные показатели смертности через 5 лет), называют эффектом или, если уместно, эффектом лечения.

Нулевую гипотезу выражают как отсутствие эффекта (например 5-летняя смертность от рака мо­лочной железы одинаковая в двух группах, получаю­щих разное лечение); двусторонняя альтернативная гипотеза будет означать, что различие эффектов не равно нулю.

Критериальная проверка гипотезы дает возможность определить, достаточно ли аргументов, чтобы отвергнуть нулевую гипотезу. Можно принять только одно из двух решений:

  1. отвергнуть нулевую гипотезу и принять альтер­нативную гипотезу
  2. остаться в рамках нулевой гипотезы

Важно: В литературе достаточно часто встречается понятие «принять нулевую гипотезу». Хотелось бы внести ясность, что со статистической точки зрения принять нулевую гипотезу невозможно, т.к. нулевая гипотеза представляет собой достаточно строгое утверждение (например, средние значения в сравниваемых группах равны ).

Поэтому фразу о принятии нулевой гипотезы следует понимать как то, что мы просто остаемся в рамках гипотезы.

Принятие неправильного решения

Возможно неправильное решение, когда отвергают/не отвергают нулевую гипотезу, потому что есть только выборочная информация.

  Верная гипотеза
H0 H1
Результат

 применения 

критерия

H0 H0 верно принята H0 неверно принята 

(Ошибка второго рода)

H1 H0 неверно отвергнута 

(Ошибка первого рода)

H0 верно отвергнута

Ошибка 1-го рода: нулевую гипотезу отвергают, когда она истинна, и делают вывод, что имеется эффект, когда в действительности его нет. Максимальный шанс (вероятность) допустить ошибку 1-го рода обозначается α (альфа). Это уровень значимости критерия; нулевую гипотезу отвергают, если наше значение p ниже уровня значимости, т. е., если p < α.

Следует принять решение относительно значения а прежде, чем будут собраны данные; обычно назначают условное значение 0,05, хотя можно выбрать более ограничивающее значение, например 0,01.

Шанс допустить ошибку 1-го рода никогда не превысит выбранного уровня значимости, скажем α = 0,05, так как нулевую гипотезу отвергают только тогда, когда p< 0,05. Если обнаружено, что p > 0,05, то нулевую гипотезу не отвергнут и, следовательно, не допустят ошибки 1-го рода.

Ошибка 2-го рода: не отвергают нулевую гипотезу, когда она ложна, и делают вывод, что нет эффекта, тогда как в действительности он существует. Шанс возникновения ошибки 2-го рода обозначается β (бета); а величина (1-β) называется мощностью критерия.

Следовательно, мощность — это вероятность отклонения нулевой гипотезы, когда она ложна, т.е. это шанс (обычно выраженный в процентах) обнаружить реальный эффект лечения в выборке данного объема как статистически значимый.

В идеале хотелось бы, чтобы мощность критерия составляла 100%; однако это невозможно, так как всегда остается шанс, хотя и незначительный, допустить ошибку 2-го рода.

К счастью, известно, какие факторы влияют на мощность и, таким образом, можно контролировать мощность критерия, рассматривая их.

Мощность и связанные факторы

Планируя исследование, необходимо знать мощность предложенного критерия. Очевидно, можно начинать исследование, если есть «хороший» шанс обнаружить уместный эффект, если таковой существует (под «хорошим» мы подразумеваем, что мощность должна быть по крайней мере 70-80%).

Этически безответственно начинать исследование, у которого, скажем, только 40% вероятности обнаружить реальный эффект лечения; это бесполезная трата времени и денежных средств.

Ряд факторов имеют прямое отношение к мощности критерия.

Объем выборки: мощность критерия увеличивается по мере увеличения объема выборки. Это означает, что у большей выборки больше возможностей, чем у незначительной, обнаружить важный эффект, если он существует.

Когда объем выборки небольшой, у критерия может быть недостаточно мощности, чтобы обнаружить отдельный эффект. Эти методы также можно использовать для оценки мощности критерия для точно установленного объема выборки.

Вариабельность наблюдений: мощность увеличивается по мере того, как вариабельность наблюдений уменьшается.

Интересующий исследователя эффект: мощность критерия больше для более высоких эффектов. Критерий проверки гипотез имеет больше шансов обнаружить значительный реальный эффект, чем незначительный.

Уровень значимости: мощность будет больше, если уровень значимости выше (это эквивалентно увеличению допущения ошибки 1-го рода, α, а допущение ошибки 2-го рода, β, уменьшается).

Таким образом, вероятнее всего, исследователь обнаружит реальный эффект, если на стадии планирования решит, что будет рассматривать значение р как значимое, если оно скорее будет меньше 0,05, чем меньше 0,01.

Обратите внимание, что проверка ДИ для интересующего эффекта указывает на то, была ли мощность адекватной. Большой доверительный интервал следует из небольшой выборки и/или набора данных с существенной вариабельностью и указывает на недостаточную мощность.

Проверка множественных гипотез

Часто нужно выполнить критериальную проверку значимости множественных гипотез на наборе данных с многими переменными или существует более двух видов лечения.

Ошибка 1-го рода драматически увеличивается по мере увеличения числа сравнений, что приводит к ложным выводам относительно гипотез. Следовательно, следует проверить только небольшое число гипотез, выбранных для достижения первоначальной цели исследования и точно установленных априорно.

Можно использовать какую-нибудь форму апостериорного уточнения значения р, принимая во внимание число выполненных проверок гипотез.

Например, при подходе Бонферрони (его часто считают довольно консервативным) умножают каждое значение р на число выполненных проверок; тогда любые решения относительно значимости будут основываться на этом уточненном значении р.

Связанные определения:
p-уровень
Альтернативная гипотеза, альтернатива
Альфа-уровень
Бета-уровень
Гипотеза
Двусторонний критерий
Критерий для проверки гипотезы
Критическая область проверки гипотезы
Мощность
Мощность исследования
Мощность статистического критерия
Нулевая гипотеза
Односторонний критерий
Ошибка I рода
Ошибка II рода
Статистика критерия
Эквивалентные статистические критерии

В начало

Содержание портала

Понравилась статья? Поделить с друзьями:

Интересное по теме:

  • При проведении опыта ван гельмонтом была допущена ошибка
  • При проверке код пароля iphone произошла ошибка
  • При проведении операции произошла непредвиденная ошибка
  • При проведении несплошного наблюдения допускаются ошибки
  • При проведении корректировки реализации ошибка на закрытый период

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии