Стандартная ошибка разности двух средних

Критерий Стьюдента применяется для проверки равенства средних значений двух выборок, сравнение количественных значений только двух выборок с нормальным распределением случайной величины. 

 Критерий Стьюдента определяется по формуле:

Критерий Стьюдента формула

$\bar{X_1}$ – выборочные средние значения первой выборки;

$\bar{X_2}$ – выборочные средние значения второй выборки;

n1 – объем первой выборки;

n2 – объем второй выборки;

σ1 и σ2 – среднее квадратическое отклонение в соответствующих выборках и находятся из формулы:

СКО

Число степеней свободы определяется по формуле:

k=n1+n2−2

Fкр(α, k) определяется по таблице

При Fнабл<Fкр нулевая гипотеза принимается.

Формула критерия Стьюдента для несвязанных независимых выборок:

Формула критерия Стьюдента для независимых выборок

Формула для определения стандартной ошибки разности средних арифметических σxy:

стандартная ошибка разности средних арифметических формула

Число степеней свободы определяется выражением:

k=n1+n2–2

При n1=n2 число степеней свободы находится по формуле:

k=2n-2

а стандартная ошибка разности средних арифметических σxy задаётся выражением:

стандартная ошибка разности средних арифметических


Пример

Даны две выборки.

В первой выборки продажа товара со скидкой, а во второй без скидки.

№ п/п X Y
1 25 19
2 34 31
3 23 17
4 35 24
5 33 28
6 25 31
7 45 39
8 41 32
9 27 38
10 54 43
11 32 21
12 32

По критерию Стьюдента определить зависит ли спрос на товар от скидок на него при p=0.99?

Решение

В соответствии с таблицей n1=12, n2=11

Вычислим дисперсии D(X), D(Y)

№ п/п X Y D(X) D(Y)
1 25 19 78,028 107,4
2 34 31 0,0278 2,6777
3 23 17 117,36 152,86
4 35 24 1,3611 28,769
5 33 28 0,6944 1,8595
6 25 31 78,028 2,6777
7 45 39 124,69 92,86
8 41 32 51,361 6,9504
9 27 38 46,694 74,587
10 54 43 406,69 185,95
11 32 21 3,3611 69,95
12 32 3,3611
Сумма 406 323 911,67 726,55
Среднее 33,833 29,364

Подставим значения в формулу стандартной ошибки разности средних арифметических σxy:

 стандартная ошибка разности решение

Вычисляем критерий Стьюдента:

критерий Стьюдента решение

Число степеней свободы равно:

k=12+11–2=21

По таблице Стьюдента находим критическое значение:

tкрит=2,8310     

Отсюда tкрит> tнабл, следовательно, зависит.

19865


Непараметрические
критерии статистики 
—  свободны
от допущения о законе распределения
выборок и базируются на предположении
о независимости наблюдений.

В
группу параметрических
критериев 
методов
математической статистики входят
методы для вычисления описательных
статистик, построения графиков на
нормальность распределения, проверка
гипотез о при­надлежности двух выборок
одной совокупности. Эти методы
основыва­ются на предположении о том,
что распределение выборок подчиняется
нормальному (гауссовому) закону
распределения. Среди параметрических
критериев статистики нами будут
рассмотрены критерий Стьюдента и Фишера.

6.1.1 Методы проверки выборки на нормальность

Чтобы
определить,  имеем ли мы дело с
нормальным распределением, можно
применять следующие методы:

1)
в пределах осей можно нарисовать полигон
частоты (эмпирическую функцию
распределения) и кривую нормального
распределения на основе данных
исследования. Исследуя формы кривой
нормального распределения и графика
эмпирической функции распределения,
можно выяснить те параметры, которыми
последняя кривая отличается от первой;

2)
вычисляется среднее, медиана и мода и
на основе этого определяется отклонение
от нормального распределения. Если
мода, медиана и среднее арифметическое
друг от друга значительно не отличаются,
мы имеем дело с нормальным распределением.
Если медиана значительно отличается
от среднего, то мы имеем дело с асимметричной
выборкой.

3)
эксцесс кривой распределения должен
быть равен 0.
Кривые  с  положительным  эксцессом  значительно  вертикальнее
кривой нормального распределения.
Кривые с отрицательным эксцессом
являются более покатистыми по сравнению
с кривой нормального распределения;

4)
после   определения среднего
значения распределения частоты и
стандартного oтклонения находят следующие
четыре интервала распределения сравнивают
их с действительными данными  ряда:

а) 
к интервалу должно относиться около
25% частоты совокупности,

б) 
к интервалу должно относиться около
50% частоты совокупности,

в) 
к интервалу должно относиться около
75% частоты совокупности,

г) 
к интервалу должно относиться около
100% частоты совокупности.

6.1.2 Критерий Стьюдента (t-критерий)

Критерий
позволяет найти вероятность того, что
оба средних значения в выборке относятся
к одной и той же совокупности. Данный
критерий наиболее часто используется
для проверки гипотезы: «Средние двух
выборок относятся к одной и той же
совокупности».

При
использовании критерия можно выделить
два случая. В первом случае его применяют
для проверки гипотезы о равенстве
генеральных средних
двух неза­висимыхнесвязанныхвыборок
(так называемый двухвыборочный t-критерий).
В этом случае есть контрольная группа
и экспериментальная (опытная) группа,
количество испытуемых в группах может
быть различно.

Во
втором случае, когда одна и та же группа
объектов порождает числовой матери­ал
для проверки гипотез о средних,
используется так называемый парный
t-критерий
.
Выборки при этом называют зависимымисвязанными.

а)
случай независимых выборок

Статистика
критерия для случая несвязанных,
независимых выборок равна:

                                                                             (1)                  

 где ,
средние арифметические в эксперименталь­ной
и контрольной группах,

 —
стан­дартная ошибка разности средних
арифметических. Находится из формулы:

  ,                              (2)

где n1 и n2 соответственно
величины первой и второй выборки.

Если n1=n2,
то стандартная ошибка разности средних
арифметических будет считаться по
формуле:

                                         (3)

где
n величина выборки.

Подсчет числа
степеней свободы
 осуществля­ется
по формуле:

k
= n1 +
n2 –
2.                                                                                     (4)

При
численном равенстве выборок k =
2n —
2.

Далее
необходимо срав­нить полученное
значение tэмп с
теоретическим значением t—рас­пределения
Стьюдента (см. приложение к учеб­никам
статистики). Если tэмп<tкрит,
то гипотезаH0 принимается,
в противном случае нулевая гипотеза
отвергается и принимается альтернативная
гипотеза.

Рассмотрим
пример использования t-критерия
Стьюдента для несвязных и неравных по
численности выборок.

Пример 1. В
двух группах учащихся — экспериментальной
и контрольной — получены следующие
результаты по учеб­ному предмету
(тестовые баллы; см. табл. 1).[1]

Таблица
1. Результаты эксперимента

Первая
группа (экспериментальная) N1=11
человек

Вторая
группа (контрольная)

N2=9
человек

12   14   13   16   11   9   13   15  15   18   14

13   9   11   10   7   6   8  10   11

Общее
количество членов выборки: n1=11, n2=9.

Расчет
средних арифметических: Хср=13,636; Yср=9,444

Стандартное
отклонение: sx=2,460; sy=2,186       

По
формуле (2) рассчитываем стандартную
ошибку разности арифметических средних:

Считаем
статистику критерия:

 Сравниваем
полученное в эксперименте значение t с
табличным значением с учетом степеней
свободы, равных по формуле (4) числу
испытуемых минус два (18).

Табличное
значение tкрит равняется
2,1 при допущении возможности риска
сделать ошибочное сужде­ние в пяти
случаях из ста (уровень значимости=5 %
или 0,05).

Если
полученное в эксперименте эмпирическое
значение t превы­шает табличное, то
есть основания принять альтернативную
гипотезу (H1)
о том, что учащиеся экспериментальной
группы показывают в среднем более
высокий уровень знаний. В эксперименте
t=3,981, табличное t=2,10, 3,981>2,10, откуда
следует вывод о преимуществе
эксперимен­тального обучения.

Здесь
могут возникнуть такие вопросы:

1.
Что если полученное в опыте значение t
окажется меньше табличного? Тогда надо
принять нулевую гипотезу.

2.
Доказано ли преимущество экспериментального
метода? Не столько доказано, сколько
показано, потому что с самого начала
допускается риск ошибиться в пяти
случаях из ста (р=0,05). Наш эксперимент
мог быть одним из этих пяти случаев. Но
95% возможных случаев говорит в пользу
альтернативной гипотезы, а это достаточно
убедительный аргумент в статистическом
доказательстве.

3.
Что если в контрольной группе результаты
окажутся выше, чем в экспериментальной?
Поменяем, например, местами, сделав средней
арифметической эксперимен­тальной
группы, a 
контрольной:

 Отсюда
следует вывод, что новый метод пока не
про­явил себя с хорошей стороны по
разным, возможно, при­чинам. Поскольку
абсолютное значение 3,9811>2,1, принимается
вторая альтернативная гипотеза (Н2)
о пре­имуществе традиционного метода.

б)
случай связанных (парных) выборок

В
случае связанных выборок с равным числом
измерений в каждой можно использовать
более простую формулу t-критерия
Стьюдента.

Вычисление
значения t осуществляется по формуле:

                                                                                                       (5)

  где 
разности между соответствующими
значениями переменной X и переменной
У, аd —
среднее этих разностей;

Sd
вычисляется по следующей формуле:

                                                                                       (6)

Число
степеней свободы k определяется
по формуле k=n-1.
Рассмотрим пример использования t-критерия
Стьюдента для связных и, очевидно, равных
по численности выборок.

Если tэмп<tкрит,
то нулевая гипотеза принимается, в
противном случае принимается
альтернативная.

Пример
2
.
Изучался уровень ориентации учащихся
на художественно-эстети­ческие
ценности. С целью активизации формирования
этой ориентации в экспериментальной
группе проводились бе­седы, выставки
детских рисунков, были организованы
по­сещения музеев и картинных галерей,
проведены встречи с музыкантами,
художниками и др. Закономерно встает
вопрос: какова эффективность проведенной
работы? С целью проверки эффективности
этой работы до начала эксперимента и
после давался тест. Из методических
со­ображений в таблице 2 приводятся
результаты небольшо­го числа
испытуемых.[2]

Таблица
2. Результаты эксперимента

Ученики

(n=10)

Баллы

Вспомогательные
расчеты

до
начала экспери­мента (Х)

в
конце

экспери­мента
(У)

d

d2

Иванов

14

18

4

16

Новиков

20

19

-1

1

Сидоров

15

22

7

49

Пирогов

11

17

6

36

Агапов

16

24

8

64

Суворов

13

21

8

64

Рыжиков

16

25

9

81

Серов

19

26

7

49

Топоров

15

24

9

81

Быстров

9

15

6

36

å

148

211

63

477

Среднее

14,8

21,1

Вначале
произведем расчет по формуле:

Затем
применим формулу (6), получим:

И,
наконец, следует применить формулу (5).
Получим:

Число
степеней свободы: k=10-1=9
и по таблице При­ложения 1 находим
tкрит =2.262,
экспериментальное t=6,678, откуда следует
возможность принятия альтерна­тивной
гипотезы (H1)
о достоверных различиях средних
арифметических, т. е. делается вывод об
эффективности экспериментального
воздействия.

В
терминах статистических гипотез
полученный результат будет звучать
так: на 5% уров­не гипотеза Н0 отклоняется
и принимается гипотеза Н1 .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Содержание

  • Расчет ошибки средней арифметической
    • Способ 1: расчет с помощью комбинации функций
    • Способ 2: применение инструмента «Описательная статистика»
  • Вопросы и ответы

Ошибка средней арифметической в Microsoft Excel

Стандартная ошибка или, как часто называют, ошибка средней арифметической, является одним из важных статистических показателей. С помощью данного показателя можно определить неоднородность выборки. Он также довольно важен при прогнозировании. Давайте узнаем, какими способами можно рассчитать величину стандартной ошибки с помощью инструментов Microsoft Excel.

Расчет ошибки средней арифметической

Одним из показателей, которые характеризуют цельность и однородность выборки, является стандартная ошибка. Эта величина представляет собой корень квадратный из дисперсии. Сама дисперсия является средним квадратном от средней арифметической. Средняя арифметическая вычисляется делением суммарной величины объектов выборки на их общее количество.

В Экселе существуют два способа вычисления стандартной ошибки: используя набор функций и при помощи инструментов Пакета анализа. Давайте подробно рассмотрим каждый из этих вариантов.

Способ 1: расчет с помощью комбинации функций

Прежде всего, давайте составим алгоритм действий на конкретном примере по расчету ошибки средней арифметической, используя для этих целей комбинацию функций. Для выполнения задачи нам понадобятся операторы СТАНДОТКЛОН.В, КОРЕНЬ и СЧЁТ.

Для примера нами будет использована выборка из двенадцати чисел, представленных в таблице.

Выборка в Microsoft Excel

  1. Выделяем ячейку, в которой будет выводиться итоговое значение стандартной ошибки, и клацаем по иконке «Вставить функцию».
  2. Переход в Мастер функций в Microsoft Excel

  3. Открывается Мастер функций. Производим перемещение в блок «Статистические». В представленном перечне наименований выбираем название «СТАНДОТКЛОН.В».
  4. Переход в окно аргументов функции СТАНДОТКЛОН.В в Microsoft Excel

  5. Запускается окно аргументов вышеуказанного оператора. СТАНДОТКЛОН.В предназначен для оценивания стандартного отклонения при выборке. Данный оператор имеет следующий синтаксис:

    =СТАНДОТКЛОН.В(число1;число2;…)

    «Число1» и последующие аргументы являются числовыми значениями или ссылками на ячейки и диапазоны листа, в которых они расположены. Всего может насчитываться до 255 аргументов этого типа. Обязательным является только первый аргумент.

    Итак, устанавливаем курсор в поле «Число1». Далее, обязательно произведя зажим левой кнопки мыши, выделяем курсором весь диапазон выборки на листе. Координаты данного массива тут же отображаются в поле окна. После этого клацаем по кнопке «OK».

  6. Окно аргументов функции СТАНДОТКЛОН.В в Microsoft Excel

  7. В ячейку на листе выводится результат расчета оператора СТАНДОТКЛОН.В. Но это ещё не ошибка средней арифметической. Для того, чтобы получить искомое значение, нужно стандартное отклонение разделить на квадратный корень от количества элементов выборки. Для того, чтобы продолжить вычисления, выделяем ячейку, содержащую функцию СТАНДОТКЛОН.В. После этого устанавливаем курсор в строку формул и дописываем после уже существующего выражения знак деления (/). Вслед за этим клацаем по пиктограмме перевернутого вниз углом треугольника, которая располагается слева от строки формул. Открывается список недавно использованных функций. Если вы в нем найдете наименование оператора «КОРЕНЬ», то переходите по данному наименованию. В обратном случае жмите по пункту «Другие функции…».
  8. Переход к дальнейшему продолжению написания формулы стандартной ошибки в Microsoft Excel

  9. Снова происходит запуск Мастера функций. На этот раз нам следует посетить категорию «Математические». В представленном перечне выделяем название «КОРЕНЬ» и жмем на кнопку «OK».
  10. Переход в окно аргументов функции КОРЕНЬ в Microsoft Excel

  11. Открывается окно аргументов функции КОРЕНЬ. Единственной задачей данного оператора является вычисление квадратного корня из заданного числа. Его синтаксис предельно простой:

    =КОРЕНЬ(число)

    Lumpics.ru

    Как видим, функция имеет всего один аргумент «Число». Он может быть представлен числовым значением, ссылкой на ячейку, в которой оно содержится или другой функцией, вычисляющей это число. Последний вариант как раз и будет представлен в нашем примере.

    Устанавливаем курсор в поле «Число» и кликаем по знакомому нам треугольнику, который вызывает список последних использованных функций. Ищем в нем наименование «СЧЁТ». Если находим, то кликаем по нему. В обратном случае, опять же, переходим по наименованию «Другие функции…».

  12. Окно аргументов функции КОРЕНЬ в Microsoft Excel

  13. В раскрывшемся окне Мастера функций производим перемещение в группу «Статистические». Там выделяем наименование «СЧЁТ» и выполняем клик по кнопке «OK».
  14. Переход в окно аргументов функции СЧЁТ в Microsoft Excel

  15. Запускается окно аргументов функции СЧЁТ. Указанный оператор предназначен для вычисления количества ячеек, которые заполнены числовыми значениями. В нашем случае он будет подсчитывать количество элементов выборки и сообщать результат «материнскому» оператору КОРЕНЬ. Синтаксис функции следующий:

    =СЧЁТ(значение1;значение2;…)

    В качестве аргументов «Значение», которых может насчитываться до 255 штук, выступают ссылки на диапазоны ячеек. Ставим курсор в поле «Значение1», зажимаем левую кнопку мыши и выделяем весь диапазон выборки. После того, как его координаты отобразились в поле, жмем на кнопку «OK».

  16. Окно аргументов функции СЧЁТ в Microsoft Excel

  17. После выполнения последнего действия будет не только рассчитано количество ячеек заполненных числами, но и вычислена ошибка средней арифметической, так как это был последний штрих в работе над данной формулой. Величина стандартной ошибки выведена в ту ячейку, где размещена сложная формула, общий вид которой в нашем случае следующий:

    =СТАНДОТКЛОН.В(B2:B13)/КОРЕНЬ(СЧЁТ(B2:B13))

    Результат вычисления ошибки средней арифметической составил 0,505793. Запомним это число и сравним с тем, которое получим при решении поставленной задачи следующим способом.

Результат вычисления стандартной ошибки в сложной формуле в Microsoft Excel

Но дело в том, что для малых выборок (до 30 единиц) для большей точности лучше применять немного измененную формулу. В ней величина стандартного отклонения делится не на квадратный корень от количества элементов выборки, а на квадратный корень от количества элементов выборки минус один. Таким образом, с учетом нюансов малой выборки наша формула приобретет следующий вид:

=СТАНДОТКЛОН.В(B2:B13)/КОРЕНЬ(СЧЁТ(B2:B13)-1)

Результат вычисления стандартной ошибки для малой выборки в Microsoft Excel

Урок: Статистические функции в Экселе

Способ 2: применение инструмента «Описательная статистика»

Вторым вариантом, с помощью которого можно вычислить стандартную ошибку в Экселе, является применение инструмента «Описательная статистика», входящего в набор инструментов «Анализ данных» («Пакет анализа»). «Описательная статистика» проводит комплексный анализ выборки по различным критериям. Одним из них как раз и является нахождение ошибки средней арифметической.

Но чтобы воспользоваться данной возможностью, нужно сразу активировать «Пакет анализа», так как по умолчанию в Экселе он отключен.

  1. После того, как открыт документ с выборкой, переходим во вкладку «Файл».
  2. Переход во вкладку Файл в Microsoft Excel

  3. Далее, воспользовавшись левым вертикальным меню, перемещаемся через его пункт в раздел «Параметры».
  4. Перемещение в раздел Параметры в Microsoft Excel

  5. Запускается окно параметров Эксель. В левой части данного окна размещено меню, через которое перемещаемся в подраздел «Надстройки».
  6. Переход в подраздел надстройки окна параметров в Microsoft Excel

  7. В самой нижней части появившегося окна расположено поле «Управление». Выставляем в нем параметр «Надстройки Excel» и жмем на кнопку «Перейти…» справа от него.
  8. Переход в окно надстроек в Microsoft Excel

  9. Запускается окно надстроек с перечнем доступных скриптов. Отмечаем галочкой наименование «Пакет анализа» и щелкаем по кнопке «OK» в правой части окошка.
  10. Включение пакета анализа в окне надстроек в Microsoft Excel

  11. После выполнения последнего действия на ленте появится новая группа инструментов, которая имеет наименование «Анализ». Чтобы перейти к ней, щелкаем по названию вкладки «Данные».
  12. Переход во вкладку Данные в Microsoft Excel

  13. После перехода жмем на кнопку «Анализ данных» в блоке инструментов «Анализ», который расположен в самом конце ленты.
  14. Переход в Анализ данных в Microsoft Excel

  15. Запускается окошко выбора инструмента анализа. Выделяем наименование «Описательная статистика» и жмем на кнопку «OK» справа.
  16. Переход в описательную статистику в Microsoft Excel

  17. Запускается окно настроек инструмента комплексного статистического анализа «Описательная статистика».

    В поле «Входной интервал» необходимо указать диапазон ячеек таблицы, в которых находится анализируемая выборка. Вручную это делать неудобно, хотя и можно, поэтому ставим курсор в указанное поле и при зажатой левой кнопке мыши выделяем соответствующий массив данных на листе. Его координаты тут же отобразятся в поле окна.

    В блоке «Группирование» оставляем настройки по умолчанию. То есть, переключатель должен стоять около пункта «По столбцам». Если это не так, то его следует переставить.

    Галочку «Метки в первой строке» можно не устанавливать. Для решения нашего вопроса это не важно.

    Далее переходим к блоку настроек «Параметры вывода». Здесь следует указать, куда именно будет выводиться результат расчета инструмента «Описательная статистика»:

    • На новый лист;
    • В новую книгу (другой файл);
    • В указанный диапазон текущего листа.

    Давайте выберем последний из этих вариантов. Для этого переставляем переключатель в позицию «Выходной интервал» и устанавливаем курсор в поле напротив данного параметра. После этого клацаем на листе по ячейке, которая станет верхним левым элементом массива вывода данных. Её координаты должны отобразиться в поле, в котором мы до этого устанавливали курсор.

    Далее следует блок настроек определяющий, какие именно данные нужно вводить:

    • Итоговая статистика;
    • К-ый наибольший;
    • К-ый наименьший;
    • Уровень надежности.

    Для определения стандартной ошибки обязательно нужно установить галочку около параметра «Итоговая статистика». Напротив остальных пунктов выставляем галочки на свое усмотрение. На решение нашей основной задачи это никак не повлияет.

    После того, как все настройки в окне «Описательная статистика» установлены, щелкаем по кнопке «OK» в его правой части.

  18. Окно описаительная статистика в Microsoft Excel

  19. После этого инструмент «Описательная статистика» выводит результаты обработки выборки на текущий лист. Как видим, это довольно много разноплановых статистических показателей, но среди них есть и нужный нам – «Стандартная ошибка». Он равен числу 0,505793. Это в точности тот же результат, который мы достигли путем применения сложной формулы при описании предыдущего способа.

Результат расчета стандартной ошибки путем применения инструмента Описательная статистика в Microsoft Excel

Урок: Описательная статистика в Экселе

Как видим, в Экселе можно произвести расчет стандартной ошибки двумя способами: применив набор функций и воспользовавшись инструментом пакета анализа «Описательная статистика». Итоговый результат будет абсолютно одинаковый. Поэтому выбор метода зависит от удобства пользователя и поставленной конкретной задачи. Например, если ошибка средней арифметической является только одним из многих статистических показателей выборки, которые нужно рассчитать, то удобнее воспользоваться инструментом «Описательная статистика». Но если вам нужно вычислить исключительно этот показатель, то во избежание нагромождения лишних данных лучше прибегнуть к сложной формуле. В этом случае результат расчета уместится в одной ячейке листа.

Стандартная ошибка появляется при прогнозировании каких-либо данных или арифметических вычислениях, поэтому важно научиться находить этот параметр. В этой публикации разбираем, как найти и исправить стандартную ошибку путем использования инструментов Excel.

Расчет средней арифметической ошибки

В Microsoft Excel цельность и однородность выборки определяется при помощи стандартной ошибки. Стандартная ошибка — это квадратный корень из дисперсии. В приложении предусмотрено два варианта поиска стандартной ошибки: при помощи пакетного анализа и расширенных функций программы.
Чтобы найти значение средней арифметической, необходимо выполнить деление суммарной величины выборки на ее количество в электронной книге.

Расчет стандартной ошибки при помощи встроенных функций

Для того, чтобы правильно вычислять, необходимо изучить пошаговую инструкцию. В этом способе подбор результатов будет осуществляться с помощью комбинированных манипуляций.

  1. Для расчетов будем использовать таблицу с выборкой чисел. Кликаем на любой пустой ячейке на листе, где будет отображаться результат. Затем нажимаем кнопку «Вставить функцию.

№ 14.png

  1. Далее перед вами открывается диалоговое окно, в котором необходимо использовать «СТАНДОТКЛ.В», для этого в поле «Категория» необходимо выбрать «Полный алфавитный перечень». Затем нажмите кнопку «ОК».

№ 15.png

  1. В окне «Аргументы функции» кликаем в первом поле «Число 1», затем выполняем выделение мышью диапазона ячеек со значениями таблицы и нажимаем кнопку «ОК».

№ 16.png

  1. Далее активируем ячейку с нашими значениями, переходим в строку формулы и ставим после значений наклонную линию. Переходим в поле наименования, кликаем на указывающий вниз флажок, где из списка выбираем «Другие функции».

№ 17.png

  1. Снова активируется окно с перечнем функций, в котором необходимо выбрать категорию «Математические», затем функцию «Корень». Далее нажмите кнопку «ОК».

№ 18.png

  1. Далее открывается окно, в котором необходимо заполнить поле с числом. Для этого переходим в поле «Имя», где спускаемся к пункту «Счет». Если его нет, ищите в дополнительных функциях.

№ 19.png

После выполнения этих шагов, стандартная ошибка высчитывается автоматически, пользователю остается только сверить их и проверить значение на некорректное отображение.

Важно!

Для малых и стандартных выборок необходимо использовать разные формулы. В первом случае (если находится до 30 значений), ее необходимо видоизменить.

Решение задачи с помощью опции «Описательная статистика»

Благодаря опции «Описательная статистика» удается выполнить вычисление по различным критериям. По этим правилам удается найти среднюю арифметическую ошибку. Для использования данного метода предварительно нужно запустить «Пакет анализа».

  1. Переходим во вкладку «Файл», где перемещаемся в пункт «Параметры». Далее нажимаем на запись «Надстройки».

№ 20.png

  1. Открывается окошко, в нем в графе «Управление» должно быть прописано «Надстройки Excel», затем рядом нажимаем кнопку «Параметры».

№ 21.png

  1. В появившемся окне находим «Пакет анализа» и нажимаем кнопку «ОК».

№ 22.png

  1. Далее выбираем любую свободную ячейку, переходим во вкладку «Данные» и нажимаем «Анализ данных» в блоке «Анализ».

№ 23.png

  1. Происходит запуск вспомогательного окошка, в котором необходимо выбрать из всех инструментов «Описательную статистику» и нажать кнопку «ОК».

№ 24.png

  1. Открывается новый мастер значений. Здесь нужно вводить данные предельно внимательно. В поле «Входной интервал» вносим адрес диапазона ячеек с выборкой. Затем указываем параметр «Группирование» «По столбцам». Затем выбираем место для «выходного интервала», его должно быть столько же, сколько и «входного». Ставим галочку напротив «Итоговая статистика» и нажимаем кнопку «ОК».

№ 25.png

В результате вычислений вы получаете небольшую таблицу, в которой указаны все данные с определенной стандартной ошибкой.

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Стандартная ошибка среднего — это способ измерить, насколько разбросаны значения в наборе данных. Он рассчитывается как:

Стандартная ошибка = с / √n

куда:

  • s : стандартное отклонение выборки
  • n : размер выборки

Вы можете рассчитать стандартную ошибку среднего для любого набора данных в Excel, используя следующую формулу:

= СТАНДОТКЛОН (диапазон значений) / КОРЕНЬ ( СЧЁТ (диапазон значений))

В следующем примере показано, как использовать эту формулу.

Пример: Стандартная ошибка в Excel

Предположим, у нас есть следующий набор данных:

На следующем снимке экрана показано, как рассчитать стандартную ошибку среднего значения для этого набора данных:

Стандартная ошибка среднего в Excel

Стандартная ошибка оказывается равной 2,0014 .

Обратите внимание, что функция =СТАНДОТКЛОН() вычисляет выборочное среднее, что эквивалентно функции =СТАНДОТКЛОН.С() в Excel.

Таким образом, мы могли бы использовать следующую формулу для получения тех же результатов:

Стандартная ошибка среднего значения в Excel с использованием выборочного стандартного отклонения

И снова стандартная ошибка оказывается равной 2,0014 .

Как интерпретировать стандартную ошибку среднего

Стандартная ошибка среднего — это просто мера того, насколько разбросаны значения вокруг среднего. При интерпретации стандартной ошибки среднего следует помнить о двух вещах:

1. Чем больше стандартная ошибка среднего, тем более разбросаны значения вокруг среднего в наборе данных.

Чтобы проиллюстрировать это, рассмотрим, изменим ли мы последнее значение в предыдущем наборе данных на гораздо большее число:

Обратите внимание на скачок стандартной ошибки с 2,0014 до 6,9783.Это указывает на то, что значения в этом наборе данных более разбросаны вокруг среднего значения по сравнению с предыдущим набором данных.

2. По мере увеличения размера выборки стандартная ошибка среднего имеет тенденцию к уменьшению.

Чтобы проиллюстрировать это, рассмотрим стандартную ошибку среднего для следующих двух наборов данных:

Второй набор данных — это просто первый набор данных, повторенный дважды. Таким образом, два набора данных имеют одинаковое среднее значение, но второй набор данных имеет больший размер выборки, поэтому стандартная ошибка меньше.

Функция СРЗНАЧЕСЛИ

В этой статье описаны синтаксис формулы и использование СРЗНАЧЕСЛИ функция в Microsoft Excel.

Описание

Возвращает среднее значение (среднее арифметическое) всех ячеек в диапазоне, которые соответствуют данному условию.

Синтаксис

СРЗНАЧЕСЛИ(диапазон, условия, [диапазон_усреднения])

Аргументы функции СРЗНАЧЕСЛИ указаны ниже.

Диапазон. Обязательный. Одна или несколько ячеек для вычисления среднего, включающих числа или имена, массивы или ссылки, содержащие числа.

Условие. Обязательный. Условие в форме числа, выражения, ссылки на ячейку или текста, которое определяет ячейки, используемые при вычислении среднего. Например, условие может быть выражено следующим образом: 32, «32», «>32», «яблоки» или B4.

Диапазон_усреднения. Необязательный. Фактическое множество ячеек для вычисления среднего. Если этот параметр не указан, используется диапазон.

Замечания

Ячейки в диапазоне, которые содержат значения ИСТИНА или ЛОЖЬ, игнорируются.

Если ячейка в «диапазоне_усреднения» пустая, функция СРЗНАЧЕСЛИ игнорирует ее.

Если диапазон является пустым или текстовым значением, СРЗНАЧЕСЛИ Возвращает #DIV0! значение ошибки #ЗНАЧ!.

Если ячейка в условии пустая, «СРЗНАЧЕСЛИ» обрабатывает ее как ячейки со значением 0.

Если ни одна из ячеек в диапазоне не удовлетворяет критерию, СРЗНАЧЕСЛИ Возвращает #DIV/0! значение ошибки #ДЕЛ/0!.

В этом аргументе можно использовать подстановочные знаки: вопросительный знак (?) и звездочку (*). Вопросительный знак соответствует любому одиночному символу; звездочка — любой последовательности символов. Если нужно найти сам вопросительный знак или звездочку, то перед ними следует поставить знак тильды (

Значение «диапазон_усреднения» не обязательно должно совпадать по размеру и форме с диапазоном. При определении фактических ячеек, для которых вычисляется среднее, в качестве начальной используется верхняя левая ячейка в «диапазоне_усреднения», а затем добавляются ячейки с совпадающим размером и формой. Например:

Если диапазон равен

Примечание: Функция СРЗНАЧЕСЛИ измеряет среднее значение, то есть центр набора чисел в статистическом распределении. Существует три наиболее распространенных способа определения среднего значения: :

Среднее значение — это среднее арифметическое, которое вычисляется путем сложения набора чисел с последующим делением полученной суммы на их количество. Например, средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.

Медиана — это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Например, медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.

Мода — это число, наиболее часто встречающееся в данном наборе чисел. Например, модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.

При симметричном распределении множества чисел все три значения центральной тенденции будут совпадать. При смещенном распределении множества чисел значения могут быть разными.

Примеры

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

How to dou

Анализ НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ | АНАЛИЗ ДАННЫХ #4

Table of Contents:

Когда вы создаете граф в Excel и ваши данные являются средствами, рекомендуется включить стандартную ошибку каждого значения на вашем графике. Это дает зрителю представление о распространении баллов вокруг каждого среднего.

Вот пример ситуации, когда это возникает. Данные являются (вымышленными) результатами тестов для четырех групп людей. Каждый заголовок столбца указывает количество времени подготовки для восьми человек в группе. Вы можете использовать графические возможности Excel для рисования графика. Поскольку независимая переменная является количественной, граф линии является подходящим.

Четыре группы, их средства, стандартные отклонения и стандартные ошибки. На графике показаны групповые средства.

Для каждой группы вы можете использовать AVERAGE для вычисления среднего и STDEV. S для вычисления стандартного отклонения. Вы можете рассчитать стандартную ошибку каждого среднего. Выберите ячейку B12, поэтому в поле формулы показано, что вы вычислили стандартную ошибку для столбца B по этой формуле:

= B11 / SQRT (COUNT (B2: B9))

Фокус в том, чтобы получить каждую стандартную ошибку в графике. В Excel 2016 это легко сделать, и оно отличается от предыдущих версий Excel. Начните с выбора графика. Это приведет к появлению вкладок Design and Format. Выберите

Дизайн | Добавить элемент диаграммы | Ошибка баров | Дополнительные параметры ошибок.

Путь к вставке баров ошибок.

В меню «Бары ошибок» вы должны быть осторожны. Один из вариантов — стандартная ошибка. Избегай это. Если вы считаете, что этот выбор указывает Excel на стандартную ошибку каждого значения на графике, будьте уверены, что Excel не имеет абсолютно никакого представления о том, о чем вы говорите. Для этого выбора Excel вычисляет стандартную ошибку набора из четырех средств — не стандартную ошибку в каждой группе.

Дополнительные параметры панели ошибок являются подходящим выбором. Откроется панель «Формат ошибок».

Панель «Ошибки формата».

В области «Направление» панели выберите переключатель рядом с «Оба», а в области «Стиль конца» выберите переключатель рядом с «Кап».

Один выбор в области «Сумма ошибки» — это стандартная ошибка. Избегайте этого. Это не означает, что Excel помещает стандартную ошибку каждого среднего на график.

Прокрутите вниз до области «Сумма ошибки» и выберите переключатель рядом с «Пользовательский». Это активирует кнопку «Укажите значение». Нажмите эту кнопку, чтобы открыть диалоговое окно «Пользовательские ошибки». С помощью курсора в поле «Положительное значение ошибки» выберите диапазон ячеек, который содержит стандартные ошибки ($ B $ 12: $ E $ 12). Вставьте вкладку «Отрицательная ошибка» и сделайте то же самое.

Диалоговое окно «Нестандартные ошибки».

Это поле Negative Error Value может дать вам небольшую проблему. Перед тем, как вводить диапазон ячеек, убедитесь, что он очищен от значений по умолчанию.

Нажмите «ОК» в диалоговом окне «Нестандартные ошибки» и закройте диалоговое окно «Формат ошибок», и график будет выглядеть следующим образом.

График группы означает, включая стандартную ошибку каждого среднего.

Стандартная ошибка средней арифметической

Среднее арифметическое, как известно, используется для получения обобщающей характеристики некоторого набора данных. Если данные более-менее однородны и в них нет аномальных наблюдений (выбросов), то среднее хорошо обобщает данные, сведя к минимуму влияние случайных факторов (они взаимопогашаются при сложении).

Когда анализируемые данные представляют собой выборку (которая состоит из случайных значений), то среднее арифметическое часто (но не всегда) выступает в роли приближенной оценки математического ожидания. Почему приближенной? Потому что среднее арифметическое – это величина, которая зависит от набора случайных чисел, и, следовательно, сама является случайной величиной. При повторных экспериментах (даже в одних и тех же условиях) средние будут отличаться друг от друга.

Для того, чтобы на основе статистического анализа данных делать корректные выводы, необходимо оценить возможный разброс полученного результата. Для этого рассчитываются различные показатели вариации. Но то исходные данные. И как мы только что установили, среднее арифметическое также обладает разбросом, который необходимо оценить и учитывать в дальнейшем (в выводах, в выборе метода анализа и т.д.).

Интуитивно понятно, что разброс средней должен быть как-то связан с разбросом исходных данных. Основной характеристикой разброса средней выступает та же дисперсия.

Дисперсия выборочных данных – это средний квадрат отклонения от средней, и рассчитать ее по исходным данным не составляет труда, например, в Excel предусмотрены специальные функции. Однако, как же рассчитать дисперсию средней, если в распоряжении есть только одна выборка и одно среднее арифметическое?

Расчет дисперсии и стандартной ошибки средней арифметической

Чтобы получить дисперсию средней арифметической нет необходимости проводить множество экспериментов, достаточно иметь только одну выборку. Это легко доказать. Для начала вспомним, что средняя арифметическая (простая) рассчитывается по формуле:

где xi – значения переменной,
n – количество значений.

Теперь учтем два свойства дисперсии, согласно которым, 1) — постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат и 2) — дисперсия суммы независимых случайных величин равняется сумме соответствующих дисперсий. Предполагается, что каждое случайное значение xi обладает одинаковым разбросом, поэтому несложно вывести формулу дисперсии средней арифметической:

Используя более привычные обозначения, формулу записывают как:

где σ 2 – это дисперсия, случайной величины, причем генеральная.

На практике же, генеральная дисперсия известна далеко не всегда, точнее совсем редко, поэтому в качестве оной используют выборочную дисперсию:

Стандартное отклонение средней арифметической называется стандартной ошибкой средней и рассчитывается, как квадратный корень из дисперсии.

Формула стандартной ошибки средней при использовании генеральной дисперсии

Формула стандартной ошибки средней при использовании выборочной дисперсии

Последняя формула на практике используется чаще всего, т.к. генеральная дисперсия обычно не известна. Чтобы не вводить новые обозначения, стандартную ошибку средней обычно записывают в виде соотношения стандартного отклонения выборки и корня объема выборки.

Назначение и свойство стандартной ошибки средней арифметической

Стандартная ошибка средней много, где используется. И очень полезно понимать ее свойства. Посмотрим еще раз на формулу стандартной ошибки средней:

Числитель – это стандартное отклонение выборки и здесь все понятно. Чем больше разброс данных, тем больше стандартная ошибка средней – прямо пропорциональная зависимость.

Посмотрим на знаменатель. Здесь находится квадратный корень из объема выборки. Соответственно, чем больше объем выборки, тем меньше стандартная ошибка средней. Для наглядности изобразим на одной диаграмме график нормально распределенной переменной со средней равной 10, сигмой – 3, и второй график – распределение средней арифметической этой же переменной, полученной по 16-ти наблюдениям (которое также будет нормальным).

Судя по формуле, разброс стандартной ошибки средней должен быть в 4 раза (корень из 16) меньше, чем разброс исходных данных, что и видно на рисунке выше. Чем больше наблюдений, тем меньше разброс средней.

Казалось бы, что для получения наиболее точной средней достаточно использовать максимально большую выборку и тогда стандартная ошибка средней будет стремиться к нулю, а сама средняя, соответственно, к математическому ожиданию. Однако квадратный корень объема выборки в знаменателе говорит о том, что связь между точностью выборочной средней и размером выборки не является линейной. Например, увеличение выборки с 20-ти до 50-ти наблюдений, то есть на 30 значений или в 2,5 раза, уменьшает стандартную ошибку средней только на 36%, а со 100-а до 130-ти наблюдений (на те же 30 значений), снижает разброс данных лишь на 12%.

Лучше всего изобразить эту мысль в виде графика зависимости стандартной ошибки средней от размера выборки. Пусть стандартное отклонение равно 10 (на форму графика это не влияет).

Видно, что примерно после 50-ти значений, уменьшение стандартной ошибки средней резко замедляется, после 100-а – наклон постепенно становится почти нулевым.

Таким образом, при достижении некоторого размера выборки ее дальнейшее увеличение уже почти не сказывается на точности средней. Этот факт имеет далеко идущие последствия. Например, при проведении выборочного обследования населения (опроса) чрезмерное увеличение выборки ведет к неоправданным затратам, т.к. точность почти не меняется. Именно поэтому количество опрошенных редко превышает 1,5 тысячи человек. Точность при таком размере выборки часто является достаточной, а дальнейшее увеличение выборки – нецелесообразным.

Подведем итог. Расчет дисперсии и стандартной ошибки средней имеет довольно простую формулу и обладает полезным свойством, связанным с тем, что относительно хорошая точность средней достигается уже при 100 наблюдениях (в этом случае стандартная ошибка средней становится в 10 раз меньше, чем стандартное отклонение выборки). Больше, конечно, лучше, но бесконечно увеличивать объем выборки не имеет практического смысла. Хотя, все зависит от поставленных задач и цены ошибки. В некоторых опросах участие принимают десятки тысяч людей.

Дисперсия и стандартная ошибка средней имеют большое практическое значение. Они используются в проверке гипотез и расчете доверительных интервалов.

Стандартная ошибка в Excel

Расчет с помощью комбинаций функций

На примере рассмотрим составленный алгоритм действий по расчету ошибки средней арифметической с использованием комбинаций функций. Для того чтобы выполнить задачу, нужно использовать операторы СТАНДОТКЛОН.В, КОРЕНЬ и СЧЁТ. Выборка будет использоваться из 12 чисел, которые представлены в таблице.

Выделите ячейку, в которой отобразится итоговое значение стандартной ошибки. Кликаете на иконку «Вставить функцию».

Появится Мастер функций, в котором нужно произвести перемещение в блок «Статистические». Появится список наименований, выбираете «СТАНДОТКЛОН.В».

Запустится окно аргументов выбранного оператора, предназначенного для оценивания стандартного отклонения при выборке. У него такой синтаксис — =СТАНДОТКЛОН.В(число1;число2;…). Устанавливаете курсор в полу «Число1». Далее, зажав левую кнопку мыши, выделяете курсором весь диапазон выборки, чтобы координаты этого массива отобразились там же в поле окна. Кликаете на ОК.

В ячейке появится проделанный результат, но это еще не то, что мы хотим получить в итоге. Теперь нужно стандартное отклонение разделить на квадратный корень от числа элементов выборки. Выделяете ячейку с нужной функцией и устанавливаете курсор мышки в строку формул. Дописываете выражение, которое там уже существует, знаком деления (/). Далее нажимаете на пиктограмму перевернутого вниз углом треугольника (находится слева от строки формул). Должен открыться список недавно использованных функций. Находите оператора «КОРЕНЬ» и нажимаете на него. Если его нет в списке, то кликайте на «Другие функции…».

Должен снова запуститься Мастер функций, в котором нужно перейти в категорию «Математические». Выделяете там «КОРЕНЬ» и кликаете ОК.

Далее должно открыться окно аргументов функции КОРЕНЬ. Его синтаксис простой — =КОРЕНЬ(число). Устанавливаете курсор в поле «Число» и нажимаете на уже знакомый треугольник, чтобы показался список последних использованных функций. Находите «СЧЕТ» и нажимаете на него. Если в списке его нет, тогда нажимаете на «Другие функции…».

Появится раскрывшееся окно Мастера функций, в котором нужно переместиться в группу «Статистические». В ней выделяете «СЧЕТ» и кликаете ОК.

Должно запуститься окно аргументов функции СЧЕТ. Синтаксис функции будет таким — =СЧЁТ(значение1;значение2;…). Ставите курсор в строку «Значение1» и зажимаете левую кнопку мыши, чтобы выделить весь диапазон выборки. Когда координаты отобразятся, жмите ОК.

Когда будет выполнено последнее действие, то не только произведется расчет количества ячеек, которые заполнены числами, но и вычисляется ошибка средней арифметической. Величина будет выведена в ячейку с размещенной сложной формулой, вид которой таков — =СТАНДОТКЛОН.В(B2:B13)/КОРЕНЬ(СЧЁТ(B2:B13)).

Если выборка до 30 единиц, тогда лучше применять немного другую формулу — =СТАНДОТКЛОН.В(B2:B13)/КОРЕНЬ(СЧЁТ(B2:B13)-1).

Применение инструмента «Описательная статистика»

Когда будет открыт документ с выборкой, нужно перейти во вкладку «Файл».

В левом вертикальном меню заходите в раздел «Параметры».

Должно запуститься окно параметров Excel, в левой части которого нужно перейти в «Надстройки».

В самом низу окна находите «Управление» в выставляете в нем параметр «Надстройки Excel». Кликаете на «Перейти…» справа от него.

В окне надстроек появится список скриптов, которые доступны и нужно отметить галочкой «Пакет анализа», а затем нажать ОК.

Теперь на странице должна появиться новая группа инструментов «Анализ». Для перехода к ней кликаете на вкладку «Данные».

Кликаете на «Анализ данных» в блоке инструментов «Анализ» в самом конце.

Запустится окно выбора инструмента анализа, в котором необходимо выделить «Описательная статистика» и нажать справа на ОК.

Далее запустится окно настроек инструмента комплексного статистического анализа «Описательная статистика». Здесь нужно установить все так, в зависимости от того, что именно вы хотите получить в итоге.

После всех совершенных манипуляций, инструмент «Описательная статистика» должен отобразить результаты обработки выборки на текущем листе. Разноплановых статистических показателей будет немало, но среди них находится и тот, который нам нужен – «Стандартная ошибка».

Функция СРЗНАЧЕСЛИ

В этой статье описаны синтаксис формулы и использование СРЗНАЧЕСЛИ функция в Microsoft Excel.

Описание

Возвращает среднее значение (среднее арифметическое) всех ячеек в диапазоне, которые соответствуют данному условию.

Синтаксис

СРЗНАЧЕСЛИ(диапазон, условия, [диапазон_усреднения])

Аргументы функции СРЗНАЧЕСЛИ указаны ниже.

Диапазон. Обязательный. Одна или несколько ячеек для вычисления среднего, включающих числа или имена, массивы или ссылки, содержащие числа.

Условие. Обязательный. Условие в форме числа, выражения, ссылки на ячейку или текста, которое определяет ячейки, используемые при вычислении среднего. Например, условие может быть выражено следующим образом: 32, «32», «>32», «яблоки» или B4.

Диапазон_усреднения. Необязательный. Фактическое множество ячеек для вычисления среднего. Если этот параметр не указан, используется диапазон.

Замечания

Ячейки в диапазоне, которые содержат значения ИСТИНА или ЛОЖЬ, игнорируются.

Если ячейка в «диапазоне_усреднения» пустая, функция СРЗНАЧЕСЛИ игнорирует ее.

Если диапазон является пустым или текстовым значением, СРЗНАЧЕСЛИ Возвращает #DIV0! значение ошибки #ЗНАЧ!.

Если ячейка в условии пустая, «СРЗНАЧЕСЛИ» обрабатывает ее как ячейки со значением 0.

Если ни одна из ячеек в диапазоне не удовлетворяет критерию, СРЗНАЧЕСЛИ Возвращает #DIV/0! значение ошибки #ДЕЛ/0!.

В этом аргументе можно использовать подстановочные знаки: вопросительный знак (?) и звездочку (*). Вопросительный знак соответствует любому одиночному символу; звездочка — любой последовательности символов. Если нужно найти сам вопросительный знак или звездочку, то перед ними следует поставить знак тильды (

Значение «диапазон_усреднения» не обязательно должно совпадать по размеру и форме с диапазоном. При определении фактических ячеек, для которых вычисляется среднее, в качестве начальной используется верхняя левая ячейка в «диапазоне_усреднения», а затем добавляются ячейки с совпадающим размером и формой. Например:

Если диапазон равен

Примечание: Функция СРЗНАЧЕСЛИ измеряет среднее значение, то есть центр набора чисел в статистическом распределении. Существует три наиболее распространенных способа определения среднего значения: :

Среднее значение — это среднее арифметическое, которое вычисляется путем сложения набора чисел с последующим делением полученной суммы на их количество. Например, средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.

Медиана — это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Например, медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.

Мода — это число, наиболее часто встречающееся в данном наборе чисел. Например, модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.

При симметричном распределении множества чисел все три значения центральной тенденции будут совпадать. При смещенном распределении множества чисел значения могут быть разными.

Примеры

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

Критерий Стьюдента применяется для проверки равенства средних значений двух выборок, сравнение количественных значений только двух выборок с нормальным распределением случайной величины. 

 Критерий Стьюдента определяется по формуле:

Критерий Стьюдента формула

$bar{X_1}$ – выборочные средние значения первой выборки;

$bar{X_2}$ – выборочные средние значения второй выборки;

n1 – объем первой выборки;

n2 – объем второй выборки;

σ1 и σ2 – среднее квадратическое отклонение в соответствующих выборках и находятся из формулы:

СКО

Число степеней свободы определяется по формуле:

k=n1+n2−2

Fкр(α, k) определяется по таблице

При Fнабл<Fкр нулевая гипотеза принимается.

Формула критерия Стьюдента для несвязанных независимых выборок:

Формула критерия Стьюдента для независимых выборок

Формула для определения стандартной ошибки разности средних арифметических σxy:

стандартная ошибка разности средних арифметических формула

Число степеней свободы определяется выражением:

k=n1+n2–2

При n1=n2 число степеней свободы находится по формуле:

k=2n-2

а стандартная ошибка разности средних арифметических σxy задаётся выражением:

стандартная ошибка разности средних арифметических


Пример

Даны две выборки.

В первой выборки продажа товара со скидкой, а во второй без скидки.

№ п/п X Y
1 25 19
2 34 31
3 23 17
4 35 24
5 33 28
6 25 31
7 45 39
8 41 32
9 27 38
10 54 43
11 32 21
12 32

По критерию Стьюдента определить зависит ли спрос на товар от скидок на него при p=0.99?

Решение

В соответствии с таблицей n1=12, n2=11

Вычислим дисперсии D(X), D(Y)

№ п/п X Y D(X) D(Y)
1 25 19 78,028 107,4
2 34 31 0,0278 2,6777
3 23 17 117,36 152,86
4 35 24 1,3611 28,769
5 33 28 0,6944 1,8595
6 25 31 78,028 2,6777
7 45 39 124,69 92,86
8 41 32 51,361 6,9504
9 27 38 46,694 74,587
10 54 43 406,69 185,95
11 32 21 3,3611 69,95
12 32 3,3611
Сумма 406 323 911,67 726,55
Среднее 33,833 29,364

Подставим значения в формулу стандартной ошибки разности средних арифметических σxy:

 стандартная ошибка разности решение

Вычисляем критерий Стьюдента:

критерий Стьюдента решение

Число степеней свободы равно:

k=12+11–2=21

По таблице Стьюдента находим критическое значение:

tкрит=2,8310     

Отсюда tкрит> tнабл, следовательно, зависит.

18953


Условное обозначение средней ошибки среднего арифметического — т. Следует помнить, что под «ошибкой» в статистике понимается не ошибка исследования, а мера представительства данной величины, т. е. мера, которой средняя арифметическая величина, полученная на выборочной совокупности (в нашем примере — на 125 детях), отличается от истинной средней арифметической величины, которая была бы получена на генеральной совокупности (в нашем примере это были бы все дети аналогичного возраста, уровня подготовленности и т. д.). Например, в приведенном ранее примере определялась точность попадания малым мячом в цель у 125 детей и была получена средняя арифметическая величина примерно равная 5,6 см. Теперь надо установить, в какой мере эта величина будет характерна, если взять для исследования 200, 300, 500 и больше аналогичных детей. Ответ на этот вопрос и даст вычисление средней ошибки среднего арифметического, которое производится по формуле:

Для приведенного примера величина средней ошибки среднего арифметического будет равна:

Следовательно, M±m = 5,6±0,38. Это означает, что полученная средняя арифметическая величина (M = 5,6) может иметь в других аналогичных исследованиях значения от 5,22 (5,6 — 0,38 = 5,22) до 5,98 (5,6+0,38 = 5,98).

4. Вычисление средней ошибки разности

Условное обозначение средней ошибки разности — t. Таким образом, установлены основные статистические параметры, характеризующие количественную сторону эффективности одной из методик обучения метанию малых мячей в цель. Но в приведенном примере речь шла о сравнительном эксперименте, в котором сопоставлялись две методики обучения. Предположим, что вычисленные параметры характеризуют методику «А». Тогда для методики «Б» также необходимо вычислить аналогичные статистические параметры. Допустим, они будут равны:

МБ 4,7; σБ ± 3,67 mБ ± 0,33

Теперь есть числовые характеристики двух разных методик обучения. Необходимо установить, насколько эти характеристики достоверно различны, т. е. установить статистически реальную значимость разницы между ними. Условно принято считать, что если разница равна трем своим ошибкам или больше, то она является достоверной:

В приведенном примере:

0,9<1,5

Следовательно, найденные количественные характеристики двух методик обучения не имеют достоверных различий и объясняются не закономерными, а случайными факторами. Поэтому можно сделать следующий педагогический вывод: обе методики обучения равноценны по своей эффективности; новая методика расширяет существующие способы решения данной педагогической задачи.

Подобное вычисление средней ошибки разности применяется в тех случаях, когда имеются количественно значительные показатели п (т. е. при большом числе вариант). Если же в распоряжении экспериментатора имеется небольшое число наблюдений (менее 20), то целесообразно вычислять среднюю ошибку разности по формулам:

где С — число степеней свободы вариаций от 1 до ∞, которые равны числу наблюдений без единицы (С = п — 1).

В виде примера можно привести исследование, в котором оценивалась разница в величине становой динамометрии боксеров двух весовых категорий (А. Г. Жданова, 1961). Были получены следующие исходные данные: тяжелый вес — п1 = 12 человек, легкий вес — п2 = 15человек.

М1 = 139,2 кг M2 = 135,0 кг

σ1 = ± 4,2 кг σ2 = ±4,0 кг

m1 = ± 1,23 кг m2 = ± 1,69 кг

Если подставить эти значения в формулы, то получится:

Далее достоверность различия определяют по таблице вероятностей P/t/≥/t1/ по распределению Стьюдента (t — критерий Стьюдента).

В данной таблице столбец t является нормированным отклонением и содержит числа, которые показывают, во сколько раз разница больше средней ошибки. По вычисленным показателям t и С в таблице определяется число Р, которое показывает вероятность разницы между М1 и М2. Чем больше Р, тем менее существенна разница, тем меньше достоверность различий.

В приведенном примере при значении t 2,0 и С = 25 число Р будет равняться 0,0455 (в таблице оно расположено на пересечении строки, соответствующей t 2,0, и столбца, соответствующего С = ∞). Это свидетельствует о том, что реальная разница весьма вероятна.

В тех случаях, когда расчеты показывают отсутствие достоверности различия, преждевременно считать, что между изучаемыми явлениями вообще не может быть различия. Можно лишь утверждать, что нет различия при данных условиях исследования. При увеличении объема выборки достоверность в различии может появиться. Это положение является главным доказательством важности правильного определения необходимого числа исследований до начала эксперимента.

СПИСОК ЛИТЕРАТУРЫ

  1. Масальгин Н.А. Математико-статистические методы в спорте. М., ФиС, 1974.

  2. Методика и техника статистической обработки первичной социологической информации. Отв. ред. Г.В. Осипов. М., «Наука», 1968.

  3. Начинская С.В. Основы спортивной статистики. — К.: Вища шк., 1987. — 189 с.

  4. Толоконцев Н.А. Вычисление среднего квадратичного отклонения по размаху. Сравнение с общепринятым методом. Тезисы докладов третьего совещания по применению математических методов в биологии. ЛГУ, 1961, стр. 83 — 85.

  5. Фаламеев А.И., Выдрин В.М. Научно-исследовательская работа в тяжелой атлетике. ГДОИФК им. П. Ф. Лесгафта, 1974.

Оценка разности двух показателей

При оценке
существенности разности двух показателей
вначале находят разность
двух показателей

α
по формуле:

После этого
вычисляют среднюю
ошибку разности
Sα
и
коэффициент доверительности
tα
по формулам:


,

Пример:
Из 125 студентов у 43 (pЭГ
= 34,40%) выявлен высокий уровень личностной
тревожности в экспериментальной группе
(ЭГ). В контрольной группе (КГ) из 125
студентов – высокий уровень личностной
тревожности у 59 (pКГ
= 47,20%). Необходимо определить, имеются
ли существенные различия между
показателями экспериментальной (pЭГ)
и контрольной (pКГ)
групп.

В нашем примере α
= 12,80, Sα
= 6,16, tα
= 2,08. Разность показателей α
превышает
свою ошибку Sα
более, чем в 2 раза (tα
= 2,08).

По таблице Стьюдента
находим, что эмпирическое значение tα
(2,08) превышает табличное для вероятности
ошибки P
= 0,05 (5%). Значение коэффициента Стьюдента
зависит не только от вероятности P
, но и от объема выборки. Число
степеней свободы
n
при оценке
одного показателя равняется n
– 1
, при
оценке достоверности разности двух
показателей n
=
n1
+
n2
– 2
. Так как
эмпирическое значение tα
(2,08) превышает табличное для вероятности
ошибки P
= 0,05 (5%), следовательно, имеются существенные
различия в показателях высоких уровней
личностной тревожности среди студентов
экспериментальной и контрольной групп.

Таблица 2 – Значения
критерия t
(по Стьюденту)

Число степеней
свободы n

Вероятность
ошибки (P)

0,05 = 5%

0,02 = 2%

0,01 = 1%

0,001 = 0,1%

30

2,042

2,457

2,750

3,64

1,957

2,326

2,575

3,29

Определение средней ошибки показателей равных или близких к нулю или 100%

Величина средней
ошибки рассчитывается по формуле:

где
Sp
величина
средней ошибки;

t
– доверительный
коэффициент;

n
число
наблюдений (объем выборки).

Пример:
По данным минутной пробы Н.И Моисеевой
– В.М. Сысуева у всех 35 студентов
зарегистрирован средний уровень
способности к адаптации и ориентации
во времени (p
= 100%). Значит ли это, что в данной группе
отсутствуют студенты, имеющие высокие
или низкие способности к адаптации?

Принимаем
доверительный коэффициент t
= 2, что соответствует вероятности ошибки
меньше 5% (0,05), тогда средняя ошибка
показателя Sp
= 10,3%.

Следовательно,
при последующих испытаниях число лиц,
имеющих средние способности к адаптации
и ориентации во времени, может быть p
= 100%
10,3% = 89,7%.

Если необходимо
увеличить надежность вывода, можно
принять t
= 3.

Критерий х2

Часто возникает
задача сравнения частных (например,
процентных) распределений
данных. В этом случае можно воспользоваться
статистикой, именуемой х2-критерий:

где
Pk


частоты
результатов наблюдений до эксперимента;

Vk

частоты результатов наблюдений после
эксперимента;

S

общее
число групп, на которые разделились
результаты наблюдений.

Полученное
расчетным путем значение х2
сопоставляется
с табличным и в случае его превышения
или равенства делается вывод о значимости
различий с определенной вероятностью
допустимой
ошибки.

Таблица 3 – Граничные
(критические)
значения х2-критерия

Число
степеней свободы (S
– 1)

Вероятность
допустимой
ошибки

0,05

0,01

0,001

1

3,84

6,64

10,83

2

5,99

9,21

13,82

3

7,81

11,34

16,27

4

9,49

13,23

18,46

5

11,07

15,09

20,52

6

12,59

16,81

22,46

7

14,07

18,48

24,32

8

15,51

20,09

26,12

9

16,92

21,67

27,88

10

18,31

23,21

29,59

Например,
из 100 испытуемых до
начала эксперимента 30 человек показали
результаты
ниже средних, 50
средние
и 20
выше средних.
После проведения формирующего эксперимента
результаты
распределились следующим образом: 20
человек
показали результаты ниже среднего, 40
средние и 40

выше среднего уровня.

Можно ли, опираясь
на эти данные, утверждать, что формирующий
эксперимент, направленный на увеличение
показателей (например, уровней самооценки)
удался?

Для
ответа на данный вопрос воспользуемся
формулой.
В данном примере переменная Pk
принимает
значение
30 %, 50 %, 20 %, a
Vk

20
%, 40 %, 40 %. Подставив
эти значения в формулу, получим

Воспользуемся
теперь таблицей «Граничные
(критические)
значения х2-критерия»,
где для заданного числа степеней
свободы (S1=31=2)
можно определить степень
значимости различий показателей до и
после эксперимента. Полученное нами
значение 25,33 больше соответствующего
табличного значения
(13,82) при вероятности допустимой ошибки
меньше
0,1 % (0,001). Следовательно, эксперимент
удался, и мы можем
это утверждать, допуская ошибку, не
превышающую
0,1 %.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Стандартная ошибка разности средних Решение

ШАГ 0: Сводка предварительного расчета

ШАГ 1. Преобразование входов в базовый блок

Стандартное отклонение образца X: 2.8 —> Конверсия не требуется
Размер образца X: 14 —> Конверсия не требуется
Стандартное отклонение образца Y: 3.2 —> Конверсия не требуется
Размер образца Y: 16 —> Конверсия не требуется

ШАГ 2: Оцените формулу

ШАГ 3: Преобразуйте результат в единицу вывода

1.09544511501033 —> Конверсия не требуется




7 Ошибки Калькуляторы

Стандартная ошибка разности средних формула

Стандартная ошибка разности средних = sqrt(((Стандартное отклонение образца X^2)/Размер образца X)+((Стандартное отклонение образца Y^2)/Размер образца Y))

σμ1-μ2 = sqrt(((σX^2)/NX)+((σY^2)/NY))

Что такое стандартная ошибка и ее важность?

В статистике и анализе данных большое значение имеет стандартная ошибка. Термин «стандартная ошибка» используется для обозначения стандартного отклонения различных выборочных статистических данных, таких как среднее значение или медиана. Например, «стандартная ошибка среднего» относится к стандартному отклонению распределения выборочных средних, взятых из совокупности. Чем меньше стандартная ошибка, тем более репрезентативной будет выборка для генеральной совокупности. Соотношение между стандартной ошибкой и стандартным отклонением таково, что для данного размера выборки стандартная ошибка равна стандартному отклонению, деленному на квадратный корень размера выборки. Стандартная ошибка также обратно пропорциональна размеру выборки; чем больше размер выборки, тем меньше стандартная ошибка, потому что статистика будет приближаться к фактическому значению.

Понравилась статья? Поделить с друзьями:
  • Стандартная ошибка символ
  • Стандартная ошибка оценки уравнения регрессии формула
  • Стандартная ошибка регрессии формула эксель
  • Стандартная ошибка среднего статистика
  • Стандартная ошибка оценки среднего