Средняя ошибка выработки формула

Решение типовых задач

Пример
1.

Для изучения оснащения заводов основными
про­изводственными фондами было
проведено 10%-ное выборочное обследование,
в результате которого получены следующие
данные о распределении заводов по
стоимости основных производственных
фондов:

Среднегодовая
стоимость основных производственных
фондов, млн. руб.

До
2

2
– 4

4
– 6

Свыше
6

Итого

Число
заводов

5

12

23

10

50

Требуется
определить: 1) с вероятностью 0,997 предельную
ошибку выборочной средней и границы, в
которых будет находиться среднегодовая
стоимость основных производственных
фондов всех заводов генеральной
совокупности; 2) с вероятностью 0,954
предельную ошибку выборки при определении
доли и границы, в которых будет находиться
удельный вес заводов со стоимостью
основных производ­ственных фондов
свыше 4 млн. руб.

Решение.
Предельная
ошибка выборки (ошибка репрезентативности)
исчисляется по формуле:

,

где
μ
– средняя ошибка репрезентативности;

t

коэффициент кратности ошибки, показывающий,
сколько средних ошибок содержится в
предельной ошибке.

Пределы
возможной ошибки (∆) определяются с
вероятностью. Значение t
найдем
по таблице интеграла вероятностей.

Для Соответствует
вероятность

t
= 1 Р
=0,683;

t
= 2 Р
=0,954;

t
= 3 Р
=0,997
и т. д.

Конкретное
количественное выражение предельная
ошибка принимает после определения
средней ошибки выборки. Для нахождения
ошибки репрезентативности собственно
чайной и механической выборок имеются
нижеследующие формулы.

Повторная
выборка
при
определении:

среднего
размера ошибки признака (1)

средней
ошибки доли признака (2)

Бесповторная
выборка

при определении:

среднего
размера ошибки признака (3)

средней
ошибки доли признака (4)

N
– численность генеральной совокупности;

п
– численность выборочной совокупности;

2
– дисперсия варьирующего (осредняемого)
признака в выбороч­ной совокупности;

ω
– доля данного признака в выборке;

(1
– ω) – доля противоположного признака
в выборке.

1.
Для определения границ генеральной
средней необ­ходимо исчислить среднюю
выборочную (
дисперсию (2),
техника расчета которых приведена в
таблице:

Среднегодовая
стоимость основных производственных
фондов, млн. руб., х

Число
заводов, f

Середина
интервала, х

х
f

х

(х

)2

(х

)2
f

До
2

5

1

5

-3,52

12,39

61,95

2
– 4

12

3

36

-1,52

2,31

27,72

4
– 6

23

5

115

0,48

0,23

5,29

Свыше
6

10

7

70

2,48

6,15

61,50

50

226

156,46

Тогда


млн.
руб.;

.

Для
упрощения расчетов средней и дисперсии
можно использовать способ моментов.
Техника расчетов
и
2
по способу моментов изложена в первой
части брошюры «Прак­тикум по общей
теории статистики».

Итак
имеются данные: N
= 500, п
= 50 заводов; 2
= 3,13.

Средняя
ошибка выборки при определении
среднегодовой .стоимости основных
фондов составит:

а)
при повторном отборе (по формуле 1) –


±
0,25 млн. руб.;

б)
при бесповторном отборе (по формуле 3)


≈ ±
0,24 млн. руб.;

Следовательно,
при определении среднегодовой стоимости
основных производственных фондов в
среднем мы могли до­пустить среднюю
ошибку репрезентативности в 0,25 млн.
руб. при повторном и 0,24 млн. руб. при
бесповторном от­боре в ту или иную
сторону от среднегодовой стоимости
ос­новных производственных фондов,
приходящейся на один завод в выборочной
совокупности. Исчисленные данные
по­казывают, что при бесповторной
выборке средняя ошибка репрезентативности
(0,24) меньше, чем при тех же условиях при
повторном отборе (0,25).

В
нашем примере Р
=
0,997, следовательно, t
= 3.

Исчислим
предельную ошибку выборочной средней
(∆х):
х
= ±3μ; т. е. ∆х
= = ±3 × 0,25 = ±0,75 млн. руб. (при повтор­ном
отборе); ∆х
= ±3 × 0,24 = ±0,72 млн. руб. (при бесповторном
отборе).

Порядок
установления пределов, в которых
находится средняя величина изучаемого
показателя в генеральной со­вокупности
в общем виде, может быть представлен
следую­щим образом:

;

Для
нашего примера среднегодовая стоимость
основных производственных фондов в
среднем на один завод генеральной
совокупности будет находиться в следующих
пределах.

а)
при повторном отборе –


=
4,52 ± 0,25 или 4,27 млн. руб. ≤


4,77
млн.
руб.;

б)
при бесповторном отборе –


=
4,52 ± 0,24 или 4,28 млн. руб. ≤


4,76 млн. руб.

Эти
границы можно гарантировать е вероятностью
0,997.

2.
Вычисление пределов при установлении
доли осуще­ствляется аналогично
нахождению пределов для средней величины.
В общем виде расчет можно представить
следующим образом:

; ,

где
р

доля единиц, обладающих данным признаком
в генеральной совокупности.

Доля
заводов в выборочной совокупности со
стоимость основных производственных
фондов свыше 4 млн. руб. со­ставляет:

,
или 66%.

Определяем
предельную ошибку для дели. По условию
задачи известно, что N
= 500; n
= 5; ω = 0,66; Р
= 0,954; t
= 2.

Исчислим
предельную ошибку доли:

при
повторном отборе (по формуле 2) –

,
или 13,4%;

при
бесповторном отборе (по формуле 4) –

,
или 12,7%.

Следовательно,
с вероятностью 0,954 доля заведен се
стоимостью основных производственных
фондов свыше 4 млн. руб. в генеральной
совокупности будет находиться в пределах:

р
= 66% ± 13,4%, или 52,6% ≤ р ≤ 79,4% при повторном
отборе;

р
= 66%
± 12,7%, или 53,3% ≤ р ≤ 78,7% при бесповторном
отборе.

Расчеты
убеждают в том, что при бесповторном
отборе ошибка выборки меньше, чем при
тех же условиях при повторной выборке.

Пример
2.

Используя данные предыдущей задачи,
требуется ответить, каким должен быть
объем выборочной совокупности при
условии, что: 1) предельная ошибка выборки
при определении среднегодовой стоимости
основных производ­ственных фондов
(с вероятностью 0,997) была бы не более 0,5
млн. руб.; 2) то же при вероятности 0,954; 3)
предельная ошибка доли (с вероятностью
0,954) была бы не более 15%.

Решение.
Для нахождения численности случайной
и механической выборок имеются следующие
четыре формулы:

Повторный
отбор
Бесповторный
отбор

При
определении

среднего
размера

ошибки
признака


(5); (6);

При
определении

ошибки
доли признака


(7); (8).

1)
Известно, что N
= 500;

= 0,5 млн. руб.; 2
= 3,13; Р
= 0,997; t
= 3.

Найдем
объем выборки для расчета ошибки средней:

при
повторном отборе (по формуле 5) –


заводов;

при
бесповторном отборе (по формуле 6) –


завода.

2)
Известно, что N
= 500;

= 0,5 млн. руб.; 2
= 3,13; Р
= 0,954; t
= 2.

Определим
объем выборки при бесповторном отборе
(по формуле 6):


завода.

3)
Известно, что N
= 500;

= 0,5 млн. руб.; ω =
0,66; Р
= 0,954; t
= 2.

Объем
выборки для расчета ошибки доли будет:
при повторном отборе (по формуле 7) –


заводов;

при
бесповторном отборе (по формуле 8)


заводов.

Выводы:
1) численность выборки увеличится, если
при прочих равных условиях уменьшить
предельную ошибку; 2) численность выборки
уменьшится, если при прочих рав­ных
условиях уменьшить вероятность, с
которой требуется гарантировать
результат выборочного обследования;
3) численность выборки уменьшится, если
при прочих равных условиях увеличить
предельную ошибку.

Пример
3.

На заводе 1000 рабочих вырабатывают
одноименную продукцию. Из них со стажем
работы до пяти лет трудятся 400 чел., а
более пяти лет – 600 чел. Для изучения
среднегодовой выработки и установления
доли квалифицированных рабочих проведена
10%-ная типическая выборка с отбором
единиц пропорционально численности
рабочих по указанным группам (внутри
групп применялся случайный метод
отбора).

На
основе обследования получены следующие
данные:

Группы
рабочих со стажем работы

Общая
численность рабочих, чел., N

Число
обследованных рабочих, чел., п

Средне­дневная
выработка, шт.,

Дисперсия
выработки, Число

Число
рабочих в выработке, чел., m

Доля
рабочих,

До
5 лет (включ-но)

400

40

25

81

32

0,8

Свыше
5 лет

600

60

30

64

54

0,9

Итого

1000

100

Определим:
1) с вероятностью 0,954 предельную ошибку
выработки и границы, в которых будут
находиться среднедневная выработка
всех рабочих завода; 2) с той же вероятностью
пределы удельного веса квалифицированных
рабочих в общей численности рабочих
завода.

Решение.
1) Средняя ошибка типической выборки
определяется по формуле:

(9)

где



средняя
из внутригрупповых дисперсий.

Она
исчисляется по формуле:

;

Тогда

.

Определим
среднюю ошибку выборки при бесповторном
отборе (по формуле 9) :


шт.

Техника
расчета предельной ошибки при типической
вы­борке аналогична вышеизложенному
расчету предельной ошибки при случайном
отборе:

или
;

Подставив
данные, получим:

= ± 2 × 0,83 = ± 1,6 шт.

Для
определения возможных пределов
среднедневной вы­работки всех рабочих
завода первоначально нужно исчис­лить
среднедневную выработку в выборочной
совокупности по средней арифметической
взвешенной:

шт.

Пределы
среднедневной выработки всех рабочих
завода:
= 28 ± 1,6 шт.

С
вероятностью 0,954 можно утверждать, что
среднеднев­ная выработка всех рабочих
завода находится в пределах 26,4 шт. ≤

29,6 шт.

2)
Средняя ошибка репрезентативности для
доли исчис­ляется по формуле:

(10)

где


– дисперсия доли ()
является средней из внутри групповых
дисперсий.

Эта
величина исчисляется по формуле:

Технику
расчета покажем в таблице:

Группы
рабочих со стажем работы

Числен­ность
рабочих,

Доля
квали­фициро­ванных рабочих,

Доля
малоквалифицированных рабочих,

Дисперсия
доли

Взвешенный
показатель дисперсии,

До
5 лет

40

0,8

0,2

0,16

6,4

Свыше
5 лет

60

0,9

0,1

0,09

5,4

Итого

100

11,8

Тогда

.

Определим
среднюю ошибку репрезентативности для
доли (по формуле 10):

,
или ± 3,2%.

Исчислим
среднюю ошибку выборочной доли с
вероятностью 0,954:

,
или 6,4%.

Расчет
предела при установлении доли в общем
виде представляется следующим образом:

.

Определим
среднюю долю для выборочной совокупности:

,
или 86%.

Отсюда:
р
= 86% ± 6,4%.

Вывод:
с вероятностью 0,954 можно утверждать,
что доля квалифицированных рабочих на
заводе будет находить­ся в пределах
79,6% ≤ р
≤ 92,4%.

Пример
4.

С целью определения среднего
эксплуатационного пробега 10000 шин
легковых автомобилей, распределенных,
на партии по 100 шт., проводится серийная
4%-ная бесповторная выборка. Результаты
испытания отобранных шин характеризуются
следующими данными:

Показатели

Партии

1

2

3

4

Средний
эксплуатационный пробег шин, тыс. км

40

42

45

48

Доля
шин с пробегом не ме­нее 42 тыс. км

0,80

0,85

0,90

0,95

Определите:
1) средние ошибки репрезентативности:
а) эксплуатационного пробега шин; б)
удельного веса шин с пробегом не менее
42 тыс. км; 2) с вероятностью 0,954 пределы,
в которых будет находиться: а) средний
эксплуа­тационный пробег всех
обследуемых шин; б) доля шин, про­бег
которых не менее 42 тыс. км в генеральной
совокупности.

Решение.
1) При бесповторном отборе серий средняя
ошибка репрезентативности определяется
по формулам:

для
средней –

(11)

для
доли –

(12)

где
R
– число серий в генеральной совокупности;

r
– число отобранных серий;

– межсерийная
дисперсия средних;


межсерийная
дисперсия доли.

Сначала
исчислим обобщающие показатели.

Средний
эксплуатационный пробег шин:


тыс.
км.

Средний
удельный вес шин с пробегом не менее 42
тыс. км равен:


(или
87,5%)

Межсерийная
дисперсия определяется по формулам:
для средней –

для
средней –

;

для
доли –

.

Для
ее расчета построим вспомогательную
расчетную таб­лицу:

№ партии

Средний
пробег шин, тыс. км.,

Доля
шин с пробегом не менее 42 тыс. км.,

1

40

-3,75

14,06

0,8

-0,075

0,005625

2

42

-1,76

3,06

0,85

-0,025

0,000625

3

45

1,25

1,56

0,90

0,025

0,000625

4

48

4,25

18,06

0,95

0,075

0,005625

Итого

36,74

0,012500

Тогда

; .

Определим
средние ошибки репрезентативности:

для
средней (по формуле 11) –


тыс.
км.;

для
доли (по формуле 12) –

,
или ± 2,74%.

2)
Определим с вероятностью 0,954 предельные
ошибки репрезентативности для средней
и для доли:

тыс.
км.;

%.

Отсюда
средний эксплуатационный пробег
всех обсле­дуемых шин будет находиться
в пределах:


=


±

= 43,75 ± 3,0, или 40,75 тыс. км ≤ х
≤ 46,75 тыс. км.

Средний
удельный вес шин с пробегом не менее 42
тыс. км в генеральной совокупности будет
находиться в пределах:

p
=

±
=
87,5% ± 5,5%, или 82,0% ≤ р

93,0%.

Пример
5.

Используя условие и решение предыдущей
задачи, определите вероятность того,
что: а) предельная ошибка выборки при
установлении среднего эксплуатационного
про­бега шин не превышает 4,0 тыс. км;
б) доля шин с пробегом не менее 42 тыс. км
будет находиться в пределах от 83% До
92%.

Решение.
При определении вероятности используется
формула предельной ошибки:

.

В
нашем примере следует использовать
формулу пре­дельной ошибки серийного
отбора.

а)
Дано: R
= 100; r
= 4;
= 43,75 тыс. км;

= 9,185;

= 4,0 тыс. км.

Требуется
определить вероятность того, что разница
сред­них величин эксплуатационного
пробега шин в выборочной и генеральной
совокупности не превысит ± 4,0 тыс. км,
т. е.

р
|



|
≤ 4,0 тыс. км.

Подставляем
данные в формулу:

;

;

.

По
таблице значений вероятностей находим,
что при t
= 2,67
вероятность будет 0,992.

Следовательно,
с вероятностью 0,992 можно гарантиро­вать,
что средний эксплуатационный пробег
шин легковых автомобилей в генеральной
совокупности будет находиться в пределах
39,75 тыс. км ≤
≤ 47,75 тыс. км;

б)
Дано: R
= 100; r
= 4;
= 87,5%;

= 0,003125;

= 4,5%.

Требуется
определить: p
|
р
| ≤ 4,5%, т. е. вероятность того, что доля
шин с пробегом не менее 42 тыс. км в
вы­борочной совокупности не будет
отклоняться от доли гене­ральной
совокупности более чем на 4,5%.

Подставив
данные в формулу

(см.
решение выше), получим 4,5% = t
× 2,74%;


,
тогда Р
= 0,899.

Следовательно,
вероятность того, что удельный вес шин
с пробегом не менее 42 тыс. км будет
находиться в преде­лах от 83% до 92%,
равна 0,899.

Соседние файлы в папке статистика

  • #
  • #
  • #
  • #
  • #
  • #

Средние ошибки повторной и бесповторной выборки

Средняя ошибка выборки

Средняя ошибка выборки представляет из себя такое расхождение между средними выборочной и генеральной совокупностями, которое не превышает ±б (дельта).

На основании теоремы Чебышева П. Л. величина средней ошибки при случайном повторном отборе в контрольных работах по статистике рассчитывается по формуле (для среднего количественного признака):

Средняя ошибка выборки

где числитель — дисперсия признака х в выборочной совокупности;
n — численность выборочной совокупности.

Для альтернативного признака формула средней ошибки выборки для доли по теореме Я. Бернулли рассчитывается по формуле:

формула средней ошибки для альтернативного признака

где р(1- р) — дисперсия доли признака в генеральной совокупности;
n — объем выборки.

Вследствие, того что дисперсия признака в генеральной совокупности точно не известна, на практике используют значение дисперсии, которое рассчитано для выборочной совокупности на основании закона больших чисел. Согласно данному закону выборочная совокупность при большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Поэтому расчетные формулы средней ошибки при случайном повторном отборе будут выглядеть таким образом:

1. Для среднего количественного признака:

средняя ошибка при случайном повторном отборе

где S^2 — дисперсия признака х в выборочной совокупности;
n — объем выборки.

2. Для доли (альтернативного признака):

средняя ошибка при случайном повторном отборе для альтернативного признака

где w (1 — w) — дисперсия доли изучаемого признака в выборочной совокупности.

В теории вероятностей было показано, что генеральная дисперсия выражается через выборочную согласно формуле:

генеральная дисперсия

В случаях малой выборки, когда её объем меньше 30, необходимо учитывать коэффициент n/(n-1). Тогда среднюю ошибку малой выборки рассчитывают по формуле:

средняя ошибка малой выборки

Так как в процессе бесповторной выборки сокращается численность единиц генеральной совокупности, то в представленных выше формулах расчета средних ошибок выборки нужно подкоренное выражение умножить на 1- (n/N).

Расчетные формулы для такого вида выборки будут выглядеть так:

1. Для средней количественного признака:

средняя ошибка безповторной выборки

где N — объем генеральной совокупности; n — объем выборки.

2. Для доли (альтернативного признака):

средняя ошибка безповторной выборки для альтернативного признака

где 1- (n/N) — доля единиц генеральной совокупности, не попавших в выборку.

Поскольку n всегда меньше N, то дополнительный множитель 1 — (n/N) всегда будет меньше единицы. Это означает, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. Когда доля единиц генеральной совокупности, которые не попали в выборку, существенная, то величина 1 — (n/N) близка к единице и тогда расчет средней ошибки производится по общей формуле.

Средняя ошибка зависит от следующих факторов:

1. При выполнении принципа случайного отбора средняя ошибка выборки определяется во-первых объемом выборки: чем больше численность, тем меньше величины средней ошибки выборки. Генеральная совокупность характеризуется точнее тогда, когда больше единиц данной совокупности охватывает выборочное наблюдение

2. Средняя ошибка также зависит от степени варьирования признака. Степень варьирования характеризуется дисперсией. Чем меньше вариация признака (дисперсия), тем меньше средняя ошибка выборки. При нулевой дисперсии (признак не варьируется) средняя ошибка выборки равна нулю, таким образом, любая единица генеральной совокупности будет характеризовать всю совокупность по этому признаку.

Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.

11.2. Оценка результатов выборочного наблюдения

11.2.1. Средняя и предельная ошибки выборки. Построение доверительных границ для средней и доли

Средняя ошибка выборки показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной. Если рассчитать среднюю из ошибок всех возможных выборок определенного вида заданного объема (n), извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику — среднюю ошибку выборки ( \mu ).

В теории выборочного наблюдения выведены формулы для определения  \mu , которые индивидуальны для разных способов отбора (повторного и бесповторного), типов используемых выборок и видов оцениваемых статистических показателей.

Например, если применяется повторная собственно случайная выборка, то  \mu определяется как:

— при оценивании среднего значения признака;

— если признак альтернативный, и оценивается доля.

При бесповторном собственно случайном отборе в формулы вносится поправка (1 — n/N):

— для среднего значения признака;

— для доли.

Вероятность получения именно такой величины ошибки всегда равна 0,683. На практике же предпочитают получать данные с большей вероятностью, но это приводит к возрастанию величины ошибки выборки.

Предельная ошибка выборки (\Delta) равна t-кратному числу средних ошибок выборки (в теории выборки принято коэффициент t называть коэффициентом доверия):

\Delta =t \mu.

Если ошибку выборки увеличить в два раза (t = 2), то получим гораздо большую вероятность того, что она не превысит определенного предела (в нашем случае — двойной средней ошибки) — 0,954. Если взять t = 3, то доверительная вероятность составит 0,997 — практически достоверность.

Уровень предельной ошибки выборки зависит от следующих факторов:

  • степени вариации единиц генеральной совокупности;
  • объема выборки;
  • выбранных схем отбора (бесповторный отбор дает меньшую величину ошибки);
  • уровня доверительной вероятности.

Если объем выборки больше 30, то значение t определяется по таблице нормального распределения, если меньше — по таблице распределения Стьюдента.

Приведем некоторые значения коэффициента доверия из таблицы нормального распределения.

Таблица
11.2.

Значение доверительной вероятности P 0,683 0,954 0,997
Значение коэффициента доверия t 1,0 2,0 3,0

Доверительный интервал для среднего значения признака и для доли в генеральной совокупности устанавливается следующим образом:

Итак, определение границ генеральной средней и доли состоит из следующих этапов:

Ошибки выборки при различных видах отбора

  1. Собственно случайная и механическая выборка. Средняя ошибка собственно случайной и механической выборки находятся по формулам, представленным в табл. 11.3.

Таблица
11.3.
Формулы для расчета средней ошибки собственно случайной и механической выборки ( \mu )

где \sigma^{2} — дисперсия признака в выборочной совокупности.

Пример 11.2. Для изучения уровня фондоотдачи было проведено выборочное обследование 90 предприятий из 225 методом случайной повторной выборки, в результате которого получены данные, представленные в таблице.

Таблица
11.4.

Уровень фондоотдачи, руб. До 1,4 1,4-1,6 1,6-1,8 1,8-2,0 2,0-2,2 2,2 и выше Итого
Количество предприятий 13 15 17 15 16 14 90

В рассматриваемом примере имеем 40%-ную выборку (90 : 225 = 0,4, или 40%). Определим ее предельную ошибку и границы для среднего значения признака в генеральной совокупности по шагам алгоритма:

  1. По результатам выборочного обследования рассчитаем среднее значение и дисперсию в выборочной совокупности:

Таблица
11.5.

Результаты наблюдения Расчетные значения
уровень фондоотдачи, руб., xi количество предприятий, fi середина интервала, xi\xb4 xi\xb4fi xi\xb42fi
До 1,4 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2,2 и выше 14 2,3 32,2 74,06
Итого 90 162,6 303,62

Выборочная средняя

Выборочная дисперсия изучаемого признака

  1. Определяем среднюю ошибку повторной случайной выборки

  2. Зададим вероятность, на уровне которой будем говорить о величине предельной ошибки выборки. Чаще всего она принимается равной 0,999; 0,997; 0,954.

Для наших данных определим предельную ошибку выборки, например, с вероятностью 0,954. По таблице значений вероятности функции нормального распределения (см. выдержку из нее, приведенную в Приложении 1) находим величину коэффициента доверия t, соответствующего вероятности 0,954. При вероятности 0,954 коэффициент t равен 2.

  1. Предельная ошибка выборки с вероятностью 0,954 равна

    \delta_{x}= t\mu_{x}= 2*0.035 = 0.07

  2. Найдем доверительные границы для среднего значения уровня фондоотдачи в генеральной совокупности

Таким образом, в 954 случаях из 1000 среднее значение фондоотдачи будет не выше 1,88 руб. и не ниже 1,74 руб.

Выше была использована повторная схема случайного отбора. Посмотрим, изменятся ли результаты обследования, если предположить, что отбор осуществлялся по схеме бесповторного отбора. В этом случае расчет средней ошибки проводится по формуле

Тогда при вероятности равной 0,954 величина предельной ошибки выборки составит:

\delta_{x}= t\mu_{x}= 2*0.027 = 0.054

Доверительные границы для среднего значения признака при бесповторном случайном отборе будут иметь следующие значения:

Сравнив результаты двух схем отбора, можно сделать вывод о том, что применение бесповторной случайной выборки дает более точные результаты по сравнению с применением повторного отбора при одной и той же доверительной вероятности. При этом, чем больше объем выборки, тем существеннее сужаются границы значений средней при переходе от одной схемы отбора к другой.

По данным примера определим, в каких границах находится доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., в генеральной совокупности:

  1. рассчитаем выборочную долю.

Количество предприятий в выборке с уровнем фондоотдачи, не превышающим значения 2,0 руб., составляет 60 единиц. Тогда

m = 60, n = 90, w = m/n = 60 : 90 = 0,667;

  1. рассчитаем дисперсию доли в выборочной совокупности

\sigma_{w}^{2}= w(1 - w) = 0,667(1 - 0,667) = 0,222;

  1. средняя ошибка выборки при использовании повторной схемы отбора составит

Если предположить, что была использована бесповторная схема отбора, то средняя ошибка выборки с учетом поправки на конечность совокупности составит

  1. зададим доверительную вероятность и определим предельную ошибку выборки.

При значении вероятности Р = 0,997 по таблице нормального распределения получаем значение для коэффициента доверия t = 3 (см. выдержку из нее, приведенную в Приложении 1):

\delta_{x}= t\mu_{x}= 3*0.04 = 0.12

  1. установим границы для генеральной доли с вероятностью 0,997:

Таким образом, с вероятностью 0,997 можно утверждать, что в генеральной совокупности доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., не меньше, чем 54,7%, и не больше 78,7%.

  1. Типическая выборка. При типической выборке генеральная совокупность объектов разбита на k групп, тогда

N1 + N2 + … + Ni + … + Nk = N.

Объем извлекаемых из каждой типической группы единиц зависит от принятого способа отбора; их общее количество образует необходимый объем выборки

n1 + n2 + … + ni + … + nk = n.

Существуют следующие два способа организации отбора внутри типической группы: пропорциональной объему типических групп и пропорциональной степени колеблемости значений признака у единиц наблюдения в группах. Рассмотрим первый из них, как наиболее часто используемый.

Отбор, пропорциональный объему типических групп, предполагает, что в каждой из них будет отобрано следующее число единиц совокупности:

n = ni · Ni/N

где ni — количество извлекаемых единиц для выборки из i-й типической группы;

n — общий объем выборки;

Ni — количество единиц генеральной совокупности, составивших i-ю типическую группу;

N — общее количество единиц генеральной совокупности.

Отбор единиц внутри групп происходит в виде случайной или механической выборки.

Формулы для оценивания средней ошибки выборки для среднего и доли представлены в табл. 11.6.

Таблица
11.6.
Формулы для расчета средней ошибки выборки (\mu) при использовании типического отбора, пропорционального объему типических групп

Здесь \sigma^{2} — средняя из групповых дисперсий типических групп.

Пример 11.3. В одном из московских вузов проведено выборочное обследование студентов с целью определения показателя средней посещаемости вузовской библиотеки одним студентом за семестр. Для этого была использована 5%-ная бесповторная типическая выборка, типические группы которой соответствуют номеру курса. При отборе, пропорциональном объему типических групп, получены следующие данные:

Таблица
11.7.

Номер курса Всего студентов, чел., Ni Обследовано в результате выборочного наблюдения, чел., ni Среднее число посещений библиотеки одним студентом за семестр, xi Внутригрупповая выборочная дисперсия, \sigma_{i}^{2}
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
Итого 2 550 128 8

Число студентов, которое необходимо обследовать на каждом курсе, рассчитаем следующим образом:

  • общий объем выборочной совокупности:

    n = 2550/130*5 =128 (чел.);

  • количество единиц, отобранных из каждой типической группы:

аналогично для других групп:

n2 = 31 (чел.);

n3 = 29 (чел.);

n4 = 18 (чел.);

n5 = 17 (чел.).

Проведем необходимые расчеты.

  1. Выборочная средняя, исходя из значений средних типических групп, составит:

  2. Средняя из внутригрупповых дисперсий

  3. Средняя ошибка выборки:

    С вероятностью 0,954 находим предельную ошибку выборки:

    \delta_{x} = t\mu_{x} = 2*0.334 = 0.667

  4. Доверительные границы для среднего значения признака в генеральной совокупности:

Таким образом, с вероятностью 0,954 можно утверждать, что один студент за семестр посещает вузовскую библиотеку в среднем от семи до девяти раз.

  1. Малая выборка. В связи с небольшим объемом выборочной совокупности те формулы для определения ошибок выборки, которые использовались нами ранее при «больших» выборках, становятся неподходящими и требуют корректировки.

Среднюю ошибку малой выборки определяют по формуле

Предельная ошибка малой выборки:

\delta_{MB}= t\mu_{MB}

Распределение значений выборочных средних всегда имеет нормальный закон распределения (или приближается к нему) при п > 100, независимо от характера распределения генеральной совокупности. Однако в случае малых выборок действует иной закон распределения — распределение Стьюдента. В этом случае коэффициент доверия находится по таблице t-распределения Стьюдента в зависимости от величины доверительной вероятности Р и объема выборки п. В Приложении 1 приводится фрагмент таблицы t-распределения Стьюдента, представленной в виде зависимости доверительной вероятности от объема выборки и коэффициента доверия t.

Пример 11.4. Предположим, что выборочное обследование восьми студентов академии показало, что на подготовку к контрольной работе по статистике они затратили следующее количество часов: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6,6.

Оценим выборочные средние затраты времени и построим доверительный интервал для среднего значения признака в генеральной совокупности, приняв доверительную вероятность равной 0,95.

  1. Среднее значение признака в выборке равно

  2. Значение среднего квадратического отклонения составляет

  3. Средняя ошибка выборки:

  4. Значение коэффициента доверия t = 2,365 для п = 8 и Р = 0,95 .
  5. Предельная ошибка выборки:

    \delta_{MB}= t\mu_{MB}=2,365*0,344 = 0,81356 ~ 0,81 (ч)

  6. Доверительный интервал для среднего значения признака в генеральной совокупности:

То есть с вероятностью 0,95 можно утверждать, что затраты времени студента на подготовку к контрольной работе находятся в пределах от 6,9 до 8,5 ч.

11.2.2. Определение численности выборочной совокупности

Перед непосредственным проведением выборочного наблюдения всегда решается вопрос, сколько единиц исследуемой совокупности необходимо отобрать для обследования. Формулы для определения численности выборки выводят из формул предельных ошибок выборки в соответствии со следующими исходными положениями (табл. 11.7):

  1. вид предполагаемой выборки;
  2. способ отбора (повторный или бесповторный);
  3. выбор оцениваемого параметра (среднего значения признака или доли).

Кроме того, следует заранее определиться со значением доверительной вероятности, устраивающей потребителя информации, и с размером допустимой предельной ошибки выборки.

Таблица
11.8.
Формулы для определения численности выборочной совокупности

Примечание: при использовании приведенных в таблице формул рекомендуется получаемую численность выборки округлять в большую сторону для обеспечения некоторого запаса в точности.

Пример 11.5. Рассчитаем, сколько из 507 промышленных предприятий следует проверить налоговой инспекции, чтобы с вероятностью 0,997 определить долю предприятий с нарушениями в уплате налогов. По данным прошлого аналогичного обследования величина среднего квадратического отклонения составила 0,15; размер ошибки выборки предполагается получить не выше, чем 0,05.

При использовании повторного случайного отбора следует проверить

При бесповторном случайном отборе потребуется проверить

Как видим, использование бесповторного отбора позволяет проводить обследование гораздо меньшего числа объектов.

Пример 11.6. Планируется провести обследование заработной платы на предприятиях отрасли методом случайного бесповторного отбора. Какова должна быть численность выборочной совокупности, если на момент обследования в отрасли число занятых составляло 100 000 чел.? Предельная ошибка выборки не должна превышать 100 руб. с вероятностью 0,954. По результатам предыдущих обследований заработной платы в отрасли известно, что среднее квадратическое отклонение составляет 500 руб.

Следовательно, для решения поставленной задачи необходимо включить в выборку не менее 100 человек.

Понравилась статья? Поделить с друзьями:
  • Средняя ошибка выборки для средней величины характеризует тест
  • Средняя ошибка выборочной средней характеризует
  • Средняя ошибка средней арифметической это стандартное отклонение
  • Средняя ошибка аппроксимации диапазон
  • Средняя ошибка выборочной средней для бесповторного отбора