Повторный и бесповторный отбор.
Ошибка выборки
Краткая теория
На основании выборочных данных дается оценка статистических
показателей по всей (генеральной) совокупности. Подобное возможно, если выборка
основывается на принципах случайности отбора и репрезентативности
(представительности) выборочных данных. Каждая единица генеральной совокупности
должна иметь равную возможность (вероятность) попасть в выборку.
При формировании выборочной совокупности используются следующие
способы отбора: а) собственно-случайный отбор; б) механическая выборка; в)
типический (районированный) отбор; г) многоступенчатая (комбинированная)
выборка; д) моментно-выборочное наблюдение.
Выборка может осуществляться по схеме повторного и бесповторного
отбора.
В первом случае единицы совокупности, попавшие в выборку, снова
возвращаются в генеральную, а во втором случае – единицы совокупности, попавшие
в выборку, в генеральную совокупность уже не возвращаются.
Выборка может осуществляться отдельными единицами или сериями
(гнездами).
Собственно-случайная выборка
Отбор в этом случае производится либо по жребию, либо по таблицам
случайных чисел.
На основании приемов классической выборки решаются следующие
задачи:
а) определяются границы среднего значения показателя по генеральной
совокупности;
б) определяются границы доли признака по генеральной совокупности.
Предельная ошибка средней при собственно-случайном отборе
исчисляется по формулам:
а) при повторном отборе:
б) при бесповторном отборе:
где
– численность выборочной совокупности;
– численность генеральной совокупности;
– дисперсия признака;
– критерий кратности ошибки: при
;
при
;
при
.
Значения
определяются
по таблице функции Лапласа.
Границы (пределы) среднего значения признака по генеральной
совокупности определяются следующим неравенством:
где
– среднее значение признака по выборочной
совокупности.
Предельная ошибка доли при собственно-случайном отборе определяется
по формулам:
а) при повторном отборе:
при бесповторном отборе:
где
– доля единиц совокупности с заданным
значением признака в обзей численности выборки,
– дисперсия доли признака.
Границы (пределы) доли признака по всей (генеральной) совокупности
определяются неравенством:
где
– доля признака по генеральной совокупности.
Типическая (районированная) выборка
Особенность этого вида
выборки заключается в том, что предварительно генеральная совокупность по
признаку типизации разбивается на частные группы (типы, районы), а затем в
пределах этих групп производится выборка.
Предельная ошибка средней
при типическом бесповторном отборе определяется по формуле:
где
– средняя из внутригрупповых дисперсий
по каждой типичной группе.
При пропорциональном отборе из групп генеральной совокупности
средняя из внутригрупповых дисперсий определяется по формуле:
где
– численности единиц совокупности групп по выборке.
Границы (пределы) средней по генеральной совокупности на основании
данных типической выборки определяются по тому же неравенству, что при
собственно-случайной выборке. Только предварительно необходимо вычислить общую
выборочную среднюю
из частных выборочных средних
.
Для случая пропорционального отбора это определяется по формуле:
При непропорциональном отборе средняя из внутригрупповых дисперсий вычисляется по
формуле:
где
– численность единиц групп по генеральной
совокупности.
Общая выборочная средняя в этом случае определяется по формуле:
Предельная ошибка доли
признака при типическом бесповторном отборе определяется формулой:
Средняя дисперсия доли
признака из групповых дисперсий доли
при
типической пропорциональной выборке вычисляется по формуле:
Средняя доля признака по
выборке из показателей групповых долей рассчитывается формуле:
Средняя дисперсия доли при
непропорциональном типическом отборе определяется следующим образом:
а средняя доля признака:
Формулы ошибок выборки при типическом повторном отборе будут те же,
то и для случая бесповторного отбора. Отличие заключается только в том, что в
них будет отсутствовать по корнем сомножитель
.
Серийная выборка
Серийная ошибка выборки
может применяться в двух вариантах:
а) объем серий различный
б) все серии имеют
одинаковое число единиц (равновеликие серии).
Наиболее распространенной
в практике статистических исследований является серийная выборка с
равновеликими сериями. Генеральная совокупность делится на одинаковые по объему
группы-серии
и
производится отбор не единиц совокупности, а серий
. Группы (серии) для обследования отбирают в
случайном порядке или путем механической выборки как повторным, так и
бесповторными способами. Внутри каждой отобранной серии осуществляется сплошное
наблюдение. Предельные ошибки выборки
при
серийном отборе исчисляются по формулам:
а) при повторном отборе
б) при бесповторном отборе
где
– число
серий в генеральной совокупности;
– число
отобранных серий;
– межсерийная дисперсия, исчисляемая для случая равновеликих
серий по формуле:
где
–
среднее значение признака в каждой из отобранных серий;
– межсерийная
средняя, исчисляемая для случая равновеликих серий по формуле:
Определение численности выборочной совокупности
При проектировании
выборочного наблюдения важно наряду с организационными вопросами решить одну из
основных постановочных задач: какова должна быть необходимая численность
выборки с тем, чтобы с заданной степенью точности (вероятности) заранее
установленная ошибка выборки не была бы превзойдена.
Примеры решения задач
Задача 1
На основании результатов проведенного на заводе 5%
выборочного наблюдения (отбор случайный, бесповторный) получен следующий ряд
распределения рабочих по заработной плате:
Группы рабочих по размеру заработной платы, тыс.р. | до 200 | 200-240 | 240-280 | 280-320 | 320 и выше | Итого |
Число рабочих | 33 | 35 | 47 | 45 | 40 | 200 |
На основании приведенных данных определите:
1) с вероятностью 0,954 (t=2) возможные пределы, в которых
ожидается средняя заработная плата рабочего в целом по заводу (по генеральной
совокупности);
2) с вероятностью 0,997 (t=3) предельную ошибку и границы доли
рабочих с заработной платой от 320 тыс.руб. и выше.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Вычислим среднюю з/п: Для этого просуммируем произведения середин
интервалов и соответствующих частот, и полученную сумму разделим на сумму
частот.
2) Выборочная дисперсия:
Найдем доверительный интервал для средней. Предельная ошибка выборочной
средней считается по формуле:
где
—
аргумент функции Лапласа.
Искомые возможные пределы, в которых ожидается средняя заработная плата
рабочего в целом по заводу:
Найдем доверительный интервал для выборочной доли. Предельная ошибка
выборочной доли считается по формуле:
Доля рабочих с з/п от 320 тыс.р.:
Искомые границы доли рабочих с заработной платой от 320 тыс.руб. и выше:
Задача 2
В
городе 23560 семей. В порядке механической выборки предполагается определить
количество семей в городе с числом детей трое и более. Какова должна быть
численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала
0,02 человека. На основе предыдущих обследований известно, что дисперсия равна
0,3.
Решение
Численность
выборки можно найти по формуле:
В нашем случае:
Вывод к задаче
Таким образом численность
выборки должна составить 2661 чел.
Задача 3
С
целью определения средней месячной заработной платы персонала фирмы было
проведено 25%-ное выборочное обследование с отбором
единиц пропорционально численности типических групп. Для отбора сотрудников
внутри каждого филиала использовался механический отбор. Результаты
обследования представлены в следующей таблице:
Номер филиала |
Средняя месячная заработная плата, руб. |
Среднее квадратическое отклонение, руб. |
Число сотрудников, чел. |
1 | 870 | 40 | 30 |
2 | 1040 | 160 | 80 |
3 | 1260 | 190 | 140 |
4 | 1530 | 215 | 190 |
С
вероятностью 0,954 определите пределы средней месячной заработной платы всех
сотрудников гостиниц.
Решение
Предельная
ошибка выборочной средней:
Средняя
из внутригрупповых дисперсий:
Получаем:
Средняя
месячная заработная плата по всей совокупности филиалов:
Искомые
пределы средней месячной заработной платы:
Вывод к задаче
Таким
образом с вероятностью 0,954 средняя месячная заработная плата всех сотрудников
гостиниц находится в пределах от 1294,3 руб. до 1325,7 руб.
Механическая, типическая и серийная выборка
Механическая выборка
Механическая выборка характеризуется тем, что отбор единиц в выборочную совокупность из генеральной, разбитую по нейтральному признаку на равные интервалы, в задачах статистики проводится так, что из каждой такой группы в выборку отбирается лишь одна единица.
Для того, чтобы избежать систематической ошибки, отбирается единица, которая находится в середине каждой группы.
При организации механического отбора единицы совокупности заранее располагают в определенном порядке и далее отбирают заданное число единиц механически через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки.
При анализе достаточно большой совокупности механический отбор по точности результатов близок к случайному. Поэтому для определения средней ошибки механической выборки пользуются формулами собственно-случайной бесповторной выборки.
Типическая выборка
Типическую выборку применяют для отбора единиц из неоднородной совокупности. Она используется тогда, когда все единицы генеральной совокупности можно разбить на несколько качественно однотипных групп по признакам, которые влияют на изучаемые показатели.
При анализе предприятий такими группами могут быть: отрасль, формы собственности, специфика работы и т. д. Затем из каждой типической группы механической или собственно-случайной выборкой производят индивидуальный отбор единиц в выборочную совокупность.
Часто типическая выборка применяется при анализе сложных статистических совокупностей (например, производительность труда рабочих организации, представленных отдельными группами по квалификации).
Такой вид выборки дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность.
При расчете средней ошибки типической выборки в качестве показателя вариации берут среднюю из внутригрупповых дисперсий.
Средняя ошибка типической выборки
1. Для средней количественного признака:
где S — средняя из внутригрупповых дисперсий по выборочной совокупности.
2. Для доли (альтернативного признака):
где w(1 -w) – числитель — средняя из внутригрупповых дисперсий доли (альтернативного признака) по выборочной совокупности.
Серийная (гнездовая) выборка
В серийной выборке происходит случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп, с тем чтобы в этих группах все единицы были подвергнуты наблюдению.
Серийная выборка определена тем, что многие товары для их транспортировки, хранения или продажи упаковываются, следовательно при контроле качества упакованного товара рациональнее провести проверку несколько серий упаковок, чем из всех упаковок отбирать необходимое количество товара.
В связи с тем, что внутри групп (или серий) анализируются все единицы, средняя ошибка выборки при отборе равновеликих серий зависит только от межгрупповой (или межсерийной) дисперсии.
Расчет средней ошибки серийной (гнездовой) выборки
1. Для средней количественного признака:
где r — число отобранных серий;
R — общее число серий; дельта-квадрат — межгрупповая дисперсия серийной выборки, рассчитанная по формуле:
где xi — средняя i-й серии;
х — ошибка средняя по всей выборочной совокупности.
2. Для доли (альтернативного признака):
Межгрупповая (межсерийная) дисперсия доли серийной выборки определяется по формуле:
где w — доля признака в i-й серии;
w — общая доля признака во всей выборочной совокупности.
Комбинированная выборка
Комбинированную выборку применяют зачастую в практике выборочных наблюдений в разном сочетании их способов и видов.
Если в комбинированной выборке использовались механическая и типическая выборки, то средняя ошибка определяется по формуле:
где значения в формуле — средние ошибки механической и типической выборок.
Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.
11.2. Оценка результатов выборочного наблюдения
11.2.1. Средняя и предельная ошибки выборки. Построение доверительных границ для средней и доли
Средняя ошибка выборки показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной. Если рассчитать среднюю из ошибок всех возможных выборок определенного вида заданного объема (n), извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику — среднюю ошибку выборки ().
В теории выборочного наблюдения выведены формулы для определения , которые индивидуальны для разных способов отбора (повторного и бесповторного), типов используемых выборок и видов оцениваемых статистических показателей.
Например, если применяется повторная собственно случайная выборка, то определяется как:
— при оценивании среднего значения признака;
— если признак альтернативный, и оценивается доля.
При бесповторном собственно случайном отборе в формулы вносится поправка (1 — n/N):
— для среднего значения признака;
— для доли.
Вероятность получения именно такой величины ошибки всегда равна 0,683. На практике же предпочитают получать данные с большей вероятностью, но это приводит к возрастанию величины ошибки выборки.
Предельная ошибка выборки () равна t-кратному числу средних ошибок выборки (в теории выборки принято коэффициент t называть коэффициентом доверия):
.
Если ошибку выборки увеличить в два раза (t = 2), то получим гораздо большую вероятность того, что она не превысит определенного предела (в нашем случае — двойной средней ошибки) — 0,954. Если взять t = 3, то доверительная вероятность составит 0,997 — практически достоверность.
Уровень предельной ошибки выборки зависит от следующих факторов:
- степени вариации единиц генеральной совокупности;
- объема выборки;
- выбранных схем отбора (бесповторный отбор дает меньшую величину ошибки);
- уровня доверительной вероятности.
Если объем выборки больше 30, то значение t определяется по таблице нормального распределения, если меньше — по таблице распределения Стьюдента.
Приведем некоторые значения коэффициента доверия из таблицы нормального распределения.
Значение доверительной вероятности P | 0,683 | 0,954 | 0,997 |
---|---|---|---|
Значение коэффициента доверия t | 1,0 | 2,0 | 3,0 |
Доверительный интервал для среднего значения признака и для доли в генеральной совокупности устанавливается следующим образом:
Итак, определение границ генеральной средней и доли состоит из следующих этапов:
Ошибки выборки при различных видах отбора
- Собственно случайная и механическая выборка. Средняя ошибка собственно случайной и механической выборки находятся по формулам, представленным в табл. 11.3.
|
где |
Пример 11.2. Для изучения уровня фондоотдачи было проведено выборочное обследование 90 предприятий из 225 методом случайной повторной выборки, в результате которого получены данные, представленные в таблице.
Уровень фондоотдачи, руб. | До 1,4 | 1,4-1,6 | 1,6-1,8 | 1,8-2,0 | 2,0-2,2 | 2,2 и выше | Итого |
---|---|---|---|---|---|---|---|
Количество предприятий | 13 | 15 | 17 | 15 | 16 | 14 | 90 |
В рассматриваемом примере имеем 40%-ную выборку (90 : 225 = 0,4, или 40%). Определим ее предельную ошибку и границы для среднего значения признака в генеральной совокупности по шагам алгоритма:
- По результатам выборочного обследования рассчитаем среднее значение и дисперсию в выборочной совокупности:
Результаты наблюдения | Расчетные значения | |||
---|---|---|---|---|
уровень фондоотдачи, руб., xi | количество предприятий, fi | середина интервала, xi\xb4 | xi\xb4fi | xi\xb42fi |
До 1,4 | 13 | 1,3 | 16,9 | 21,97 |
1,4-1,6 | 15 | 1,5 | 22,5 | 33,75 |
1,6-1,8 | 17 | 1,7 | 28,9 | 49,13 |
1,8-2,0 | 15 | 1,9 | 28,5 | 54,15 |
2,0-2,2 | 16 | 2,1 | 33,6 | 70,56 |
2,2 и выше | 14 | 2,3 | 32,2 | 74,06 |
Итого | 90 | — | 162,6 | 303,62 |
Выборочная средняя
Выборочная дисперсия изучаемого признака
- Определяем среднюю ошибку повторной случайной выборки
- Зададим вероятность, на уровне которой будем говорить о величине предельной ошибки выборки. Чаще всего она принимается равной 0,999; 0,997; 0,954.
Для наших данных определим предельную ошибку выборки, например, с вероятностью 0,954. По таблице значений вероятности функции нормального распределения (см. выдержку из нее, приведенную в Приложении 1) находим величину коэффициента доверия t, соответствующего вероятности 0,954. При вероятности 0,954 коэффициент t равен 2.
- Предельная ошибка выборки с вероятностью 0,954 равна
- Найдем доверительные границы для среднего значения уровня фондоотдачи в генеральной совокупности
Таким образом, в 954 случаях из 1000 среднее значение фондоотдачи будет не выше 1,88 руб. и не ниже 1,74 руб.
Выше была использована повторная схема случайного отбора. Посмотрим, изменятся ли результаты обследования, если предположить, что отбор осуществлялся по схеме бесповторного отбора. В этом случае расчет средней ошибки проводится по формуле
Тогда при вероятности равной 0,954 величина предельной ошибки выборки составит:
Доверительные границы для среднего значения признака при бесповторном случайном отборе будут иметь следующие значения:
Сравнив результаты двух схем отбора, можно сделать вывод о том, что применение бесповторной случайной выборки дает более точные результаты по сравнению с применением повторного отбора при одной и той же доверительной вероятности. При этом, чем больше объем выборки, тем существеннее сужаются границы значений средней при переходе от одной схемы отбора к другой.
По данным примера определим, в каких границах находится доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., в генеральной совокупности:
- рассчитаем выборочную долю.
Количество предприятий в выборке с уровнем фондоотдачи, не превышающим значения 2,0 руб., составляет 60 единиц. Тогда
m = 60, n = 90, w = m/n = 60 : 90 = 0,667;
- рассчитаем дисперсию доли в выборочной совокупности
;
- средняя ошибка выборки при использовании повторной схемы отбора составит
Если предположить, что была использована бесповторная схема отбора, то средняя ошибка выборки с учетом поправки на конечность совокупности составит
- зададим доверительную вероятность и определим предельную ошибку выборки.
При значении вероятности Р = 0,997 по таблице нормального распределения получаем значение для коэффициента доверия t = 3 (см. выдержку из нее, приведенную в Приложении 1):
- установим границы для генеральной доли с вероятностью 0,997:
Таким образом, с вероятностью 0,997 можно утверждать, что в генеральной совокупности доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., не меньше, чем 54,7%, и не больше 78,7%.
- Типическая выборка. При типической выборке генеральная совокупность объектов разбита на k групп, тогда
N1 + N2 + … + Ni + … + Nk = N.
Объем извлекаемых из каждой типической группы единиц зависит от принятого способа отбора; их общее количество образует необходимый объем выборки
n1 + n2 + … + ni + … + nk = n.
Существуют следующие два способа организации отбора внутри типической группы: пропорциональной объему типических групп и пропорциональной степени колеблемости значений признака у единиц наблюдения в группах. Рассмотрим первый из них, как наиболее часто используемый.
Отбор, пропорциональный объему типических групп, предполагает, что в каждой из них будет отобрано следующее число единиц совокупности:
n = ni · Ni/N
где ni — количество извлекаемых единиц для выборки из i-й типической группы;
n — общий объем выборки;
Ni — количество единиц генеральной совокупности, составивших i-ю типическую группу;
N — общее количество единиц генеральной совокупности.
Отбор единиц внутри групп происходит в виде случайной или механической выборки.
Формулы для оценивания средней ошибки выборки для среднего и доли представлены в табл. 11.6.
|
Здесь — средняя из групповых дисперсий типических групп.
Пример 11.3. В одном из московских вузов проведено выборочное обследование студентов с целью определения показателя средней посещаемости вузовской библиотеки одним студентом за семестр. Для этого была использована 5%-ная бесповторная типическая выборка, типические группы которой соответствуют номеру курса. При отборе, пропорциональном объему типических групп, получены следующие данные:
Номер курса | Всего студентов, чел., Ni | Обследовано в результате выборочного наблюдения, чел., ni | Среднее число посещений библиотеки одним студентом за семестр, xi | Внутригрупповая выборочная дисперсия, |
---|---|---|---|---|
1 | 650 | 33 | 11 | 6 |
2 | 610 | 31 | 8 | 15 |
3 | 580 | 29 | 5 | 18 |
4 | 360 | 18 | 6 | 24 |
5 | 350 | 17 | 10 | 12 |
Итого | 2 550 | 128 | 8 | — |
Число студентов, которое необходимо обследовать на каждом курсе, рассчитаем следующим образом:
- общий объем выборочной совокупности:
n = 2550/130*5 =128 (чел.);
- количество единиц, отобранных из каждой типической группы:
аналогично для других групп:
n2 = 31 (чел.);
n3 = 29 (чел.);
n4 = 18 (чел.);
n5 = 17 (чел.).
Проведем необходимые расчеты.
- Выборочная средняя, исходя из значений средних типических групп, составит:
- Средняя из внутригрупповых дисперсий
- Средняя ошибка выборки:
С вероятностью 0,954 находим предельную ошибку выборки:
- Доверительные границы для среднего значения признака в генеральной совокупности:
Таким образом, с вероятностью 0,954 можно утверждать, что один студент за семестр посещает вузовскую библиотеку в среднем от семи до девяти раз.
- Малая выборка. В связи с небольшим объемом выборочной совокупности те формулы для определения ошибок выборки, которые использовались нами ранее при «больших» выборках, становятся неподходящими и требуют корректировки.
Среднюю ошибку малой выборки определяют по формуле
Предельная ошибка малой выборки:
Распределение значений выборочных средних всегда имеет нормальный закон распределения (или приближается к нему) при п > 100, независимо от характера распределения генеральной совокупности. Однако в случае малых выборок действует иной закон распределения — распределение Стьюдента. В этом случае коэффициент доверия находится по таблице t-распределения Стьюдента в зависимости от величины доверительной вероятности Р и объема выборки п. В Приложении 1 приводится фрагмент таблицы t-распределения Стьюдента, представленной в виде зависимости доверительной вероятности от объема выборки и коэффициента доверия t.
Пример 11.4. Предположим, что выборочное обследование восьми студентов академии показало, что на подготовку к контрольной работе по статистике они затратили следующее количество часов: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6,6.
Оценим выборочные средние затраты времени и построим доверительный интервал для среднего значения признака в генеральной совокупности, приняв доверительную вероятность равной 0,95.
- Среднее значение признака в выборке равно
- Значение среднего квадратического отклонения составляет
- Средняя ошибка выборки:
- Значение коэффициента доверия t = 2,365 для п = 8 и Р = 0,95 .
- Предельная ошибка выборки:
- Доверительный интервал для среднего значения признака в генеральной совокупности:
То есть с вероятностью 0,95 можно утверждать, что затраты времени студента на подготовку к контрольной работе находятся в пределах от 6,9 до 8,5 ч.
11.2.2. Определение численности выборочной совокупности
Перед непосредственным проведением выборочного наблюдения всегда решается вопрос, сколько единиц исследуемой совокупности необходимо отобрать для обследования. Формулы для определения численности выборки выводят из формул предельных ошибок выборки в соответствии со следующими исходными положениями (табл. 11.7):
- вид предполагаемой выборки;
- способ отбора (повторный или бесповторный);
- выбор оцениваемого параметра (среднего значения признака или доли).
Кроме того, следует заранее определиться со значением доверительной вероятности, устраивающей потребителя информации, и с размером допустимой предельной ошибки выборки.
|
Примечание: при использовании приведенных в таблице формул рекомендуется получаемую численность выборки округлять в большую сторону для обеспечения некоторого запаса в точности.
Пример 11.5. Рассчитаем, сколько из 507 промышленных предприятий следует проверить налоговой инспекции, чтобы с вероятностью 0,997 определить долю предприятий с нарушениями в уплате налогов. По данным прошлого аналогичного обследования величина среднего квадратического отклонения составила 0,15; размер ошибки выборки предполагается получить не выше, чем 0,05.
При использовании повторного случайного отбора следует проверить
При бесповторном случайном отборе потребуется проверить
Как видим, использование бесповторного отбора позволяет проводить обследование гораздо меньшего числа объектов.
Пример 11.6. Планируется провести обследование заработной платы на предприятиях отрасли методом случайного бесповторного отбора. Какова должна быть численность выборочной совокупности, если на момент обследования в отрасли число занятых составляло 100 000 чел.? Предельная ошибка выборки не должна превышать 100 руб. с вероятностью 0,954. По результатам предыдущих обследований заработной платы в отрасли известно, что среднее квадратическое отклонение составляет 500 руб.
Следовательно, для решения поставленной задачи необходимо включить в выборку не менее 100 человек.
Собственно-случайная
выборка
состоит в том, что выборочная совокупность
образуется в результате случайного
(непреднамеренного) отбора отдельных
единиц из генеральной совокупности.
При этом количество отобранных в
выборочную совокупность единиц обычно
определяется исходя из принятой доли
выборки.
Доля выборки есть
отношение числа единиц выборочной
совокупности n к численности единиц
генеральной совокупности N, т.е..
Так, при 5%-ной
выборке из партии товара в 2 000 ед.
численность выборки n составляет 100 ед.
(5*2000:100), а при 20%-ной выборке она составит
400 ед. (20*2000:100) и т.д.
Механическая
выборка
состоит в том, что отбор единиц в
выборочную совокупность производится
из генеральной совокупности, разбитой
на равные интервалы (группы). При этом
размер интервала в генеральной
совокупности равен обратной величине
доли выборки.
Так, при 2%-ной
выборке отбирается каждая 50-я единица
(1:0,02), при 5%-ной выборке — каждая 20-я
единица (1:0,05) и т.д.
Таким образом, в
соответствии с принятой долей отбора,
генеральная совокупность как бы
механически разбивается на равновеликие
группы. Из каждой группы в выборку
отбирается лишь одна единица.
Важной особенностью
механической выборки является то, что
формирование выборочной совокупности
можно осуществить, не прибегая к
составлению списков. На практике часто
используют тот порядок, в котором
фактически размещаются единицы
генеральной совокупности. Например,
последовательность выхода готовых
изделий с конвейера или поточной линии,
порядок размещения единиц партии товара
при хранении, транспортировке, реализации
и т.д.
21. Средняя и предельная ошибки выборки при типическом и серийном способах отбора.
Типическая
выборка. При
типической выборке генеральная
совокупность вначале расчленяется на
однородные типические группы. Затем из
каждой типической группы собственно-случайной
или механической выборкой производится
индивидуальный отбор единиц в выборочную
совокупность.
Типическая выборка
обычно применяется при изучении сложных
статистических совокупностей. Например,
при выборочном обследовании
производительности труда работников
торговли, состоящих из отдельных групп
по квалификации.
Важной особенностью
типической выборки является то, что она
дает более точные результаты по сравнению
с другими способами отбора единиц в
выборочную совокупность.
Для определения
средней ошибки типической выборки
используются формулы:
повторный отбор
,
бесповторный отбор
,
Дисперсия определяется
по следующим формулам:
,
Серийная выборка.
При серийной выборке генеральную
совокупность делят на одинаковые по
объему группы — серии. В выборочную
совокупность отбираются серии. Внутри
серий производится сплошное наблюдение
единиц, попавших в серию.
При бесповторном
отборе серий средняя ошибка выборочной
серии определяется по формуле:
,
где
— межсерийная дисперсия средних;
R — число серий в
генеральной совокупности;
r — число отобранных
серий.
В статистике
различают одноступенчатые и многоступенчатые
способы отбора единиц в выборочную
совокупность.
При одноступенчатой
выборке каждая отобранная единица сразу
же подвергается изучению по заданному
признаку. Так обстоит дело при
собственно-случайной и серийной выборке.
При многоступенчатой
выборке производят подбор из генеральной
совокупности отдельных групп, а из групп
выбираются отдельные единицы. Так
производится типическая выборка с
механическим способом отбора единиц в
выборочную совокупность.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Тема 8. Выборочный метод
8.1. Сущность выборочного наблюдения, причины и практика его применения
Выборочное обследование – наиболее распространенный вид несплошного наблюдения в практике отечественной и зарубежной статистики. Сущность этого вида наблюдения состоит в том, что характеристика всей совокупности единиц дается по некоторой их части, отобранной научно обоснованным методом. В основе отбора единиц в выборку лежит принцип случайности, который обеспечивает равную возможность попадания в отобранную часть любой из единиц всей генеральной совокупности. Именно принцип случайности, заложенный в основу выборочного метода, и обеспечивает объективность результатов наблюдения, позволяет установить границы возможных ошибок и получить достоверные данные для характеристики всей совокупности.
Если отбор единиц произведен строго случайно, выборочная совокупность будет представительной или репрезентативной.
Выборочное наблюдение является наиболее совершенным и научно обоснованным методом несплошного наблюдения. При выборочном методе численность и доля единиц, которая будет обследоваться, известна до начала наблюдения, этим оно отличается от анкетного. В отличие от способа основного массива и монографического описания при проведении выборки неизвестно какие единицы совокупности будут подвергнуты обследованию. Выборочный метод, таким образом, в отличие от названных, исключает тенденциозность отбора и в большей степени обеспечивает представительство всех видов, групп, составляющих изучаемую совокупность.
Выборочный метод широко применяется в социально-экономических исследованиях, т.к. обладает рядом достоинств. Во-первых, он дает большую экономию средств и требует меньше времени для проведения наблюдения. То есть, выборочное наблюдение более экономичное, а результаты его носят более оперативный характер, чем при сплошном наблюдении. Во-вторых, при выборочном наблюдении при значительном сокращении объема работы обследование можно провести по более широкой программе, т.е. изучить явление более глубоко и детально. В-третьих, поскольку объем работы сокращается, то при выборке допускается меньше ошибок регистрации, и часто получают более точные результаты, чем при сплошном наблюдении.
Выборочный метод иногда является единственно возможным методом изучения явления, т.к. применение сплошного обследования может привести к физическому уничтожению всех единиц наблюдения. Например, при контроле качества некоторых видов продукции в промышленности, проверке семян на всхожесть в сельском хозяйстве и т.д.
Применение выборочного метода вызывается необходимостью контроля данных сплошного наблюдения. Например, контрольные проверки размеров посевных площадей и численности скота в личных хозяйствах населения.
Использование этого метода является целесообразным при изучении расходов населения, времени работы оборудования, рабочего времени и т.д.
Часто выборочный метод применяется в сочетании со сплошным наблюдением, например, при переписях населения.
8.2. Ошибки репрезентативности и теоретические основы их определения
В статистике принято называть совокупность отобранных единиц выборочной совокупностью (n), а совокупность единиц, из которых производится отбор – генеральной совокупностью (N). Генеральная и выборочная совокупности характеризуются такими показателями как средний размер признака, дисперсия, доля.
Рекомендуемые материалы
Задача выборочного наблюдения – дать верное представление о показателях всей генеральной совокупности на основе данных их некоторой части, попавшей в выборку.
Естественно, что когда изучают не всю, а только часть совокупности, результаты расчетов показателей выборочной и генеральной совокупности не совпадают. Эти отклонения выборочной средней и выборочной доли от доли и средней в генеральной совокупности называются ошибками выборки, или ошибками репрезентативности. Ошибки репрезентативности – это специфические ошибки, присущие только выборке и появляются они вследствие расхождения структуры выборочной и генеральной совокупности.
Как уже отмечалось, при выборочном наблюдении имеют место и ошибки регистрации, но они незначительны.
Основной организационный принцип выборочного наблюдения состоит в том, чтобы не допустить тенденциозного подбора выборочной совокупности, т.е. обеспечить строгое соблюдение принципа случайности отбора единиц в выборку. На результаты выборочного наблюдения можно полагаться именно благодаря тому, что отбор носит случайный характер. Это и позволяет максимально сократить возможные пределы отклонений выборочных результатов от показателей, вычисленных по всей генеральной совокупности.
Обобщенное действие механизма случайности в математике представляет закон больших чисел. Теория выборочного метода, основывается на доказательствах теорем русских математиков П.Л. Чебышева и А.М. Ляпунова. Из сущности закона больших чисел вытекает:
1) хотя каждая выборочная средняя и доля являются случайной величиной, однако средняя арифметическая из всех выборочных средних равняется генеральной средней;
2) каждый из возможных результатов выборочного наблюдения имеет свою вероятность появления, которая зависит от доли индивидуальных значений в генеральной совокупности. Чем больше доля индивидуальных показателей в генеральной совокупности, тем выше вероятность этих значений попасть в выборку;
3) каждая выборочная средняя отличается от генеральной средней. Разница между выборочной и генеральной средними представляет собой ошибку репрезентативности (выборки). Последняя измеряется средним квадратом отклонений всех возможных значений выборочных средних от генеральной средней, т.е. дисперсией.
В математической статистике доказывается, что между дисперсией выборочных средних и генеральной дисперсией существует определенное соотношение.
Дисперсия выборочных средних равна отношению генеральной дисперсии к численности выборочной совокупности.
Корень квадратный из этого отношения представляет собой стандартную (среднюю) ошибку репрезентативности (выборки):
.
Эта величина средней ошибки играет огромную роль в теории выборочного метода. Знание ее позволяет определять размер конкретных выборок и сказать какая выборка будет лучше еще до самой работы по выборочному обследованию.
Если выборочное обследование проводится с целью определения доли единиц, обладающих изучаемым признаком, то используются те же формулы расчетов, но в этом случае средняя и дисперсия заменяются аналогичными показателями альтернативного признака. Отсюда средняя ошибка выборки равна:
,
где – доля единиц , обладающих данным признаком в выборочной совокупности.
Из приведенной формулы видно, что величина средней ошибки выборки зависит от вариации признака в генеральной совокупности, которая характеризуется дисперсией, и объема выборочной совокупности. Чем сильнее колеблется изучаемый признак у единиц генеральной совокупности, тем больше дисперсия, а отсюда и больше ошибка выборки, и, наоборот, чем больше объем выборочной совокупности, тем меньше ошибка выборки.
При организации выборки величина колеблемости признака в генеральной совокупности (N) неизвестна. В математической статистике доказано, что соотношение между дисперсиями генеральной и выборочной совокупностей выражается формулой:
.
Поскольку величина при достаточно большой численности выборки близка к 1, то приближенно считают, что выборочная дисперсия равна генеральной дисперсии, т.е.
, и в формуле средней ошибки выборки генеральная дисперсия заменяется выборочной.
4) при достаточно большом объеме выборки распределение средних вокруг генеральной средней подчинено закону нормального распределения. Это означает, что отклонение от генеральной средней расположено в ту или другую сторону симметрично. Если взять одно среднее квадратическое отклонение в ту или другую сторону, то тем самым будет принято во внимание 68,3% всех выборочных средних, т.е. выборочная средняя не отклонится в ту или другую сторону на одну сигму. Если взять два средних квадратических отклонения, то во внимание будет принято 95,4% всех выборочных средних, если взять три средних квадратических отклонения – 99,7% средних. Зная среднюю ошибку выборки и вероятности с какой уверенностью хотят гарантировать результаты выборочного наблюдения можно установить пределы ошибок.
,
где – предельная ошибка выборки;
– коэффициент доверия.
Коэффициент доверия выражает число средних ошибок, которые нужно взять, чтобы получить заданную вероятность. Так при вероятности 0,683 , при вероятности 0,954
, при вероятности 0,997
.
При выборочном наблюдении утверждения носят ориентировочный характер и выборочные показатели выражаются в интервале от и до.
Границы этих интервалов называются доверительными пределами. Нижний доверительный предел равен выборочной средней (доли) минус ошибка выборки.
8.3. Способы отбора и виды выборочного наблюдения
Репрезентативность выборки зависит не только от объема выборочной совокупности, но и от того как она образована, от характера отбора.
В генеральной совокупности могут отбираться отдельные единицы совокупности или же их группы.
В зависимости от того что является единицей отбора, последний делится на два вида: индивидуальный и групповой.
При индивидуальном отборе единицей отбора является непосредственно единица наблюдения. Например, проверка качества продукции непосредственно на рабочем месте. Контролер проверяет не каждую изготовленную деталь, а отбирает часть деталей из всей партии, которые подвергает проверке.
Групповой отбор заключается в том, что для наблюдения отбираются не только единицы совокупности, а их группы или серии. Примером могут служить контрольные проверки веса продукции, если она реализуется в упаковке (чай, макаронные изделия, сахар-рафинад и т.д.). Для контроля отбираются ящики, в отобранных ящиках взвешивается каждая пачка.
В некоторых случаях групповой отбор производится в сочетании с индивидуальным. Такой отбор называется комбинированным и связан со ступенчатостью. Здесь выборочная совокупность формируется не сразу, а проходит несколько стадий, ступеней, поэтому он еще называется многоступенчатым. Наиболее простым его случаем является двухступенчатый отбор, когда на первой ступени отбираются группы, на второй – отдельные единицы из отобранных групп.
Например, для контроля за соблюдением весовых стандартов пачек чая, сахара сначала отбираются ящики, в которых упакованы пачки, а из этих ящиков отбираются отдельные пачки.
Средняя ошибка выборки при двухступенчатом отборе исчисляется по формуле:
где – число отобранных групп
– среднегрупповая дисперсия из отобранных единиц
– межгрупповая дисперсия.
Иногда сплошное наблюдение проводится в комбинации с выборочным. Например, переписи населения. Все население обследуется по основной программе, а 25% его обследуется по расширенной программе. Сплошное наблюдение может комбинироваться и с несколькими выборочными обследованиями, различающимися детализацией программ и числом обследуемых единиц.
Точность результатов и размеры ошибок выборочного наблюдения во многом зависят и от способа отбора единиц выборочной совокупности.
В зависимости от цели изучения и характера исходных данных, для обеспечения наибольшей репрезентативности выборки применяются следующие виды и способы отбора единиц совокупности для наблюдения:
а) собственно-случайная выборка,
б) механическая,
в) типическая (районированная),
г) серийно-гнездовая.
Собственно-случайная выборка.
При собственно-случайной выборке из генеральной совокупности отбираются для наблюдения отдельные единицы в случайном порядке. Для этого используются таблицы случайных чисел или жеребьевка.
Собственно-случайная выборка может проводиться по способу повторного и бесповторного отбора.
При повторном отборе отобранная единица после регистрации ее данных возвращается в генеральную совокупность и таким образом может попасть в выборку вторично и даже несколько раз. При бесповторном отборе каждая единица участвует в выборке только один раз.
Случайный отбор дает хорошие результаты в условиях, когда между единицами исследуемой совокупности нет резких различий.
При проведении собственно-случайной выборки нужно иметь исчерпывающий перечень всех единиц генеральной совокупности. Может оказаться, что пока организуется жеребьевка, единицы совокупности снова возникнут или ликвидируются. А при изучении качества продукции в течение дня вообще не имеется исчерпывающего перечня единиц. Неудобство этого способа отбора еще состоит и в том, что для жеребьевки на каждую единицу генеральной совокупности изготавливаются карточки (фишки) для жеребьевки.
Среднюю ошибку выборки для средней определяют в зависимости от способа отбора по разным формулам.
При повторном отборе:
.
При бесповторном отборе:
.
Аналогично вычисляют среднюю ошибку выборки для доли признака.
При повторном отборе:
.
При бесповторном отборе:
.
Бесповторный отбор обеспечивает большую репрезентативность выборки, чем повторный.
Собственно-случайная выборка применяется при контроле качества продукции, качества уборочных работ в сельском хозяйстве, при изучении оплаты пассажирами проезда в общественном транспорте и т.д.
Механическая выборка.
Механическая выборка представляет собой последовательный отбор единиц через равные интервалы в порядке определенного расположения их в генеральной совокупности или каком-нибудь перечне. Интервалы отбора определяются в соответствие с долей выборочной совокупности. Если, например, десятипроцентная выборка, то отбирается каждая десятая единица, если пятипроцентная – каждая двадцатая единица и т.д.
Расположение единиц генеральной совокупности в списке может быть двояким – упорядоченным или неупорядоченным относительно изучаемого признака. Так, списки рабочих могут быть составлены в алфавитном порядке по первым буквам фамилий; поскольку первые буквы фамилий рабочих не связаны с выполнением норм выработки, такое расположение является неупорядоченным относительно изучаемого признака. Если рабочих в списки записать по возрастанию или убыванию процента выполнения норм, расположение будет упорядоченным. Способ расположения единиц генеральной совокупности влияет на порядок их отбора в выборочную совокупность. В случае неупорядоченного расположения единиц из первых десяти рабочих можно взять любого (первого, второго, десятого) и затем последовательно брать одного через 10 человек. Если расположение упорядоченное, в выборочную совокупность следует отбирать рабочих, стоящих посредине каждого десятка; в противном случае может образоваться систематическая ошибка выборки. В самом деле, если рабочие в списках расположены по нисходящему проценту выполнения норм, то первые номера в каждом десятке будут всегда лучше по изучаемому признаку, а последние номера – худшими. Следовательно, отобрав в выборку первые номера, статистик завысит выборочный показатель выполнения норм, отобрав последние номера – занизит. Поэтому следует брать из каждого десятка пятые или шестые номера.
Механический отбор из упорядоченной (ранжированной) совокупности иногда называют систематическим отбором.
Механический отбор можно применять и не прибегая к спискам, а используя тот естественный порядок, в котором фактически расположены единицы генеральной совокупности, если только этот порядок не приведет к тенденциозным ошибкам.
Механическая выборка всегда бывает бесповторной и ошибки определяются по формулам собственно-случайной выборки.
Применяется механическая выборка при контроле за результатами сплошного наблюдения, при изучении потерь рабочего времени и т.д.
Например, из общего числа пенсионных вкладов банка была проведена 5%-ная механическая выборка. Результаты выборки следующие:
Таблица 8.1
Размер пенсионного вклада, тыс р. |
Число вкладов |
до 20 |
25 |
20-40 |
37 |
40-60 |
70 |
60-80 |
50 |
80 и выше |
18 |
Итого |
200 |
Определить: 1) с вероятностью 0,683 пределы среднего размера пенсионного вклада во всей генеральной совокупности; 2) с вероятностью 0,954 пределы доли вкладов, размер которых превышает 80 тыс. р.
Решение:
1. Предельная ошибка выборки на средний размер пенсионного вклада при механической выборке определяется по формуле:
.
Вероятности 0,683 соответствует коэффициент доверия (t), равный 1.
Вычислим среднюю и дисперсию по выборочной совокупности.
;
.
Вывод: с вероятностью 0,683 можно утверждать, что средний размер пенсионного вклада у всех вкладчиков банка будет находиться в пределах:
;
2. Предельная ошибка доли:
.
При вероятности 0,954 t=2.
W – доля вкладов, размер которых превышает 80 тыс. р.
.
.
Вывод: с вероятностью 0,954 можно утверждать, что доля вкладов, размер которых составляет 80 тыс. р. и выше во всей генеральной совокупности будет находиться в следующих доверительных пределах:
;
Типическая выборка.
Типический (районированный) отбор применяют в том случае, если изучаемая совокупность неоднородна.
При этом отборе генеральная совокупность предварительно расчленяется на типы (районы) из которых отбираются единицы либо посредством жеребьевки, либо механическим способом.
Типы (районы) могут быть образованы искусственно или использованы те, которые сложились естественно.
Количество единиц, отбираемых из каждого типа (района), как правило, берется пропорционально численности типов в генеральной совокупности. Однако в принципе наиболее точный результат дает типический отбор, учитывающий вариацию признака в отдельных частях (типах, районах) генеральной совокупности. Для достижения этого численность частей выборочной совокупности, имеющих большую вариацию, несколько увеличивается.
Случайная ошибка при типическом отборе меньше, чем при собственно-случайном и механическом отборах, так как типический отбор дает более репрезентативную выборку, лучше обеспечивает возможность сохранить в выборке то соотношение между типами (районами), которое имеется в генеральной совокупности.
Предельная ошибка при пропорциональной типической выборке исчисляется по нижеследующим формулам.
При повторном отборе:
,
.
При бесповторном отборе:
,
.
Пропорциональная типическая выборка широко применяется в социологических, бюджетных обследованиях, при изучении урожайности по типам хозяйств.
Например, для исчисления среднего размера депозита в банке была проведена 2% – типическая выборка. Распределение депозитов по срокам хранения и их статистические характеристики в выборке представлены в табл. 8.2.
Таблица 8.2
Срок хранения депозита |
Число депозитов |
Средний размер депозита, тыс. р. |
Дисперсия |
3 месяца |
500 |
40 |
340 |
6 месяцев |
300 |
65 |
580 |
1 год |
200 |
100 |
260 |
Вычислим средний размер депозита:
С вероятностью 0,954 установить предельную ошибку выборки на средний размер депозита.
Вычислим среднюю групповую дисперсию:
Средняя ошибка выборки составит:
Предельная ошибка выборки при вероятности 0,954 составит:
Таким образом, средний размер депозита в генеральной совокупности будет находиться в пределах от 58,26 до 60,74 тыс. р.
Серийная (гнездовая) выборка.
Весьма часто в практике выборочного наблюдения применяется гнездовой или серийный отбор. При гнездовой или серийной выборке отбор производится не единицами, а целыми гнездами, сериями единиц совокупности, в пределах которых обследуются все единицы полностью. Например, 200 рабочих из 2000 можно отобрать целыми бригадами; отбор бригад может быть осуществлен посредством жеребьевки или механически. В отобранных бригадах общей численностью 200 человек должны быть обследованы все рабочие сплошь.
Серии (гнезда) состоят из единиц, связанных между собой или территориально, или организационно, или, наконец, во времени. Отбор серий может производится в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и неравновеликими. На практике чаще применяется серийный отбор с равными сериями.
Серийный отбор значительно проще в организационном отношении и дешевле других способов. Однако получающаяся в процессе этого отбора ошибки выборки в подавляющем большинстве случаев больше, чем при любом другом способе отбора.
Средняя ошибка выборки при отборе равновеликими сериями будет выражаться формулами:
при повторном отборе: ;
при бесповторном отборе: ,
где – число отобранных серий;
– общее число серий в генеральной совокупности.
Приведем пример. Выборочное наблюдение урожайности зерновых культур по области проводилось при помощи отбора районов. По каждому отобранному району находилась средняя урожайность, которая оказалась следующей: I район – 14 ц с 1 га, II район – 15 ц с 1 га, III район – 14,5 ц с 1 га, IV район – 15,5 ц с 1 га, V район – 16 ц с 1 га. С вероятностью 0,997 оценить урожайность зерновых во всей области. В области 25 районов.
Найдем сначала общую среднюю:
затем межгрупповую дисперсию:
Средняя ошибка серийного бесповторного отбора:
Найдем предельную ошибку выборки:
Следовательно, с вероятностью 0,997 можно ожидать, что средняя урожайность зерновых в этой области заключается в пределах:
8.5. Определение необходимой численности выборки
Ошибки выборочного наблюдения и доверительные пределы генеральной средней (генеральной доли) определяются после того, как получены данные, характеризующие каждую единицу выборочной совокупности. А поэтому при проведении выборки первоначально необходимо определить сколько единиц или какая часть генеральной совокупности должна быть подвергнута наблюдению. Это важный момент в проведении выборочного наблюдения. Важность его в том, что излишняя численность выборочной совокупности вызывает необоснованное завышение затрат времени, труда, материальных и денежных средств, а недостаточная – дает результаты с большей погрешностью. Объем выборки должен быть оптимальным.
Факторами, определяющими численность выборки, являются:
1. Показатели вариации данного признака. Здесь обнаруживается прямая зависимость, т.е. чем больше показатель вариации, тем больше объем выборки.
2. Размер вероятности. Зависимость также прямая. Чем выше вероятность, тем выше коэффициент доверия, а, следовательно, и численность выборки. Величина вероятности зависит от того какое явление изучается. Естественно, что при контроле качества продовольственной продукции величина вероятности выше, чем непродовольственной продукции.
3. Размер возможной допустимой ошибки (). Зависимость обратная. Чем меньше размер допустимой ошибки, тем больше должна быть необходимая численность выборки.
4. Способ отбора единиц для обследования. При прочих равных условиях для бесповторной выборки требуется меньшая численность выборки, чем при повторном отборе.
Основной трудностью, возникающей при установлении необходимой численности выборки, является определение среднеквадратического отклонения, которое характеризует вариацию признака. Значение этого показателя отсутствует как для генеральной, так и выборочной совокупности, поскольку задача определения необходимой численности выборки возникает тогда, когда еще выборка не проведена. Поэтому на практике используют несколько методов приближенного расчета среднеквадратического отклонения. Рассмотрим некоторые из них.
1. Вместо среднеквадратического отклонения данного отчетного периода берут значение данного показателя в базисном периоде. Этот прием применяется в тех случаях, когда мы в отчетном периоде, по сравнению с базисным, не ожидаем резкого изменения в исследуемых признаках.
2. Расчет среднеквадратического отклонения может быть основан на той связи, которая существует между показателями средней арифметической и коэффициентом вариации. Практика показывает, что во всех более или менее однородных совокупностях коэффициент вариации колеблется в пределах от 25-35%. Иначе говоря, коэффициент вариации обычно приблизительно равен среднеарифметической величины. А, следовательно, и показатель вариации при расчете необходимой численности выборки будет равен
среднеарифметической величины соответствующего признака.
3. Следующий прием опирается на величину размаха вариации. Разность между максимальным и минимальным значениями признака равна приблизительно шести средним квадратическим отклонениям. Разделив размах колебаний на шесть, мы получим приближенное значение среднего квадратического отклонения. Этот прием можно использовать, т.к. максимальное и минимальное значение изучаемого признака известны до проведения наблюдения.
При установлении колеблемости доли, как и средней, в первую очередь надо попытаться найти ориентировочные данные о величине W. Если таких данных нет, то берется максимальная величина произведения W на (1-W). Эта величина равна 0,25.
Необходимую численность выборочной совокупности определяют на основе алгебраического преобразования формулы предельной ошибки выборки для разных видов и способов отбора.
Для собственно-случайной повторной выборки:
.
Чтобы найти численность выборки, нужно освободиться от радикала. Это достигается возведением левой и правой частей уравнения в квадрат.
,
отсюда численность выборки: .
Объем выборочной совокупности прямо пропорционален квадрату коэффициента доверия и дисперсии и обратно пропорционален квадрату предельной ошибки выборки.
При бесповторном собственно-случайном и механическом отборе численность выборки будет равна:
.
Для доли признака численность выборки будет определяться по формулам:
– при повторном отборе,
– при бесповторном отборе.
Аналогичным преобразованием предельной ошибки определяется численность выборочной совокупности при типической и серийной выборке.
Допустим, что для установления средней дневной выработки рабочих предприятия проводится собственно-случайная бесповторная выборка. Сколько рабочих должно быть обследовано, чтобы получить результат с точностью 0,3 р. с вероятностью 0,954. Общая численность рабочих завода 5000 человек. По данным прошлогоднего обследования среднее квадратическое отклонение выработки составляет 1,6 р.
.
Следовательно, должно быть обследовано 112 рабочих, чтобы выполнить поставленные перед наблюдением требования.
8.6. Способы распространения данных выборочного наблюдения
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе данных, полученных по выборочной совокупности. Существуют два способа распространения данных выборочного наблюдения на генеральную совокупность – способ прямого пересчета и способ поправочных коэффициентов.
Способ прямого перерасчета заключается в том, что выборочная средняя или доля умножаются на численность генеральной совокупности и получается соответствующий объемный показатель. Так, в статистике сельского хозяйства выход шерсти от овец, находящихся в личном пользовании, определяется путем умножения полученных по выборке данных о среднем настриге шерсти с одной овцы на всю численность овец, находящихся в личной собственности. Например, согласно выборке, в области годовой настриг шерсти с одной овцы составляет 3 кг (с ошибкой выборки г), среднегодовая численность овец в хозяйствах – 30 тыс голов. Исходя из этого годовой выход шерсти в хозяйствах определяется как произведение настрига с одной овцы на все поголовье овец:
кг, или 900 ц; с учетом ошибки выборки
– от 885 до 915 ц.
Второй пример. в 3%-ной выборке численностью 150 светильников 6 светильников оказались бракованными (ошибка выборки 1 светильник). По количеству брака, имеющемуся в выборочной совокупности (4%), можно подсчитать, сколько брака будет во всей партии светильников, составляющей 5 000 шт. Брак составит:
светильников.
Вместе с этой лекцией читают «22 Сатурн».
Данный способ применяется тогда, когда известна численность единиц в генеральной совокупности.
Способ поправочных коэффициентом используется при проведении контрольных выборочных наблюдений для проверки и уточнения данных сплошного наблюдения. Он заключается в том, что по одним и тем же объектам сопоставляют данные сплошного и контрольного выборочного наблюдения. В результате такого сопоставления исчисляют поправочные коэффициенты, которые применяют для внесения поправок в данные сплошных наблюдений. Поправочные коэффициенты исчисляют, например, на основе данных контрольных выборочных обследований скота, находящегося в личной собственности населения сельской местности, при контроле за качеством деталей непосредственно на рабочем месте и т.д.
Например, по данным сплошного наблюдения численность крупного рогатого скота в личном подсобном хозяйстве граждан составляет 1 0000 голов.
Для контрольной проверки отобрано 1 000 семей, в хозяйствах которых сплошным наблюдением определена численность поголовья скота 1000 голов. В результате контрольного обхода в этих хозяйствах установлена численность крупного рогатого скота 1 050 голов.
Отсюда поправочный коэффициент составляет 1 050:1 000=1,05.
Общее поголовье скота в личном подсобном хозяйстве граждан равно голов.