Величина допустимой ошибки выборки зависит от чего

Расхождения
между величиной какого-либо показателя,
найденного посредством статистического
наблюдения, и действительными его
размерами называются ошибками
наблюдения
.В зависимости от
причин возникновения различают ошибки
регистрации и ошибки репрезентативности.

Ошибки
регистрации
возникают в результате
неправильного установления фактов или
ошибочной записи в процессе наблюдения
или опроса. Они бывают случайными или
систематическими. Случайные ошибки
регистрации могут быть допущены как
опрашиваемыми в их ответах, так и
регистраторами. Систематические ошибки
могут быть и преднамеренными, и
непреднамеренными. Преднамеренные –
сознательные, тенденциозные искажения
действительного положения дела.
Непреднамеренные вызываются различными
случайными причинами (небрежность,
невнимательность).

Ошибки
репрезентативности
(представительности)
возникают в результате неполного
обследования и в случае, если обследуемая
совокупность недостаточно полно
воспроизводит генеральную совокупность.
Они могут быть случайными и систематическими.
Случайные ошибки репрезентативности
– это отклонения, возникающие при
несплошном наблюдении из-за того, что
совокупность отобранных единиц наблюдения
(выборка) неполно воспроизводит всю
совокупность в целом. Систематические
ошибки репрезентативности – это
отклонения, возникающие вследствие
нарушения принципов случайного отбора
единиц. Ошибки репрезентативности
органически присущи выборочному
наблюдению и возникают в силу того, что
выборочная совокупность не полностью
воспроизводит генеральную. Избежать
ошибок репрезентативности нельзя,
однако, пользуясь методами теории
вероятностей, основанными на использовании
предельных теорем закона больших чисел,
эти ошибки можно свести к минимальным
значениям, границы которых устанавливаются
с достаточно большой точностью.

Ошибки
выборки –
разность между
характеристиками выборочной и генеральной
совокупности. Для среднего значения
ошибка будет определяться по формуле


(7.1)

где

Величина
называетсяпредельной ошибкойвыборки.

Предельная
ошибка выборки – величина случайная.
Исследованию закономерностей случайных
ошибок выборки посвящены предельные
теоремы закона больших чисел. Наиболее
полно эти закономерности раскрыты в
теоремах П. Л. Чебышева и А. М. Ляпунова.

Теорему П.
Л. Чебышева
применительно к
рассматриваемому методу можно
сформулировать следующим образом: при
достаточно большом числе независимых
наблюдений можно с вероятностью, близкой
к единице (т. е. почти с достоверностью),
утверждать, что отклонение выборочной
средней от генеральной будет сколько
угодно малым. В теореме П. Л. Чебышева
доказано, что величина ошибки не должна
превышать.
В свою очередь величина,
выражающая среднее квадратическое
отклонение выборочной средней от
генеральной средней, зависит от
колеблемости признака в генеральной
совокупностии числа отобранных единицn. Эта
зависимость выражается формулой

,
(7.2)

где
зависит также от способа производства
выборки.

Величину
=называютсредней ошибкой выборки. В
этом выражении– генеральная дисперсия,n– объем
выборочной совокупности.

Рассмотрим, как
влияет на величину средней ошибки число
отбираемых единиц n. Логически
нетрудно убедиться, что при отборе
большого числа единиц расхождения между
средними будут меньше, т. е. существует
обратная связь между средней ошибкой
выборки и числом отобранных единиц. При
этом здесь образуется не просто обратная
математическая зависимость, а такая
зависимость, которая показывает, что
квадрат расхождения между средними
обратно пропорционален числу отобранных
единиц.

Увеличение
колеблемости признака влечет за собой
увеличение среднего квадратического
отклонения, а следовательно, и ошибки.
Если предположить, что все единицы будут
иметь одинаковую величину признака, то
среднее квадратическое отклонение
станет равно нулю и ошибка выборки
также исчезнет. Тогда нет необходимости
применять выборку. Однако следует иметь
в виду, что величина колеблемости
признака в генеральной совокупности
неизвестна, поскольку неизвестны размеры
единиц в ней. Можно рассчитать лишь
колеблемость признака в выборочной
совокупности. Соотношение между
дисперсиями генеральной и выборочной
совокупности выражается формулой

Поскольку
величина
при достаточно большихnблизка к
единице, можно приближенно считать, что
выборочная дисперсия равна генеральной
дисперсии, т. е.

Следовательно,
средняя ошибка выборки показывает,
какие возможны отклонения характеристик
выборочной совокупности от соответствующих
характеристик генеральной совокупности.
Однако о величине этой ошибки можно
судить с определенной вероятностью. На
величину вероятности указывает множитель

Теорема А.
М. Ляпунова
. А. М. Ляпунов доказал,
что распределение выборочных средних
(следовательно, и их отклонений от
генеральной средней) при достаточно
большом числе независимых наблюдений
приближенно нормально при условии, что
генеральная совокупность обладает
конечной средней и ограниченной
дисперсией.

Математически
теорему Ляпуноваможно записать
так:

(7.3)

где

,
(7.4)

где – математическая постоянная;

предельная ошибка выборки,которая дает возможность выяснить, в
каких пределах находится величина
генеральной средней.

Значения этого
интеграла для различных значений
коэффициента доверия tвычислены и
приводятся в специальных математических
таблицах. В частности, при:

Поскольку tуказывает на вероятность расхождения,
т. е. на вероятность того, на какую
величину генеральная средняя будет
отличаться от выборочной средней, то
это может быть прочитано так: с вероятностью
0,683 можно утверждать, что разность между
выборочной и генеральной средними не
превышает одной величины средней ошибки
выборки. Другими словами, в 68,3 % случаев
ошибка репрезентативности не выйдет
за пределыС вероятностью 0,954 можно утверждать,
что ошибка репрезентативности не
превышает(т. е. в 95 % случаев). С вероятностью
0,997, т. е. довольно близкой к единице,
можно ожидать, что разность между
выборочной и генеральной средней не
превзойдет трехкратной средней ошибки
выборки и т. д.

Логически связь
здесь выглядит довольно ясно: чем больше
пределы, в которых допускается
возможная ошибка, тем с большей
вероятностью судят о ее величине.

Зная выборочную
среднюю величину признака
и предельную ошибку выборки,
можно определить границы (пределы),
в которых заключена генеральная
средняя

(7.5)

1.
Собственно-случайная выборка

этот способ ориентирован на выборку
единиц из генеральной совокупности без
всякого расчленения на части или группы.
При этом для соблюдения основного
принципа выборки – равной возможности
всем единицам генеральной совокупности
быть отобранным – используются схема
случайного извлечения единиц путем
жеребьевки (лотереи) или таблицы случайных
чисел. Возможен повторный и бесповторный
отбор единиц

Средняя ошибка
собственно-случайной выборки
представляет собой среднеквадратическое
отклонение возможных значений выборочной
средней от генеральной средней. Средние
ошибки выборки при собственно-случайном
методе отбора представлены в табл. 7.2.

Таблица 7.2

Средняя ошибка
выборки μ

При отборе

повторном

бесповторном

Для средней

Для доли

В таблице
использованы следующие обозначения:

– дисперсия выборочной совокупности;

– численность выборки;

– численность генеральной совокупности;

– выборочная доля единиц, обладающих
изучаемым признаком;

– число единиц, обладающих изучаемым
признаком;

– численность выборки.

Для увеличения
точности вместо множителя
следует
брать множитель
,
но при большой численностиNразличие
между этими выражениями практического
значения не имеет.

Предельная
ошибка собственно-случайной выборки
рассчитывается по формуле

,
(7.6)

где t
– коэффициент доверия зависит от
значения вероятности.

Пример.При
обследовании ста образцов изделий,
отобранных из партии в случайном порядке,
20 оказалось нестандартными. С вероятностью
0,954 определите пределы, в которых
находится доля нестандартной продукции
в партии.

Решение.
Вычислим генеральную долю (Р):
.

Доля нестандартной
продукции:
.

Предельная
ошибка выборочной доли с вероятностью
0,954 рассчитывается по формуле (7.6) с
применением формулы табл. 7.2 для доли:

С вероятностью
0,954 можно утверждать, что доля нестандартной
продукции в партии товара находится в
пределах 12 % ≤ P≤ 28 %.

В практике
проектирования выборочного наблюдения
возникает потребность определения
численности выборки, которая необходима
для обеспечения определенной точности
расчета генеральных средних. Предельная
ошибка выборки и ее вероятность при
этом являются заданными. Из формулы
и формул средних ошибок выборки
устанавливается необходимая численность
выборки. Формулы для определения
численности выборки (n) зависят от
способа отбора. Расчет численности
выборки для собственно-случайной выборки
приведен в табл. 7.3.

Таблица 7.3

Предполагаемый
отбор

Формулы

для средней

для доли

Повторный

Бесповторный

2.
Механическая выборка
– при этом
методе исходят из учета некоторых
особенностей расположения объектов в
генеральной совокупности, их упорядоченности
(по списку, номеру, алфавиту). Механическая
выборка осуществляется путем отбора
отдельных объектов генеральной
совокупности через определенный интервал
(каждый 10-й или 20-й). Интервал рассчитывается
по отношению,
гдеn– численность выборки,N
численность генеральной совокупности.
Так, если из совокупности в 500 000 единиц
предполагается получить 2 %-ную выборку,
т. е. отобрать 10 000
единиц, то пропорция отбора составитОтбор
единиц осуществляется в соответствии
с установленной пропорцией через равные
интервалы. Если расположение объектов
в генеральной совокупности носит
случайный характер, то механическая
выборка по содержанию аналогична
случайному отбору. При механическом
отборе применяется только бесповторная
выборка [1, 5–10].

Средняя ошибка
и численность выборки при механическом
отборе подсчитывается по формулам
собственно-случайной выборки (см.
табл. 7.2 и 7.3).

3.
Типическая выборка
, при котрой
генеральная совокупность делится по
некоторым существенным признакам на
типические группы; отбор единиц
производится из типических групп. При
этом способе отбора генеральная
совокупность расчленяется на однородные
в некотором отношении группы, которые
имеют свои характеристики, и вопрос
сводится к определению объема выборок
из каждой группы. Может бытьравномерная
выборка
– при этом способе из каждой
типической группы отбирается одинаковое
число единицТакой подход оправдан лишь при равенстве
численностей исходных типических групп.
При типическом отборе, непропорциональном
объему групп, общее число отбираемых
единиц делится на число типических
групп, полученная величина дает
численность отбора из каждой типической
группы.

Более совершенной
формой отбора является пропорциональная
выборка
. Пропорциональной называется
такая схема формирования выборочной
совокупности, когда численность выборок,
взятых из каждой типической группы в
генеральной совокупности, пропорциональна
численностям, дисперсиям (или комбинированно
и численностям, и дисперсиям). Условно
определяем численность выборки в 100
единиц и отбираем единицы из групп:

пропорционально
численности их генеральной совокупности

(табл. 7.4). В таблице
обозначено:

Ni– численность типической группы;

dj
– доля (Ni/N);

N– численность
генеральной совокупности;

ni– численность выборки из типической
группы вычисляется:

, (7.7)

n – численность выборки из генеральной
совокупности.

Таблица
7.4

Группы

Ni

dj

ni

1

300

0,3

30

2

500

0,5

50

3

200

0,2

20

1000

1,0

100


пропорционально среднему квадратическому
отклонению
(табл. 7.5).

здесь
i– среднее
квадратическое отклонение типических
групп;

ni
– численность выборки из типической
группы вычисляется по формуле


(7.8)

Таблица
7.5

Ni

i

ni

300

5

0,25

25

500

7

0,35

35

200

8

0,40

40

1000

20

1,0

100


комбинированно (табл. 7.6).

Численность
выборки вычисляется по формуле

. (7.9)

Таблица 7.6

i

iNi

300

5

1500

0,23

23

500

7

2100

0,53

53

200

8

1600

0.24

24

1000

20

6600

1,0

100

При проведении
типической выборки непосредственный
отбор из каждой группы проводится
методом случайного отбора.

Средние ошибки
выборки рассчитываются по формулам
табл. 7.7 в зависимости от способа отбора
из типических групп.

Таблица 7.7

Способ
отбора

Повторный

Бесповторный

для
средней

для
доли

для
средней

для
доли

Непропорциональный
объему групп

Пропорциональный

объему групп

Пропорциональный
колеблемости в группах (является
наивыгоднейшим)

здесь
– средняя из внутригрупповых дисперсий
типических групп;

– доля единиц, обладающих изучаемым
признаком;

– средняя из внутригрупповых дисперсий
для доли;

– среднее квадратическое отклонение
в выборке изi-й типической группы;

– объем выборки из типической группы;

– общий объем выборки;


объем типической группы;

– объем генеральной совокупности.

Численность
выборки из каждой типической группы
должна быть пропорциональна среднему
квадратическому отклонению в этой
группе
.Расчет численности
производится по формулам, приведенным
в табл. 7.8.

Таблица 7.8

Повторный

Бесповторный

Для определения
средней

Для определения
доли

4. Серийная
выборка
– удобена в тех случаях,
когда единицы совокупности объединены
в небольшие группы или серии. При серийной
выборке генеральную совокупность делят
на одинаковые по объему группы – серии.
В выборочную совокупность отбираются
серии. Сущность серийной выборки
заключается в случайном или механическом
отборе серий, внутри которых производится
сплошное обследование единиц. Средняя
ошибка серийной выборки с равновеликими
сериями зависит от величины только
межгрупповой дисперсии. Средние ошибки
сведены в табл. 7.9.

Таблица 7.9

Способ
отбора серии

Формулы

для
средней

для
доли

Повторный

Бесповторный

Здесь
R– число серий в генеральной
совокупности;

r – число
отобранных серий;

– межсерийная (межгрупповая) дисперсия
средних;

– межсерийная (межгрупповая) дисперсия
доли.

При серийном
отборе необходимую численность отбираемых
серий определяют так же, как и при
собственно-случайном методе отбора.

Расчет численности
серийной выборки производится по
формулам, приведенным в табл. 7.10.

Таблица 7.10

Повторный

Бесповторный

Для
определения среднего признака

Для
определения доли

Пример.В
механическом цехе завода в десяти
бригадах работает 100 рабочих. В целях
изучения квалификации рабочих была
произведена 20 %-ная серийная бесповторная
выборка, в которую вошли две бригады.
Получено следующее распределение
обследованных рабочих по разрядам:

Рабочие

Разряды

рабочих
в бригаде 1

Разряды

рабочих
в бригаде 2

Рабочие

Разряды
рабочих
в бригаде 1

Разряды
рабочих
в бригаде 2

1

2

3

4

5

2

4

5

2

5

3

6

1

5

3

6

7

8

9

10

6

5

8

4

5

4

2

1

3

2

Необходимо
определить с вероятностью 0,997 пределы,
в которых находится средний разряд
рабочих механического цеха.

Решение.
Определим выборочные средние по
бригадам и общую среднюю как среднюю
взвешенную из групповых средних:

Определим
межсерийную дисперсию по формулам
(5.25):

Рассчитаем
среднюю ошибку выборки по формуле табл.
7.9:

Вычислим
предельную ошибку выборки с вероятностью
0,997:

С вероятностью
0,997 можно утверждать, что средний разряд
рабочих механического цеха находится
в пределах

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Краткий
курс лекции

Понятие и методы
обоснования аудиторской выборки. Критерии аудиторской выборки.

Международный стандарт аудита 530 «Аудиторская выборка» введен в
действие на территории Российской Федерации приказом Минфина России от
09.01.2019 № 2н

Аудиторская
выборка
 – это перечень
определенным образом отобранных элементов проверяемой совокупности с целью на
основе их изучения сделать вывод обо всей проверяемой совокупности.

Аудиторская выборка — это применение аудиторских процедур
менее чем ко всем элементам одной статьи отчетности или группы однотипных
операций.

Она дает возможность аудитору получить и оценить аудиторские доказательства в отношении некоторых характеристик
элементов, отобранных для того, чтобы сформировать или помочь сформировать
выводы, касающиеся генеральной совокупности, из которой произведена выборка.

Выборка может быть нестатистической
(произвольной) и статистической.

Нестатистический
выборочный метод
 – это анализ
по качественным признакам в зонах повышенного аудиторского риска. Как правило,
его применяют при невозможности использовать метод статистической выборки.

Например – проверяемая совокупность неоднородна, разный
уровень эффективности внутреннего контроля в структурных подразделениях
предприятия, небольшое количество хозяйственных операций, имеющих высокий
уровень существенности.

Наиболее распространенными методами нестатистической
(произвольной) выборки являются: блочный отбор (выбор первого элемента
определяет все остальные элементы проверяемого блока), беспорядочный отбор,
оценочные методы.

Статистический
выборочный
метод может
применяться для достижения следующих целей:

· обнаружения повторяющихся ошибок, искажений,
проявляющихся с определенной частотой и в определенном количестве;

· оценка масштабов распространения обнаруженных ошибок.

Основными методами статистической выборки при аудите
являются:

— возвратная выборка – не исключаются из процесса отбора
ранее проверенные элементы;

— безвозвратная выборка — исключаются из процесса отбора
ранее проверенные элементы;

— механическая выборка – предполагает предварительное
ранжирование единиц проверяемой совокупности;

— серийная выборка – отбор элементов для проверки
осуществляется не единицами, а сериями и другие методы.

Риск выборки возникает,
когда вывод аудитора, сделанный на основе отобранной совокупности, отличается
от вывода при применении идентичных процедур аудита к генеральной совокупности
в целом.

В аудите различают два типа рисков выборки. Риск
первого типа представляет собой риск того, что аудитор сделает следующие
заключения:

§ 

риск средств внутреннего контроля ниже, чем в
действительности (при выполнении тестов средств внутреннего контроля);

§ 

существенной ошибки не существует, вопреки тому,
что в действительности она есть (при выполнении аудиторских процедур проверки
по существу).

Риск данного типа
оказывает влияние на надежность аудита и с большой степенью вероятности может
привести к ненадлежащему аудиторскому мнению.

Риск второго типа
представляет собой риск того, что аудитор придет к следующим выводам:

§ 

риск средств внутреннего контроля выше, чем в
действительности (при выполнении тестов средств внутреннего контроля);

§ 

имеет место существенная ошибка, тогда как в
действительности ее не существует (при выполнении аудиторских процедур проверки
по существу).

Риск такого типа
оказывает влияние на эффективность аудита, поскольку он обычно приводит к
дополнительной работе по установлению того, что первоначальные выводы были
неверны.

Риск, не зависящий от
аудиторской выборки, является следствием факторов, которые приводят аудитора к
ошибочному выводу по любым причинам, кроме тех, которые связаны с объемом
выборки (т.е. числом отбираемых для проверки элементов). Риск, связанный с
выборкой, может быть снижен путем увеличения объема отбираемой совокупности, а
не связанный — путем надлежащего планирования задания, текущего контроля за
работой аудиторов и проверки выполнения процедур.

Различают следующие
виды выборки:

§ 

представительная (репрезентативная) — элементы ее
генеральной совокупности имеют равную вероятность быть отобранными;

§ 

непредставительная (нерепрезентативная) — элементы ее
генеральной совокупности не имеют равную вероятность быть отобранными. Аудитор
полагается на свое профессиональное суждение при отборе элементов.

Элементами выборки могут
быть натуральные объекты (например, первичные учетные документы) или показатели
в денежном выражении. Аудитор должен стараться сформировать репрезентативную совокупность
путем отбора элементов выборки, которые обладают характеристиками, типичными
для генеральной совокупности, так как целью выборки является получение выводов
по всей генеральной совокупности. При формировании проверяемой совокупности
необходимо исключать предвзятость.

Для построения выборки
аудитор определяет метод отбора элементов, который будет использоваться при
тестировании с целью получения аудиторских доказательств. Различают следующие
методы отбора элементов:

1.     

отбор всех элементов (сплошная проверка);

2.     

отбор специфических (определенных) элементов;

3.     

отбор отдельных элементов (формирование
аудиторской выборки).

Первый метод отбора не
применяют при проведении тестов средств внутреннего контроля, его используют в
отношении аудиторских процедур проверок по существу. Сплошная проверка
целесообразна в следующих случаях:

§ 

генеральная совокупность состоит из небольшого
числа элементов наибольшей стоимости;

§ 

неотъемлемый риск и риск средств контроля
являются высокими, а другие средства не позволяют получить достаточные
надлежащие аудиторские доказательства;

§ 

повторяющийся характер расчетов или иных
процессов, осуществляемых с помощью компьютерной системы бухгалтерского учета,
делает сплошную проверку эффективной с точки зрения соотношения затрат и результатов.

Второй метод
предполагает отбор специфических элементов. Различают специфические элементы
наибольшей стоимости и ключевые элементы. К элементам наибольшей стоимости
относят суммы сальдо счетов, которые превышают планируемую степень точности, т.е.
уровень существенности. При определении ключевых элементов аудитор отбирает
сальдо счетов, существенных качественно, т.е. элементы, по которым возможна
наибольшая вероятность наличия ошибки или искажения, и элементы существенные
количественно, т.е. элементы (например, месяцы), имеющие наибольший оборот по
данному счету в отчетном периоде. При использовании данного метода
осуществляется построение непредставительной выборки, в связи с чем результаты,
полученные по отобранным элементам, не могут быть экстраполированы на всю
совокупность.

Третий метод
представляет собой отбор элементов для построения представительной выборки.
Прежде чем отобрать элементы, необходимо определить объем выборки.

Организация выборочного исследования включает в себя определение:

величины
выборки (массива, поля проверяемой и генеральной совокупности);

единицы
наблюдения;

единицы
отбора;

методов
отбора;

объема
выборки;

проверки
представительности (репрезентативности) выборки;

порядка
распространения выборочных данных на проверяемую совокупность.

            Для достижения
поставленных целей проверки необходимо определение соответствующей проверяемой
совокупности, поскольку именно к ней относится заключение, сделанное на основе
выборки.

            В аудите в
качестве элементов могут выступать бухгалтерские записи (проводки), статьи,
записи, из которых делается выборка.

            Для составления
проверяемой совокупности вся документация клиента разбивается на однородные
массивы данных по различным признакам (характеру документов, материально ответственным
лицам, временной последовательности и др.).

            Например, аудитор
собирает информацию о дебиторской задолженности свыше 600 тыс. руб.,
исследуемой совокупностью будет совокупность всех бухгалтерских документов,
записей, затрагивающих расчеты с дебиторами, но не менее чем на 600 тыс. руб.

            Единица отбора
при таком типе выборок совпадает с единицей наблюдения (документом).

            Единица
наблюдения при аудиторской проверке объективно обусловлена. Ею может быть
какой-либо раздел или участок бухучета, тип хозяйственных операций. В рамках
одной и той же единицы наблюдения единицы отбора могут быть различными.

            Осуществляя
выборку, аудитор может разбить всю изучаемую 
совокупность на отдельные группы, элементы, каждый из которых имеет сходные
характеристики. Эта процедура называется стратификацией, она позволяет снизить
разброс (вариацию) данных.

            Обычно выборка
должна быть репрезентативной. Это предполагает, что все элементы изучаемой
совокупности имеют равную вероятность быть 
отобранными в выборку.          Репрезентативность
выборки обеспечивается одним из способов отбора:

            случайный – может проводиться по таблице случайных чисел;

            систематический – предполагает, что элементы отбираются через постоянный
интервал, начиная со случайно выбранного числа.

            Интервал строится
либо на определенном числе элементов совокупности (например, изучение каждого
20-го документа из всех документов данной категории), либо на стоимостной их
оценке (например, отбирается тот элемент, на который приходится каждый
следующий миллион рублей в совокупной стоимости элементов);

            комбинированный – представляет собой комбинацию различных методов
случайного и систематического отбора.

            Аудитор имеет право
прибегать к нерепрезентативной
(непредставительной)
выборке только тогда, когда профессиональное суждение аудитора по итогам
проведения выборки не должно касаться всей совокупности в целом.

            Например,
когда аудитор проверяет отдельно взятую группу операций либо класс операций, по
которым установлены возможные ошибки.

            Для
любой выборки аудитор обязан:

            анализировать
каждую ошибку, попавшую в выборку;

            экстраполировать
полученные при выборке результаты на всю проверяемую совокупность;

            оценить
риски выборки.

            При
анализе ошибок, попавших в выборку, аудитор должен в первую очередь установить
их характер. Формируя выборку, следует описать, для достижения каких целей она
проводится, и применительно к ним оценить найденные в выборке ошибки.

            Если поставленные цели проверки не
были достигнуты с помощью выборочного исследования, то аудитор может провести
альтернативные аудиторские процедуры.

            Аудитор может оценить качественный
аспект ошибок (их сущность и вызвавшую их причину), а также установить их
влияние на другие участки аудита.

            Аудитор должен убедиться, что ошибка
в проверяемой совокупности не превышает допустимую величину. Для этого он
сравнивает ошибку совокупности, полученную посредством распространения, с
допустимой ошибкой.

            Если первая ошибка оказалась больше
допустимой, аудитор должен повторно оценить риски выборки, и если сочтет их
неприемлемыми, то ему следует расширить круг аудиторских процедур или применять
аудиторские процедуры, альтернативные уже проведенным.

            При определении объема выборки
аудитор должен установить риск выборки, допустимую и ожидаемую ошибки.

            Риск выборки заключается в том, что
мнение аудитора по  определенному
вопросу, составленное на основе выборочных данных, может отличаться от мнения
по данному вопросу, составленному на основании изучения всей совокупности. Риск
выборки имеется как при тестировании средств системы контроля, так и при
проведении детальной проверки верности отражения в бухучете оборотов и сальдо
по счетам. Различают риски первого и второго рода.

            При тестировании средств контроля различают
следующие риски выборки:

            риск первого рода – риск отклонить верную гипотезу,
когда результат выборки  свидетельствует
о ненадежности системы контроля, в то время как в действительности система
надежна;

            риск второго рода – риск принять неверную гипотезу,
когда результат выборки свидетельствует о надежности системы, в то время как в действительности
система контроля не обладает необходимой надежностью.

            При проведении детальной проверки
верности отражения в учете оборотов и сальдо по счетам выделяют следующие риски
выборки:

              риск первого
рода – риск отклонить верную гипотезу, когда результат выборки свидетельствует,
что проверяемая совокупность содержит существенную ошибку, в то время как
совокупность свободна от такой ошибки;

            риск второго рода – риск принять неверную гипотезу,
когда результат выборки свидетельствует, что проверяемая совокупность не

 существенную ошибку.

            Риск
отклонения верной гипотезы требует проведения дополнительной работы со стороны
аудиторской организации или экономического субъекта.

            Риск
принятия неверной гипотезы ставит под сомнение сами результаты работы аудитора.

            Размер
выборки определяется величиной ошибки, которую аудитор считает допустимой.

            Допустимая
ошибка устанавливается на стадии планирования аудита. Чем меньше размер
допустимой ошибки, тем больше должен быть объем аудиторской выборки.

Пример 1.

         Аудитор располагает информацией по ООО «Контакт»: аудиту подлежат
материально-производственные запасы, общий объем проверяемой совокупности
составляет 500 тыс. руб., уровень существенности – 10 тыс. руб., номера
документов – с 50-го по 1050-й, система внутреннего контроля эффективна, в
бухгалтерском учёте по данным предыдущих проверок нет существенных искажений.

Необходимо построить выборку, указав
первые семь элементов методом случайного отбора (используя таблицу случайных
чисел и соответствующий коэффициент проверки).

Решение задачи:

Для построения выборки необходимо
определить ее элементы:

ЭВ = (ГС к)/УС,

ЭВ – элементы выборки;

ГС – генеральная совокупность;

к – коэффициент проверки;

УС – уровень существенности.

            Из
генеральной совокупности исключаются элементы наибольших значений и ключевые
значения. По условию задачи они отсутствуют. Тогда:

                                    ЭВ
= (500000
0,7)/1000 =
35.

            Коэффициент
проверки равен 0,7, так как система внутреннего контроля эффективна, в
бухгалтерском учете по данным предыдущих проверок нет существенных искажений.

            Далее
определяются элементы выборки методом случайного отбора по формуле:

                                                           (ЗК
– ЗН)
СЧ + ЗН,

ЗК – значение конечное;

ЗН – значение начальное;

СЧ – случайное число, взятое из таблицы
случайных чисел случайным образом.

Подставив ЗН, ЗК, имеем:

            (1050
– 50)
СЧ + 50.

Используя данный алгоритм, находим семь
первых значений выборки:

1000*0,4877+50=538;

1000*0,0441+50=94;

1000*0,2017+50=252;

1000*0,1797+50=230;

1000*0,7575+50=808;

1000*0,9374+50=987;

1000*0,3228+50=373.

Пример 2.

            Аудитор
выборочно изучил 120 документов из 1250. При этом выявленная величина ошибок
(искажений) составила 1850 руб. Определить величину суммарной ошибки во всей
совокупности документов. Какими должны быть выводы и действия аудитора, если
приемлемой считается величина ошибки 17800 руб.?

Решение:
            Суммарная
ошибка совокупности рассчитывается по формуле:

                                                                                   Ос=Ов*С/В,
где Ос – ошибка совокупности;

ОВ – ошибка выборки;

С – объем совокупности в целом;

В – объем исследуемой выборки.

Ос=1850*1250/120=19271
руб.

            Суммарная
ошибка совокупности (19271 руб.) больше приемлемой величины ошибки (17800
руб.). Поскольку исчисленная суммарная ошибка выше приемлемой величины ошибки,
то финансовая отчетность считается неприемлемой. Аудитор может либо определить,
действительно ли завышенное показание превышает 17800 руб., либо представить заключение
с оговоркой или отрицательное заключение.

Практическое задание

Задание 1

Тест

1. Величина допустимой ошибки выборки
зависит от:

А)

 Показателя оценки системы внутреннего
контроля

Б)

Уровня
существенности

В)

Риска необнаружения

2. Допустимая ошибка в процессе аудита должна определяться в стадии:

А)

Планирования

Б)

Ознакомления с
деятельностью экономического субъекта

В)

Проведения проверки

3. Если ошибка в проверяемой совокупности больше допустимой, аудитор
должен:

А)

Расширить круг
применяемых аудиторских процедур и проверить другие элементы совокупности

Б)

Отказаться от
выражения мнения по поводу достоверности бухгалтерской отчетности

В)

Сообщить о данном
факте в письменной информации руководству экономического субъекта

4. Методы распространения результатов выборки на всю совокупность:

А)

Четко
регламентированы внутренними стандартами аудиторских организаций

Б)

Определяется
законодательно

В)

Устанавливаются
аудиторской организацией в зависимости от методов построения выборки

5. Выбор метода построения выборки определяется:

А)

Аудитором в каждой
конкретной ситуации

Б)

Внутренними
правилами аудиторской организации

В)

Стандартами
аккредитованных профессиональных аудиторских объединений

6. Основная цель стратификации генеральной совокупности:

А)

Распределить
обязанности между аудиторами при проверке

Б)

Уменьшить риск
выборки за счет снижения вариации данных

В)

Увеличить допустимую
ошибку выборки

7.
Преднамеренными искажениями бухгалтерской отчетности являются:

А)

Ошибки в
расчетах

Б)

Арифметические
ошибки

В)

Действия,
совершенные в корыстных целях для введения в заблуждение пользователей
финансовой отчетности

8.
Недостаточность или неадекватность описания учетной политики, когда
существует вероятность того, что пользователи финансовой отчетности будут
введены в заблуждение, являются примером:

А)

Количественных
искажений

Б)

Качественных
искажений

В)

Не являются
искажениями

9.Максимальный
размер ошибки генеральной совокупности, которую аудитор считает приемлемой, —
это:

А)

Общая ошибка
выборки

Б)

Аномальная
ошибка

В)

Допустимая
ошибка

10. Если элементы генеральной совокупности не имеют равную
вероятность быть отобранными, то речь идет о:

А)

Репрезентативной
выборке

Б)

Нерепрезентативной
выборке

В)

Случайной
выборке

11.Аудиторская организация может применять нерепрезентативную выборку
в случае:

А)

Если не следует
распространить результаты исследования на всю совокупность

Б)

Большого объема
проверяемой совокупности

В)

Неоднородности
элементов генеральной совокупности

12.Полный набор элементов, из которых аудитор проводит выборку для
того, чтобы сделать выводы, — это:

А)

Генеральная
совокупность

Б)

Выборочная совокупность

В)

Стратифицированная
совокупность

13.
Аудиторская выборка – это:

А)

Полный набор
элементов, из которых аудитор проводит выборку для того, чтобы сделать выводы

Б)

Индивидуальные
элементы, отражаемые в учете и составляющие генеральную совокупность

В)

Применение
аудиторских процедур менее чем ко всем элементам одной статьи отчетности или
группы однотипных операций

14.
К методам отбора элементов для построения выборки не относится:

А)

Систематический

Б)

Бессистемный

В)

Систематизированный

15. Аудиторская выборка это: а) один из методов аудиторской проверки;
б) определенным образом отобранные элементы с целью распространения
полученных результатов на всю проверяемую совокупность; в) способ группировки
данных по определенным признакам:

А)

а, б

Б)

а, б, в

В)

а, в

16. Отбор элементов из генеральной совокупности через определенный
интервал – это:

А)

Статистический
отбор

Б)

Систематический
отбор

В)

Бессистемный
отбор

Задание 2

Задача 2.1

            Аудитор должен подтвердить оценку товарных
запасов. По данным бухгалтерского учета стоимость материальных ценностей на
складе  составляет  600 000 руб., стоимость выборки — 195 000
руб., обнаруженная ошибка— 3000 руб.

            Следует определить планируемую ожидаемую ошибку в
генеральной совокупности.

Задача 2.2. 

              Размер выборочной
совокупности —250  документов, размер
генеральной совокупности — 2500

            Необходимо установить
выборочный интервал и порядок проведения случайной выборки.

Задание 3.

Составить  кроссворд 

       Ключевые слова —    

А

У

Д

И

Т

О

Р

С

К

А

Я

хх

В

Ы

Б

О

Р

К

А

Аудитор

Существенность

Репрезентативность

Стратификация

Компиляция

Независимость

Планирование

Конфидициальность

Достаточность (в аудите)

Программа (аудита)

Рекомендованная
литература:

            1.
ЭБС
«Юрайт»: Аудит: учебник для СПО/ Н.А.Казакова  и др. ; под ред. Н.А.Казаковой  — 3-е изд., перераб. и доп. — М.:Изд-во Юрайт,
2018. — 409 с. — (Серия: Профессиональное образование). —
ISBN
978-5-534-09320-9/

            2.  Парушина, Н. В. Аудит: практикум : учеб. пособие /
Н.В. Парушина, С.П. Суворова, Е.В. Галкина. — 3-е изд., перераб. и доп. —
Москва : ИД «ФОРУМ» : ИНФРА-М, 2017. — 286 с. — (Профессиональное образование).
— ISBN 978-5-16-102859-9. — Текст : электронный. — URL:
https://znanium.com/catalog/product/773992

            3. Парушина, Н. В.
Аудит: практикум : учеб. пособие / Н.В. Парушина, С.П. Суворова, Е.В. Галкина.
— 3-е изд., перераб. и доп. — Москва : ИД «ФОРУМ» : ИНФРА-М, 2017. — 286 с. —
(Профессиональное образование). — ISBN 978-5-16-102859-9. — Текст :
электронный. — URL: https://znanium.com/catalog/product/773992

11.2. Оценка результатов выборочного наблюдения

11.2.1. Средняя и предельная ошибки выборки. Построение доверительных границ для средней и доли

Средняя ошибка выборки показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной. Если рассчитать среднюю из ошибок всех возможных выборок определенного вида заданного объема (n), извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику — среднюю ошибку выборки ( \mu ).

В теории выборочного наблюдения выведены формулы для определения  \mu , которые индивидуальны для разных способов отбора (повторного и бесповторного), типов используемых выборок и видов оцениваемых статистических показателей.

Например, если применяется повторная собственно случайная выборка, то  \mu определяется как:

— при оценивании среднего значения признака;

— если признак альтернативный, и оценивается доля.

При бесповторном собственно случайном отборе в формулы вносится поправка (1 — n/N):

— для среднего значения признака;

— для доли.

Вероятность получения именно такой величины ошибки всегда равна 0,683. На практике же предпочитают получать данные с большей вероятностью, но это приводит к возрастанию величины ошибки выборки.

Предельная ошибка выборки (\Delta) равна t-кратному числу средних ошибок выборки (в теории выборки принято коэффициент t называть коэффициентом доверия):

\Delta =t \mu.

Если ошибку выборки увеличить в два раза (t = 2), то получим гораздо большую вероятность того, что она не превысит определенного предела (в нашем случае — двойной средней ошибки) — 0,954. Если взять t = 3, то доверительная вероятность составит 0,997 — практически достоверность.

Уровень предельной ошибки выборки зависит от следующих факторов:

  • степени вариации единиц генеральной совокупности;
  • объема выборки;
  • выбранных схем отбора (бесповторный отбор дает меньшую величину ошибки);
  • уровня доверительной вероятности.

Если объем выборки больше 30, то значение t определяется по таблице нормального распределения, если меньше — по таблице распределения Стьюдента.

Приведем некоторые значения коэффициента доверия из таблицы нормального распределения.

Таблица
11.2.

Значение доверительной вероятности P 0,683 0,954 0,997
Значение коэффициента доверия t 1,0 2,0 3,0

Доверительный интервал для среднего значения признака и для доли в генеральной совокупности устанавливается следующим образом:

Итак, определение границ генеральной средней и доли состоит из следующих этапов:

Ошибки выборки при различных видах отбора

  1. Собственно случайная и механическая выборка. Средняя ошибка собственно случайной и механической выборки находятся по формулам, представленным в табл. 11.3.

Таблица
11.3.
Формулы для расчета средней ошибки собственно случайной и механической выборки ( \mu )

где \sigma^{2} — дисперсия признака в выборочной совокупности.

Пример 11.2. Для изучения уровня фондоотдачи было проведено выборочное обследование 90 предприятий из 225 методом случайной повторной выборки, в результате которого получены данные, представленные в таблице.

Таблица
11.4.

Уровень фондоотдачи, руб. До 1,4 1,4-1,6 1,6-1,8 1,8-2,0 2,0-2,2 2,2 и выше Итого
Количество предприятий 13 15 17 15 16 14 90

В рассматриваемом примере имеем 40%-ную выборку (90 : 225 = 0,4, или 40%). Определим ее предельную ошибку и границы для среднего значения признака в генеральной совокупности по шагам алгоритма:

  1. По результатам выборочного обследования рассчитаем среднее значение и дисперсию в выборочной совокупности:

Таблица
11.5.

Результаты наблюдения Расчетные значения
уровень фондоотдачи, руб., xi количество предприятий, fi середина интервала, xi\xb4 xi\xb4fi xi\xb42fi
До 1,4 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2,2 и выше 14 2,3 32,2 74,06
Итого 90 162,6 303,62

Выборочная средняя

Выборочная дисперсия изучаемого признака

  1. Определяем среднюю ошибку повторной случайной выборки

  2. Зададим вероятность, на уровне которой будем говорить о величине предельной ошибки выборки. Чаще всего она принимается равной 0,999; 0,997; 0,954.

Для наших данных определим предельную ошибку выборки, например, с вероятностью 0,954. По таблице значений вероятности функции нормального распределения (см. выдержку из нее, приведенную в Приложении 1) находим величину коэффициента доверия t, соответствующего вероятности 0,954. При вероятности 0,954 коэффициент t равен 2.

  1. Предельная ошибка выборки с вероятностью 0,954 равна

    \delta_{x}= t\mu_{x}= 2*0.035 = 0.07

  2. Найдем доверительные границы для среднего значения уровня фондоотдачи в генеральной совокупности

Таким образом, в 954 случаях из 1000 среднее значение фондоотдачи будет не выше 1,88 руб. и не ниже 1,74 руб.

Выше была использована повторная схема случайного отбора. Посмотрим, изменятся ли результаты обследования, если предположить, что отбор осуществлялся по схеме бесповторного отбора. В этом случае расчет средней ошибки проводится по формуле

Тогда при вероятности равной 0,954 величина предельной ошибки выборки составит:

\delta_{x}= t\mu_{x}= 2*0.027 = 0.054

Доверительные границы для среднего значения признака при бесповторном случайном отборе будут иметь следующие значения:

Сравнив результаты двух схем отбора, можно сделать вывод о том, что применение бесповторной случайной выборки дает более точные результаты по сравнению с применением повторного отбора при одной и той же доверительной вероятности. При этом, чем больше объем выборки, тем существеннее сужаются границы значений средней при переходе от одной схемы отбора к другой.

По данным примера определим, в каких границах находится доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., в генеральной совокупности:

  1. рассчитаем выборочную долю.

Количество предприятий в выборке с уровнем фондоотдачи, не превышающим значения 2,0 руб., составляет 60 единиц. Тогда

m = 60, n = 90, w = m/n = 60 : 90 = 0,667;

  1. рассчитаем дисперсию доли в выборочной совокупности

\sigma_{w}^{2}= w(1 - w) = 0,667(1 - 0,667) = 0,222;

  1. средняя ошибка выборки при использовании повторной схемы отбора составит

Если предположить, что была использована бесповторная схема отбора, то средняя ошибка выборки с учетом поправки на конечность совокупности составит

  1. зададим доверительную вероятность и определим предельную ошибку выборки.

При значении вероятности Р = 0,997 по таблице нормального распределения получаем значение для коэффициента доверия t = 3 (см. выдержку из нее, приведенную в Приложении 1):

\delta_{x}= t\mu_{x}= 3*0.04 = 0.12

  1. установим границы для генеральной доли с вероятностью 0,997:

Таким образом, с вероятностью 0,997 можно утверждать, что в генеральной совокупности доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., не меньше, чем 54,7%, и не больше 78,7%.

  1. Типическая выборка. При типической выборке генеральная совокупность объектов разбита на k групп, тогда

N1 + N2 + … + Ni + … + Nk = N.

Объем извлекаемых из каждой типической группы единиц зависит от принятого способа отбора; их общее количество образует необходимый объем выборки

n1 + n2 + … + ni + … + nk = n.

Существуют следующие два способа организации отбора внутри типической группы: пропорциональной объему типических групп и пропорциональной степени колеблемости значений признака у единиц наблюдения в группах. Рассмотрим первый из них, как наиболее часто используемый.

Отбор, пропорциональный объему типических групп, предполагает, что в каждой из них будет отобрано следующее число единиц совокупности:

n = ni · Ni/N

где ni — количество извлекаемых единиц для выборки из i-й типической группы;

n — общий объем выборки;

Ni — количество единиц генеральной совокупности, составивших i-ю типическую группу;

N — общее количество единиц генеральной совокупности.

Отбор единиц внутри групп происходит в виде случайной или механической выборки.

Формулы для оценивания средней ошибки выборки для среднего и доли представлены в табл. 11.6.

Таблица
11.6.
Формулы для расчета средней ошибки выборки (\mu) при использовании типического отбора, пропорционального объему типических групп

Здесь \sigma^{2} — средняя из групповых дисперсий типических групп.

Пример 11.3. В одном из московских вузов проведено выборочное обследование студентов с целью определения показателя средней посещаемости вузовской библиотеки одним студентом за семестр. Для этого была использована 5%-ная бесповторная типическая выборка, типические группы которой соответствуют номеру курса. При отборе, пропорциональном объему типических групп, получены следующие данные:

Таблица
11.7.

Номер курса Всего студентов, чел., Ni Обследовано в результате выборочного наблюдения, чел., ni Среднее число посещений библиотеки одним студентом за семестр, xi Внутригрупповая выборочная дисперсия, \sigma_{i}^{2}
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
Итого 2 550 128 8

Число студентов, которое необходимо обследовать на каждом курсе, рассчитаем следующим образом:

  • общий объем выборочной совокупности:

    n = 2550/130*5 =128 (чел.);

  • количество единиц, отобранных из каждой типической группы:

аналогично для других групп:

n2 = 31 (чел.);

n3 = 29 (чел.);

n4 = 18 (чел.);

n5 = 17 (чел.).

Проведем необходимые расчеты.

  1. Выборочная средняя, исходя из значений средних типических групп, составит:

  2. Средняя из внутригрупповых дисперсий

  3. Средняя ошибка выборки:

    С вероятностью 0,954 находим предельную ошибку выборки:

    \delta_{x} = t\mu_{x} = 2*0.334 = 0.667

  4. Доверительные границы для среднего значения признака в генеральной совокупности:

Таким образом, с вероятностью 0,954 можно утверждать, что один студент за семестр посещает вузовскую библиотеку в среднем от семи до девяти раз.

  1. Малая выборка. В связи с небольшим объемом выборочной совокупности те формулы для определения ошибок выборки, которые использовались нами ранее при «больших» выборках, становятся неподходящими и требуют корректировки.

Среднюю ошибку малой выборки определяют по формуле

Предельная ошибка малой выборки:

\delta_{MB}= t\mu_{MB}

Распределение значений выборочных средних всегда имеет нормальный закон распределения (или приближается к нему) при п > 100, независимо от характера распределения генеральной совокупности. Однако в случае малых выборок действует иной закон распределения — распределение Стьюдента. В этом случае коэффициент доверия находится по таблице t-распределения Стьюдента в зависимости от величины доверительной вероятности Р и объема выборки п. В Приложении 1 приводится фрагмент таблицы t-распределения Стьюдента, представленной в виде зависимости доверительной вероятности от объема выборки и коэффициента доверия t.

Пример 11.4. Предположим, что выборочное обследование восьми студентов академии показало, что на подготовку к контрольной работе по статистике они затратили следующее количество часов: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6,6.

Оценим выборочные средние затраты времени и построим доверительный интервал для среднего значения признака в генеральной совокупности, приняв доверительную вероятность равной 0,95.

  1. Среднее значение признака в выборке равно

  2. Значение среднего квадратического отклонения составляет

  3. Средняя ошибка выборки:

  4. Значение коэффициента доверия t = 2,365 для п = 8 и Р = 0,95 .
  5. Предельная ошибка выборки:

    \delta_{MB}= t\mu_{MB}=2,365*0,344 = 0,81356 ~ 0,81 (ч)

  6. Доверительный интервал для среднего значения признака в генеральной совокупности:

То есть с вероятностью 0,95 можно утверждать, что затраты времени студента на подготовку к контрольной работе находятся в пределах от 6,9 до 8,5 ч.

11.2.2. Определение численности выборочной совокупности

Перед непосредственным проведением выборочного наблюдения всегда решается вопрос, сколько единиц исследуемой совокупности необходимо отобрать для обследования. Формулы для определения численности выборки выводят из формул предельных ошибок выборки в соответствии со следующими исходными положениями (табл. 11.7):

  1. вид предполагаемой выборки;
  2. способ отбора (повторный или бесповторный);
  3. выбор оцениваемого параметра (среднего значения признака или доли).

Кроме того, следует заранее определиться со значением доверительной вероятности, устраивающей потребителя информации, и с размером допустимой предельной ошибки выборки.

Таблица
11.8.
Формулы для определения численности выборочной совокупности

Примечание: при использовании приведенных в таблице формул рекомендуется получаемую численность выборки округлять в большую сторону для обеспечения некоторого запаса в точности.

Пример 11.5. Рассчитаем, сколько из 507 промышленных предприятий следует проверить налоговой инспекции, чтобы с вероятностью 0,997 определить долю предприятий с нарушениями в уплате налогов. По данным прошлого аналогичного обследования величина среднего квадратического отклонения составила 0,15; размер ошибки выборки предполагается получить не выше, чем 0,05.

При использовании повторного случайного отбора следует проверить

При бесповторном случайном отборе потребуется проверить

Как видим, использование бесповторного отбора позволяет проводить обследование гораздо меньшего числа объектов.

Пример 11.6. Планируется провести обследование заработной платы на предприятиях отрасли методом случайного бесповторного отбора. Какова должна быть численность выборочной совокупности, если на момент обследования в отрасли число занятых составляло 100 000 чел.? Предельная ошибка выборки не должна превышать 100 руб. с вероятностью 0,954. По результатам предыдущих обследований заработной платы в отрасли известно, что среднее квадратическое отклонение составляет 500 руб.

Следовательно, для решения поставленной задачи необходимо включить в выборку не менее 100 человек.

Как мы уже знаем, репрезентативность — свойство выборочной совокупности представлять характеристику генеральной. Если совпадения нет, говорят об ошибке репрезентативности — мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности. Предположим, что средний ежемесячный семейный доход пенсионеров в генеральной совокупности составляет 2 тыс. руб., а в выборочной — 6 тыс. руб. Это означает, что социолог опрашивал только зажиточную часть пенсионеров, а в его исследование вкралась ошибка репрезентативности. Иными словами, ошибкой репрезентативности называется расхождение между двумя совокупностями — генеральной, на которую направлен теоретический интерес социолога и представление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес социолога, которая выступает одновременно как объект обследования и средство получения информации о генеральной совокупности.

Наряду с термином «ошибка репрезентативности» в отечественной литературе можно встретить другой — «ошибка выборки». Иногда они употребляются как синонимы, а иногда «ошибка выборки» используется вместо «ошибки репрезентативности» как количественно более точное понятие.

Ошибка выборки — отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

На практике ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, результаты предшествующих опросов. В качестве контрольных параметров обычно применяются социально-демографические признаки. Сравнение средних генеральной и выборочной совокупностей, на основе этого определение ошибки выборки и ее уменьшение называется контролированием репрезентативности. Поскольку сравнение своих и чужих данных можно сделать по завершении исследования, такой способ контроля называется апостериорным, т.е. осуществляемым после опыта.

В опросах Института Дж. Гэллапа репрезентативность контролируется по имеющимся в национальных переписях данным о распределении населения по полу, возрасту, образованию, доходу, профессии, расовой принадлежности, месту проживания, величине населенного пункта. Всероссийский центр изучения общественного мнения (ВЦИОМ) использует для подобных целей такие показатели, как пол, возраст, образование, тип поселения, семейное положение, сфера занятости, должностной статус респондента, которые заимствуются в Государственном комитете по статистике РФ. В том и другом случае генеральная совокупность известна. Ошибку выборки невозможно установить, если неизвестны значения переменной в выборочной и генеральной совокупностях.

Специалисты ВЦИОМ обеспечивают при анализе данных тщательный ремонт выборки, чтобы минимизировать отклонения, возникшие на этапе полевых работ. Особенно сильные смещения наблюдаются по параметрам пола и возраста. Объясняется это тем, что женщины и люди с высшим образованием больше времени проводят дома и легче идут на контакт с интервьюером, т.е. являются легко достижимой группой по сравнению с мужчинами и людьми «необразованными»35.

Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки.

Ошибки выборки подразделяются на два типа — случайные и систематические. Случайная ошибка — это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. К случайным ошибкам относят статистические погрешности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности.

Второй тип ошибок выборки — систематические ошибки. Если социолог решил узнать мнение всех жителей города о проводимой местными органами власти социальной политике, а опросил только тех, у кого есть телефон, то возникает предумышленное смещение выборки в пользу зажиточных слоев, т.е. систематическая ошибка.

Таким образом, систематические ошибки — результат деятельности самого исследователя. Они наиболее опасны, поскольку приводят к довольно значительным смещениям результатов исследования. Систематические ошибки считаются страшнее случайных еще и потому, что они не поддаются контролю и измерению.

Они возникают, когда, например:

  1. выборка не соответствует задачам исследования (социолог решил изучить только работающих пенсионеров, а опросил всех подряд);
  2. налицо незнание характера генеральной совокупности (социолог думал, что 70% всех пенсионеров не работает, а оказалось, что не работает только 10%);
  3. отбираются только «выигрышные» элементы генеральной совокупности (например, только обеспеченные пенсионеры).

Внимание! В отличие от случайных ошибок систематические ошибки при возрастании объема выборки не уменьшаются.

Обобщив все случаи, когда происходят систематические ошибки, методисты составили их реестр. Они полагают, что источником неконтролируемых перекосов в распределении выборочных наблюдений могут быть следующие факторы:

  • нарушены методические и методологические правила проведения социологического исследования;
  • выбраны неадекватные способы формирования выборочной совокупности, методы сбора и расчета данных;
  • произошла замена требуемых единиц наблюдения другими, более доступными;
  • отмечен неполный охват выборочной совокупности (недополучение анкет, неполное их заполнение, труднодоступность единиц наблюдения).

Намеренные ошибки социолог допускает редко. Чаще ошибки возникают из-за того, что социологу плохо известна структура генеральной совокупности: распределение людей по возрасту, профессии, доходам и т.д.

Систематические ошибки легче предупредить (по сравнению со случайными), но их очень трудно устранить. Предупреждать систематические ошибки, точно предвидя их источники, лучше всего заранее — в самом начале исследования.

Вот некоторые способы избежать ошибок выборки:

  • каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;
  • отбор желательно производить из однородных совокупностей;
  • надо знать характеристики генеральной совокупности;
  • при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (или просто выборка) составлена правильно, то социолог получает надежные результаты, харастеризующие всю генеральную совокупность. Если она составлена неправильно, то ошибка, возникшая на этапе составления выборки, на каждом следующем этапе проведения социологического исследования приумножается и достигает в конечном счете такой величины, которая перевешивает ценность проведенного исследования. Говорят, что от такого исследования больше вреда, нежели пользы.

Подобные ошибки могут произойти только с выборочной совокупностыо. Чтобы избежать или уменьшить вероятность ошибки, самый простой способ — увеличивать размеры выборки (в идеале до объема генеральной: когда обе совокупности совпадут, ошибка выборки вообще исчезнет). Экономически такой метод невозможен. Остается другой путь — совершенствовать математические методы составления выборки. Они то и применяются на практике. Таков первый канал проникновения в социологию математики. Второй канал — математическая обработка данных.

Особенно важной проблема ошибок становится в маркетинговых исследованиях, где используются не очень большие выборки. Обычно они составляют несколько сотен, реже — тысячу респондентов. Здесь исходным пунктом расчета выборки выступает вопрос об определении размеров выборочной совокупности. Численность выборочной совокупности зависит от двух факторов:

  1. стоимости сбора информации,
  2. стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь.

Конечно, даже не искушенные в статистике и социологии люди интуитивно понимают, что чем больше размеры выборки, т.е. чем ближе они к размерам генеральной совокупности в целом, тем более надежны и достоверны полученные данные. Однако выше мы уже говорили о практической невозможности сплошных опросов в тех случаях, когда они проводятся на объектах, численность которых превышает десятки, сотни тысяч и даже миллионы. Понятно, что стоимость сбора информации (включающая оплату тиражирования инструментария, труда анкетеров, полевых менеджеров и операторов по компьютерному вводу) зависит от той суммы, которую готов выделить заказчик, и слабо зависит от исследователей. Что же касается второго фактора, то мы остановимся на нем чуть подробнее.

Итак, чем больше величина выборки, тем меньше возможная ошибка. Хотя необходимо отметить, что при желании увеличить точность вдвое вам придется увеличить выборку не в два, а в четыре раза. Например, чтобы сделать в два раза более точной оценку данных, полученных путем опроса 400 человек, вам потребуется опросить не 800, а 1600 человек. Впрочем, вряд ли маркетинговое исследование испытывает нужду в стопроцентной точности. Если пивовару необходимо узнать, какая часть потребителей пива предпочитает именно его марку, а не сорт его конкурента, — 60% или 40%, то на его планы никак не повлияет разница между 57%, 60 или 63%.

Ошибка выборки может зависеть не только от ее величины, но и от степени различий между отдельными единицами внутри генеральной совокупности, которую мы исследуем. Например, если нам нужно узнать, какое количество пива потребляется, то мы обнаружим, что внутри нашей генеральной совокупности нормы потребления у различных людей существенно различаются (гетерогенная генеральная совокупность). В другом случае мы будем изучать потребление хлеба и установим, что у разных людей оно различается гораздо менее существенно {гомогенная генеральная совокупность). Чем больше различия (или гетерогенность) внутри генеральной совокупности, тем больше величина возможной ошибки выборки. Указанная закономерность лишь подтверждает то, что нам подсказывает простой здравый смысл. Таким образом, как справедливо утверждает В. Ядов, «численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы».

Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые связаны с природой любых статистических погрешностей. В.И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5%-ной ошибки:
Это означает,что если вы, опросив, предположим, 400 человек в районном городе, где численность взрослого платежеспособного населения составляет 100 тыс. человек, выявили, что 33% опрошенных покупателей предпочитают продукцию местного мясокомбината, то с 95%-ной вероятностью можете утверждать, что постоянными покупателями этой продукции являются 33+5% (т.е. от 28 до 38%) жителей этого города.

Можно также воспользоваться расчетами института Гэллапа для оценки соотношения размеров выборки и ошибки выборки.

Тема 8. Выборочный метод

8.1. Сущность выборочного наблюдения, причины и практика его применения

Выборочное обследование – наиболее распространенный вид несплошного наблюдения в практике отечественной и зарубежной статистики. Сущность этого вида наблюдения состоит в том, что характеристика всей совокупности единиц дается по некоторой их части, отобранной научно обоснованным методом. В основе отбора единиц в выборку лежит принцип случайности, который обеспечивает равную возможность попадания в отобранную часть любой из единиц всей генеральной совокупности. Именно принцип случайности, заложенный в основу выборочного метода, и обеспечивает объективность результатов наблюдения, позволяет установить границы возможных ошибок и получить достоверные данные для характеристики всей совокупности.

Если отбор единиц произведен строго случайно, выборочная совокупность будет представительной или репрезентативной.

Выборочное наблюдение является наиболее совершенным и научно обоснованным методом несплошного наблюдения. При выборочном методе численность и доля единиц, которая будет обследоваться, известна до начала наблюдения, этим оно отличается от анкетного. В отличие от способа основного массива и монографического описания при проведении выборки неизвестно какие единицы совокупности будут подвергнуты обследованию. Выборочный метод, таким образом, в отличие от названных, исключает тенденциозность отбора и в большей степени обеспечивает представительство всех видов, групп, составляющих изучаемую совокупность.

Выборочный метод широко применяется в социально-экономических исследованиях, т.к. обладает рядом достоинств. Во-первых, он дает большую экономию средств и требует меньше времени для проведения наблюдения. То есть, выборочное наблюдение более экономичное, а результаты его носят более оперативный характер, чем при сплошном наблюдении. Во-вторых, при выборочном наблюдении при значительном сокращении объема работы обследование можно провести по более широкой программе, т.е. изучить явление более глубоко и детально. В-третьих, поскольку объем работы сокращается, то при выборке допускается меньше ошибок регистрации, и часто получают более точные результаты, чем при сплошном наблюдении.

Выборочный метод иногда является единственно возможным методом изучения явления, т.к. применение сплошного обследования может привести к физическому уничтожению всех единиц наблюдения. Например, при контроле качества некоторых видов продукции в промышленности, проверке семян на всхожесть в сельском хозяйстве и т.д.

Применение выборочного метода вызывается необходимостью контроля данных сплошного наблюдения. Например, контрольные проверки размеров посевных площадей и численности скота в личных хозяйствах населения.

Использование этого метода является целесообразным при изучении расходов населения, времени работы оборудования, рабочего времени и т.д.

Часто выборочный метод применяется в сочетании со сплошным наблюдением, например, при переписях населения.

8.2. Ошибки репрезентативности и теоретические основы их определения

В статистике принято называть совокупность отобранных единиц выборочной совокупностью (n), а совокупность единиц, из которых производится отбор – генеральной совокупностью (N). Генеральная и выборочная совокупности характеризуются такими показателями как средний размер признака, дисперсия, доля.

Рекомендуемые материалы

Задача выборочного наблюдения – дать верное представление о показателях всей генеральной совокупности на основе данных их некоторой части, попавшей в выборку.

Естественно, что когда изучают не всю, а только часть совокупности, результаты расчетов показателей выборочной и генеральной совокупности не совпадают. Эти отклонения выборочной средней и выборочной доли от доли и средней в генеральной совокупности называются ошибками выборки, или ошибками репрезентативности. Ошибки репрезентативности – это специфические ошибки, присущие только выборке и появляются они вследствие расхождения структуры выборочной и генеральной совокупности.

Как уже отмечалось, при выборочном наблюдении имеют место и ошибки регистрации, но они незначительны.

Основной организационный принцип выборочного наблюдения состоит в том, чтобы не допустить тенденциозного подбора выборочной совокупности, т.е. обеспечить строгое соблюдение принципа случайности отбора единиц в выборку. На результаты выборочного наблюдения можно полагаться именно благодаря тому, что отбор носит случайный характер. Это и позволяет максимально сократить возможные пределы отклонений выборочных результатов от показателей, вычисленных по всей генеральной совокупности.

Обобщенное действие механизма случайности в математике представляет закон больших чисел. Теория выборочного метода, основывается на доказательствах теорем русских математиков П.Л. Чебышева и А.М. Ляпунова. Из сущности закона больших чисел вытекает:

1) хотя каждая выборочная средняя и доля являются случайной величиной, однако средняя арифметическая из всех выборочных средних равняется генеральной средней;

2) каждый из возможных результатов выборочного наблюдения имеет свою вероятность появления, которая зависит от доли индивидуальных значений в генеральной совокупности. Чем больше доля индивидуальных показателей в генеральной совокупности, тем выше вероятность этих значений попасть в выборку;

3) каждая выборочная средняя отличается от генеральной средней. Разница между выборочной и генеральной средними представляет собой ошибку репрезентативности (выборки). Последняя измеряется средним квадратом отклонений всех возможных значений выборочных средних от генеральной средней, т.е. дисперсией.

В математической статистике доказывается, что между дисперсией выборочных средних и генеральной дисперсией существует определенное соотношение.

Дисперсия выборочных средних равна отношению генеральной дисперсии к численности выборочной совокупности.

Корень квадратный из этого отношения представляет собой стандартную (среднюю) ошибку репрезентативности (выборки):

.

Эта величина средней ошибки играет огромную роль в теории выборочного метода. Знание ее позволяет определять размер конкретных выборок и сказать какая выборка будет лучше еще до самой работы по выборочному обследованию.

Если выборочное обследование проводится с целью определения доли единиц, обладающих изучаемым признаком, то используются те же формулы расчетов, но в этом случае средняя и дисперсия заменяются аналогичными показателями альтернативного признака. Отсюда средняя ошибка выборки равна:

,

где  – доля единиц , обладающих данным признаком в выборочной совокупности.

Из приведенной формулы видно, что величина средней ошибки выборки зависит от вариации признака в генеральной совокупности, которая характеризуется дисперсией, и объема выборочной совокупности. Чем сильнее колеблется изучаемый признак у единиц генеральной совокупности, тем больше дисперсия, а отсюда и больше ошибка выборки, и, наоборот, чем больше объем выборочной совокупности, тем меньше ошибка выборки.

При организации выборки величина колеблемости признака в генеральной совокупности (N) неизвестна. В математической статистике доказано, что соотношение между дисперсиями генеральной и выборочной совокупностей выражается формулой:

.

Поскольку величина  при достаточно большой численности выборки близка к 1, то приближенно считают, что выборочная дисперсия равна генеральной дисперсии, т.е. , и в формуле средней ошибки выборки генеральная дисперсия заменяется выборочной.

4) при достаточно большом объеме выборки распределение средних вокруг генеральной средней подчинено закону нормального распределения. Это означает, что отклонение от генеральной средней расположено в ту или другую сторону симметрично. Если взять одно среднее квадратическое отклонение в ту или другую сторону, то тем самым будет принято во внимание 68,3% всех выборочных средних, т.е. выборочная средняя не отклонится в ту или другую сторону на одну сигму. Если взять два средних квадратических отклонения, то во внимание будет принято 95,4% всех выборочных средних, если взять три средних квадратических отклонения – 99,7% средних. Зная среднюю ошибку выборки и вероятности с какой уверенностью хотят гарантировать результаты выборочного наблюдения можно установить пределы ошибок.

,

где  – предельная ошибка выборки;

     – коэффициент доверия.

Коэффициент доверия выражает число средних ошибок, которые нужно взять, чтобы получить заданную вероятность. Так при вероятности 0,683 , при вероятности 0,954 , при вероятности 0,997 .

При выборочном наблюдении утверждения носят ориентировочный характер и выборочные показатели выражаются в интервале от и до.

Границы этих интервалов называются доверительными пределами. Нижний доверительный предел равен выборочной средней (доли) минус ошибка выборки.

8.3. Способы отбора и виды выборочного наблюдения

Репрезентативность выборки зависит не только от объема выборочной совокупности, но и от того как она образована, от характера отбора.

В генеральной совокупности могут отбираться отдельные единицы совокупности или же их группы.

В зависимости от того что является единицей отбора, последний делится на два вида: индивидуальный и групповой.

При индивидуальном отборе единицей отбора является непосредственно единица наблюдения. Например, проверка качества продукции непосредственно на рабочем месте. Контролер проверяет не каждую изготовленную деталь, а отбирает часть деталей из всей партии, которые подвергает проверке.

Групповой отбор заключается в том, что для наблюдения отбираются не только единицы совокупности, а их группы или серии. Примером могут служить контрольные проверки веса продукции, если она реализуется в упаковке (чай, макаронные изделия, сахар-рафинад и т.д.). Для контроля отбираются ящики, в отобранных ящиках взвешивается каждая пачка.

В некоторых случаях групповой отбор производится в сочетании с индивидуальным. Такой отбор называется комбинированным и связан со ступенчатостью. Здесь выборочная совокупность формируется не сразу, а проходит несколько стадий, ступеней, поэтому он еще называется многоступенчатым. Наиболее простым его случаем является двухступенчатый отбор, когда на первой ступени отбираются группы, на второй – отдельные единицы из отобранных групп.

Например, для контроля за соблюдением весовых стандартов пачек чая, сахара сначала отбираются ящики, в которых упакованы пачки, а из этих ящиков отбираются отдельные пачки.

Средняя ошибка выборки при двухступенчатом отборе исчисляется по формуле:

где  – число отобранных групп

     – среднегрупповая дисперсия из отобранных единиц

     – межгрупповая дисперсия.

Иногда сплошное наблюдение проводится в комбинации с выборочным. Например, переписи населения. Все население обследуется по основной программе, а 25% его обследуется по расширенной программе. Сплошное наблюдение может комбинироваться и с несколькими выборочными обследованиями, различающимися детализацией программ и числом обследуемых единиц.

Точность результатов и размеры ошибок выборочного наблюдения во многом зависят и от способа отбора единиц выборочной совокупности.

В зависимости от цели изучения и характера исходных данных, для обеспечения наибольшей репрезентативности выборки применяются следующие виды и способы отбора единиц совокупности для наблюдения:

а) собственно-случайная выборка,

б) механическая,

в) типическая (районированная),

г) серийно-гнездовая.

Собственно-случайная выборка.

При собственно-случайной выборке из генеральной совокупности отбираются для наблюдения отдельные единицы в случайном порядке. Для этого используются таблицы случайных чисел или жеребьевка.

Собственно-случайная выборка может проводиться по способу повторного и бесповторного отбора.

При повторном отборе отобранная единица после регистрации ее данных возвращается в генеральную совокупность и таким образом может попасть в выборку вторично и даже несколько раз. При бесповторном отборе каждая единица участвует в выборке только один раз.

Случайный отбор дает хорошие результаты в условиях, когда между единицами исследуемой совокупности нет резких различий.

При проведении собственно-случайной выборки нужно иметь исчерпывающий перечень всех единиц генеральной совокупности. Может оказаться, что пока организуется жеребьевка, единицы совокупности снова возникнут или ликвидируются. А при изучении качества продукции в течение дня вообще не имеется исчерпывающего перечня единиц. Неудобство этого способа отбора еще состоит и в том, что для жеребьевки на каждую единицу генеральной совокупности изготавливаются карточки (фишки) для жеребьевки.

Среднюю ошибку выборки для средней определяют в зависимости от способа отбора по разным формулам.

При повторном отборе:

.

При бесповторном отборе:

.

Аналогично вычисляют среднюю ошибку выборки для доли признака.

При повторном отборе:

.

При бесповторном отборе:

.

Бесповторный отбор обеспечивает большую репрезентативность выборки, чем повторный.

Собственно-случайная выборка применяется при контроле качества продукции, качества уборочных работ в сельском хозяйстве, при изучении оплаты пассажирами проезда в общественном транспорте и т.д.

Механическая выборка.

Механическая выборка представляет собой последовательный отбор единиц через равные интервалы в порядке определенного расположения их в генеральной совокупности или каком-нибудь перечне. Интервалы отбора определяются в соответствие с долей выборочной совокупности. Если, например, десятипроцентная выборка, то отбирается каждая десятая единица, если пятипроцентная – каждая двадцатая единица и т.д.

Расположение единиц генеральной совокупности в списке может быть двояким – упорядоченным или неупорядоченным относительно изучаемого признака. Так, списки рабочих могут быть составлены в алфавитном порядке по первым буквам фамилий; поскольку первые буквы фамилий рабочих не связаны с выполнением норм выработки, такое расположение является неупорядоченным относительно изучаемого признака. Если рабочих в списки записать по возрастанию или убыванию процента выполнения норм, расположение будет упорядоченным. Способ расположения единиц генеральной совокупности влияет на порядок их отбора в выборочную совокупность. В случае неупорядоченного расположения единиц из первых десяти рабочих можно взять любого (первого, второго, десятого) и затем последовательно брать одного через 10 человек. Если расположение упорядоченное, в выборочную совокупность следует отбирать рабочих, стоящих посредине каждого десятка; в противном случае может образоваться систематическая ошибка выборки. В самом деле, если рабочие в списках расположены по нисходящему проценту выполнения норм, то первые номера в каждом десятке будут всегда лучше по изучаемому признаку, а последние номера – худшими. Следовательно, отобрав в выборку первые номера, статистик завысит выборочный показатель выполнения норм, отобрав последние номера – занизит. Поэтому следует брать из каждого десятка пятые или шестые номера.

Механический отбор из упорядоченной (ранжированной) совокупности иногда называют систематическим отбором.

Механический отбор можно применять и не прибегая к спискам, а используя тот естественный порядок, в котором фактически расположены единицы генеральной совокупности, если только этот порядок не приведет к тенденциозным ошибкам.

Механическая выборка всегда бывает бесповторной и ошибки определяются по формулам собственно-случайной выборки.

Применяется механическая выборка при контроле за результатами сплошного наблюдения, при изучении потерь рабочего времени и т.д.

Например, из общего числа пенсионных вкладов банка была проведена 5%-ная механическая выборка. Результаты выборки следующие:

Таблица 8.1

Размер пенсионного вклада, тыс р.

Число вкладов

до 20

25

20-40

37

40-60

70

60-80

50

80 и выше

18

Итого

200

Определить: 1) с вероятностью 0,683 пределы среднего размера пенсионного вклада во всей генеральной совокупности; 2) с вероятностью 0,954 пределы доли вкладов, размер которых превышает 80 тыс. р.

Решение:

1. Предельная ошибка выборки на средний размер пенсионного вклада при механической выборке определяется по формуле:

.

Вероятности 0,683 соответствует коэффициент доверия (t), равный 1.

Вычислим среднюю и дисперсию по выборочной совокупности.

.

Вывод: с вероятностью 0,683 можно утверждать, что средний размер пенсионного вклада у всех вкладчиков банка будет находиться в пределах:

;

2. Предельная ошибка доли:

.

При вероятности 0,954  t=2.

W – доля вкладов, размер которых превышает 80 тыс. р.

.

.

Вывод: с вероятностью 0,954 можно утверждать, что доля вкладов, размер которых составляет 80 тыс. р. и выше во всей генеральной совокупности будет находиться в следующих доверительных пределах:

;

Типическая выборка.

Типический (районированный) отбор применяют в том случае, если изучаемая совокупность неоднородна.

При этом отборе генеральная совокупность предварительно расчленяется на типы (районы) из которых отбираются единицы либо посредством жеребьевки, либо механическим способом.

Типы (районы) могут быть образованы искусственно или использованы те, которые сложились естественно.

Количество единиц, отбираемых из каждого типа (района), как правило, берется пропорционально численности типов в генеральной совокупности. Однако в принципе наиболее точный результат дает типический отбор, учитывающий вариацию признака в отдельных частях (типах, районах) генеральной совокупности. Для достижения этого численность частей выборочной совокупности, имеющих большую вариацию, несколько увеличивается.

Случайная ошибка при типическом отборе меньше, чем при собственно-случайном и механическом отборах, так как типический отбор дает более репрезентативную выборку, лучше обеспечивает возможность сохранить в выборке то соотношение между типами (районами), которое имеется в генеральной совокупности.

Предельная ошибка при пропорциональной типической выборке исчисляется по нижеследующим формулам.

При повторном отборе:

,

.

При бесповторном отборе:

,

.

Пропорциональная типическая выборка широко применяется в социологических, бюджетных обследованиях, при изучении урожайности по типам хозяйств.

Например, для исчисления среднего размера депозита в банке была проведена 2% – типическая выборка. Распределение депозитов по срокам хранения и их статистические характеристики в выборке представлены в табл. 8.2.

Таблица 8.2

Срок хранения депозита

Число депозитов

Средний размер депозита, тыс. р.

Дисперсия

3 месяца

500

40

340

6 месяцев

300

65

580

1 год

200

100

260

Вычислим средний размер депозита:

С вероятностью 0,954 установить предельную ошибку выборки на средний размер депозита.

Вычислим среднюю групповую дисперсию:

Средняя ошибка выборки составит:

Предельная ошибка выборки при вероятности 0,954 составит:

Таким образом, средний размер депозита в генеральной совокупности будет находиться в пределах от 58,26 до 60,74 тыс. р.

Серийная (гнездовая) выборка.

Весьма часто в практике выборочного наблюдения применяется гнездовой или серийный отбор. При гнездовой или серийной выборке отбор производится не единицами, а целыми гнездами, сериями единиц совокупности, в пределах которых обследуются все единицы полностью. Например, 200 рабочих из 2000 можно отобрать целыми бригадами; отбор бригад может быть осуществлен посредством жеребьевки или механически. В отобранных бригадах общей численностью 200 человек должны быть обследованы все рабочие сплошь.

Серии (гнезда) состоят из единиц, связанных между собой или территориально, или организационно, или, наконец, во времени. Отбор серий может производится в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и неравновеликими. На практике чаще применяется серийный отбор с равными сериями.

Серийный отбор значительно проще в организационном отношении и дешевле других способов. Однако получающаяся в процессе этого отбора ошибки выборки в подавляющем большинстве случаев больше, чем при любом другом способе отбора.

Средняя ошибка выборки при отборе равновеликими сериями будет выражаться формулами:

при повторном отборе:        ;

при бесповторном отборе: ,

где  – число отобранных серий;

   – общее число серий в генеральной совокупности.

Приведем пример. Выборочное наблюдение урожайности зерновых культур по области проводилось при помощи отбора районов. По каждому отобранному району находилась средняя урожайность, которая оказалась следующей: I район – 14 ц с 1 га, II район – 15 ц с 1 га, III район – 14,5 ц с 1 га, IV район – 15,5 ц с 1 га, V район – 16 ц с 1 га. С вероятностью 0,997 оценить урожайность зерновых во всей области. В области 25 районов.

Найдем сначала общую среднюю:

затем межгрупповую дисперсию:

Средняя ошибка серийного бесповторного отбора:

Найдем предельную ошибку выборки:

Следовательно, с вероятностью 0,997 можно ожидать, что средняя урожайность зерновых в этой области заключается в пределах:

8.5. Определение необходимой численности выборки

Ошибки выборочного наблюдения и доверительные пределы генеральной средней (генеральной доли) определяются после того, как получены данные, характеризующие каждую единицу выборочной совокупности. А поэтому при проведении выборки первоначально необходимо определить сколько единиц или какая часть генеральной совокупности должна быть подвергнута наблюдению. Это важный момент в проведении выборочного наблюдения. Важность его в том, что излишняя численность выборочной совокупности вызывает необоснованное завышение затрат времени, труда, материальных и денежных средств, а недостаточная – дает результаты с большей погрешностью. Объем выборки должен быть оптимальным.

Факторами, определяющими численность выборки, являются:

1. Показатели вариации данного признака. Здесь обнаруживается прямая зависимость, т.е. чем больше показатель вариации, тем больше объем выборки.

2. Размер вероятности. Зависимость также прямая. Чем выше вероятность, тем выше коэффициент доверия, а, следовательно, и численность выборки. Величина вероятности зависит от того какое явление изучается. Естественно, что при контроле качества продовольственной продукции величина вероятности выше, чем непродовольственной продукции.

3. Размер возможной допустимой ошибки (). Зависимость обратная. Чем меньше размер допустимой ошибки, тем больше должна быть необходимая численность выборки.

4. Способ отбора единиц для обследования. При прочих равных условиях для бесповторной выборки требуется меньшая численность выборки, чем при повторном отборе.

Основной трудностью, возникающей при установлении необходимой численности выборки, является определение среднеквадратического отклонения, которое характеризует вариацию признака. Значение этого показателя отсутствует как для генеральной, так и выборочной совокупности, поскольку задача определения необходимой численности выборки возникает тогда, когда еще выборка не проведена. Поэтому на практике используют несколько методов приближенного расчета среднеквадратического отклонения. Рассмотрим некоторые из них.

1. Вместо среднеквадратического отклонения данного отчетного периода берут значение данного показателя в базисном периоде. Этот прием применяется в тех случаях, когда мы в отчетном периоде, по сравнению с базисным, не ожидаем резкого изменения в исследуемых признаках.

2. Расчет среднеквадратического отклонения может быть основан на той связи, которая существует между показателями средней арифметической и коэффициентом вариации. Практика показывает, что во всех более или менее однородных совокупностях коэффициент вариации колеблется в пределах от 25-35%. Иначе говоря, коэффициент вариации обычно приблизительно равен  среднеарифметической величины. А, следовательно, и показатель вариации при расчете необходимой численности выборки будет равен  среднеарифметической величины соответствующего признака.

3. Следующий прием опирается на величину размаха вариации. Разность между максимальным и минимальным значениями признака равна приблизительно шести средним квадратическим отклонениям. Разделив размах колебаний на шесть, мы получим приближенное значение среднего квадратического отклонения. Этот прием можно использовать, т.к. максимальное и минимальное значение изучаемого признака известны до проведения наблюдения.

При установлении колеблемости доли, как и средней, в первую очередь надо попытаться найти ориентировочные данные о величине W. Если таких данных нет, то берется максимальная величина произведения W на (1-W). Эта величина равна 0,25.

Необходимую численность выборочной совокупности определяют на основе алгебраического преобразования формулы предельной ошибки выборки для разных видов и способов отбора.

Для собственно-случайной повторной выборки:

.

Чтобы найти численность выборки, нужно освободиться от радикала. Это достигается возведением левой и правой частей уравнения в квадрат.

,

отсюда численность выборки: .

Объем выборочной совокупности прямо пропорционален квадрату коэффициента доверия и дисперсии и обратно пропорционален квадрату предельной ошибки выборки.

При бесповторном собственно-случайном и механическом отборе численность выборки будет равна:

.

Для доли признака численность выборки будет определяться по формулам:

 – при повторном отборе,

 – при бесповторном отборе.

Аналогичным преобразованием предельной ошибки определяется численность выборочной совокупности при типической и серийной выборке.

Допустим, что для установления средней дневной выработки рабочих предприятия проводится собственно-случайная бесповторная выборка. Сколько рабочих должно быть обследовано, чтобы получить результат с точностью 0,3 р. с вероятностью 0,954. Общая численность рабочих завода 5000 человек. По данным прошлогоднего обследования среднее квадратическое отклонение выработки составляет 1,6 р.

.

Следовательно, должно быть обследовано 112 рабочих, чтобы выполнить поставленные перед наблюдением требования.

8.6. Способы распространения данных выборочного наблюдения

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе данных, полученных по выборочной совокупности. Существуют два способа распространения данных выборочного наблюдения на генеральную совокупность – способ прямого пересчета и способ поправочных коэффициентов.

Способ прямого перерасчета заключается в том, что выборочная средняя или доля умножаются на численность генеральной совокупности и получается соответствующий объемный показатель. Так, в статистике сельского хозяйства выход шерсти от овец, находящихся в личном пользовании, определяется путем умножения полученных по выборке данных о среднем настриге шерсти с одной овцы на всю численность овец, находящихся в личной собственности. Например, согласно выборке, в области годовой настриг шерсти с одной овцы составляет 3 кг (с ошибкой выборки  г), среднегодовая численность овец в хозяйствах – 30 тыс голов. Исходя из этого годовой выход шерсти в хозяйствах определяется как произведение настрига с одной овцы на все поголовье овец:  кг, или 900 ц; с учетом ошибки выборки  – от 885 до 915 ц.

Второй пример. в 3%-ной выборке численностью 150 светильников 6 светильников оказались бракованными (ошибка выборки 1 светильник). По количеству брака, имеющемуся в выборочной совокупности (4%), можно подсчитать, сколько брака будет во всей партии светильников, составляющей 5 000 шт. Брак составит:

 светильников.

Вместе с этой лекцией читают «22 Сатурн».

Данный способ применяется тогда, когда известна численность единиц в генеральной совокупности.

Способ поправочных коэффициентом используется при проведении контрольных выборочных наблюдений для проверки и уточнения данных сплошного наблюдения. Он заключается в том, что по одним и тем же объектам сопоставляют данные сплошного и контрольного выборочного наблюдения. В результате такого сопоставления исчисляют поправочные коэффициенты, которые применяют для внесения поправок в данные сплошных наблюдений. Поправочные коэффициенты исчисляют, например, на основе данных контрольных выборочных обследований скота, находящегося в личной собственности населения сельской местности, при контроле за качеством деталей непосредственно на рабочем месте и т.д.

Например, по данным сплошного наблюдения численность крупного рогатого скота в личном подсобном хозяйстве граждан составляет 1 0000 голов.

Для контрольной проверки отобрано 1 000 семей, в хозяйствах которых сплошным наблюдением определена численность поголовья скота 1000 голов. В результате контрольного обхода в этих хозяйствах установлена численность крупного рогатого скота 1 050 голов.

Отсюда поправочный коэффициент составляет 1 050:1 000=1,05.

Общее поголовье скота в личном подсобном хозяйстве граждан равно  голов.

Понравилась статья? Поделить с друзьями:
  • Величина допустимой ошибки выборки зависит от уровня существенности
  • Величина допустимой ошибки выборки зависит от тест
  • Величина допустимой ошибки выборки зависит от риска необнаружения
  • Величайшие ошибки человечества
  • Величайшие ошибки науки