Ошибки регистрации и ошибки репрезентативности предельная ошибка выборки

Расхождения
между величиной какого-либо показателя,
найденного посредством статистического
наблюдения, и действительными его
размерами называются ошибками
наблюдения
.В зависимости от
причин возникновения различают ошибки
регистрации и ошибки репрезентативности.

Ошибки
регистрации
возникают в результате
неправильного установления фактов или
ошибочной записи в процессе наблюдения
или опроса. Они бывают случайными или
систематическими. Случайные ошибки
регистрации могут быть допущены как
опрашиваемыми в их ответах, так и
регистраторами. Систематические ошибки
могут быть и преднамеренными, и
непреднамеренными. Преднамеренные –
сознательные, тенденциозные искажения
действительного положения дела.
Непреднамеренные вызываются различными
случайными причинами (небрежность,
невнимательность).

Ошибки
репрезентативности
(представительности)
возникают в результате неполного
обследования и в случае, если обследуемая
совокупность недостаточно полно
воспроизводит генеральную совокупность.
Они могут быть случайными и систематическими.
Случайные ошибки репрезентативности
– это отклонения, возникающие при
несплошном наблюдении из-за того, что
совокупность отобранных единиц наблюдения
(выборка) неполно воспроизводит всю
совокупность в целом. Систематические
ошибки репрезентативности – это
отклонения, возникающие вследствие
нарушения принципов случайного отбора
единиц. Ошибки репрезентативности
органически присущи выборочному
наблюдению и возникают в силу того, что
выборочная совокупность не полностью
воспроизводит генеральную. Избежать
ошибок репрезентативности нельзя,
однако, пользуясь методами теории
вероятностей, основанными на использовании
предельных теорем закона больших чисел,
эти ошибки можно свести к минимальным
значениям, границы которых устанавливаются
с достаточно большой точностью.

Ошибки
выборки –
разность между
характеристиками выборочной и генеральной
совокупности. Для среднего значения
ошибка будет определяться по формуле


(7.1)

где

Величина
называетсяпредельной ошибкойвыборки.

Предельная
ошибка выборки – величина случайная.
Исследованию закономерностей случайных
ошибок выборки посвящены предельные
теоремы закона больших чисел. Наиболее
полно эти закономерности раскрыты в
теоремах П. Л. Чебышева и А. М. Ляпунова.

Теорему П.
Л. Чебышева
применительно к
рассматриваемому методу можно
сформулировать следующим образом: при
достаточно большом числе независимых
наблюдений можно с вероятностью, близкой
к единице (т. е. почти с достоверностью),
утверждать, что отклонение выборочной
средней от генеральной будет сколько
угодно малым. В теореме П. Л. Чебышева
доказано, что величина ошибки не должна
превышать.
В свою очередь величина,
выражающая среднее квадратическое
отклонение выборочной средней от
генеральной средней, зависит от
колеблемости признака в генеральной
совокупностии числа отобранных единицn. Эта
зависимость выражается формулой

,
(7.2)

где
зависит также от способа производства
выборки.

Величину
=называютсредней ошибкой выборки. В
этом выражении– генеральная дисперсия,n– объем
выборочной совокупности.

Рассмотрим, как
влияет на величину средней ошибки число
отбираемых единиц n. Логически
нетрудно убедиться, что при отборе
большого числа единиц расхождения между
средними будут меньше, т. е. существует
обратная связь между средней ошибкой
выборки и числом отобранных единиц. При
этом здесь образуется не просто обратная
математическая зависимость, а такая
зависимость, которая показывает, что
квадрат расхождения между средними
обратно пропорционален числу отобранных
единиц.

Увеличение
колеблемости признака влечет за собой
увеличение среднего квадратического
отклонения, а следовательно, и ошибки.
Если предположить, что все единицы будут
иметь одинаковую величину признака, то
среднее квадратическое отклонение
станет равно нулю и ошибка выборки
также исчезнет. Тогда нет необходимости
применять выборку. Однако следует иметь
в виду, что величина колеблемости
признака в генеральной совокупности
неизвестна, поскольку неизвестны размеры
единиц в ней. Можно рассчитать лишь
колеблемость признака в выборочной
совокупности. Соотношение между
дисперсиями генеральной и выборочной
совокупности выражается формулой

Поскольку
величина
при достаточно большихnблизка к
единице, можно приближенно считать, что
выборочная дисперсия равна генеральной
дисперсии, т. е.

Следовательно,
средняя ошибка выборки показывает,
какие возможны отклонения характеристик
выборочной совокупности от соответствующих
характеристик генеральной совокупности.
Однако о величине этой ошибки можно
судить с определенной вероятностью. На
величину вероятности указывает множитель

Теорема А.
М. Ляпунова
. А. М. Ляпунов доказал,
что распределение выборочных средних
(следовательно, и их отклонений от
генеральной средней) при достаточно
большом числе независимых наблюдений
приближенно нормально при условии, что
генеральная совокупность обладает
конечной средней и ограниченной
дисперсией.

Математически
теорему Ляпуноваможно записать
так:

(7.3)

где

,
(7.4)

где – математическая постоянная;

предельная ошибка выборки,которая дает возможность выяснить, в
каких пределах находится величина
генеральной средней.

Значения этого
интеграла для различных значений
коэффициента доверия tвычислены и
приводятся в специальных математических
таблицах. В частности, при:

Поскольку tуказывает на вероятность расхождения,
т. е. на вероятность того, на какую
величину генеральная средняя будет
отличаться от выборочной средней, то
это может быть прочитано так: с вероятностью
0,683 можно утверждать, что разность между
выборочной и генеральной средними не
превышает одной величины средней ошибки
выборки. Другими словами, в 68,3 % случаев
ошибка репрезентативности не выйдет
за пределыС вероятностью 0,954 можно утверждать,
что ошибка репрезентативности не
превышает(т. е. в 95 % случаев). С вероятностью
0,997, т. е. довольно близкой к единице,
можно ожидать, что разность между
выборочной и генеральной средней не
превзойдет трехкратной средней ошибки
выборки и т. д.

Логически связь
здесь выглядит довольно ясно: чем больше
пределы, в которых допускается
возможная ошибка, тем с большей
вероятностью судят о ее величине.

Зная выборочную
среднюю величину признака
и предельную ошибку выборки,
можно определить границы (пределы),
в которых заключена генеральная
средняя

(7.5)

1.
Собственно-случайная выборка

этот способ ориентирован на выборку
единиц из генеральной совокупности без
всякого расчленения на части или группы.
При этом для соблюдения основного
принципа выборки – равной возможности
всем единицам генеральной совокупности
быть отобранным – используются схема
случайного извлечения единиц путем
жеребьевки (лотереи) или таблицы случайных
чисел. Возможен повторный и бесповторный
отбор единиц

Средняя ошибка
собственно-случайной выборки
представляет собой среднеквадратическое
отклонение возможных значений выборочной
средней от генеральной средней. Средние
ошибки выборки при собственно-случайном
методе отбора представлены в табл. 7.2.

Таблица 7.2

Средняя ошибка
выборки μ

При отборе

повторном

бесповторном

Для средней

Для доли

В таблице
использованы следующие обозначения:

– дисперсия выборочной совокупности;

– численность выборки;

– численность генеральной совокупности;

– выборочная доля единиц, обладающих
изучаемым признаком;

– число единиц, обладающих изучаемым
признаком;

– численность выборки.

Для увеличения
точности вместо множителя
следует
брать множитель
,
но при большой численностиNразличие
между этими выражениями практического
значения не имеет.

Предельная
ошибка собственно-случайной выборки
рассчитывается по формуле

,
(7.6)

где t
– коэффициент доверия зависит от
значения вероятности.

Пример.При
обследовании ста образцов изделий,
отобранных из партии в случайном порядке,
20 оказалось нестандартными. С вероятностью
0,954 определите пределы, в которых
находится доля нестандартной продукции
в партии.

Решение.
Вычислим генеральную долю (Р):
.

Доля нестандартной
продукции:
.

Предельная
ошибка выборочной доли с вероятностью
0,954 рассчитывается по формуле (7.6) с
применением формулы табл. 7.2 для доли:

С вероятностью
0,954 можно утверждать, что доля нестандартной
продукции в партии товара находится в
пределах 12 % ≤ P≤ 28 %.

В практике
проектирования выборочного наблюдения
возникает потребность определения
численности выборки, которая необходима
для обеспечения определенной точности
расчета генеральных средних. Предельная
ошибка выборки и ее вероятность при
этом являются заданными. Из формулы
и формул средних ошибок выборки
устанавливается необходимая численность
выборки. Формулы для определения
численности выборки (n) зависят от
способа отбора. Расчет численности
выборки для собственно-случайной выборки
приведен в табл. 7.3.

Таблица 7.3

Предполагаемый
отбор

Формулы

для средней

для доли

Повторный

Бесповторный

2.
Механическая выборка
– при этом
методе исходят из учета некоторых
особенностей расположения объектов в
генеральной совокупности, их упорядоченности
(по списку, номеру, алфавиту). Механическая
выборка осуществляется путем отбора
отдельных объектов генеральной
совокупности через определенный интервал
(каждый 10-й или 20-й). Интервал рассчитывается
по отношению,
гдеn– численность выборки,N
численность генеральной совокупности.
Так, если из совокупности в 500 000 единиц
предполагается получить 2 %-ную выборку,
т. е. отобрать 10 000
единиц, то пропорция отбора составитОтбор
единиц осуществляется в соответствии
с установленной пропорцией через равные
интервалы. Если расположение объектов
в генеральной совокупности носит
случайный характер, то механическая
выборка по содержанию аналогична
случайному отбору. При механическом
отборе применяется только бесповторная
выборка [1, 5–10].

Средняя ошибка
и численность выборки при механическом
отборе подсчитывается по формулам
собственно-случайной выборки (см.
табл. 7.2 и 7.3).

3.
Типическая выборка
, при котрой
генеральная совокупность делится по
некоторым существенным признакам на
типические группы; отбор единиц
производится из типических групп. При
этом способе отбора генеральная
совокупность расчленяется на однородные
в некотором отношении группы, которые
имеют свои характеристики, и вопрос
сводится к определению объема выборок
из каждой группы. Может бытьравномерная
выборка
– при этом способе из каждой
типической группы отбирается одинаковое
число единицТакой подход оправдан лишь при равенстве
численностей исходных типических групп.
При типическом отборе, непропорциональном
объему групп, общее число отбираемых
единиц делится на число типических
групп, полученная величина дает
численность отбора из каждой типической
группы.

Более совершенной
формой отбора является пропорциональная
выборка
. Пропорциональной называется
такая схема формирования выборочной
совокупности, когда численность выборок,
взятых из каждой типической группы в
генеральной совокупности, пропорциональна
численностям, дисперсиям (или комбинированно
и численностям, и дисперсиям). Условно
определяем численность выборки в 100
единиц и отбираем единицы из групп:

пропорционально
численности их генеральной совокупности

(табл. 7.4). В таблице
обозначено:

Ni– численность типической группы;

dj
– доля (Ni/N);

N– численность
генеральной совокупности;

ni– численность выборки из типической
группы вычисляется:

, (7.7)

n – численность выборки из генеральной
совокупности.

Таблица
7.4

Группы

Ni

dj

ni

1

300

0,3

30

2

500

0,5

50

3

200

0,2

20

1000

1,0

100


пропорционально среднему квадратическому
отклонению
(табл. 7.5).

здесь
i– среднее
квадратическое отклонение типических
групп;

ni
– численность выборки из типической
группы вычисляется по формуле


(7.8)

Таблица
7.5

Ni

i

ni

300

5

0,25

25

500

7

0,35

35

200

8

0,40

40

1000

20

1,0

100


комбинированно (табл. 7.6).

Численность
выборки вычисляется по формуле

. (7.9)

Таблица 7.6

i

iNi

300

5

1500

0,23

23

500

7

2100

0,53

53

200

8

1600

0.24

24

1000

20

6600

1,0

100

При проведении
типической выборки непосредственный
отбор из каждой группы проводится
методом случайного отбора.

Средние ошибки
выборки рассчитываются по формулам
табл. 7.7 в зависимости от способа отбора
из типических групп.

Таблица 7.7

Способ
отбора

Повторный

Бесповторный

для
средней

для
доли

для
средней

для
доли

Непропорциональный
объему групп

Пропорциональный

объему групп

Пропорциональный
колеблемости в группах (является
наивыгоднейшим)

здесь
– средняя из внутригрупповых дисперсий
типических групп;

– доля единиц, обладающих изучаемым
признаком;

– средняя из внутригрупповых дисперсий
для доли;

– среднее квадратическое отклонение
в выборке изi-й типической группы;

– объем выборки из типической группы;

– общий объем выборки;


объем типической группы;

– объем генеральной совокупности.

Численность
выборки из каждой типической группы
должна быть пропорциональна среднему
квадратическому отклонению в этой
группе
.Расчет численности
производится по формулам, приведенным
в табл. 7.8.

Таблица 7.8

Повторный

Бесповторный

Для определения
средней

Для определения
доли

4. Серийная
выборка
– удобена в тех случаях,
когда единицы совокупности объединены
в небольшие группы или серии. При серийной
выборке генеральную совокупность делят
на одинаковые по объему группы – серии.
В выборочную совокупность отбираются
серии. Сущность серийной выборки
заключается в случайном или механическом
отборе серий, внутри которых производится
сплошное обследование единиц. Средняя
ошибка серийной выборки с равновеликими
сериями зависит от величины только
межгрупповой дисперсии. Средние ошибки
сведены в табл. 7.9.

Таблица 7.9

Способ
отбора серии

Формулы

для
средней

для
доли

Повторный

Бесповторный

Здесь
R– число серий в генеральной
совокупности;

r – число
отобранных серий;

– межсерийная (межгрупповая) дисперсия
средних;

– межсерийная (межгрупповая) дисперсия
доли.

При серийном
отборе необходимую численность отбираемых
серий определяют так же, как и при
собственно-случайном методе отбора.

Расчет численности
серийной выборки производится по
формулам, приведенным в табл. 7.10.

Таблица 7.10

Повторный

Бесповторный

Для
определения среднего признака

Для
определения доли

Пример.В
механическом цехе завода в десяти
бригадах работает 100 рабочих. В целях
изучения квалификации рабочих была
произведена 20 %-ная серийная бесповторная
выборка, в которую вошли две бригады.
Получено следующее распределение
обследованных рабочих по разрядам:

Рабочие

Разряды

рабочих
в бригаде 1

Разряды

рабочих
в бригаде 2

Рабочие

Разряды
рабочих
в бригаде 1

Разряды
рабочих
в бригаде 2

1

2

3

4

5

2

4

5

2

5

3

6

1

5

3

6

7

8

9

10

6

5

8

4

5

4

2

1

3

2

Необходимо
определить с вероятностью 0,997 пределы,
в которых находится средний разряд
рабочих механического цеха.

Решение.
Определим выборочные средние по
бригадам и общую среднюю как среднюю
взвешенную из групповых средних:

Определим
межсерийную дисперсию по формулам
(5.25):

Рассчитаем
среднюю ошибку выборки по формуле табл.
7.9:

Вычислим
предельную ошибку выборки с вероятностью
0,997:

С вероятностью
0,997 можно утверждать, что средний разряд
рабочих механического цеха находится
в пределах

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Тема 8. Выборочный метод

8.1. Сущность выборочного наблюдения, причины и практика его применения

Выборочное обследование – наиболее распространенный вид несплошного наблюдения в практике отечественной и зарубежной статистики. Сущность этого вида наблюдения состоит в том, что характеристика всей совокупности единиц дается по некоторой их части, отобранной научно обоснованным методом. В основе отбора единиц в выборку лежит принцип случайности, который обеспечивает равную возможность попадания в отобранную часть любой из единиц всей генеральной совокупности. Именно принцип случайности, заложенный в основу выборочного метода, и обеспечивает объективность результатов наблюдения, позволяет установить границы возможных ошибок и получить достоверные данные для характеристики всей совокупности.

Если отбор единиц произведен строго случайно, выборочная совокупность будет представительной или репрезентативной.

Выборочное наблюдение является наиболее совершенным и научно обоснованным методом несплошного наблюдения. При выборочном методе численность и доля единиц, которая будет обследоваться, известна до начала наблюдения, этим оно отличается от анкетного. В отличие от способа основного массива и монографического описания при проведении выборки неизвестно какие единицы совокупности будут подвергнуты обследованию. Выборочный метод, таким образом, в отличие от названных, исключает тенденциозность отбора и в большей степени обеспечивает представительство всех видов, групп, составляющих изучаемую совокупность.

Выборочный метод широко применяется в социально-экономических исследованиях, т.к. обладает рядом достоинств. Во-первых, он дает большую экономию средств и требует меньше времени для проведения наблюдения. То есть, выборочное наблюдение более экономичное, а результаты его носят более оперативный характер, чем при сплошном наблюдении. Во-вторых, при выборочном наблюдении при значительном сокращении объема работы обследование можно провести по более широкой программе, т.е. изучить явление более глубоко и детально. В-третьих, поскольку объем работы сокращается, то при выборке допускается меньше ошибок регистрации, и часто получают более точные результаты, чем при сплошном наблюдении.

Выборочный метод иногда является единственно возможным методом изучения явления, т.к. применение сплошного обследования может привести к физическому уничтожению всех единиц наблюдения. Например, при контроле качества некоторых видов продукции в промышленности, проверке семян на всхожесть в сельском хозяйстве и т.д.

Применение выборочного метода вызывается необходимостью контроля данных сплошного наблюдения. Например, контрольные проверки размеров посевных площадей и численности скота в личных хозяйствах населения.

Использование этого метода является целесообразным при изучении расходов населения, времени работы оборудования, рабочего времени и т.д.

Часто выборочный метод применяется в сочетании со сплошным наблюдением, например, при переписях населения.

8.2. Ошибки репрезентативности и теоретические основы их определения

В статистике принято называть совокупность отобранных единиц выборочной совокупностью (n), а совокупность единиц, из которых производится отбор – генеральной совокупностью (N). Генеральная и выборочная совокупности характеризуются такими показателями как средний размер признака, дисперсия, доля.

Рекомендуемые материалы

Задача выборочного наблюдения – дать верное представление о показателях всей генеральной совокупности на основе данных их некоторой части, попавшей в выборку.

Естественно, что когда изучают не всю, а только часть совокупности, результаты расчетов показателей выборочной и генеральной совокупности не совпадают. Эти отклонения выборочной средней и выборочной доли от доли и средней в генеральной совокупности называются ошибками выборки, или ошибками репрезентативности. Ошибки репрезентативности – это специфические ошибки, присущие только выборке и появляются они вследствие расхождения структуры выборочной и генеральной совокупности.

Как уже отмечалось, при выборочном наблюдении имеют место и ошибки регистрации, но они незначительны.

Основной организационный принцип выборочного наблюдения состоит в том, чтобы не допустить тенденциозного подбора выборочной совокупности, т.е. обеспечить строгое соблюдение принципа случайности отбора единиц в выборку. На результаты выборочного наблюдения можно полагаться именно благодаря тому, что отбор носит случайный характер. Это и позволяет максимально сократить возможные пределы отклонений выборочных результатов от показателей, вычисленных по всей генеральной совокупности.

Обобщенное действие механизма случайности в математике представляет закон больших чисел. Теория выборочного метода, основывается на доказательствах теорем русских математиков П.Л. Чебышева и А.М. Ляпунова. Из сущности закона больших чисел вытекает:

1) хотя каждая выборочная средняя и доля являются случайной величиной, однако средняя арифметическая из всех выборочных средних равняется генеральной средней;

2) каждый из возможных результатов выборочного наблюдения имеет свою вероятность появления, которая зависит от доли индивидуальных значений в генеральной совокупности. Чем больше доля индивидуальных показателей в генеральной совокупности, тем выше вероятность этих значений попасть в выборку;

3) каждая выборочная средняя отличается от генеральной средней. Разница между выборочной и генеральной средними представляет собой ошибку репрезентативности (выборки). Последняя измеряется средним квадратом отклонений всех возможных значений выборочных средних от генеральной средней, т.е. дисперсией.

В математической статистике доказывается, что между дисперсией выборочных средних и генеральной дисперсией существует определенное соотношение.

Дисперсия выборочных средних равна отношению генеральной дисперсии к численности выборочной совокупности.

Корень квадратный из этого отношения представляет собой стандартную (среднюю) ошибку репрезентативности (выборки):

.

Эта величина средней ошибки играет огромную роль в теории выборочного метода. Знание ее позволяет определять размер конкретных выборок и сказать какая выборка будет лучше еще до самой работы по выборочному обследованию.

Если выборочное обследование проводится с целью определения доли единиц, обладающих изучаемым признаком, то используются те же формулы расчетов, но в этом случае средняя и дисперсия заменяются аналогичными показателями альтернативного признака. Отсюда средняя ошибка выборки равна:

,

где  – доля единиц , обладающих данным признаком в выборочной совокупности.

Из приведенной формулы видно, что величина средней ошибки выборки зависит от вариации признака в генеральной совокупности, которая характеризуется дисперсией, и объема выборочной совокупности. Чем сильнее колеблется изучаемый признак у единиц генеральной совокупности, тем больше дисперсия, а отсюда и больше ошибка выборки, и, наоборот, чем больше объем выборочной совокупности, тем меньше ошибка выборки.

При организации выборки величина колеблемости признака в генеральной совокупности (N) неизвестна. В математической статистике доказано, что соотношение между дисперсиями генеральной и выборочной совокупностей выражается формулой:

.

Поскольку величина  при достаточно большой численности выборки близка к 1, то приближенно считают, что выборочная дисперсия равна генеральной дисперсии, т.е. , и в формуле средней ошибки выборки генеральная дисперсия заменяется выборочной.

4) при достаточно большом объеме выборки распределение средних вокруг генеральной средней подчинено закону нормального распределения. Это означает, что отклонение от генеральной средней расположено в ту или другую сторону симметрично. Если взять одно среднее квадратическое отклонение в ту или другую сторону, то тем самым будет принято во внимание 68,3% всех выборочных средних, т.е. выборочная средняя не отклонится в ту или другую сторону на одну сигму. Если взять два средних квадратических отклонения, то во внимание будет принято 95,4% всех выборочных средних, если взять три средних квадратических отклонения – 99,7% средних. Зная среднюю ошибку выборки и вероятности с какой уверенностью хотят гарантировать результаты выборочного наблюдения можно установить пределы ошибок.

,

где  – предельная ошибка выборки;

     – коэффициент доверия.

Коэффициент доверия выражает число средних ошибок, которые нужно взять, чтобы получить заданную вероятность. Так при вероятности 0,683 , при вероятности 0,954 , при вероятности 0,997 .

При выборочном наблюдении утверждения носят ориентировочный характер и выборочные показатели выражаются в интервале от и до.

Границы этих интервалов называются доверительными пределами. Нижний доверительный предел равен выборочной средней (доли) минус ошибка выборки.

8.3. Способы отбора и виды выборочного наблюдения

Репрезентативность выборки зависит не только от объема выборочной совокупности, но и от того как она образована, от характера отбора.

В генеральной совокупности могут отбираться отдельные единицы совокупности или же их группы.

В зависимости от того что является единицей отбора, последний делится на два вида: индивидуальный и групповой.

При индивидуальном отборе единицей отбора является непосредственно единица наблюдения. Например, проверка качества продукции непосредственно на рабочем месте. Контролер проверяет не каждую изготовленную деталь, а отбирает часть деталей из всей партии, которые подвергает проверке.

Групповой отбор заключается в том, что для наблюдения отбираются не только единицы совокупности, а их группы или серии. Примером могут служить контрольные проверки веса продукции, если она реализуется в упаковке (чай, макаронные изделия, сахар-рафинад и т.д.). Для контроля отбираются ящики, в отобранных ящиках взвешивается каждая пачка.

В некоторых случаях групповой отбор производится в сочетании с индивидуальным. Такой отбор называется комбинированным и связан со ступенчатостью. Здесь выборочная совокупность формируется не сразу, а проходит несколько стадий, ступеней, поэтому он еще называется многоступенчатым. Наиболее простым его случаем является двухступенчатый отбор, когда на первой ступени отбираются группы, на второй – отдельные единицы из отобранных групп.

Например, для контроля за соблюдением весовых стандартов пачек чая, сахара сначала отбираются ящики, в которых упакованы пачки, а из этих ящиков отбираются отдельные пачки.

Средняя ошибка выборки при двухступенчатом отборе исчисляется по формуле:

где  – число отобранных групп

     – среднегрупповая дисперсия из отобранных единиц

     – межгрупповая дисперсия.

Иногда сплошное наблюдение проводится в комбинации с выборочным. Например, переписи населения. Все население обследуется по основной программе, а 25% его обследуется по расширенной программе. Сплошное наблюдение может комбинироваться и с несколькими выборочными обследованиями, различающимися детализацией программ и числом обследуемых единиц.

Точность результатов и размеры ошибок выборочного наблюдения во многом зависят и от способа отбора единиц выборочной совокупности.

В зависимости от цели изучения и характера исходных данных, для обеспечения наибольшей репрезентативности выборки применяются следующие виды и способы отбора единиц совокупности для наблюдения:

а) собственно-случайная выборка,

б) механическая,

в) типическая (районированная),

г) серийно-гнездовая.

Собственно-случайная выборка.

При собственно-случайной выборке из генеральной совокупности отбираются для наблюдения отдельные единицы в случайном порядке. Для этого используются таблицы случайных чисел или жеребьевка.

Собственно-случайная выборка может проводиться по способу повторного и бесповторного отбора.

При повторном отборе отобранная единица после регистрации ее данных возвращается в генеральную совокупность и таким образом может попасть в выборку вторично и даже несколько раз. При бесповторном отборе каждая единица участвует в выборке только один раз.

Случайный отбор дает хорошие результаты в условиях, когда между единицами исследуемой совокупности нет резких различий.

При проведении собственно-случайной выборки нужно иметь исчерпывающий перечень всех единиц генеральной совокупности. Может оказаться, что пока организуется жеребьевка, единицы совокупности снова возникнут или ликвидируются. А при изучении качества продукции в течение дня вообще не имеется исчерпывающего перечня единиц. Неудобство этого способа отбора еще состоит и в том, что для жеребьевки на каждую единицу генеральной совокупности изготавливаются карточки (фишки) для жеребьевки.

Среднюю ошибку выборки для средней определяют в зависимости от способа отбора по разным формулам.

При повторном отборе:

.

При бесповторном отборе:

.

Аналогично вычисляют среднюю ошибку выборки для доли признака.

При повторном отборе:

.

При бесповторном отборе:

.

Бесповторный отбор обеспечивает большую репрезентативность выборки, чем повторный.

Собственно-случайная выборка применяется при контроле качества продукции, качества уборочных работ в сельском хозяйстве, при изучении оплаты пассажирами проезда в общественном транспорте и т.д.

Механическая выборка.

Механическая выборка представляет собой последовательный отбор единиц через равные интервалы в порядке определенного расположения их в генеральной совокупности или каком-нибудь перечне. Интервалы отбора определяются в соответствие с долей выборочной совокупности. Если, например, десятипроцентная выборка, то отбирается каждая десятая единица, если пятипроцентная – каждая двадцатая единица и т.д.

Расположение единиц генеральной совокупности в списке может быть двояким – упорядоченным или неупорядоченным относительно изучаемого признака. Так, списки рабочих могут быть составлены в алфавитном порядке по первым буквам фамилий; поскольку первые буквы фамилий рабочих не связаны с выполнением норм выработки, такое расположение является неупорядоченным относительно изучаемого признака. Если рабочих в списки записать по возрастанию или убыванию процента выполнения норм, расположение будет упорядоченным. Способ расположения единиц генеральной совокупности влияет на порядок их отбора в выборочную совокупность. В случае неупорядоченного расположения единиц из первых десяти рабочих можно взять любого (первого, второго, десятого) и затем последовательно брать одного через 10 человек. Если расположение упорядоченное, в выборочную совокупность следует отбирать рабочих, стоящих посредине каждого десятка; в противном случае может образоваться систематическая ошибка выборки. В самом деле, если рабочие в списках расположены по нисходящему проценту выполнения норм, то первые номера в каждом десятке будут всегда лучше по изучаемому признаку, а последние номера – худшими. Следовательно, отобрав в выборку первые номера, статистик завысит выборочный показатель выполнения норм, отобрав последние номера – занизит. Поэтому следует брать из каждого десятка пятые или шестые номера.

Механический отбор из упорядоченной (ранжированной) совокупности иногда называют систематическим отбором.

Механический отбор можно применять и не прибегая к спискам, а используя тот естественный порядок, в котором фактически расположены единицы генеральной совокупности, если только этот порядок не приведет к тенденциозным ошибкам.

Механическая выборка всегда бывает бесповторной и ошибки определяются по формулам собственно-случайной выборки.

Применяется механическая выборка при контроле за результатами сплошного наблюдения, при изучении потерь рабочего времени и т.д.

Например, из общего числа пенсионных вкладов банка была проведена 5%-ная механическая выборка. Результаты выборки следующие:

Таблица 8.1

Размер пенсионного вклада, тыс р.

Число вкладов

до 20

25

20-40

37

40-60

70

60-80

50

80 и выше

18

Итого

200

Определить: 1) с вероятностью 0,683 пределы среднего размера пенсионного вклада во всей генеральной совокупности; 2) с вероятностью 0,954 пределы доли вкладов, размер которых превышает 80 тыс. р.

Решение:

1. Предельная ошибка выборки на средний размер пенсионного вклада при механической выборке определяется по формуле:

.

Вероятности 0,683 соответствует коэффициент доверия (t), равный 1.

Вычислим среднюю и дисперсию по выборочной совокупности.

.

Вывод: с вероятностью 0,683 можно утверждать, что средний размер пенсионного вклада у всех вкладчиков банка будет находиться в пределах:

;

2. Предельная ошибка доли:

.

При вероятности 0,954  t=2.

W – доля вкладов, размер которых превышает 80 тыс. р.

.

.

Вывод: с вероятностью 0,954 можно утверждать, что доля вкладов, размер которых составляет 80 тыс. р. и выше во всей генеральной совокупности будет находиться в следующих доверительных пределах:

;

Типическая выборка.

Типический (районированный) отбор применяют в том случае, если изучаемая совокупность неоднородна.

При этом отборе генеральная совокупность предварительно расчленяется на типы (районы) из которых отбираются единицы либо посредством жеребьевки, либо механическим способом.

Типы (районы) могут быть образованы искусственно или использованы те, которые сложились естественно.

Количество единиц, отбираемых из каждого типа (района), как правило, берется пропорционально численности типов в генеральной совокупности. Однако в принципе наиболее точный результат дает типический отбор, учитывающий вариацию признака в отдельных частях (типах, районах) генеральной совокупности. Для достижения этого численность частей выборочной совокупности, имеющих большую вариацию, несколько увеличивается.

Случайная ошибка при типическом отборе меньше, чем при собственно-случайном и механическом отборах, так как типический отбор дает более репрезентативную выборку, лучше обеспечивает возможность сохранить в выборке то соотношение между типами (районами), которое имеется в генеральной совокупности.

Предельная ошибка при пропорциональной типической выборке исчисляется по нижеследующим формулам.

При повторном отборе:

,

.

При бесповторном отборе:

,

.

Пропорциональная типическая выборка широко применяется в социологических, бюджетных обследованиях, при изучении урожайности по типам хозяйств.

Например, для исчисления среднего размера депозита в банке была проведена 2% – типическая выборка. Распределение депозитов по срокам хранения и их статистические характеристики в выборке представлены в табл. 8.2.

Таблица 8.2

Срок хранения депозита

Число депозитов

Средний размер депозита, тыс. р.

Дисперсия

3 месяца

500

40

340

6 месяцев

300

65

580

1 год

200

100

260

Вычислим средний размер депозита:

С вероятностью 0,954 установить предельную ошибку выборки на средний размер депозита.

Вычислим среднюю групповую дисперсию:

Средняя ошибка выборки составит:

Предельная ошибка выборки при вероятности 0,954 составит:

Таким образом, средний размер депозита в генеральной совокупности будет находиться в пределах от 58,26 до 60,74 тыс. р.

Серийная (гнездовая) выборка.

Весьма часто в практике выборочного наблюдения применяется гнездовой или серийный отбор. При гнездовой или серийной выборке отбор производится не единицами, а целыми гнездами, сериями единиц совокупности, в пределах которых обследуются все единицы полностью. Например, 200 рабочих из 2000 можно отобрать целыми бригадами; отбор бригад может быть осуществлен посредством жеребьевки или механически. В отобранных бригадах общей численностью 200 человек должны быть обследованы все рабочие сплошь.

Серии (гнезда) состоят из единиц, связанных между собой или территориально, или организационно, или, наконец, во времени. Отбор серий может производится в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и неравновеликими. На практике чаще применяется серийный отбор с равными сериями.

Серийный отбор значительно проще в организационном отношении и дешевле других способов. Однако получающаяся в процессе этого отбора ошибки выборки в подавляющем большинстве случаев больше, чем при любом другом способе отбора.

Средняя ошибка выборки при отборе равновеликими сериями будет выражаться формулами:

при повторном отборе:        ;

при бесповторном отборе: ,

где  – число отобранных серий;

   – общее число серий в генеральной совокупности.

Приведем пример. Выборочное наблюдение урожайности зерновых культур по области проводилось при помощи отбора районов. По каждому отобранному району находилась средняя урожайность, которая оказалась следующей: I район – 14 ц с 1 га, II район – 15 ц с 1 га, III район – 14,5 ц с 1 га, IV район – 15,5 ц с 1 га, V район – 16 ц с 1 га. С вероятностью 0,997 оценить урожайность зерновых во всей области. В области 25 районов.

Найдем сначала общую среднюю:

затем межгрупповую дисперсию:

Средняя ошибка серийного бесповторного отбора:

Найдем предельную ошибку выборки:

Следовательно, с вероятностью 0,997 можно ожидать, что средняя урожайность зерновых в этой области заключается в пределах:

8.5. Определение необходимой численности выборки

Ошибки выборочного наблюдения и доверительные пределы генеральной средней (генеральной доли) определяются после того, как получены данные, характеризующие каждую единицу выборочной совокупности. А поэтому при проведении выборки первоначально необходимо определить сколько единиц или какая часть генеральной совокупности должна быть подвергнута наблюдению. Это важный момент в проведении выборочного наблюдения. Важность его в том, что излишняя численность выборочной совокупности вызывает необоснованное завышение затрат времени, труда, материальных и денежных средств, а недостаточная – дает результаты с большей погрешностью. Объем выборки должен быть оптимальным.

Факторами, определяющими численность выборки, являются:

1. Показатели вариации данного признака. Здесь обнаруживается прямая зависимость, т.е. чем больше показатель вариации, тем больше объем выборки.

2. Размер вероятности. Зависимость также прямая. Чем выше вероятность, тем выше коэффициент доверия, а, следовательно, и численность выборки. Величина вероятности зависит от того какое явление изучается. Естественно, что при контроле качества продовольственной продукции величина вероятности выше, чем непродовольственной продукции.

3. Размер возможной допустимой ошибки (). Зависимость обратная. Чем меньше размер допустимой ошибки, тем больше должна быть необходимая численность выборки.

4. Способ отбора единиц для обследования. При прочих равных условиях для бесповторной выборки требуется меньшая численность выборки, чем при повторном отборе.

Основной трудностью, возникающей при установлении необходимой численности выборки, является определение среднеквадратического отклонения, которое характеризует вариацию признака. Значение этого показателя отсутствует как для генеральной, так и выборочной совокупности, поскольку задача определения необходимой численности выборки возникает тогда, когда еще выборка не проведена. Поэтому на практике используют несколько методов приближенного расчета среднеквадратического отклонения. Рассмотрим некоторые из них.

1. Вместо среднеквадратического отклонения данного отчетного периода берут значение данного показателя в базисном периоде. Этот прием применяется в тех случаях, когда мы в отчетном периоде, по сравнению с базисным, не ожидаем резкого изменения в исследуемых признаках.

2. Расчет среднеквадратического отклонения может быть основан на той связи, которая существует между показателями средней арифметической и коэффициентом вариации. Практика показывает, что во всех более или менее однородных совокупностях коэффициент вариации колеблется в пределах от 25-35%. Иначе говоря, коэффициент вариации обычно приблизительно равен  среднеарифметической величины. А, следовательно, и показатель вариации при расчете необходимой численности выборки будет равен  среднеарифметической величины соответствующего признака.

3. Следующий прием опирается на величину размаха вариации. Разность между максимальным и минимальным значениями признака равна приблизительно шести средним квадратическим отклонениям. Разделив размах колебаний на шесть, мы получим приближенное значение среднего квадратического отклонения. Этот прием можно использовать, т.к. максимальное и минимальное значение изучаемого признака известны до проведения наблюдения.

При установлении колеблемости доли, как и средней, в первую очередь надо попытаться найти ориентировочные данные о величине W. Если таких данных нет, то берется максимальная величина произведения W на (1-W). Эта величина равна 0,25.

Необходимую численность выборочной совокупности определяют на основе алгебраического преобразования формулы предельной ошибки выборки для разных видов и способов отбора.

Для собственно-случайной повторной выборки:

.

Чтобы найти численность выборки, нужно освободиться от радикала. Это достигается возведением левой и правой частей уравнения в квадрат.

,

отсюда численность выборки: .

Объем выборочной совокупности прямо пропорционален квадрату коэффициента доверия и дисперсии и обратно пропорционален квадрату предельной ошибки выборки.

При бесповторном собственно-случайном и механическом отборе численность выборки будет равна:

.

Для доли признака численность выборки будет определяться по формулам:

 – при повторном отборе,

 – при бесповторном отборе.

Аналогичным преобразованием предельной ошибки определяется численность выборочной совокупности при типической и серийной выборке.

Допустим, что для установления средней дневной выработки рабочих предприятия проводится собственно-случайная бесповторная выборка. Сколько рабочих должно быть обследовано, чтобы получить результат с точностью 0,3 р. с вероятностью 0,954. Общая численность рабочих завода 5000 человек. По данным прошлогоднего обследования среднее квадратическое отклонение выработки составляет 1,6 р.

.

Следовательно, должно быть обследовано 112 рабочих, чтобы выполнить поставленные перед наблюдением требования.

8.6. Способы распространения данных выборочного наблюдения

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе данных, полученных по выборочной совокупности. Существуют два способа распространения данных выборочного наблюдения на генеральную совокупность – способ прямого пересчета и способ поправочных коэффициентов.

Способ прямого перерасчета заключается в том, что выборочная средняя или доля умножаются на численность генеральной совокупности и получается соответствующий объемный показатель. Так, в статистике сельского хозяйства выход шерсти от овец, находящихся в личном пользовании, определяется путем умножения полученных по выборке данных о среднем настриге шерсти с одной овцы на всю численность овец, находящихся в личной собственности. Например, согласно выборке, в области годовой настриг шерсти с одной овцы составляет 3 кг (с ошибкой выборки  г), среднегодовая численность овец в хозяйствах – 30 тыс голов. Исходя из этого годовой выход шерсти в хозяйствах определяется как произведение настрига с одной овцы на все поголовье овец:  кг, или 900 ц; с учетом ошибки выборки  – от 885 до 915 ц.

Второй пример. в 3%-ной выборке численностью 150 светильников 6 светильников оказались бракованными (ошибка выборки 1 светильник). По количеству брака, имеющемуся в выборочной совокупности (4%), можно подсчитать, сколько брака будет во всей партии светильников, составляющей 5 000 шт. Брак составит:

 светильников.

Вместе с этой лекцией читают «22 Сатурн».

Данный способ применяется тогда, когда известна численность единиц в генеральной совокупности.

Способ поправочных коэффициентом используется при проведении контрольных выборочных наблюдений для проверки и уточнения данных сплошного наблюдения. Он заключается в том, что по одним и тем же объектам сопоставляют данные сплошного и контрольного выборочного наблюдения. В результате такого сопоставления исчисляют поправочные коэффициенты, которые применяют для внесения поправок в данные сплошных наблюдений. Поправочные коэффициенты исчисляют, например, на основе данных контрольных выборочных обследований скота, находящегося в личной собственности населения сельской местности, при контроле за качеством деталей непосредственно на рабочем месте и т.д.

Например, по данным сплошного наблюдения численность крупного рогатого скота в личном подсобном хозяйстве граждан составляет 1 0000 голов.

Для контрольной проверки отобрано 1 000 семей, в хозяйствах которых сплошным наблюдением определена численность поголовья скота 1000 голов. В результате контрольного обхода в этих хозяйствах установлена численность крупного рогатого скота 1 050 голов.

Отсюда поправочный коэффициент составляет 1 050:1 000=1,05.

Общее поголовье скота в личном подсобном хозяйстве граждан равно  голов.

Практическое занятие №3. Ошибки выборки

3.1 Ошибки регистрации и ошибки репрезентативности

В результате статистической обработки данных могут возникнуть ошибки наблюдения, получаемые вследствие расхождения между величиной какого-либо показателя, найденного при статистическом наблюдении данных и действительными его размерами. Их еще называют выбросами. Это данные среди исходных результатов измерений (или данные, занесенные в таблицу и полученные из результатов измерений), которые настолько отклоняются от сопоставимых данных, внесенных в ту же самую таблицу, что признаются несовместимыми.

В зависимости от причин возникновения различаю ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения. Они бывают случайными и систематическими. Случайные ошибки регистрации могут быть допущены как в опрашиваемыми в их ответах, так и регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные ошибки – сознательные, тенденциозные искажения действительного положения дел. Непреднамеренные ошибки могут быть вызваны различными случайными причинами (небрежность, невнимательность).

Ошибки репрезентативности (представительности) возникают в результате неполного обследования и в случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими.

Ошибки репрезентативности присущи выборочному наблюдению и возникают в связи с тем, что выборочная совокупность не полностью воспроизводит генеральную.

Выборка является репрезентативной (или представительной), если она достаточно полно представлять изучаемые признаки генеральной совокупности. Условием обеспечения репрезентативности выборки являет­ся, согласно закону больших чисел, соблюдение случайности отбора, т.е. все объекты генеральной совокупности должны иметь равные вероятности попасть в выборку.

Анализ репрезентативности выборки особенно важен на начальном этапе исследований, когда численность генеральной совокупности неизвестна, но известны некоторые параметры опыта, позволяющие оценить репрезентативность.

Ошибки выборки – разность между характеристиками выборочной и генеральной совокупностей. Для среднего значения определяют предельную ошибку выборки по формуле

(3.1)

где

(3.2)

N– объем выборки.

Грубые ошибки и промахи обнаруживают и исключают из расчетов следующим образом:

  • находят среднее арифметическое результата nкратного измерения величины хi;
  • определяют среднее квадратическое отклонение S; Если базовый элемент ijсодержит лишь два результата измерений, то внутриэлементное расхождение (аналог стандартного отклонения) равно

(3.3)

Таким образом, если во всех базовых элементах содержится по два результата измерений, для простоты вместо стандартных отклонений могут быть использованы абсолютные расхождения;

  • вычисляют вспомогательную величину t(S) (табл. 3.1).

Таблица 3.1 – Значения вспомогательной величины t(S) в зависимости от числа nповторных измерений (степень достоверности 0,95)

n 2 3 4 5 6 7 8 9 10
t(S) 15,56 4,97 3,56 3,04 2,78 2,62 2,51 2,43 2,37

При |хi |>t(S) результат измерения хiявляется грубой ошибкой, поэтому его исключают из расчетов и среднее значение вычисляют заново для оставшихся достоверных результатов измерения.

Ошибки (промахи) могут быть исключены из генеральной совокупности с помощью следующего правила:

Если k больше допустимого значения, то делается вывод о том, что xi не принадлежит к генеральной совокупности.

Значения допустимых k дано в таблице 3.2.

Таблица 3.2 – Значения допустимых kв зависимости от числа измерений

Число измерений 4 6 8 10 12 14 16 18 20 25
Значение k 1,49 1,94 2,22 2,41 2,55 2,66 2,75 2,82 2,88 3,01

В литературе известны также критерии 3s, Граббса (Смирнова) [ГОСТ Р ИСО 5725-2-2002 Точность (правильность и прецизионность) методов и результатов измерений. Часть 2. Основной метод определения повторяемости и воспроизводимости стандартного метода измерений], Шарлье, Шовенэ, Диксона и др., которые позволяют исключить грубые промахи.

3.2 Критерий Романовского

Используя критерий Романовского можно определить грубую погрешность в зависимости от числа измерений и уровня значимости α. Для этого необходимо вычислить расчетное значение Vрасч сомнительного результата по формулам:

(3.4)

где Vнб, Vнм – соответственно расчетные значения соответствующие наибольшему (хнб) и наименьшему (хнм) значениям сомнительного результата.

Для принятых значений числа измерений n и уровня значимости α определяется максимально допустимое значение Vдоп по таблице 3.3, которое сравнивается с расчетным. Если Vдоп<Vрасч, то сомнительные значения (хнб, хнм) являются грубыми погрешностями и должны быть исключены из дальнейших рассмотрений.

Если Vдоп>Vрасч, то хнб и хнм необходимо оставить в данном ряду измерений и учитывать при обработке результатов измерений.

Таблица 3.3 – Значение критерия Романовского Vдоп в зависимости от числа измерений и уровня значимости 

Число измерений n Уровень значимости 
0,1 0,05 0,025 0,01
3 1,41 1,41 1,41 1,41
4 1,65 1,69 1,71 1,72
5 1,79 1,87 1,92 1,96
6 1,89 2,00 2,07 2,13
7 1,97 2,09 2,18 2,27
8 2,04 2,17 2,27 2,37
9 2,10 2,24 2,35 2,46
10 2,15 2,29 2,41 2,54
11 2,19 2,34 2,47 2,61
12 2,23 2,39 2,52 2,66
13 2,26 2,43 2,56 2,71
14 2,30 2,46 2,60 2,76
15 2,33 2,49 2,64 2,8
16 2,35 2,52 2,67 2,84
17 2,38 2,55 2,70 2,87
18 2,40 2,58 2,73 2,90
19 2,43 2,60 2,75 2,93
20 2,45 2,62 2,78 2,96
21 2,47 2,64 2,8.’ 2,98
22 2,49 2,66 2,82 3,01
23 2,50 2,68 2,84 3,03
24 2,52 2,7 2,86 3,05
25 2,54 2,72 2,88 3,07

Пример 3.1. Проверить результат хнб = 17,15 на соответствие грубой погрешности при  =0,05. Выполнено измерений п = 12; разброс значений составил  = 0,03,

Решение. Рассчитаем критерий Романовского по формуле (3.4):

Vрасч = (17,15 – 17,00)/0,03 = 5.

Для заданных  = 0,05 и п = 12 найти по таблице 3 допустимое значение критерия Романовского Vдоп = 2,39. Сравнивая табличное значение с расчетным, получаем 2,39<5, т.е. Vдоп<Vрасч, следовательно, хнб является грубой погрешностью и должно быть исключено из дальнейших рассмотрений.

3.3 Статистическая обработка экспериментальных данных. Собственно-случайная выборка (простая случайная)

Выборочное наблюдение относится к разновидности несплошного наблюдения, цель которого – по отобранной части единиц дать характеристику всей совокупности единиц. Необходимо, чтобы отобранная часть была репрезентативна (т.е. представляла всю совокупность единиц).

Используя теорему Чебышева П.Л. можно вычислить величину , выражающую среднее квадратическое отклонение выборочной средней от математического ожидания:

, (3.5)

которую называют средней ошибкой выборки.

С учетом выбранного уровня вероятности и соответствующего ему значения t (выбирается по табл. 2.5) предельная ошибка выборки составит:

, (3.6)

где tα(N-1) – квантиль распределения Стьюдента для вероятности α и числа степеней свободы f = (N-1).

С учётом (3.5) и (3.6) можно утверждать, что при заданной вероятности генеральная средняя будет находиться в следующих границах:

(3.7)

Пример 3.2. Предположим, в результате выборочного обследования жилищных условий жителей города, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 3.4).

Таблица 3.4 – Результаты выборочного обследования жилищных условий жителей города

Общая площадь жилищ, приходящаяся на 1 чел., кв. м. До 5,0 5,0…10,0 10,0…15,0 15,0…20,0 20,0…25,0 25,0…30,0 30,0 и более
Число жителей 8 95 204 207 210 130 83

Рассмотрим определение границ генеральной средней, в данном случае – средней площади жилищ в расчёте на 1 чел. в целом по городу, опираясь только на результаты выборочного обследования. Для определения средней ошибки выборки нам необходимо, прежде всего, рассчитать выборочную среднюю величину и дисперсию изучаемого признака (табл. 3.5).

В случае, когда данные сгруппированы по интервалам, т. е. представлены в виде интервальных рядов распределения, при расчёте средней арифметической в качестве значения признака принимают середину интервала, исходя из предположения о равномерном распределении единиц совокупности на данном интервале.

Таблица 3.5 – Расчёт средней (полезной) площади жилищ, приходящейся на 1 чел., и дисперсии

Общая (полезная) площадь жилищ,

приходящаяся на 1 чел., м2

Число

жителей mi

Середина

интервала xi

xi·mi
До 5,0

5,0 … 10,0

10,0 … 15,0

15,0 … 20,0

20,0 … 25,0

25,0 … 30,0

30,0 и более

8

95

204

270

210

130

83

2,5

7,5

12,5

17,5

22,5

27,5

32,5

20,0

712,5

2550,0

4725,0

4725,0

3575,0

2697,5

50,0

5343,75

31875,0

82687,5

106312,5

98312,5

87668,75

Итого: 1000 19005,0 412250,0

Расчёт ведется по формулам:

(3.8)

где xi – середина интервала.

В нашем примере:

Дисперсию определим по формуле:

(3.9)

Тогда получаем:

Откуда получаем значение выборочного среднего квадратичного отклонения:

S = 7,16м2.

Средняя ошибка выборки составит:

Определим предельную ошибку выборки с вероятностью 0,954 (t=2):

.

Установим границы генеральной средней:

или .

Таким образом, на основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в пределах от 18,5 до 19,5 м2.
При расчёте средней ошибки собственно-случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора:

, (3.10)

где Nx – генеральная совокупность. Если предположить, что представленные в таблице 6 данные являются результатом 5%-го бесповторного отбора (следовательно, генеральная совокупность включает 20 000 ед.), т.е. средняя ошибка выборки согласно (3.10) будет несколько меньше:

.

Соответственно уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней. Особенно ощутимо влияние поправки на бесповторность отбора при относительно большом проценте выборки.

Варианты заданий к практическому занятию №3

Вариант в хср хнб сигма n
1 0,1 24 24,48 0,12 3
2 0,05 24 26,16 0,12 4
3 0,025 18 19,26 0,09 5
4 0,01 5 5,3 0,09 6
5 0,1 25 26,75 0,11 7
6 0,05 10 10,8 0,1 8
7 0,025 18 19,62 0,11 9
8 0,01 8 8,48 0,09 10
9 0,1 18 18,18 0,13 11
10 0,05 18 18,36 0,1 20
11 0,025 18 19,08 0,1 21
12 0,01 14 15,4 0,09 22
13 0,1 16 17,6 0,09 23
14 0,05 9 9,18 0,11 24
15 0,025 7 7,63 0,12 25
16 0,01 23 23,23 0,09 3
17 0,1 17 18,36 0,11 4
18 0,05 21 21,63 0,1 5
19 0,025 6 6,18 0,11 6
20 0,01 10 10,5 0,12 7
21 0,1 6 6,66 0,11 8
22 0,05 12 12,6 0,09 9
23 0,025 15 15,6 0,09 10
24 0,01 12 12,36 0,12 11
25 0,1 22 23,54 0,11 20
26 0,05 15 16,35 0,13 21
27 0,025 5 5,35 0,08 22
28 0,01 18 19,62 0,11 23
29 0,1 10 10,9 0,11 24
30 0,05 15 16,5 0,1 25
Вариант Общая площадь на 1 чел, кв. м. до 5 5-10 10-15 15-20 20-25 25-30 больше 30 P
1 Число жителей 100 98 121 61 12 180 72 0,953
2 71 61 90 184 87 60 102 0,939
3 67 105 63 165 123 105 51 0,931
4 57 41 188 124 127 85 30 0,937
5 199 146 146 72 101 7 156 0,971
6 178 55 85 102 182 60 85 0,974
7 45 136 136 37 62 31 33 0,926
8 152 13 80 67 144 73 23 0,953
9 199 111 75 61 197 198 78 0,962
10 66 6 12 61 171 123 178 0,955
11 169 36 177 35 132 147 101 0,975
12 40 120 17 42 53 116 140 0,967
13 38 158 107 194 26 204 166 0,923
14 83 201 110 23 161 93 46 0,942
15 64 151 84 162 188 96 49 0,958
16 115 20 183 198 84 190 109 0,922
17 189 106 89 138 148 132 38 0,977
18 144 9 156 81 204 148 11 0,979
19 31 150 202 125 182 62 119 0,947
20 16 78 148 35 30 147 132 0,971
21 6 136 123 132 163 29 64 0,97
22 99 160 159 165 29 64 196 0,969
23 89 198 56 71 152 15 198 0,967
24 153 54 150 36 134 40 189 0,95
25 112 161 66 65 182 28 146 0,923
26 37 90 88 136 25 20 149 0,943
27 187 59 13 7 148 156 194 0,922
28 84 118 159 200 62 127 7 0,961
29 66 86 11 24 54 155 202 0,956
30 50 144 179 104 86 10 49 0,968

Понравилась статья? Поделить с друзьями:
  • Ошибки приборной панели на опель омега а
  • Ошибки регистрации при статистическом наблюдении это
  • Ошибки радиоведущих примеры
  • Ошибки регистрации при статистическом наблюдении бывают
  • Ошибки равно опыт