Величина случайной ошибки репрезентативности представительности зависит от

Согласно теории выборочного метода, неоднократно подтвержденной практикой, опрашивать всех нет необходимости, а можно опросить лишь часть группы, которая может быть в тысячи раз меньше. Эта маленькая часть называется выборкой (или выборочной совокупностью), а большая группа, которую она представляет, называется генеральной совокупностью.

При этом если выборка сформирована правильно, выводы, полученные на основе изучения выборки, могут быть перенесены и на генеральную совокупность. Например, если в выборке женщины значимо чаще, чем мужчины, пользуются дезодорантами, то делается вывод, что и в генеральной совокупности (например, в исследованном городе) присутствует такая закономерность.

Процесс переноса выводов с выборки на генеральную совокупность называется генерализацией. А свойство выборки отражать характеристики генеральной совокупности называется репрезентативностью. Для более комфортного запоминания термина на рис.1.

приведены иллюстрации, когда выборка отражает свойства генеральной совокупности и когда свойства выборки отличаются от свойств генеральной совокупности.

Статистика ошибок: зависимость от репрезентативности выборки Статистика ошибок: зависимость от репрезентативности выборки Статистика ошибок: зависимость от репрезентативности выборки

Рис.1. Иллюстративные примеры соответствия (несоответствия) свойств генеральной совокупности и выборки

Не стоит путать понятие репрезентативности с такими понятиями как валидность и релевантность, хотя они тоже относятся к характеристикам качества исследования. В социальных науках валидность понимается довольно широко, но чаще всего – как обоснованность.

Понятие валидности относится не к выборке, а к исследовательской методике. Методика или измерение (анкета, блок вопросов, тест) считается валидным, если фиксирует именно то понятие или свойство, которое планируется измерить.

Например, если мы захотим оценить уровень лояльности клиента к магазину и выберем для этого лишь показатель частоты посещения магазина, валидность этого подхода будет неполной: возможно, респондент часто заходит в магазин только из-за банкомата, который там установлен.

Валидная методика в данном примере должна включать и другие показатели: предпочтение магазина, суммы покупок в этом и других магазинах, готовность переключиться на другие магазины, готовность рекомендовать магазин и др.

При установлении валидности решающую роль играет обоснование и последующая проверка гипотезы релевантности, то есть соответствия измеряемых параметров характеристикам исследуемого объекта.

Житейский пример нерелевантности – измерять уровень счастья человека количеством денег у него (хотя, наверное, не все с этим согласятся).

Очевидный пример нерелевантности – попытка измерить массу тела по его температуре.

Но вернемся к понятию репрезентативности. В то время как точность измерений зависит от размера выборки, размер выборки не гарантирует ее репрезентативности.

Репрезентативность выборки главным образом обеспечивается способом отбора ее участников (респондентов).

Примером явного нарушения репрезентативности может послужить шутка о том, что интернет-опрос показал, что 100% людей пользуется интернетом.

Можно выделить несколько вариантов нарушения репрезентативности выборки: когда опрошены не те люди и когда опрошено слишком много (или мало) определенных людей (например, женщин намного больше, чем мужчин). Кроме того, чем меньше размер выборки, тем меньше вероятность того, что она будет репрезентативной. Например, допустим, 1% населения мог бы заинтересоваться новой услугой.

Это 1 из 100 людей. Если размер выборки составляет всего 60 человек, то в вашей выборке может отсутствовать человек, который, скорее всего, будет заинтересован в услуге. Ваша выборка менее репрезентативна, потому что она меньше. Ваши результаты будут разными в зависимости от того, содержит ли ваша выборка одного из этих людей или нет.

Пример репрезентативной и нерепрезентативной выборки показан на рис.2.

Статистика ошибок: зависимость от репрезентативности выборки

Рис.2. Пример репрезентативной и нерепрезентативной выборки

На рис.3 показана та же по составу генеральная совокупность, но с другим расположением объектов внутри круга.

Статистика ошибок: зависимость от репрезентативности выборки

Рис.3. Пример репрезентативной и нерепрезентативной выборки при другом расположении объектов генеральной совокупности

Говоря простым языком, репрезентативная выборка – это такая выборка, в которой представлены все подгруппы, важные для исследования. Помимо этого, характер распределения рассматриваемых параметров в выборке должен быть таким же, как в генеральной совокупности.

Простой случайный отбор респондентов представляется оптимальным способом формирования репрезентативной выборки.

Поскольку в этом случае у любого представителя генеральной совокупности одинаковая вероятность попасть в выборку, в нее попадут люди с разными характеристиками пропорционально их долям в генеральной совокупности.

В итоге выборка будет представлять собой нечто вроде уменьшенной копии генеральной совокупности.

Случайность отбора респондентов в выборку обеспечивается разными способами.

Например, для телефонного опроса жителей города берется база данных всех телефонных номеров, и номера респондентов случайным образом выбираются компьютером (с использованием генератора случайных чисел).

При уличном опросе интервьюеров распределяют по случайно выбранным точкам и инструктируют опрашивать каждого N-ного прохожего.

Наглядным примером репрезентативной выборки может служить пицца. Если целая пицца – это генеральная совокупность, которую мы хотим изучить, то кусок пиццы – это выборка.

Как правило, достаточно одного куска пиццы, чтобы судить обо всей пицце (при условии, что ингредиенты равномерно распределены по ее поверхности). Таким образом, кусок пиццы пиццы на рис.

4 – это репрезентативная выборка из пиццы.

Статистика ошибок: зависимость от репрезентативности выборки

Рис.4. Наглядный пример репрезентативной выборки (пицца)

Важно отметить, что не любой кусок пиццы будет репрезентативной выборкой. Разные способы получения куска пиццы могут принципиально повлиять на качество исследования и выводы, которые будут получены при анализе каждого варианта выборки (рис.4)

(рисунок в сушильной камере, готовится к публикации)

Рис.5. Наглядный пример формирования репрезентативной и нерепрезентативной выборки.

Еще один показательный пример формирования репрезентативной выборки – кастрюля, содержимое которой мы должны узнать (допустим, там скрывается борщ). Мы только один раз можем зачерпнуть из кастрюли ложкой (провести исследование). В нашем примере ложка – это выборка, а содержимое кастрюли – генеральная совокупность.

Если мы зачерпнем сверху, то придем к выводу, что в кастрюле бульон. Если снизу – решим, что в кастрюле мясо. Зачерпнув где-то посередине, мы получим картошку или капусту. В любом из трех случаев выводы будут неверны.

Чтобы получить достоверный результат, нам стоит хорошенько перемешать содержимое кастрюли, перед тем как пробовать его.

Перемешивание в данном случае – аналог процедуры простого случайного отбора, поскольку оно предоставляет всем ингредиентам примерно равную вероятность попадания в ложку-выборку (или тарелку-выборку).

Статистика ошибок: зависимость от репрезентативности выборки

Рис.6. Борщ как модель, демонстрирующая репрезентативность выборки.

В реальности применить простой случайный отбор респондентов не всегда удается в полной мере. Например, мы можем абсолютно корректно отобрать в выборку нужное количество номеров домашних телефонов случайным образом, но при их прозвоне выяснится, что дозвониться и поговорить удается преимущественно с пенсионерами, а «поймать» дома молодежь и работающих людей получается плохо.

Возвращаясь к примеру с борщом, если у нас вместо кастрюли – огромный ресторанный котел, а в руках все та же обычная ложка, перемешивание будет неэффективным. Чтобы решить задачу, потребуются иные подходы.

Например, мы можем теоретически разделить глубину котла на несколько слоев и постараться зачерпнуть содержимое из каждого слоя (из случайного места слоя: не только в центре, но и по краям). Таким образом, наша итоговая выборка будет состоять уже из нескольких выборок и при этом адекватно отражать содержимое всех слоев котла.

Подобные альтернативные подходы называются типами выборки, которых придумано достаточно много для того, чтобы максимизировать репрезентативность выборки в сложных условиях реального мира.

Последствия нарушения репрезентативности выборки: некорректные выводы исследования, выброшенный на ветер бюджет исследования, финансовые потери вследствие применения неправильных выводов.

Вы можете выбрать валидную исследовательскую методику, рассчитать объем выборки, обеспечивающий приемлемую точность измерений, но, если выборка исследования нерепрезентативна, получить достоверную информацию не удастся.

  • ПРИМЕРЫ НАРУШЕНИЯ РЕПРЕЗЕНТАТИВНОСТИ ВЫБОРКИ
  • ПРЕДВЫБОРНЫЙ ОПРОС
  • Самым известным примером нарушения репрезентативности выборки является история провала американского журнала «Литературный дайджест».

В 1936 году журнал в очередной раз провел почтовый опрос общественного мнения о вероятных результатах грядущих президентских выборов в США. До 1936 года опрос всегда правильно предсказывал победителя. Опрос 1936 года показал, что победителем с большим отрывом станет кандидат от республиканцев, но в итоге победителем оказался представитель демократов.

Таким образом, гигантская выборка (около 2,4 млн. человек) не обеспечила достоверных результатов. В чем же заключалась причина ошибки?

Называются две основные причины провала: смещение при формировании выборки и смещение вследствие отказа респондентов от участия в опросе.

Прежде всего, журнал включил своих подписчиков в список для рассылки анкет и, желая расширить выборку, использовал два других доступных тогда списка граждан: зарегистрированных автовладельцев и пользователей телефонов.

Во времена Великой Депрессии представители этих групп отличались от остального населения более высоким доходом, как и подписчики самого журнала.

Таким образом, полученная база для рассылки не являлась корректным отражением структуры населения США.

Вторая проблема с опросом заключалась в том, что из 10 миллионов человек, чьи имена были в первоначальном списке рассылки, только 2,4 миллиона ответили на опрос. Вероятно, высокий процент отказов был связан с тем, что опрос проводился по почте.

Уже в те времена американцы относились к почтовым рассылкам как к спаму. Таким образом, размер выборки составил примерно одну четверть от того, что первоначально планировалось.

Когда доля ответивших низка (как это было в данном случае), считается, что исследование страдает от необъективности ответов.

У этой истории две морали: Большая, но неправильно сформированная выборка гораздо хуже маленькой, но правильно сформированной выборки. При проведении опроса не упускайте из внимания смещение отбора и смещение в результате отказов.

СИСТЕМАТИЧЕСКАЯ ОШИБКА ВЫЖИВШЕГО

Пример из военной практики. Во Вторую мировую войну американские военные столкнулись со следующей проблемой. Не все американские бомбардировщики после задания возвращались на базу.

На вернувшихся самолетах оставалось множество пробоин от выстрелов противника, но распределены они были неравномерно: больше всего на фюзеляже и прочих частях, меньше в топливной системе и гораздо меньше — в двигателе.

Командованию казалось логичным, что в наиболее поврежденных местах нужно установить больше брони. Привлеченный к решению задачи математик возразил: данные как раз показывают, что самолет, получивший пробоины в этих местах, еще может вернуться на базу.

А самолет, которому попали в бензобак или двигатель, выходит из строя и не возвращается. Поэтому укреплять следует те места, которые у вернувшихся самолетов повреждены меньше всего.

Статистика ошибок: зависимость от репрезентативности выборки

Рис .7. Пробоины на вернувшихся самолётах. Получившие повреждения в других местах не смогли вернуться на базу

Эта задача служит примером нарушения репрезентативности выборки, когда в нее включены не те респонденты: в данном случае, вернувшиеся самолеты, в то время как не вернувшиеся проигнорированы.

Применительно к маркетинговым исследованиям, эта ситуация подобна следующей. При опросе клиентов бизнеса будет ошибкой опрашивать только текущих клиентов и не опрашивать потерянных клиентов (а какие «пробоины» получили они?).

НЕПРАВИЛЬНЫЕ МЕСТА ОПРОСА

При опросе посетителей ТРЦ важно правильно расставить интервьюеров. Например, если поставить интервьюеров только у главного входа, в выборку не попадут посетители, приехавшие в ТРЦ на автомобиле и попавшие в него через парковку.

Как следствие, выводы, полученные на собранных данных, будут корректны только для той части посетителей, которые приходят в ТРЦ пешком, а значит, делают меньше покупок, не покупают габаритные товары, живут ближе к ТРЦ, чем приезжающие на автомобиле.

ОТСУТСТВИЕ КВОТИРОВАНИЯ

Другой пример. Бывает, что в разных районах города сбор анкет идет с разной скоростью: где-то (например, в центре города) большой пешеходный поток и у людей есть время на участие в опросе (отдыхающие, в отпуске, офисные сотрудники на обеде), а на окраинах либо мало людей на улицах, либо все спешат на работу и отказываются участвовать.

В результате, если не ограничивать доли районов, в выборке будут преобладать люди из центрального района, которые могут значимо отличаться от остальных людей родом занятий, уровнем дохода и образования, уровнем осведомленности о магазинах и др.

Таким образом, собранная выборка уже не будет репрезентативной по отношению к населению всего города.

ОНЛАЙН-ОПРОСЫ (ОНЛАЙН-ПАНЕЛИ)

Несмотря на многие положительные стороны онлайн-опросов, такие как экономичность, оперативность сбора информации, удобство ее обработки и т. д., некоторые их особенности напрямую угрожают репрезентативности исследования:

  1. Во-первых, участники онлайн-опросов – это, как правило, активные пользователи интернета, хорошо в нем разбирающиеся и больше подверженные влиянию интернет-культуры, чем обычные люди.
  2. Во-вторых, люди, у которых есть время и желание регулярно участвовать в онлайн-опросах за небольшое вознаграждение, скорее всего, значительно отличаются от остальных людей как по социально-демографическим, так и по психографическим характеристикам.
  3. В-третьих, профессиональное участие в опросах приводит к так называемой профессиональной деформации, когда ответы респондентов на вопросы новых исследований обусловлены предыдущим опытом, но не жизненным, а опытом участия в других опросах.
  4. Таким образом, в данном случае возникает та ситуация, когда опрашиваются не те люди, хотя по формальным характеристикам они подходят под описание целевой аудитории.
  5. ВЫВОДЫ
  6. Итак, чтобы получить достаточно точные данные об интересующей нас группе людей, необязательно опрашивать их всех, благодаря свойству репрезентативности выборки.
  7. «Чем больше, тем лучше» – неправильный подход к формированию выборки.

Небольшая репрезентативная выборка лучше большой, но нерепрезентативной выборки. Применительно к выборке не стоит пугаться слова «случайная». Это вовсе не значит, что в исследовании будут получены случайные результаты. Напротив, случайный подход к формированию выборки делает ее максимально похожей на генеральную совокупность, а значит, репрезентативной.

При проектировании выборки следует учитывать опасность смещения структуры выборки вследствие особенностей сбора информации и других условий.

Источник: https://scanmarket.ru/blog/reprezentativnost-vyborki

Ошибки выборки

Чтобы оценить степень точности выборочного наблюдения, необходимо оценить величину ошибок, которые могут возникнуть в процессе проведения выборочного наблюдения.

Статистика ошибок: зависимость от репрезентативности выборки

Статистическое исследование может осуществляться по данным несплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной ее части. Одним из наиболее распространенных в статистике методов, применяющих несплошное наблюдение, является выборочный метод.

Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора.

При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности (обычно до 5 — 10%, реже до 15 — 25%). При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью.

Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью
или просто выборкой.

Значение выборочного метода состоит в  том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

В проведении ряда исследований выборочный метод является единственно возможным, например, при контроле качества продукции (товара), если проверка сопровождается уничтожением или разложением на составные части обследуемых образцов (определение сахаристости фруктов, клейковины печеного хлеба, установление носкости обуви, прочности тканей на разрыв и т.д.).

  • Проведение исследования социально — экономических явлений выборочным методом складывается из ряда последовательных этапов:
  • 1) обоснование (в соответствии с задачами исследования) целесообразности применения выборочного метода;
  • 2) составление программы проведения статистического исследования выборочным методом;
  • 3) решение организационных вопросов сбора и обработки исходной     информации;

4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности;

  1. 5) обоснование способов формирования выборочной совокупности;
  2. 6) осуществление отбора единиц из генеральной совокупности для их обследования;
  3. 7) фиксация в отобранных единицах (пробах) изучаемых признаков;
  4. 8) статистическая обработка полученной в выборке информации с определением обобщающих характеристик изучаемых признаков;
  5. 9) определение количественной оценки ошибки выборки;
  6. 10) распространение обобщающих выборочных характеристик на генеральную совокупность.
  7. В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака — генеральной средней (обозначается ).
  8. В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью (обозначается ), а среднюю  величину в выборке — выборочной средней (обозначается ).
  9. Пример.

При контрольной проверке качества хлебобулочных изделий проведено 5%-ное выборочное обследование партии нарезных батонов из муки высшего сорта. При этом из 100 отобранных в выборку батонов 90 шт. соответствовали требованиям стандарта. Средний вес одного батона в выборке составлял 500,5 г при среднем квадратическом отклонении г.

  • На основе полученных в выборке данных нужно установить возможные значения доли стандартных изделий и среднего веса одного изделия во всей партии.
  • Прежде всего устанавливаются характеристики выборочной совокупности. Выборочная доля, или частость,  определяется из отношения единиц, обладающих изучаемым признаком m, к общей численности единиц выборочной совокупности n:

Поскольку из 100 изделий, попавших в выборку n, 90 ед. оказались стандартными m, то показатель частости равен: = 90:100=0,9.

Средний вес изделия в выборке х = 500,5 г определен взвешиванием. Но полученные показатели частости (0,9) и средней величины (500,5 г) характеризуют долю стандартной продукции и средний вес одного изделия лишь в выборке. Дляопределения соответствующих показателей для всей партии товара надо установить возможные при этом значения ошибки выборки.

Ошибка выборки — это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методом отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования.

  1. Определение ошибки выборочной средней.
  2. При случайном повторном отборе средняя ошибка выборочной средней рассчитывается по формуле:
  3. ,
  4. где  — средняя ошибка выборочной средней;
  5. — дисперсия выборочной совокупности;
  6. n — численность выборки.
  7. При бесповторном отборе она рассчитывается по формуле:
  8. Статистика ошибок: зависимость от репрезентативности выборки,
  9. где N — численность генеральной совокупности.
  10. Определение ошибки выборочной доли.
  11. При повторном отборе средняя ошибка выборочной доли рассчитывается по формуле:
  • где  — выборочная  доля единиц, обладающих изучаемым признаком;
  •  — число единиц, обладающих изучаемым признаком;
  •  — численность выборки.
  • При бесповторном способе отбора средняя ошибка выборочной доли определяется по формулам:

Статистика ошибок: зависимость от репрезентативности выборки

  1. Предельная ошибка выборки  связана со средней ошибкой выборки  отношением:
  2. .
  3. При этом t как коэффициент кратности средней ошибки выборки зависит от значения вероятности Р, с которой гарантируется величина предельной ошибки выборки.
  4. Предельная ошибка выборки при бесповторном отборе определяется по следующим формулам:

Статистика ошибок: зависимость от репрезентативности выборки
Статистика ошибок: зависимость от репрезентативности выборки

Предельная ошибка выборки при повторном отборе определяется по формуле:

Статистика ошибок: зависимость от репрезентативности выборки

.

Источник: https://www.ekonomstat.ru/lektsii-po-distsipline-statistika/36-obshhaja-teorija-statistiki-lekcii/834-oshibki-vyborki.html

116. Ошибка репрезентативности, методика вычисления ошибки средней и относительной величины

В статистике выделяют два основных метода исследования – сплошной и выборочный. При проведении выборочного исследования обязательным является соблюдение следующих требований: репрезентативность выборочной совокупности и достаточное число единиц наблюдений.

При выборе единиц наблюдения возможны Ошибки смещения, т. е. такие события, появление которых не может быть точно предсказуемым. Эти ошибки являются объектив­ными и закономерными.

При определении степени точности выборочно­го исследования оценивается величина ошибки, которая может прои­зойти в процессе выборки – Случайная ошибка репрезентативности (M) – Является фактической разностью между средними или относительными величинами, полученными при проведении выборочного исследования и аналогичными величинами, которые были бы получены при проведении исследования на гене­ральной совокупности.

  • Оценка достоверности результатов исследования предусматривает определение:
  • 1. ошибки репрезентативности
  • 2. доверительных границ средних (или относительных) величин в генеральной совокупности
  • 3. достоверности разности средних (или относительных) величин (по критерию t)
  • Расчет ошибки репрезентативности (mм) средней арифмети­ческой величины (М):
  • , где σ – среднее квадратическое отклонение; n – численность выборки (>30).
  • Расчет ошибки репрезентативности (mР) относительной величины (Р):
  • , где Р – соответствующая относительная величина (рассчитанная, например, в %);
  • Q =100 – Ρ% – величина, обратная Р; n – численность выборки (n>30)

В клинических и экспериментальных работах довольно часто приходится использовать Малую выборку, Когда число наблюдений меньше или равно 30. При малой выборке для расчета ошибок репрезентатив­ности, как средних, так и относительных величин, Число наблюде­ний уменьшается на единицу, т. е.

Статистика ошибок: зависимость от репрезентативности выборки

Величина ошибки репрезентативности зависит от объема выборки: чем больше число наблюдений, тем меньше ошибка. Для оценки достоверности выборочного показателя принят следующий подход: показатель (или средняя величина) должен в 3 раза превышать свою ошибку, в этом случае он считается достоверным.

Знание величины ошибки недостаточно для того, чтобы быть уве­ренным в результатах выборочного исследования, так как конкрет­ная ошибка выборочного исследования может быть значительно больше (или меньше) величины средней ошибки репрезентативности.

Для оп­ределения точности, с которой исследователь желает получить ре­зультат, в статистике используется такое понятие, как вероят­ность безошибочного прогноза, которая является характеристикой надежности результатов выборочных медико-биологических статистических исследований.

Обычно, при проведении медико-биологических статистических исследований используют вероятность безошибочного прогноза 95% или 99%.

В наиболее ответственных случаях, когда необходимо сделать особенно важные выводы в теоретическом или практическом отношении, используют вероятность безошибочного прогноза 99,7%

  1. Определенной степени вероятности безошибочного прогноза соот­ветствует определенная величина Предельной ошибки случайной выборки (Δ – дельта), которая определяется по формуле:
  2. Δ=t * m, где t – доверительный коэффициент, который при большой выборке при вероятности безо­шибочного прогноза 95% равен 2,6; при вероятности безоши­бочного прогноза 99% – 3,0; при вероятности безошибочно­го прогноза 99,7% – 3,3, а при малой выборке определяется по специальной таблице значений t Стьюдента.
  3. Используя предельную ошибку выборки (Δ), можно определить До­верительные границы, в которых с определенной вероятностью безо­шибочного прогноза заключено действительное значение статистичес­кой величины, Характеризующей всю генеральную совокупность (сред­ней или относительной).
  4. Для определения доверительных границ используются следующие формулы:
  5. 1) для средних величин:

Статистика ошибок: зависимость от репрезентативности выборки

Мвыб – средняя величина, Полученная при проведении исследова­ния на выборочной совокупности; t – доверительный коэффициент, значение которого определяет­ся степенью вероятности безошибочного прогноза, с кото­рой исследователь желает получить результат; mM – ошибка репрезентативности средней величины.

2) для относительных величин:

Статистика ошибок: зависимость от репрезентативности выборки

Доверительные границы показывают, в каких пределах может колебаться размер выборочного показателя в зависимости от причин случайного характера.

При малом числе наблюдений (n

Источник: https://uchenie.net/116-oshibka-reprezentativnosti-metodika-vychisleniya-oshibki-srednej-i-otnositelnoj-velichiny/

Ошибки репрезентативности. Ошибки выборки

Любое выборочное наблюдение ставит своей задачей определение среднего размера признака или доли единиц, обладающих данным признаком, и распространение полученных характеристик выборочной совокупности на генеральную совокупность.

Ошибки репрезентативности возникают вследствие различия структуры выборочной и генеральной совокупности.

Структура генеральной совокупности вполне однозначна, и ей соответствует вполне определенное значение среднего размера (или доли) изучаемого признака. Выборочная же совокупность формируется на основе случайного отбора, в силу этого ее состав отличается от состава генеральной совокупности, отличается, естественно, и значение среднего размера (или доли) изучаемого признака.

Если из одной и той же генеральной совокупности производится несколько выборок, то в каждую из них попадут разные единицы и, следовательно, каждой выборочной совокупности будет соответствовать своя средняя. Отсюда следует важный вывод: выборочная средняя, в отличие от генеральной, – величина переменная. Переменной или случайной величиной будет и ошибка репрезентативности.

В практических статистических работах выборочное наблюдение проводится один раз, поэтому фактически приходится иметь дело с одной из множества выборочных средних, но с какой именно – сказать невозможно.

Чтобы получить суждение о точности результатов выборочного наблюдения, математическая статистика дает формулу средней ошибки, т.е.

средней величины из всех возможных ошибок при бесчисленном множестве случайных выборок.

При бесконечно большом числе выборок получится кривая частот, которая представляет кривую выборочного распределения.

Рассмотрим выборочное распределение средней величины.

Такое распределение будет являться нормальным или приближаться к нему по мере увеличения объема выборки независимо от того, имеет или не имеет нормальное распределение та генеральная совокупность, из которой взяты выборки.

С увеличением числа выборок средняя для всех выборок будет приближаться к генеральной средней. По выборочному распределению может быть рассчитана средняя квадратическая ошибка репрезентативности:

Среднее квадратическое отклонение выборочных средних от генеральной средней называется средней ошибкой выборочной средней (средней ошибкой выборки для средней величины признака):

Статистика ошибок: зависимость от репрезентативности выборки

Поскольку, как правило, генеральная средняя неизвестна, этой формулой нельзя воспользоваться. Кроме того, в социально-экономических исследованиях выборки из одной и той же совокупности не производятся многократно. Поэтому используют нижеприведенную формулу, исходя из того, что средняя ошибка выборки зависит от колеблемости признака в генеральной совокупности и числа отобранных единиц.

Средняя ошибка выборки для средней величины признака определяется по формуле:

Статистика ошибок: зависимость от репрезентативности выборки

где s2г – дисперсия количественного признака в генеральной совокупности.

Следовательно, средняя ошибка выборки тем больше, чем больше вариация в генеральной совокупности, и тем меньше, чем больше объем выборки.

Т.о. можно утверждать, что отклонение выборочной средней от генеральной средней в среднем равно . Ошибка конкретной выборки может принимать различные значения, но ее отношение к средней ошибке практически не превышает , если величина объема выборки достаточно большая .

  • Отношение ошибки конкретной выборки к средней квадратической ошибке называется нормированным отклонением :
  • .
  • Распределение нормированного отклонения выборочной средней от генеральной средней при численности выборки определяется следующим уравнением:
  • (1)

Данное уравнение называют стандартным уравнением нормальной кривой. Величина достигает максимума при , в этом случае .

На рис. приведен график кривой распределения нормированных отклонений ошибок выборочных средних .

Рис.

Ординаты соответствуют плотностям вероятности при том или ином значении . Для того, чтобы определить вероятность значений в интервале от до , следует найти отношение части площади кривой, заключенной между ординатами, соответствующими и ко всей площади кривой. Вся площадь под кривой нормального распределения вероятностей принимается за единицу.

  1. Площадь нормальной кривой, заключенную между ординатами и , определяют, интегрируя функцию (1) – интеграл Лапласа.
  2. Имеются таблицы интеграла Лапласа, которые содержат значения вероятностей для нормированных отклонений . Значения функции Ф(t) табулированы при разных значениях, например:
  3. при t=1 P(D£ m) = Ф(1) = 0,683;
  4. при t=2 P(D£2m) = Ф(2) = 0,9545;

при t=3 P(D£3m) = Ф(3) = 0,9973 и т.д.

  • Это вероятность того, что ошибка попадет в заданные пределы.
  • В общем виде
  • D=tm

характеризует предельную ошибку выборки, показывающую максимально возможное расхождение выборочной и генеральной характеристик при заданной вероятности этого утверждения. Т.о. о величине ошибки можно судить с определенной вероятностью.

  1. Так, при t=2 возможная ошибка D не превысит 2m, что гарантируется с вероятностью 0,9545. Это значит, что в 9545 выборках из 10000 подобных максимальная ошибка не выйдет за пределы ±2m,
  2. где – это коэффициент доверия.
  3. При проведении выборочного учета массовых социально-экономических явлений считается достаточным максимальный размах ошибки выборки ±3m.
  4. На практике наиболее часто пользуются значениями вероятности Р=0,95 (t=1,96), Р=0,99 (t=2,58) и Р=0,999 (t=3,28), гарантирующими репрезентативность выборки соответственно с ошибкой 5; 1; 0,1%.

Предельная ошибка выборки позволяет определять предельные значения характеристик генеральной совокупности при заданной вероятности, т.е. их доверительные интервалы.

Поэтому вероятность Р называется доверительной, она представляет собой вероятность того, что ошибка выборки не превысит некоторую заданную величину D, т.е. генеральная средняя находится где-то в пределах

  • (от до ),
  • генеральная доля – в пределах
  • (от w–D до w+D).
  • Как мы определили выше, средняя ошибка выборки для средней величины признака определяется по формуле:
  • ,
  • где s2г – дисперсия количественного признака в генеральной совокупности.
  • Если при выборочном наблюдении изучению подлежит альтернативный признак, то средняя ошибка выборки для доли единиц, обладающих данным признаком, определяется по теореме Я. Бернулли:
  • ,
  • где p – доля единиц, обладающих данным качеством, в генеральной совокупности; p(1-p) – дисперсия альтернативного признака в генеральной совокупности.

Приведенные формулы средних ошибок выборки практически непригодны для расчета. В них фигурирует дисперсия признака в генеральной совокупности, которая неизвестна, как неизвестна и генеральная доля, генеральная средняя. Поскольку в теории вероятности доказано, что

,

то при большом объеме выборки дисперсии генеральной s2г и выборочной s2 совокупностей равны. ( ). Это дает основание исчислять среднюю ошибку выборки по значениям выборочной дисперсии s2 для средней и w(1–w) для доли признака:

  1. , ,
  2. где w – доля признака в выборочной совокупности.
  3. Наряду с абсолютной величиной предельной ошибки выборки рассчитывается и относительная ошибка выборки, которая определяется отношением предельной ошибки средней или доли к соответствующей характеристике выборочной совокупности:
  4. ; .

При проведении выборочного наблюдения в экономических исследованиях преимущественно стремятся к тому, чтобы относительная ошибка репрезентативности выборки не превышала 5 … 10%.

Вывод формул , ,

исходит из схемы повторной выборки. На практике повторная выборка, при которой численность генеральной совокупности остается неизменной (т.е.отобранная единица возвращается в генеральную совокупность и снова может быть отобрана), встречается редко (например, при изучении населения в качестве пользователей, пациентов, избирателей).

  • Обычно отбор организуется по схеме бесповторной выборки, при которой отобранная единица после обследования в генеральную совокупность не возвращается и в дальнейшей выборке не участвует.
  • При бесповторной выборке численность генеральной совокупности в процессе отбора сокращается на
  • 1–n/N, где n/N – доля отобранных единиц.
  • В связи с этим формулы ошибки выборки приобретают следующий вид:
  • ; .
  • Так как доля единиц генеральной совокупности, не попавших в выборку (1–n/N), всегда меньше единицы, то ошибка выборки при бесповторном отборе при прочих равных условиях меньше, чем при повторном отборе.

Источник: https://infopedia.su/10x41a.html

2.2.2. Стихийная выборка

Исследователь при
применении данного метода в некоторой
степени контролирует выборку (например,
публикуя анкету в журнале, он обращается
только к читателям этого журнала), но
решение о включении в выборку принимает
сам респондент.

То есть, её размер заранее
часто не известен, а определяется
конкретным условием — активностью
респондентов. Значит, нельзя и заранее
определить структуру массива респондентов,
которые заполнят и вернут анкеты.

Поэтому
этот метод не претендует на репрезентативность
выборки, а выводы исследования очень
часто распространяются только на
опрошенную совокупность.

Сферы применения
стихийной выборки:

  1. анкеты, публикуемые в газетах и журналах;

  2. почтовые опросы1;

  3. опросы покупателей в залах супермаркетов;

  4. опрос пассажиров на остановках и в общественном транспорте2.

2.3. Многоступенчатая и одноступенчатая выборки

Выборка делится
на одноступенчатую и многоступенчатую
по количеству ступеней в отборе.
Одноступенчатая выборка предполагает,
что из генеральной совокупности сразу
осуществляется отбор респондентов для
опроса.

Процедура же многоступенчатой
выборки включает несколько ступеней,
при этом на каждой из них единица отбора
меняется. «Различают единицы отбора
первой ступени (первичные единицы),
единицы отбора вторичной ступени
(вторичные единицы) и так далее.

Объекты
самой нижней ступени, с которых ведется
непосредственный сбор информации,
называются единицами наблюдения»3.
Например, задача исследования – изучение
свободного времени студентов всей
страны.

Процедура будет
строиться следующим образом:

  1. отбор регионов;

  2. отбор города в них, где есть вузы;

  3. отбор учебных заведений, в которых будет проводиться исследование;

  4. выбор академических групп;

  5. отбор студентов.

Многоступенчатая
выборка осуществляется не в локальных
масштабах, а в региональных, общенациональных,
международных. Использовать одноступенчатую
выборку в таких масштабах нерационально,
да и очень дорого обойдётся такое
исследование. Многоступенчатая выборка
в этом плане экономична и упрощает
подход к выбору объекта.

  • Но нужно
    учитывать, что чем больше ступеней в
    выборке, тем больше будет ошибка
    репрезентативности, возрастёт вероятность
    погрешностей, что приведёт к искажению
    результатов исследования4.
  • Рассмотрев
    некоторые типы выборок, необходимо
    также уяснить, что такое объем выборки
    и какие бывают ошибки выборки и как их
    избежать.
  • В
    формировании выборочной совокупности
    важную роль играет определение ее объема
    и обеспечение репрезентативности.

«Если тип выборки
говорит о том, как попадают люди в
выборочную совокупность, то объём
выборки сообщает о том, какое их
количество попало сюда»2. То есть объем выборки – это количество
единиц попавших в выборочную совокупность.

И очень важно, чтобы выборка была
репрезентативной, то есть не искажала
представлений о генеральной совокупности
вцелом3.

«Требования репрезентативности выборки
означают, что по выделенным параметрам
(критериям) состав обследуемых должен
приближаться к соответствующим пропорциям
в генеральной совокупности»4.

Одна из ключевых
проблем, встающих, как правило, перед
социологом, решающим: доверять полученным
в ходе него данным или нет, это то, сколько
же человек должно быть опрошено для
того, чтобы получить действительно
репрезентативную информацию.

К сожалению,
единой и четкой формулы, используя
которую можно было бы рассчитать
оптимальный объем выборочной совокупности,
не существует в природе. И объясняется
это весьма просто.

Дело в том, что
определение объема выборочной совокупности
– это проблема не столько статистическая,
сколько содержательная.

Иными словами,
объем выборочной совокупности зависит
от множества факторов, основные из них
следующие:

  1. затраты на сбор информации, включая временные;

  2. стремление к определённой статистической достоверности результатов, которую надеется получить исследователь;

  3. ценность и новизна информации, получаемой в результате опроса5.

Объем
выборки обусловлен степенью однородности
или неоднородности, генеральной
совокупности, количеством характеризующих
ее признаков.

Однородной считается совокупность,
в которой контролируемый признак,
например уровень грамотности, распределён
равномерно, то есть не образует пустот
и сгущений, тогда опросив лишь несколько
человек, можно сделать вывод о том, что
большинство людей грамотны.

Чем более
однородна генеральная совокупность,
тем меньше объем выборки. Например,
«допустим, мы осуществляем отбор из
генеральной совокупности в 2000 человек,
контролируя состав выборочной совокупности
по признаку «пол»»: 70% мужчин и 30% женщин.

Согласно теории вероятности, можно
предположить, что примерно среди каждых
десяти отбираемых респондентов встретятся
три женщины. Если мы хотим опросить по
крайней мерее 90 женщин, то исходя из
вышеупомянутого соотношения, нам
необходимо отобрать не менее 300 человек.

А теперь предположим, что в генеральной
совокупности 90% мужчин и 10% женщин. В
этом случае, чтобы в выборочную
совокупность попало 90 женщин, необходимо
отобрать уже не менее 900 человек»1.
Из примера видно, что объем выборки
зависит от разброса признака (дисперсии),
и его нужно вычислять по признаку,
дисперсия значений которого наибольшая.

«Степень
однородности социального объекта
зависит, в сущности, от того, насколько
детально мы намерены его исследовать.
Практически любой, самый «элементарный»
объект оказывается чрезвычайно сложным.

Лишь в анализе мы представляем его как
относительно простой, выделяя те или
иные его свойства.

Чем более основательным
и детальным будет анализ, чем больше
свойств данного объекта мы намерены
принять во внимание в их сочетании, а
не изолированно, тем больше должен быть
объем выборки»2.

Существуют, так
называемые «правила левой руки» для
определения размера выборки (таблица
1)»3:

Размер выборки растёт Размер выборки уменьшается
— при необходимости опубликовать данные для отдельных подгрупп (размеры подвыборок при этом суммируются, и выборка в целом растёт пропорционально числу подгрупп); — при исследовании организаций, институтов и прочих «первичных единиц отбора», если сравнительно невелика величина генеральной совокупности, из которой производится отбор(например, совокупности сотрудников рекламных агентств, школьников, пациентов и т.п.);
— при проведении общенациональных обследований, когда велика генеральная совокупность; — при проведении локальных и региональных исследований;

Источник: https://studfile.net/preview/5996791/page:7/

Ошибки выборки

Расхождения между величиной какого-либо показателя, найденного посредством статистического наблюдения, и действительными его размерами называются ошибками наблюдения. В зависимости от причин возникновения различают ошибки регистрации и ошибки ре- пр ез ентативн о сти.

Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения или опроса. Они бывают случайными или систематическими.

Случайные ошибки регистрации могут быть допущены как опрашиваемыми в их ответах, так и регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные — сознательные, тенденциозные искажения действительного положения дела.

Непреднамеренные вызываются различными случайными причинами (небрежность, невнимательность).

Ошибки репрезентативности (представительности) возникают в результате неполного обследования и в случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими.

Случайные ошибки репрезентативности — это отклонения, возникающие при несплошном наблюдении из-за того, что совокупность отобранных единиц наблюдения (выборка) неполно воспроизводит всю совокупность в целом. Систематические ошибки репрезентативности — это отклонения, возникающие вследствие нарушения принципов случайного отбора единиц.

Ошибки репрезентативности органически присущи выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную.

Избежать ошибок репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем закона больших чисел, эти ошибки можно свести к минимальным значениям, границы которых устанавливаются с достаточно большой точностью.

Ошибки выборки — разность между характеристиками выборочной и генеральной совокупности. Для среднего значения ошибка будет определяться по формуле

Величина называется предельной ошибкой выборки.

Предельная ошибка выборки — величина случайная. Исследованию закономерностей случайных ошибок выборки посвящены предельные теоремы закона больших чисел. Наиболее полно эти закономерности раскрыты в теоремах П.Л. Чебышева и А.М. Ляпунова.

Теорему П.Л. Чебышева применительно к рассматриваемому методу можно сформулировать следующим образом: при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице (т.е.

почти с достоверностью), утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым. В теореме П.Л. Чебышева доказано, что величина ошибки не должна превышать tp .

В свою очередь величина Р, выражающая среднее квадратическое отклонение выборочной средней от генеральной средней, зависит от колеблемости признака в генеральной совокупности о- и числа отобранных единиц п. Эта зависимость выражается формулой

  • где Р зависит также от способа производства выборки.
  • Величину М = о2 называют средней ошибкой выборки. В этом V п
  • выражении а2 — генеральная дисперсия, п — объем выборочной совокупности.

Рассмотрим, как влияет на величину средней ошибки число отбираемых единиц п. Логически нетрудно убедиться, что при отборе большого числа единиц расхождения между средними будут меньше, т.е.

существует обратная связь между средней ошибкой выборки и числом отобранных единиц.

При этом здесь образуется не просто обратная математическая зависимость, а такая зависимость, которая показывает, что квадрат расхождения между средними обратно пропорционален числу отобранных единиц.

Увеличение колеблемости признака влечет за собой увеличение среднего квадратического отклонения, а, следовательно, и ошибки. Если предположить, что все единицы будут иметь одинаковую величину признака, то среднее квадратическое отклонение станет равно нулю и ошибка выборки также исчезнет.

Тогда нет необходимости применять выборку. Однако следует иметь в виду, что величина колеблемости признака в генеральной совокупности не известна, поскольку не известны размеры единиц в ней. Можно рассчитать лишь колеблемость признака в выборочной совокупности.

Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой

Поскольку величина п при достаточно больших п близка к 1, п — 1

можно приближенно считать, что выборочная дисперсия равна генеральной дисперсии, т.е. Орен ж •

Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель t.

Теорема А.М. Ляпунова. А.М. Ляпунов доказал, что распределение выборочных средних (следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.

Математически теорему Ляпунова можно записать так:

  1. Где
  2. где я = 3,14 — математическая постоянная;
  3. предельная ошибка выборки, которая дает возможность выяснить, в каких пределах находится величина генеральной средней.
  4. Значения этого интеграла для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. В частности, при:

Поскольку t указывает на вероятность расхождения х — х , т.е.

на вероятность того, на какую величину генеральная средняя будет отличаться от выборочной средней, то это может быть прочитано так: с вероятностью 0,683 можно утверждать, что разность между выборочной и генеральной средними не превышает одной величины средней ошибки выборки.

Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±Ц. С вероятностью 0,954 можно утверждать, что ошибка репрезентативности не превышает ± 2р (т.е. в 95% случаев). С вероятностью 0,997, т.е.

довольно близкой к единице, можно ожидать, что разность между выборочной и генеральной средней не превзойдет трехкратной средней ошибки выборки и т.д.

  • Логически связь здесь выглядит довольно ясно: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.
  • Зная выборочную среднюю величину признака (х) и предельную ошибку выборки можно определить границы (пределы), в
  • которых заключена генеральная средняя

Источник: https://bstudy.net/710108/ekonomika/oshibki_vyborki

Содержание курса лекций “Статистика”


Выборочное наблюдение как источник статистической информации в изучении социально-экономических явлений и процессов

Тема 10 Выборочное наблюдение

Статистическая методология исследования массовых явлений различает, как известно, два способа наблюдения в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное, которое в условиях рыночных отношений в России находит все более широкое применение. Переход статистики РФ на международные стандарты системы национального счетоводства требует более широкого применения выборки для получения и анализа показателей СНС не только в промышленности, но и в других секторах экономики.

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу ‑ по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и науч­но организованной работы по отбору единиц.



К выборочному наблюдению статистика прибегает по различным причинам. На современном этапе появилось множество субъектов хозяйствен­ной деятельности, которые характерны для рыночной экономики. Речь идет об акционерных обществах, малых и совместных предприятиях, фермерских хозяйствах и т.д. Сплошное обследование этих статистических совокупностей, состоящих из десятков и сотен тысяч единиц, потребовало бы огромных материальных, финансовых и иных затрат. Использование же выборочного обследования позволяет значительно сэкономить силы и средства, что имеет немаловажное значение.


Наряду с экономией ресурсов одной из причин превращения выборочного наблюдения в важнейший источник статистической информации является возможность значительно ускорить получение необходимых данных. Ведь при обследовании, скажем, 10% единиц совокупности будет затрачено гораздо меньше времени, а результаты могут быть представлены быстрее, и будут более актуальными. Фактор времени важен для статисти­ческого исследования особенно в условиях изменяющейся социально-экономической ситуации.


Реализация выборочного метода базируется на понятиях генеральной и выборочной совокупностей.

Генеральной совокупностью называется вся исходная изучаемая статистическая совокупность, из которой на основе отбора единиц или групп единиц формируется совокупность выборочная. Поэтому генеральную совокупность также называют основой выборки.

Отбор единиц в выборочную совокупность может быть повторным или беспо­вторным.

При повторном отборе попавшая в выборку единица подвергается обследованию, т.е. регистрации значений ее признаков, возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Таким образом, некоторые единицы могут попадать в выборку дважды, трижды или даже большее число раз. И при изучении выборочной совокупности они будут рассматриваться как отдельные независимые наблюдения.

Отметим, что число единиц генеральной совокупности, участвующих в отборе, при таком подходе остается постоянным. Поэтому вероятность попадания в выборку для всех единиц совокупности на протяжении всего процесса отбора также не меняется.


На практике методология повторного отбора обычно используется в тех случаях, когда объем генеральной совокупности не известен и теоретически возможно повторение единиц с уже встречавшимися значениями всех регистрируемых признаков.

Например, при проведении маркетинговых исследований мы не можем сколько-нибудь точно оценить, какое число потребителей предпочитают стиральный порошок конкретной торговой марки, сколько покупателей предпочитают делать покупки именно в данном супермаркете и т.д. Поэтому возможно повторение совершенно идентичных единиц как по причине практически неограниченных объемов совокупности, так и вследствие возможной повторной регистрации. Предположим, при проведении обследования один и тот же покупатель может дважды прийти в магазин и дважды подвергнуться обследованию.



При выборочном контроле качества продукции объем генеральной совокупности также часто не определен, так как процесс производства может осуществляться постоянно, каждый день дополняя генеральную совокупность новыми единицами-изделиями. Поэтому в выборочную совокупность могут попасть два и более изделий с абсолютно одинаковыми характеристиками. Следовательно, и в этом случае при обработке результатов выборки необходимо ориентироваться на методологию, используемую при повторном отборе.


При бесповоротном отборе попавшая в выборку единица подвергается обследова­нию и в дальнейшей процедуре отбора не участвует. Такой отбор целесообразен и практически возможен в тех случаях, когда объем генеральной совокупности четко определен. Получаемые при этом результаты, как правило, являются более точными по сравнению с результатами, основанными на повторной выборке.

Как уже отмечалось выше, выборочное наблюдение всегда связано с определенны­ми ошибками получаемых характеристик. Эти ошибки называются ошибками репрезента­тивности (представительности).



Ошибки репрезентативности обусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную. Получаемые расхождения или ошибки репрезентативности позволяют заключить, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность. При этом следует различать систематические и случайные ошибки репре­зентативности.


Систематические ошибки репрезентативности связаны с нарушением принципов формирования выборочной совокупности. Например, вследствие каких-либо причин, связанных с организацией отбора, в выборку попали единицы, характеризующиеся несколько большими или, наоборот, несколько меньшими по сравнению с другими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными или заниженными.


Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Но даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характе­ристики будут несколько различаться. Получаемые случайные ошибки могут быть стати­стически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность. Оценка ошибок выборочного наблюдения основана на теоремах теории вероятностей.


При дальнейшем рассмотрении теории и методов выборочного наблюдения используются следующие общепринятые условные обозначения:

    N ‑ объем (число единиц) генеральной совокупности;

    n ‑ объем (число единиц) выборочной совокупности;

генеральная средняя

 ‑ генеральная средняя, т.е. среднее значение изучаемого признака по генераль­ной совокупности (средняя прибыль, средняя величина активов, средняя численность ра­ботников предприятия и т.п.);

выбороноая средняя

‑ выборочная средняя,
т.е. среднее значение изучаемого признака по выборочной совокупности;
 

     М ‑ численность единиц генеральной совокупности, обладающих определенным вариантом или вариантами изучаемого признака (численность городского населения, численность сельского населения, количество бракованных изделий, число нерентабельных предприятий и т.п.);

     р ‑ генеральная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака, во всей генеральной совокупности (доля городского населения в общей численности населения, доля бракованной продукции в общем выпуске, доля нерентабельных предприятий в общей численности предприятий и т.п.); определяетcя как

     m численность единиц выборочной совокупности, обладающих определенным вариантом или вариантами изучаемого признака;

     w ‑ выборочная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака, в выборочной совокупности,

определяется как ;

средняя ошибка выборки

‑ средняя ошибка выборки;

предельная ошибка выборки

‑ предельная ошибка выборки;

‑ коэффициент доверия, определяемый в зависимости от уровня вероятности.



Ошибка выборки или отклонение выборочной средней от средней генеральной находится в прямой зависимости от дисперсии изучаемого признака в генеральной совокуп­ности, и в обратной зависимости ‑ от объема выборки.

Таким образом среднюю ошибку выборки можно представить как

Формула 10.1

(10.1)


При проведении выборочного наблюдения дисперсия изучаемого признака в генеральной совокупности, как правило, не известна. В то же время, между генеральной дисперсией и средней из всех возможных выборочных дисперсий существует следующее соотношение:

Формула 10.2

(10.2)


В связи с тем, что на практике в большинстве случаев из генеральной совокупности в определенный момент времени производится только одна выборка, дисперсия изучаемого признака по этой выборке и используется при расчете ошибки.

Учитывая, что при достаточно большом объеме выборки отношение отношение близко к 1, формула средней ошибки повторной выборки принимает следующий вид:

Формула 10.3

(10.3)


Где  ‑ дисперсия дисперсия изучаемого признака по выборочной совокупности.


При определении возможных границ значений характеристик генеральной сово­купности рассчитывается предельная ошибка выборки, которая зависит от величины ее средней ошибки и уровня вероятности, с которым гарантируется, что генеральная средняя не выйдет за указанные границы.

Согласно теореме А.М. Ляпунова, вероятность той или иной величины предельной ошибки, при достаточно большом объеме выборочной сово­купности, подчиняется нормальному закону распределения и может быть определена на основе интеграла Лапласа.

Значения интеграла Лапласа при различных величинах t табулированы и представ­лены в статистических справочниках.


При обобщении результатов выборочного наблюдения наиболее часто используются следующие уровни вероятности и соответствующие им значения t:

Таблица 10.1 ‑ !!!Некоторые значения t

Вероятность, рi. 0,683 0,866 0,954 0,988 0,997 0,999
Значение t 1,0 1,5 2,0 2,5 3,0 3,5

Например, если при расчете предельной ошибки выборки мы используем значение t=2, то с вероятностью 0,954 можно утверждать, что расхождение между выборочной средней и генеральной средней не превысит двукратной величины средней ошибки вы­борки.



Теоретической основой для определения границ генеральной доли, т.е. доли еди­ниц, обладающих тем или иным вариантом признака, является теорема Вернули. Согласно данной теореме вероятность получения сколь угодно малого расхождения между выборочной долей и генеральной долей при достаточно большом объеме выборки будет стремиться к единице. С учетом того, что вероятность расхождения между выборочной и генеральной долями подчиняется нормальному закону распределения, эта вероятность также определяется по функции F(t) при заданном значении t.



Процесс подготовки и проведения выборочного наблюдения включает ряд после­довательных этапов:

  1. Определение цели обследования.
  2. Установление границ генеральной совокупности.
  3. Составление программы наблюдения и программы разработки данных
  4. Определение вида выборки, процента отбора и метода отбора
  5. Отбор и регистрация наблюдаемых признаков у отобранных единиц.
  6. Насчет выборочных характеристик и их ошибок.
  7. Распространение полученных результатов на генеральную совокупность.


В зависимости от состава и структуры генеральной совокупности выбирается вид выборки или способ отбора.

К наиболее распространенным на практике видам относятся:

  • собственно-случайная (простая случайная) выборка;
  • механическая (систематическая) выборка;
  • типическая (стратифицированная, расслоенная) выборка;
  • серийная (гнездовая) выборка.


Отбор единиц из генеральной совокупности может быть комбинированным, много­ступенчатым и многофазным.

Комбинированный отбор предполагает объединение нескольких видов выборки. Так, например, можно комбинировать типическую и серийную, серийную и собственно-случайную выборки. Ошибка такой выборки определяется ступенчатостью отбора.


Многоступенчатым называется отбор, при котором из генеральной совокупности сначала извлекаются укрупненные группы, потом ‑ более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.


Многофазная выборка, в отличие от многоступенчатой, предполагает сохранение одной и той же единицы отбора на всех этапах его проведения; при этом отобранные на каждой стадии единицы подвергаются обследованию, каждый раз – по более расширенной программе.


Собственно-случайная (простая случайная) выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности.

Однако прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной сово­купности таким образом, чтобы включение или не включение в нее отдельных единиц не вызывало сомнений. Так, например, при обследовании студентов необходимо указать, будут ли приниматься во внимание лица, находящиеся в академическом отпуске, студенты негосударственных вузов, военных училищ и т.п.; при обследовании торговых предприятий важно определиться, включит ли генеральная совокупность торговые павильоны, коммерческие палатки и прочие подобные объекты.


Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел.


Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности.

Различают среднюю и предельную ошибки выборки. Эти два вида связаны следующим соотношением:

Формула 10.4

(10.4)


Величина средней ошибки выборки рассчитывается дифференциро­ванно в зависимости от способа отбора и процедуры выборки.

Так, при собственно-случайном повторном отборе средняя ошибка определяется по формуле:

Формула 10.5

(10.5)


а при расчете средней ошибки  собственно-случайной бесповторной выборки:

Формула 10.6

(10.6)


Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности.

Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

Формула 10.7

(10.7)


где  генеральная средняяи выборочная средняя‑ генеральная и выборочная средняя соответственно;

предельная ошибка выборочной средней‑ предельная ошибка выборочной средней.



Пример.

При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30 г. при среднем квадратическом отклонении 4 г. С вероятностью 0,997 определите пределы, в которых находится средний вес изделия в генеральной совокупности.


Решение. Рассчитаем сначала предельную ошибку выборки. Так как при р = 0,997, t = 3, она равна:

Определим пределы генеральной средней:

или

Вывод: Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 29,16 г. до 30,84 г.



Пример 2.

В городе проживает 250 тыс. семей. Для определения среднего числа детей в семье была организована 2%-ная случайная бесповторная выборка семей. По ее результатам было получено следующее распре­деление семей по числу детей:

Таблица 10.2 ‑ Распределение семей по числу детей в городе N

Число детей в семье 0 1 2 3 4 5
Количество

семей

1000 2000 1200 400 200 200

С вероятностью 0,954 определите пределы, в которых будет находить­ся среднее число детей в генеральной совокупности.


Решение. В начале на основе имеющегося распределения семей определим выборочные среднюю и дисперсию:

Таблица 10.3 ‑ Вспомогательная таблица для расчета среднего числа детей

Число детей

в семье, х;

Количество семей,     f

0

1

2

3

4

5

1000

2000

1200

400

200

200

0

2000

2400

1200

800

1000

-1,5

-0,5

0,5

1,5

2,5

3,5

2,25

0,25

0,25

2,25

6,25

12,25

2250

500

300

900

1250

2450

 

Итого

5000 7400 7650

Вычислим теперь предельную ошибку выборки (с учетом того, что при р = 0,954 t = 2).


Следовательно, пределы генеральной средней:

Таким образом, с вероятностью 0,954 можно утверждать, что среднее число детей в семьях города практически не отличается от 1,5, т.е. в среднем на каждые две семьи приходится три ребенка.



Наряду с определением ошибок выборки и пределов для генеральной средней эти же показатели могут быть определены для доли признака.

В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется так:

формула 10.8

(10.8)


где формула 10.8 пояснение ‑ доля единиц, обладающих данным признаком в выборочной совокупности, определяемая как отношение количества соответствующих единиц к объему выборки.


Тогда, например, при собственно-случайном повторном отборе для определения предельной ошибки выборки используется следующая формула:

формула 10.9

(10.9)


Соответственно, при бесповторном отборе:

формула 10.10

(10.10)


Пределы доли признака в генеральной совокупности p выглядят следующим образом:

формула 10.11

(10.11)


Рассмотрим пример.

С целью определения средней фактической продолжитель­ности рабочего дня в государственном учреждении с численностью слу­жащих 480 человек, в январе 2009 г. было проведена 25%-ная случайная бесповторная выборка. По результатам наблюдения оказалось, что у 10% обследованных потери времени достигали более 45 мин. в день. С вероят­ностью 0,683 установите пределы, в которых находится генеральная доля служащих с потерями рабочего времени более 45 мин. в день.

Решение. Определим объем выборочной совокупности:

n= 480 х 0,25 = 120 чел.

Выборочная доля w равна по условию 10%.

Учитывая, что при р = 0,683   t=1, вычислим предельную ошибку выборочной доли:

формула 10.10 решение


Пределы доли признака в генеральной совокупности:

формула 10.11 пример


Таким образом, с вероятностью 0,683 можно утверждать, что доля ра­ботников учреждения с потерями рабочего времени более 45 мин. в день находится в пределах от 7,6% до 12,4%.


Мы рассмотрели определение границ генеральной средней и генеральной доли по результатам уже проведенного выборочного наблюдения, при известном объеме выборки или проценте отбора. На этапе же проектирования выборочного наблюдения именно объ­ем выборочной совокупности и требует определения.



Для определения необходимого объема собственно-случайной повторной выборки применяют следующую формулу:

формула 10.12

(10.12)


Полученный на основе использования данной формулы результат всегда округляется в большую сторону. Например, если мы получили, что необходимый объем выборки составляет 493,1 единицы, то обследовав 493 единицы мы не достигнем требуемой точности. Поэтому, для достижения желаемого результата обследованием должны быть охвачены 494 единицы.

С другой стороны, рассчитанное значение необходимого объема выборки свободно может быть увеличено в большую сторону на несколько единиц. Если мы располагаем необходимыми ресурсами, если по причинам организационного порядка (компактность расположения единиц, фиксированная нагрузка на каждого регистратора и т.п.) мы вполне можем охватить больший объем, то включение в выборочную совокуп­ность 500 или, например, 550 единиц только уменьшит значения полученных случайной и предельной ошибок.


При определении необходимого объема выборки для определения границ генеральной доли задача оценки вариации решается значительно проще. Если дисперсия изучаемого альтернативного признака неизвестна, то можно использовать ее максимальное возможное значение:

формула 10.12 после 1 расчет


Например, предприятию связи с вероятностью 0,954 необходимо определить удельный вес телефонный разговоров продолжительностью менее 1 минуты с предельной ошибкой 2%. Сколько разговоров нужно обследовать в порядке собственно-случайного повторного отбора для решения этой задачи?

Для получения ответа на поставленный вопрос воспользуемся формулой (10.12) и будем ориентироваться на максимальную возможную дисперсию доли телефонных разговоров такой продолжительности. Расчет приводит к следующему результату:

формула 10.12 пример

Таким образом, обследованием должны быть охвачены не менее 2500 разговоров на предмет их продолжительности.



Необходимый объем собственно-случайной бесповторной выборки может быть определен по следующей формуле:

формула 10.13

(10.13)


Укажем на одну особенность формулы (10.13). При проведении вычислений объем генеральной совокупности должен быть выражен только в единицах, а не в тысячах или в миллионах единиц.

Например, подставив в данную формулу общую численность населения региона, выраженную в тысячах человек, мы не получим правильное значение необходимой численности выборки, также выраженное в тысячах человек, как это иногда бывает в других расчетах. Результат вычислений будет неверен.


Механическая выборка может быть применена в тех случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последова­тельность в расположении единиц (табельные номера работников, списки избирателей, телефонные номера респондентов, номера домов и квартир и т.п.). Для проведения отбора желательно, чтобы все единицы также имели порядковые номера от 1 до N.

Для проведения механической выборки устанавливается пропорция отбора, которая определяется соотнесением объемов выборочной и генеральной совокупностей.

Так, если из совокупности в 500000 единиц предполагается отобрать 10000 единиц, то пропорция отбора составит

формула 10.13вставка после

Отбор единиц осуществляется в соответствии с установленной пропорцией через равные интервалы.

Например, при пропорции 1:50 (2%-ная выборка) отбирается каждая 50-я единица, при пропорции 1:20 (5%-ная выборка) – каждая 20-я единица и т.д.



Интервал отбора также можно определить как частное от деления 100% на уста­новленный процент отбора.

Так, например  при 2%-ном отборе интервал составит 50 (100%:2%), при 4%-ном отборе ‑ 25 (100%:4%). В тех случаях, когда результат деления получается дробным, сформировать выборку механическим способом при строгом соблюдении процента отбора не представляется возможным.

Например, по этой причине нельзя сформировать 3%-ную или 6%-ную выборки.



Генеральную совокупность при механическом отборе можно ранжировать или упорядочить по величине изучаемого или коррелирующего с ним признака, что позволит повысить репрезентативность выборки. Однако в этом случае возрастает опасность систе­матической ошибки, связанной с занижением значений изучаемого признака (если из каждого интервала регистрируется первое значение) или его завышением (если из каждого интервала регистрируется последнее значение). Поэтому целесообразно из каждого интервала отбирать центральную или одну из двух центральных единиц.


Например, при 5%-ной выборке интервал отбора составит 20 единиц, тогда отбор целесообразно начинать с 10-й или с 11-й единицы. В первом случае в выборку попадут 10, 30, 50, 70 и с таким же интервалом последующие единицы; во втором случае – единицы с номерами 11,31,51,71 и т.д.

При механической выборке также может появиться опасность систематической ошибки, обусловленной случайным совпадением выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности. Так, при переписи населения 1989 г. в ходе 25%-го выборочного обследования семей имела место опасность попадания в выборку квартир только одного типа (например, только однокомнатных или только трехкомнатных), так как на лестничных площадках многих типовых домов распо­лагаются именно по 4 квартиры. Чтобы избежать систематической ошибки, в каждом новом подъезде счетчик менял начало отбора.


Для определения средней ошибки механической выборки, а также необходимой ее численности, используются соответствующие формулы, применяемые при собственно-случайном бесповторном отборе(10.6 и 10.13). При этом, определив необходимую численность выборки и сопоставив ее с объемом генеральной совокупности, как правило, приходится производить соответствующее округление для получения целочисленного интервала отбора.


Например, в области зарегистрировано 12000 фермерских хозяйств. Определим, сколько из них нужно отобрать в порядке механического отбора для определения средней площади сельхозугодий с ошибкой ± 2 га. (Р=0,997). По результатам ранее проведенного обследования известно, что среднее квадратическое отклонение площади сельхозугодий составляет 8 га. Произведем расчет, воспользовавшись формулой (10.13).

формула 10.13 пример


С учетом полученного необходимого объема выборки (143 фермерских хозяйства) определим интервал отбора: 12000:143=83,9.

Определенный таким способом интервал всегда округляется в меньшую сторону, так как при округлении в большую сторону про­изведенная выборка не достигнет рассчитанного по формуле необходимого объема.

Сле­довательно, в нашем примере, из общего списка фермерских хозяйств необходимо отобрать для обследования каждое 83-е хозяйство. При этом процент отбора составит 1,2% (100% : 83).



Типический отбор целесообразно использовать в тех случаях, когда все единицы генеральной совокупности объединены в несколько крупных типических групп.. Такие группы также называют стартами или слоями, в связи с чем типический отбор также называют стратифицированным или расслоенным. При обследованиях населения в качестве типических групп могут быть выбраны области, районы, социальные, возрастные или об­разовательные группы, при обследовании предприятий – отрасли или подотрасли, формы собственности и т.п.

Рассматривать генеральную совокупность в разрезе нескольких крупных групп единиц имеет смысл только в том случае, если средние значения изучаемых признаков по группам существенно различаются. Например, с большой уверенностью можно предпо­ложить, что доходы населения крупного города будут в среднем выше доходов населения, проживающего в сельской местности; численность работников промышленного предприятия в среднем будет выше численности работников торгового или сельскохозяйственного предприятия; средний возраст студентов будет значительно меньше среднего возраста занятого населения и, тем более, пенсионеров. В то же время, нет никакого смысла при выделении типических групп ориентироваться на признак, не связанный или очень слабо связанный с изучаемым.


Отбор единиц в выборочную совокупность из каждой типической группы осущест­вляется собственно-случайным или механическим способом. Поскольку в выборочную совокупность в той или иной пропорции обязательно попадают представители всех групп, типизация генеральной совокупности позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. В то же время, в выделенных типических группах обследуются далеко не все единицы, а только включенные в выборку. Следовательно, на величине полученной ошибки будет сказываться различие между единицами внутри этих групп, т.е. внутригрупповая вариация. Поэтому, ошибка типической выборки будет опре­деляться величиной не общей дисперсии, а только ее части – средней из внутригрупповых дисперсий.


При типической выборке, пропорциональной объему типических групп, число еди­ниц, подлежащих отбору из каждой группы, определяется следующим образом:

формула 10.14

 (10.14)


Где Ni объем i-ой группы. а ni ‑ объем выборки из i-ой группы.


Пример. Предположим, общая численность населения области составляет 1,5 млн. чел., в том числе городское – 900 тыс. чел. и сельское – 600 тыс. чел. Если в ходе выборочного наблюдения планируется обследовать 100 тыс. жителей, то эта численность должна быть поделена пропорционально объему типических групп следующим образом:

формула 10.14пример


Средняя ошибка типической выборки определяется по формулам:

формула 10.15

(10.15)


                                    формула 10.16               (10.16)


где формула 10.16пояснение – средняя из внутригрупповых дисперсий.


При выборке, пропорциональной дифференциации признака, число наблюдений по каждой группе рассчитывается по формуле:

формула 10.17

(10.17)


Где формула 10.17 пояснение‑ среднее отклонение признака в i-ой группе.


Cредняя ошибка такого отбора определяется следующим образом:

формула 10.18

(10.18)


формула 10.19

(10.19)


Отбор, пропорциональный дифференциации признака, дает лучшие результаты, однако на практике его применение затруднено вследствие трудности получения сведений о вариации до проведения выборочного наблюдения.

Таблица 10.4 ‑ Результаты обследования рабочих предприятия

Цех Всего рабочих, человек Обследовано, человек Число дней временной не­трудоспособности за год
средняя дисперсия
I

II

III

1000

1400

800

100

140

80

18

12

15

49

25

16

Рассмотрим оба варианта типической выборки на условном примере. Предположим, 10% бесповторный типический отбор рабочих предприятия, пропорциональный размерам цехов, проведенный с целью оценки потерь из-за временной нетрудоспособности, привел к следующим результатам (табл. 10.4)

Рассчитаем среднюю из внутригрупповых дисперсий:

пример к табл 10.4


Определим  среднюю  и  предельную  ошибки  выборки  (с  вероятностью 0,954):


Рассчитаем выборочную среднюю:

пример к табл 10.4_3


С вероятностью 0,954 можно сделать вывод, что среднее число дней временной нетрудоспособности одного рабочего в целом по предприятию находится в пределах:

пример к табл 10.4_4

Воспользуемся полученными внутригрупповыми дисперсиями для проведения отбора пропорционального дифференциации признака. Опре­делим необходимый объем выборки по каждому цеху:

пример к табл 10.4_5


пример к табл 10.4_6


С учетом полученных значений рассчитаем среднюю ошибку выборки:

пример к табл 10.4_7


В данном случае средняя, а следовательно, и предельная ошибки будут несколько меньше, что отразится и на границах генеральной средней.

Серийный отбор. Данный способ отбора удобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. В качестве таких серий могут рассматриваться упаковки с определенным количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения. Сущность серийной выборки заключается в собственно-случайном или механическом отборе серий, внутри которых произ­водится сплошное обследование единиц.

Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка серийной выборки (при отборе равновеликих серий) зависит от величины только межгрупповой (межсерийной) дисперсии и определяется по следующим формулам:

формула 10.20

(10.20)


формула 10.21

(10.21)


Где r ‑ число отобранных серий; R ‑ общее число серий.



Межгрупповую дисперсию вычисляют следующим образом:

 формула 10.22(10.22)


где формула 10.22 пояснение 1 ‑ средняя i-й серии;

формула 10.22 пояснение 2‑ общая средняя по всей выборочной совокупности.


Пример.

В области, состоящей из 20 районов, проводилось выборочное обследование урожайности на основе отбора серий (районов). Выбо­рочные средние по районам составили соответственно 14,5 ц/га; 16 ц/га; 15,5 ц/га; 15 ц/га и 14 ц/га. С вероятностью 0,954 определите пределы урожайности во всей области.

Решение. Рассчитаем общую среднюю:


Межгрупповая (межсерийная) дисперсия равна:


Определим теперь предельную ошибку серийной бесповторной выборки (t = 2 при р = 0,954):


Вывод: Следовательно, урожайность будет с вероятностью 0,954 находиться в пределах:


Определение необходимого объема выборки

При проектировании выборочного наблюдения возникает вопрос о необходимой численности выборки. Эта численность может быть определена на базе допустимой ошибки при выборочном наблюдении, исходя из вероятности, на основе которой можно гарантировать величину устанавливае­мой ошибки, и, наконец, на базе способа отбора.

Формулы необходимого объема выборки для различных способов формирования выборочной совокупности могут быть выведены из соот­ветствующих соотношений, используемых при расчете предельных ошибок выборки. Приведем наиболее часто применяемые на практике выражения необходимого объема выборки:

– собственно-случайная и механическая выборка:

Формула 10.23

(10.23)


Формула 10.24

(10.24)



– типическая выборка:

Формула 10.25

(10.25)


Формула 10.26

(10.26)


 – серийная выборка:

Формула 10.27

(10.27)


Формула 10.28

(10.28)



При этом в зависимости от целей исследования дисперсии и ошибки выборки могут быть рассчитаны для средней величины или доли признака.


Рассмотрим примеры определения необходимого объема выборки при различных способах формирования выборочной совокупности.

Пример.

В 100 туристических агентствах города предполагается провести обследование среднемесячного количества реализованных путевок методом механического отбора. Какова должна быть численность вы­борки, чтобы с вероятностью 0,683 ошибка не превышала 3 путевок, если по данным пробного обследования дисперсия составляет 225.

Решение. Рассчитаем необходимый объем выборки:

29


Пример.

С целью определения доли сотрудников коммерческих банков области в возрасте старше 40 лет предполагается организовать типическую выборку пропорциональную численности сотрудников мужского и женского пола с механическим отбором внутри групп. Общее число сотрудников банков составляет 12 тыс. чел., в том числе 7 тыс. мужчин и 5 тыс. женщин.

На основании предыдущих обследований известно, что средняя из внутригрупповых дисперсий составляет 1600. Определите необходимый объем выборки при вероятности 0,997 и ошибке 5%.

Решение. Рассчитаем общую численность типической выборки:

30


Вычислим теперь объем отдельных типических групп:

31

Вывод: Таким образом, необходимый объем выборочной совокупности сотрудников банков составляет 550 чел., в т.ч. 319 мужчин и 231 женщина.


Пример.

В акционерном обществе 200 бригад рабочих. Планируется проведение выборочного обследования с целью определения удельного ве­са рабочих, имеющих профессиональные заболевания. Известно, что межсерийная дисперсия доли равна 225. С вероятностью 0,954 рассчитайте необходимое количество бригад для обследования рабочих, если ошибка вы­борки не должна превышать 5%.

Решение. Необходимое количество бригад рассчитаем на основе формулы объема серийной бесповторной выборки:

32




Содержание курса лекций “Статистика”


Контрольные задания

Самостоятельно проведите выборочное наблюдение и произведите соответствующие расчеты.

  • По направлению корреляционные связи
    разделяют на  прямые и обратные

  • Коэффициент корреляции используется
    для оценки тесноты связи

  • Величина коэффициента корреляции может
    быть равной от -1 до 1

  • Уравнение регрессии характеризует 
    вид или форму связи

  • По количеству значимых факторов
    регрессию подразделяют на  парную
    и множественную

  • По способу формирования выборочной
    совокупности различают следующие виды
    выборки: серийную, механическую,
    собственно-случайную, комбинированную,
    типическую

  • Недостающим элементом в формуле расчета
    объема выборки при бесповторном
    случайном отборе (оценивается среднее
    значение признака)  является:
    о2

  • Если объем случайной повторной выборки
    увеличить в 4 раза, то средняя ошибка
    выборки уменьшиться в 2 раза

  • Возникновение случайных ошибок
    репрезентативности (представительности)
    объясняется недостаточно равномерным
    представлением в выборочной совокупности
    различных категорий единиц генеральной
    совокупности

  • Величина случайной ошибки репрезентативности
    (представительности) зависит от: объема
    выборки и степени колеблемости изучаемого
    признака генеральной совокупности,
    принятого способа формирования
    выборочной совокупности

  • В социально-экономической статистике
    используются следующие показатели:
    показатели численности населения,
    показатели уровня жизни населения,
    показатели динамики цен

  • Эффективность экономики оценивается
    по  национальному доходу

  • Характеристикой социальной жизни
    страны служат показатели уровни жизни
    населения

  • Из ниже перечисленных классификаторами
    являются ОКАТО, ОКСМ

  • Информационный фонд ЕГРПО состоит из
    разделов информационный, экономический,
    справочный

  • Лица, которые выполняют работу без
    оплаты на семейном предприятии, относятся
    к числу занятых в экономике

  • Численность
    трудоспособного населения области в
    трудоспособном возрасте на начало года
    находилась на уровне 2300 тыс. человек,
    а на конец года составила 2500 тыс. человек
    В течение года абсолютный естественный
    прирост трудоспособного населения в
    трудоспособном возрасте составил 18
    тыс. человек, а коэффициент механического
    прироста равен – 5.
    Следовательно, коэффициент общего
    прироста трудовых ресурсов равен: 2,5

  • Численность трудовых ресурсов региона
    на начало года составила 700 тыс. человек.
    За год естественное пополнение составило
    40 тыс. человек, естественное выбытие −
    30 тыс. человек, механический прирост –
    5 тыс. человек. Численность трудовых
    ресурсов на конец года равна 715 тыс.
    человек

  • Коэффициент естественного прироста
    населения в регионе в текущем году
    составил – 5,0 Коэффициент
    интенсивности миграции равен 3,0 .
    Численность населения на конец года
    равна 5 млн. человек. Перспективная
    численность населения этого региона
    через 2 года достигнет уровня (с точностью
    0,01 млн. человек) 4,98 млн. человек

  • В текущем году показатель
    жизненности (показатель Покровского)
    составил 0,75, а коэффициент смертности
    равен 12.
    Следовательно, коэффициент рождаемости
    равен 9

  • За отчетный год коэффициент общего
    оборота рабочей силы на предприятии
    составил 44,5% при среднесписочной
    численности работников 800 человек и 40
    человек, уволенных за прогулы. При этом
    коэффициент оборота по приему равен
    23,5%. Следовательно, общее количество
    уволенных составило 168 чел

  • За отчетный год коэффициент общего
    оборота рабочей силы на предприятии
    составил 46% при среднесписочной
    численности работников 1000 человек и
    70 человек, принятых в связи с переводом.
    При этом коэффициент оборота по выбытию
    равен 20%. Следовательно, общее количество
    принятых на работу составило 260 чел

  • На начало отчетного года число работников
    предприятия составило 1000 человек. За
    год принято на работу 300 человек, уволено
    всего 150 человек (в том числе 80 человек
    уволено за прогулы). Коэффициент
    текучести кадров равен (с точностью
    0,1%) 7,4%

  • За отчетный год: среднесписочная
    численность работников предприятия
    составила 1000 чел., табельный фонд
    рабочего времени – 248000 чел.-дней,
    количество ежегодных отпусков – 24000
    чел.-дней, праздничных и выходных –
    120000 чел.-дней. При этом фактически
    отработано 212 000 чел.-дней. Коэффициент
    использования рабочего периода одним
    работником равен (с точностью 0,1%) 94,6%

  • В бригаде семи рабочим присвоен 5-й
    тарифный разряд и трем рабочим – 6-й
    тарифный разряд. Остальные 10 рабочих
    работают по 3-му тарифному разряду.
    Средний тарифный разряд в бригаде равен
    4,15

  • Средний уровень выработки на двух
    предприятиях отрасли в апреле составил
    5,6 тыс. руб. на одного работающего, а в
    мае – 6,1 тыс . руб. на одного работающего.
    В мае в условиях апрельской
    производительности труда на каждом
    предприятии средняя выработка составила
    бы 5,8 тыс. руб. на одного работающего.
    Под влиянием изменения только доли
    каждого предприятия в общем количестве
    работающих средняя выработка по обоим
    предприятиям (с точностью 0,1%) выросла
    на 3,6%

  • Общие затраты труда на производство
    продукции нескольких видов в апреле
    составили 3000 чел.-час., а в мае – 4060
    чел.-час. Общие затраты труда в мае на
    производство продукции тех же видов
    при апрельских условиях производительности
    труда составили бы 3930 чел.-час. За
    рассматриваемый период времени
    производительность труда в среднем по
    выпускаемой продукции (с точностью
    0,1%) снизилась на 3,2%

  • Средний уровень выработки по группе
    предприятий в базисном периоде составил
    42 тыс. руб. на одного работающего, в
    отчетном периоде – 46 тыс. руб. на одного
    работающего. В отчетном периоде в
    условиях базисной производительности
    труда на каждом предприятии средняя
    выработка составила бы 44 тыс. руб. на
    одного работающего. Под влиянием
    изменения только доли каждого предприятия
    в общей сумме затрат средняя выработка
    по группе предприятий в среднем (с
    точностью 0,1%) увеличилась на 4,8%

  • В текущем месяце затраты труда на выпуск
    изделия А составили 120 чел.-дней, а на
    выпуск изделия В – 100 чел.-дней.
    Производительность труда при выпуске
    изделия А снизилась на 10%, а при выпуске
    изделия В – увеличилась на 20% .
    Производительность труда при выпуске
    изделий обоих видов в среднем (с точностью
    0,1%) увеличилась на 3,6%

  • Прямым показателем производительности
    труда является выработка продукции в
    единицу времени, выработка продукции
    на одного работающего

  • Основные фонды – это часть национального
    богатства, которая в процессе производства
    в течение длительного периода (более
    года) переносит свою стоимость на
    создаваемые предметы и услуги

  • Объем национального богатства исчисляется
    в выражении стоимостном

  • К основным нематериальным фондам
    относят: программные продукты для ЭВМ,
    оригинальные произведения литературы

  • К запасам материальных оборотных
    средств относят: посадочный материал,
    топливо

  • К финансовым экономическим активам
    национального богатства относят:
    монетарное золото, кредиторскую
    задолженность

  • Специалистами Программы развития ООН
    в качестве обобщающего (агрегатного)
    показателя уровня жизни населения
    страны предлагается индекс развития
    человеческого потенциала

  • Структурная переменная, которая делит
    распределение доходов на десять равных
    частей (по 10% объема совокупности в
    каждой части), может принимать только
    9 значений

  • Стоимостная оценка минимального набора
    продуктов питания, необходимого для
    сохранения здоровья человека, поддержания
    его жизнедеятельности, а также расходы
    на цели в бюджетах низкодоходных групп
    называется прожиточный минимум

  • Располагаемые доходы населения в
    среднем выросли на 17,3%, а потребительские
    цены – в 1,15 раз. Реальные располагаемые
    доходы в среднем увеличились на 2%

  • Наивысший уровень среднедушевого
    денежного дохода десяти процентов
    наименее обеспеченного населения в
    отчетном году равен 2,1 тыс. руб. Децильный
    коэффициент дифференциации доходов
    населения равен 8,2. Верхний дециль
    достиг уровня 17,22 тыс.руб

  • Если объем выпуска товаров и услуг в
    масштабах экономики страны уменьшить
    на величину промежуточного потребления,
    то полученный показатель – это валовый
    внутренний продукт

  • За отчетный год: валовая добавочная
    стоимость в целом по стране составила
    3070 млрд. руб.; оплата труда наемных
    работников 1490 млрд. руб.; налоги на
    производство и импорт 500 млрд. руб.;
    субсидии на производство и импорт 170
    млрд. руб.; субсидии на продукты 120 млрд.
    руб. Следовательно, валовая прибыль
    экономики равна 1250 млрд.руб.

  • За отчетный год: валовая добавленная
    стоимость в целом по экономике страны
    составила 3000 млрд. руб. в основных ценах;
    налоги на продукты 350 млрд. руб. в текущих
    ценах; субсидии на продукты 120 млрд.
    руб. в текущих ценах. Следовательно,
    объем ВВП в рыночных ценах равен 3230
    млрд.руб.

  • За отчетный год: объем ВВП составил
    4000 млрд. руб.; экспорт товаров и услуг
    650 млрд. руб.; импорт товаров и услуг 550
    млрд. руб.; потребление основного
    капитала 400 млрд.; субсидии на производство
    и импорт 450 млрд. руб. Следовательно,
    чистый национальный доход равен 3700
    млрд.руб.

  • В состав промежуточного потребления
    как стадии экономической деятельности
    в стране на макроуровне не входит
    потребление основного капитала

  • В отчетном году себестоимость единицы
    продукции составила 1600 руб. при плане
    1760 руб. Планом на отчетный год предусмотрена
    экономия в размере 400 руб. с единицы
    продукции. Фактическая экономия с
    единицы продукции составила 560 руб

  • В базисном году себестоимость единицы
    продукции составила 800 руб. при плане
    850 руб., а в отчетном году – 760 руб. при
    плане 785 руб. Сверхплановая экономия
    равна 25 руб

  • Если затраты на 1 руб. товарной продукции
    составили 79 копеек, то на долю прибыли
    предприятия приходится… 21% стоимости
    продукции в отпускных ценах

  • Группа
    предприятий выпускает одноименную
    продукцию. В отчетном периоде средний
    уровень себестоимости единицы
    продукции  составил
    1600,8 руб.

  • Значение
    показателя  уменьшилось
    в отчетном периоде на 4% в результате
    структурных сдвигов в объеме выпуска
    продукции. В результате изменения только
    себестоимости единицы продукции на
    каждом предприятии значение
    показателя  уменьшилось
    на 8%. Средний уровень себестоимости
    единицы продукции  по
    группе предприятий в базисном периоде
    составил 1812,5
    руб.

    В
    статистике выделяют два основных метода
    исследования — сплошной и выборочный.
    При проведении выборочного исследования
    обязательным является соблюдение
    следующих требований: репрезентативность
    выборочной совокупности и достаточное
    число единиц наблюдений. При выборе
    единиц наблюдения возможны ошибки
    смещения
    ,
    т.е. такие события, появление которых
    не может быть точно предсказуемым. Эти
    ошибки являются объектив­ными и
    закономерными. При определении степени
    точности выборочно­го исследования
    оценивается величина ошибки, которая
    может прои­зойти в процессе выборки
    случайная
    ошибка репрезентативности (
    m)
    является
    фактической разностью между средними
    или относительными величинами, полученными
    при проведении выборочного исследования
    и аналогичными величинами, которые были
    бы получены при проведении исследования
    на гене­ральной совокупности.

    Оценка
    достоверности результатов исследования
    предусматривает определение:

    1.
    ошибки репрезентативности

    2.
    доверительных границ средних (или
    относительных) величин в генеральной
    совокупности

    3.
    достоверности разности средних (или
    относительных) величин (по критерию t)

    Расчет
    ошибки репрезентативности

    (mм)
    средней арифмети­ческой величины
    (М):

    ,
    где σ
    — среднее квадратическое отклонение; n
    — численность выборки (>30).

    Расчет
    ошибки репрезентативности (mР)
    относительной величины (Р):

    ,
    где Р — соответствующая относительная
    величина (рассчитанная, например, в %);

    q
    =100 — Ρ%
    — величина, обратная Р; n
    — численность выборки (n>30)

    В
    клинических и экспериментальных работах
    довольно часто приходится использовать
    малую
    выборку,
    когда
    число наблюдений меньше или равно 30.
    При малой выборке для расчета ошибок
    репрезентатив­ности, как средних, так
    и относительных величин,
    число
    наблюде­ний уменьшается на единицу,
    т.е.

    ;
    .

    Величина
    ошибки репрезентативности зависит от
    объема выборки: чем больше число
    наблюдений, тем меньше ошибка. Для оценки
    достоверности выборочного показателя
    принят следующий подход: показатель
    (или средняя величина) должен в 3 раза
    превышать свою ошибку, в этом случае он
    считается достоверным.

    83. Определение доверительных границ средних и относительных величин.

    Знание
    величины ошибки недостаточно для того,
    чтобы быть уве­ренным в результатах
    выборочного исследования, так как
    конкрет­ная ошибка выборочного
    исследования может быть значительно
    больше (или меньше) величины средней
    ошибки репрезентативности. Для
    оп­ределения точности, с которой
    исследователь желает получить ре­зультат,
    в статистике используется такое понятие,
    как вероят­ность безошибочного
    прогноза, которая является характеристикой
    надежности результатов выборочных
    медико-биологических статистических
    исследований. Обычно, при проведении
    медико-биологических статистических
    исследований используют вероятность
    безошибочного прогноза 95% или 99%. В
    наиболее ответственных случаях, когда
    необходимо сделать особенно важные
    выводы в теоретическом или практическом
    отношении, используют вероятность
    безошибочного прогноза 99,7%

    Определенной
    степени вероятности безошибочного
    прогноза соот­ветствует определенная
    величина предельной
    ошибки случайной выборки (
    Δ
    — дельта)
    ,
    которая определяется по формуле:

    Δ=t
    * m
    , где t
    — доверительный коэффициент, который
    при большой выборке при вероятности
    безо­шибочного прогноза 95% равен 2,6;
    при вероятности безоши­бочного
    прогноза 99% — 3,0; при вероятности
    безошибочно­го прогноза 99,7% — 3,3, а при
    малой выборке определяется по специальной
    таблице значений t
    Стьюдента.

    Используя
    предельную ошибку выборки (Δ),
    можно определить до­верительные
    границы
    ,
    в которых с определенной вероятностью
    безо­шибочного прогноза заключено
    действительное значение статистичес­кой
    величины,
    характеризующей
    всю генеральную совокупность (сред­ней
    или относительной).

    Для
    определения доверительных границ
    используются следующие формулы:

    Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

    • #
    • #
    • #
    • #
    • #
    • #
    • #
    • #
    • #
    • #
    • #

    ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ ГОРОДА МОСКВЫ

    Государственное бюджетное профессиональное образовательное учреждение города Москвы

    «ЮРИДИЧЕСКИЙ КОЛЛЕДЖ»

    (ГБПОУ Юридический колледж)

    ПЛАН-КОНСПЕКТ учебного занятия

    по ОП.11 Статистика

    учебной дисциплине/междисциплинарному курсу

    для обучающихся 2 курса

    специальность 40.02.01 Право и организация социального обеспечения

    (набор 2016 г.)

    (углубленная подготовка)

    дата проведения занятия по расписанию

    Тема 3.1. Выборочное наблюдение

    Занятие 15.  ПЗ №8 Определение ошибки репрезентативности.

    Определение объема выборочной совокупности

    Цель занятия: отработать практические навыки по определению доверительных пределов и исчислению ошибок выборки 

    Задачи занятия:

    Обучающая: Обеспечить усвоение обучающимися материала о понятиях: ошибки репрезентативности, выборка, выборочная совокупность;

    Воспитательная: воспитывать навыки самостоятельной работы, чувство ответственности за порученный участок работы, дисциплину  умственного труда, уверенность в своих силах, стремление к достижению результата;

    Развивающая: создавать условия для развития самостоятельности мышления, способности высказывания собственной точки зрения, систематизировать необходимую информацию, анализировать, сравнивать и обобщать информацию, развивать монологическую речь.

    Основная литература:

    Глава 11. Выборочное наблюдение. (211-220) Статистика: учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО 

    Дополнительная литература:

     Савюк Л.К. Правовая статистика: Учебник. — М.: Юрист, 2016

    Интернет-ресурсы:

    1. Информационно-издательский центр «Статистика России» http://www.statbook.ru 
    2. Электронный фонд правовой и технической документации http://docs.cntd.ru 
    3. Информационно правовой портал http://www.garant.ru/

    Междисциплинарные связи: Право социальное обеспечение

    Внутридисциплинарные связи: Тема 2.1. Сводка и группировка статистических данных

    1. Актуализация знаний по ранее пройденному материалу учебного курса

    (ответить на вопросы (тестовые задания) и провести самооценку усвоенного материала)

    Таблица 1.

    Вопрос

    (тестовое задание)

    Ответ

    1. Задача сводки…
    1. дать характеристику объекту исследования с помощью запроектированных систем статистических показателей, выявить и измерить такие путем его существенные черты и особенности;
    2. дать характеристику объекту исследования с помощью запроектированных систем статистических показателей;
    3. выявить и измерить такие путем его существенные черты и особенности;
    4. подсчет общих и групповых итогов, получение системы взаимосвязанных показателей.
    1. Перегруппировка ранее сгруппированных данных статистического наблюдения называется:
    1. типологической группировкой;
    2. структурной группировкой;
    3. вторичной группировкой;
    4. аналитической группировкой.
    1. Плотность распределения – это
    1. частота, рассчитанная на единицу ширины интервала;
    2. количество единиц в ширине интервала;
    3. все верно;
    4. нет верного ответа.
    1. К атрибутивным группировочным признакам относятся:
    1. пол человека;
    2. возраст человека;
    3. среднедушевой доход семьи;
    4. правильного ответа нет.
    1. «Объем производства товаров и услуг», по временному фактору относятся к …
    1. моментному виду;
    2. интервальному виду;
    3. минутному виду;
    4. интенсивному виду.

    2. Изучаемые вопросы занятия

    1. Определение ошибки репрезентативности.

    2. Определение объема выборочной совокупности.

    Вопрос 1.        Определение ошибки репрезентативности

    В статистике выделяют два основных метода исследования – сплошной и выборочный. При проведении выборочного исследования обязательным является соблюдение следующих требований: репрезентативность выборочной совокупности и достаточное число единиц наблюдений. При выборе единиц наблюдения возможны Ошибки смещения, т. е. такие события, появление которых не может быть точно предсказуемым. Эти ошибки являются объективными и закономерными. При определении степени точности выборочного исследования оценивается величина ошибки, которая может произойти в процессе выборки – Случайная ошибка репрезентативности (M) – Является фактической разностью между средними или относительными величинами, полученными при проведении выборочного исследования и аналогичными величинами, которые были бы получены при проведении исследования на генеральной совокупности.

    Оценка достоверности результатов исследования предусматривает определение:

    1. ошибки репрезентативности

    2. доверительных границ средних (или относительных) величин в генеральной совокупности

    3. достоверности разности средних (или относительных) величин (по критерию t)

    Расчет ошибки репрезентативности (mм) средней арифметической величины (М):

    https://uchenie.net/wp-content/uploads/2012/08/image142.pnghttps://uchenie.net/wp-content/uploads/2012/08/image143.png, где σ – среднее квадратическое отклонение; n – численность выборки (>30).

    Расчет ошибки репрезентативности (mР) относительной величины (Р):

    https://uchenie.net/wp-content/uploads/2012/08/image144.png, где Р – соответствующая относительная величина (рассчитанная, например, в %);

    Q =100 – Ρ% – величина, обратная Р; n – численность выборки (n>30)

    В клинических и экспериментальных работах довольно часто приходится использовать Малую выборку, Когда число наблюдений меньше или равно 30. При малой выборке для расчета ошибок репрезентативности, как средних, так и относительных величинЧисло наблюдений уменьшается на единицу, т. е.

    https://uchenie.net/wp-content/uploads/2012/08/image145.pnghttps://uchenie.net/wp-content/uploads/2012/08/image146.png.

    Величина ошибки репрезентативности зависит от объема выборки: чем больше число наблюдений, тем меньше ошибка. Для оценки достоверности выборочного показателя принят следующий подход: показатель (или средняя величина) должен в 3 раза превышать свою ошибку, в этом случае он считается достоверным.

    Знание величины ошибки недостаточно для того, чтобы быть уверенным в результатах выборочного исследования, так как конкретная ошибка выборочного исследования может быть значительно больше (или меньше) величины средней ошибки репрезентативности. Для определения точности, с которой исследователь желает получить результат, в статистике используется такое понятие, как вероятность безошибочного прогноза, которая является характеристикой надежности результатов выборочных медико-биологических статистических исследований. Обычно, при проведении медико-биологических статистических исследований используют вероятность безошибочного прогноза 95% или 99%. В наиболее ответственных случаях, когда необходимо сделать особенно важные выводы в теоретическом или практическом отношении, используют вероятность безошибочного прогноза 99,7%

    Определенной степени вероятности безошибочного прогноза соответствует определенная величина Предельной ошибки случайной выборки (Δ – дельта), которая определяется по формуле:

    Δ=t * m, где t – доверительный коэффициент, который при большой выборке при вероятности безошибочного прогноза 95% равен 2,6; при вероятности безошибочного прогноза 99% – 3,0; при вероятности безошибочного прогноза 99,7% – 3,3, а при малой выборке определяется по специальной таблице значений t Стьюдента.

    Используя предельную ошибку выборки (Δ), можно определить Доверительные границы, в которых с определенной вероятностью безошибочного прогноза заключено действительное значение статистической величины, Характеризующей всю генеральную совокупность (средней или относительной).

    Для определения доверительных границ используются следующие формулы:

    1. для средних величин:

     https://uchenie.net/wp-content/uploads/2012/08/image147.png,где Мген – доверительные границы средней величины в генеральной совокупности;

    Мвыб – средняя величинаПолученная при проведении исследования на выборочной совокупности; t – доверительный коэффициент, значение которого определяется степенью вероятности безошибочного прогноза, с которой исследователь желает получить результат; mM – ошибка репрезентативности средней величины.

         2) для относительных величин:

    https://uchenie.net/wp-content/uploads/2012/08/image148.png, где Рген – доверительные границы относительной величины в генеральной совокупности; Рвыб – относительная величина, полученная при проведении исследования на выборочной совокупности; t – доверительный коэффициент; mP – ошибка репрезентативности относительной величины.

    Доверительные границы показывают, в каких пределах может колебаться размер выборочного показателя в зависимости от причин случайного характера.

    При малом числе наблюдений (n<30), для вычисления доверительных границ значение коэффициента t находят по специальной таблице Стьюдента. Значения t расположены в таблице на пересечении с избранной вероятностью безошибочного прогноза и строкиУказывающей на имеющееся число степеней свободы (n)Которое равно n-1.

    на определение ошибок репрезентативности (m) и доверительных границ средней величины генеральной совокупности (Мген) при числе наблюдений больше 30

    Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у 36 обследованных водителей сельскохозяйственных машин через 1 ч работы составила 80 ударов в 1 минуту; σ = ± 6 ударов в минуту.

    Задание: определить ошибку репрезентативности (mM) и доверительные границы средней величины генеральной совокупности (Мген).

    Решение.

    1. Вычисление средней ошибки средней арифметической (ошибки репрезентативности) (m): m = σ / √n = 6 / √36 = ±1 удар в минуту
    2. Вычисление доверительных границ средней величины генеральной совокупности (Мген). Для этого необходимо:
    • а) задать степень вероятности безошибочного прогноза (Р = 95 %);
    • б) определить величину критерия t. При заданной степени вероятности (Р=95%) и числе наблюдений меньше 30 величина критерия t, определяемого по таблице, равна 2 (t = 2). Тогда Мген = Мвыб ± tm = 80 ± 2×1 = 80 ± 2 удара в минуту.

    Вывод. Установлено с вероятностью безошибочного прогноза Р = 95%, что средняя частота пульса в генеральной совокупности, т.е. у всех водителей сельскохозяйственных машин, через 1 ч работы в аналогичных условиях будет находиться в пределах от 78 до 82 ударов в минуту, т.е. средняя частота пульса менее 78 и более 82 ударов в минуту возможна не более, чем у 5% случаев генеральной совокупности.

    на определение ошибок репрезентативности (m) и доверительных границ относительного показателя генеральной совокупности (Рген)

    Условие задачи: при медицинском осмотре 164 детей 3 летнего возраста, проживающих в одном из районов городе Н., в 18% случаев обнаружено нарушение осанки функционального характера.

    Задание: определить ошибку репрезентативности (mp) и доверительные границы относительного показателя генеральной совокупности (Рген).

    Решение.

    1. Вычисление ошибки репрезентативности относительного показателя: m = √P x q / n = √18 x (100 — 18) / 164 = ± 3%
    2. Вычисление доверительных границ средней величины генеральной совокупности (Рген) производится следующим образом:
    • необходимо задать степень вероятности безошибочного прогноза (Р=95%);
    • при заданной степени вероятности и числе наблюдений больше 30, величина критерия t равна 2 (t = 2). Тогда Рген = Рвыб± tm = 18% ± 2 х 3 = 18% ± 6%.

    Вывод. Установлено с вероятностью безошибочного прогноза Р=95%, что частота нарушения осанки функционального характера у детей 3 летнего возраста, проживающих в городе Н., будет находиться в пределах от 12 до 24% случаев.

    на оценку достоверности разности средних величин

    Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у водителей сельскохозяйственных машин через 1 ч после начала работы составила 80 ударов в минуту; m = ± 1 удар в мин. Средняя частота пульса у этой же группы водителей до начала работы равнялась 75 ударам в минуту; m = ± 1 удар в минуту.

    Задание: оценить достоверность различий средних значений пульса у водителей сельскохозяйственных машин до и после 1 ч работы.

    Решение.

    https://extra.im/wp-content/uploads/2018/09/6.png

    Вывод. Значение критерия t = 3,5 соответствует вероятности безошибочного прогноза Р > 99,7%, следовательно можно утверждать, что различия в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч работы не случайно, а достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.

    на оценку достоверности разности относительных показателей

    Условие задачи: при медицинском осмотре детей 3 летнего возраста в 18% (m = ± 3%) случаях обнаружено нарушение осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 4-летнего возраста составила 24% (m = ± 2,64%).

    Задание: оценить достоверность различий в частоте нарушения осанки у детей 2 возрастных групп.

    Решение.

    https://extra.im/wp-content/uploads/2018/09/7.png

    Вывод. Значение критерия t=1,5 соответствует вероятности безошибочного прогноза Р<95%. Следовательно, различие в частоте нарушений осанки среди детей, сравниваемых возрастных групп случайно, недостоверно, несущественно, т.е. не обусловлено влиянием возраста детей.

    Источники информации по 1 вопросу

    Автор и наименование

    Страницы

    (форма доступа для Интернет-ресурсов)

    Основная литература

    Глава 11. Выборочное наблюдение. Статистика: учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО

     стр. 211-220

    Интернет ресурсы

    1. Информационно-издательский центр «Статистика России»

    http://www.statbook.ru

    1. Электронный фонд правовой и технической документации

    http://docs.cntd.ru 

    1. Информационно правовой портал

    http://www.garant.ru/

    Контрольное задание по Вопросу 1

    1. Записать в тетрадь конспект (1-2 стр.)

    Вопрос 2. Определение объема выборочной совокупности

     Социологические исследования редко бывают сплошными, как, например, перепись населения. Обычно сплошное исследование проводится при небольшой генеральной совокупности.

    Чаще всего исследования носят выборочный характер, при котором наиболее важным основанием является возможность распространения полученных результатов и выводов на всю генеральную совокупность. В таком случае сплошное исследование  нецелесообразно. Обеспечение этой нецелесообразности — вопрос о репрезентативности выборки, т.е. достаточной количественной и качественной представительности генеральной совокупности в выборке.

    Условиями соблюдения репрезентативности выборки являются:

    1) равная возможность каждого члена генеральной совокупности попасть в выборку;

    2) отбор необходимо проводить независимо от изучаемого признака (иначе в выборку могут попасть, например, только спортсмены);

    3) отбор по возможности должен производиться из однородных совокупностей;

    4) величина выборки должна быть достаточно большой.

    Далее возникает вопрос: как определить достаточный объем выборки? Для этого необходимо иметь характеристики генеральной совокупности по важнейшим (с точки зрения исследования) признакам. К ним, например, можно отнести сведения о количестве желающих заниматься физической культурой и спортом, о числе занимающихся и т.д. Но, как правило, такие характеристики (или многие из них) не известны. Пилотажные исследования как раз и направлены на их выявление.

    Приведем пример определения объема выборочной совокупности. В ходе подготовки к проведению конкретно-социологического исследования на основании теоретических посылок были выделены характеристики и признаки, подлежащие изучению. Например, желание заниматься физической культурой, спортом, величина потребности, участие в видах деятельности и др.

    На основании результатов изучения этих признаков в пробном исследовании (30 и более респондентов) определяется объем выборки.

    Предположим, что в пробном исследовании опрошено 147 студентов 4-х курсов в четырех вузах Республики Беларусь.

    Для желания заниматься физической культурой получены следующие распределения:

    1.«Нет, не хочу» — 5 человек;

    2.«Скорее не хочу, чем хочу» — 3 человека;

    3.«Безразлично» — 11 человек;

    4.«Скорее хочу, чем не хочу» — 34 человека;

    5.«Да, хочу» — 72 человека.

    Для расчета объема выборки используются формулы:

    http://ebooks.grsu.by/gorodilin/5.GIF

    t — 1,96 — распределение Стьюдента для вероятности 0,95 или 95% (т.е., если требуемая вероятность соответствия характеристик выборки и характеристик генеральной совокупности 95%, всегда = 1,96. Их соответствие на 95% — общепринятое требование в социологических исследованиях.

    Для нашего распределения:

    http://ebooks.grsu.by/gorodilin/3.GIF

    При условии, что выборка в пробном исследовании представляла бы собой модель генеральной совокупности, величина выборочной совокупности для изучения желания заниматься физической культурой должна быть не меньше 147 человек. Тогда с вероятностью 95% можно утверждать, что генеральное среднее лежит в пределах 4,39+0,155.

    Поскольку модель выборки в пробном исследовании во вузам не представляет собой модели генеральной совокупности (опрос был в четырех вузах из 30), то увеличиваем полученное n (30/4) в 7,5 раза. Тогда необходимый объем выборки — 1102 респондента.

    Качественная представительность полученной выборки оценивается сравнением существенных характеристик (либо связанных с существенными) генеральной совокупности и выборки. Для студенчества, например, такими характеристиками являются: соотношение по полу, охват учебными занятиями по физическому воспитанию, соотношение форм занятий и др.

    Когда информация о признаках элементов генеральной совокупности отсутствует, исключается возможность определения объема выборочной совокупности при помощи формул. В этом случае можно опереться на многолетний опыт социологов — практиков, свидетельствующий о том, что для пробных опросов достаточна выборка объемом 100-250 человек. При массовых опросах, если величина генеральной совокупности 5000 человек, достаточный объем выборочной совокупности — не менее 500 человек, если же величина генеральной совокупности 5000 человек и более, то — 10% ее состава (но не более 2000-2500 человек). Это характеризует достаточно достоверные результаты исследования.

    ПРИМЕР 1

    При проверке импортирования груза на таможне методом случайной выборки было обработано 200 изделий. В результате был установлен средний вес изделия 30г., при СКО=4г с вероятностью 0,997. Определите пределы в которых находится средний вес изделий генеральной совокупности.

    Решение.

    В данном примере – случайный повторный отбор.

    n=200

    https://www.goodstudents.ru/images/stories/vyborka/image002.gif=30г

    https://www.goodstudents.ru/images/stories/vyborka/image004.gif=4г — СКО

    p=0,997, тогда t=3

    Формула средней ошибки для случайного повторного отбора:

    https://www.goodstudents.ru/images/stories/vyborka/image006.gif

    https://www.goodstudents.ru/images/stories/vyborka/image008.gif=0,84 г

    https://www.goodstudents.ru/images/stories/vyborka/image010.gifг

    Определяем величину средней ошибки.

    https://www.goodstudents.ru/images/stories/vyborka/image012.gif

    Ответ: пределы в которых находится средний вес изделий:https://www.goodstudents.ru/images/stories/vyborka/image014.gif г

    ПРИМЕР 2

     В городе проживает 250тыс. семей. Для определения среднего числа детей в семье была организована 2%-я бесповторная выборка семей. По ее результатам было получено следующее распространение семей по числу детей:

     P=0,954. Найти пределы в которых будет находится среднее число детей в генеральной совокупности.

    Число детей в семье, xi

    0

    1

    2

    3

    4

    5

    Кол-во детей в семье

    1000

    2000

    1200

    400

    200

    200

    Решение

    2%-я выборка означает: n=250000*0,02= 5000 семей было исследовано.

    Т.к. выборка бесповторная, используем следующую формулу для определения средней величины ошибки:

    https://www.goodstudents.ru/images/stories/vyborka/image016.gif

    Найдем среднее число детей в выборочной совокупности:

    https://www.goodstudents.ru/images/stories/vyborka/image018.gif ребенка

    Определим дисперсию

    https://www.goodstudents.ru/images/stories/vyborka/image020.gif

    https://www.goodstudents.ru/images/stories/vyborka/image022.gif ребенка – средняя величина ошибки

    Т.к = 0,954, то t = 2

    https://www.goodstudents.ru/images/stories/vyborka/image024.gifребенка

    https://www.goodstudents.ru/images/stories/vyborka/image026.gifребенка

    Вывод: из-за слишком малой величины ошибки, среднее число детей в генеральной совокупности можно принять за 1,5 ребенка.

    Источники информации по 2 вопросу

    Автор и наименование

    Страницы

    (форма доступа для Интернет-ресурсов)

    Основная литература

    Глава 11. Выборочное наблюдение. Статистика: учебник / И.В. Гладун. – 3-е издание, стер. – М.: КНОРУС, 2019. – 232 с. – СПО

     стр. 211-220

    Интернет ресурсы

    1. Информационно-издательский центр «Статистика России»

    http://www.statbook.ru

    1. Электронный фонд правовой и технической документации

    http://docs.cntd.ru 

    1. Информационно правовой портал

    http://www.garant.ru/

    Контрольное задание по Вопросу 2

    1. Записать в тетрадь конспект (1-2 стр.)

    3. Подведение итогов учебного занятия

    (ответить на вопросы (тестовые задания) и провести самооценку усвоенного материала)

    Таблица 2.

    Наименование изученного вопроса учебного занятия

    Контрольное задание по изученному вопросу

    Ответ

    Определение ошибки репрезентативности.

    ЗАДАНИЕ 1

      Условие задачи: при медицинском осмотре 126 детей 6 летнего возраста, проживающих в одном из районов городе А., в 12% случаев обнаружено нарушение осанки функционального характера.

    Задание: определить ошибку репрезентативности (mp) и доверительные границы относительного показателя генеральной совокупности (Рген).

    Определение ошибки репрезентативности.

    ЗАДАНИЕ 2.  

    Условие задачи: при медицинском осмотре детей 6 летнего возраста в 15% (m = ± 3%) случаях обнаружено нарушение осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 7-летнего возраста составила 24% (m = ± 2,64%).

    Задание: оценить достоверность различий в частоте нарушения осанки у детей 2 возрастных групп.

    Определение объема выборочной совокупности

    ЗАДАНИЕ 3. В городе проживает 300 тыс. семей. Для определения среднего числа детей в семье была организована 2%-я бесповторная выборка семей. По ее результатам было получено следующее распространение семей по числу детей:

     P=0,954. Найти пределы в которых будет находится среднее число детей в генеральной совокупности

    Определение объема выборочной совокупности

    Сформулируйте понятие генеральной совокупности

    Определение объема выборочной совокупности

    Перечислите способы отбора единиц для выборочного наблюдения

    1. Домашнее задание на следующее занятие
    1. Выучить основные понятия. Глава 11. Выборочное наблюдение. Статистика: учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО (стр. 211-220)
    2. Выполнить задание 11.1. в тетради (стр. 224) учебник / И.В. Гладун. – 2-е издание, стер. – М.: КНОРУС, 2014. – 232 с. – СПО

    Преподаватель                                                                 Ю.В. Древаль

    СОГЛАСОВАНО

    Протокол заседания ЦК дисциплин профессионального цикла специальности «Право и организация

    социального обеспечения»

    ГБПОУ Юридический колледж

    от ____________ 2017 г. № ___

    Ошибка — репрезентативность

    Cтраница 1

    Ошибки репрезентативности делятся на случайные и систематические. Случайные ошибки возникают вследствие того, что выборочная совокупность недостаточно точно воспроизводит всю совокупность вследствие несплошного характера наблюдения. Случайные ошибки могут быть доведены до незначительных размеров, как это показано далее, а главное, размеры и пределы их можно определить с достаточной точностью на основании закона больших чисел. На этом законе базируется теория выборочного метода.
     [1]

    Ошибки репрезентативности, т.е. расхождения между данными выборочного наблюдения и данными всей совокупности, могут быть получены только при несплошном наблюдении, они про-изводны от самой сути выборочного наблюдения. При этом существуют и, соответственно, аудиторы должны различать две разные группы ошибок репрезентативности: случайные и систематические.
     [2]

    Ошибки репрезентативности также бывают случайными и систематическими. Случайные ошибки репрезентативности возникают, если отобранная совокупность неполно воспроизводит совокупность в целом. Величина этих ошибок может быть оценена.
     [3]

    Ошибка Д является ошибкой репрезентативности ( представительства) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть ее ( выборка), отобранная случайно. Эту ошибку часто называют случайной ошибкой репрезентативности. Ее не следует путать с систематической ошибкой репрезентативности, появляющейся в результате нарушения принципа случайности при отборе элементов в выборку.
     [4]

    При прочих равных условиях ошибка репрезентативности возрастает по мере увеличения вариабельности объектов изучаемой совокупности и уменьшается при увеличении объема выборки.
     [5]

    В отличие от ошибок регистрации ошибки репрезентативности характерны только для несплошного наблюдения. Они возникают потому, что отобранная и обследованная совокупность недостаточно точно воспроизводит генеральную совокупность в целом.
     [6]

    Разность между результатами выборочного и сплошного наблюдения называется ошибками репрезентативности.
     [7]

    После проведения выборки рассчитывают возможные ошибки выборочных показателей ( ошибки репрезентативности), которые используются для оценки результатов выборки и для получения характеристик генеральной совокупности.
     [8]

    Очень часто малоопытный социолог не улавливает разницы между проблемой ошибки репрезентативности выборки и ошибки вывода из данного конкретного распределения в рамках выборочной совокупности.
     [9]

    Если разность между ошибками регистрации этих видов обследования превысит ошибку репрезентативности, то общая ошибка при несплошном наблюдении может оказаться меньше, чем ошибка регистрации сплошного наблюдения. Особенно вероятен такой результат при выборочном наблюдении.
     [10]

    Ошибки наблюдения подразделяются на два вида: ошибки регистрации и ошибки репрезентативности.
     [11]

    Ошибки статистического наблюдения могут быть разбиты на две группы: ошибки репрезентативности и ошибки регистрации.
     [12]

    Оценку генерального параметра получают на основе выборочного показателя с учетом ошибки репрезентативности. В другом случае в отношении свойств генеральной совокупности выдвигается некоторая гипотеза о величине средней, дисперсии, характере распределения, форме и тесноте связи между переменными. Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу принимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Основой проверки статистических гипотез являются данные случайных выборок. При этом безразлично, оцениваются ли гипотезы в отношении реальной или гипотетической генеральной совокупности. Последнее открывает путь применения этого метода за пределами собственно выборки: при анализе результатов эксперимента, данных сплошного наблюдения, но малой численности. В этом случае рекомендуется проверить, не вызвана ли установленная закономерность стечением случайных обстоятельств, насколько она характерна для того комплекса условий, в которых находится изучаемая совокупность.
     [13]

    Поэтому при несплошном обследовании общая ошибка наблюдения является суммой ошибки регистрации и ошибки репрезентативности. Однако это отнюдь не означает, что при любом несплошном наблюдении ошибка будет больше, чем при сплошном.
     [14]

    Отклонение значения показателя обследованной совокупности от его величины в генеральной совокупности называется ошибкой репрезентативности.
     [15]

    Страницы:  

       1

       2

    2.4. Точность статистического наблюдения

    Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.

    Различают две группы ошибок:

    1. ошибки регистрации;
    2. ошибки репрезентативности.

    Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные ошибки регистрации и систематические ошибки регистрации.

    Случайными ошибками регистрации называют ошибки, возникающие вследствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе пол отмечен «Мужской» и т. п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, но имеется высшее образование, а в графе «Семейное положение» указано «Состоит в браке», то, естественно, следует исправить возраст. Если объем исследуемой совокупности велик или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправлены и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов — логический анализ данных.

    Систематические ошибки регистрации чаще всего имеют однонаправленные искажения: они либо увеличивают, либо уменьшают статистический показатель, и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин — мужчинам приятнее ощущать себя неженатыми, а для женщины как бы «стыдно» быть не замужем. Другой пример, когда человек округляет свой возраст — вместо 32 лет говорит 30, вместо 79-80 и т. п. (это явление широко известно и даже получило свое название — «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения.

    Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические ошибки.

    Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть, и, следовательно, при несплошном наблюдении они присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.д. эти ошибки вычисляются и находятся как бы «под контролем».

    Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические.

    Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще — если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты, или если человека не удалось застать дома и т. п.

    Ошибки статистического наблюдения для наглядности можно изобразить в виде схемы (рис. 2.1).

    Виды ошибок статистического наблюдения

    Рис.
    2.1.
    Виды ошибок статистического наблюдения

    Для повышения точности наблюдения необходимо:

    1. правильно разработать формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
    2. иметь хорошо обученный персонал для проведения обследования;
    3. строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
    4. провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
    5. целесообразно провести и арифметический контроль данных, т.д. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
    6. предпринять определенные меры по восстановлению данных при наличии незаполненных анкет или формуляров либо при получении результатов обследования сделать поправку на неответы респондентов.
    Во-первых, как это ни парадоксально, это повышение точности данных уменьшение числа единиц наблюдения в выборке резко снижает ошибки регистрации. Правда, за счет неполноты охвата единиц возникает ошибка репрезентативности, т. е. представительности выборочных данных. Но даже взятые вместе ошибка наблюдения для выборки плюс ошибка репрезентативности обеспечивают большую точность выборочных данных по сравнению с массовым сплошным наблюдением.
     [c.156]

    Ошибка выборки или, иначе говоря, ошибка репрезентативности — это разница между значением показателя, полученного по выборке, и генеральным параметром. Так, ошибка репрезентативности выборочной средней равна ег = х — ц, выборочной относительной величины гг=р-п, дисперсии едЛ = s1 — а2, коэффициента корреляции ЕГ = г — р.
     [c.165]

    Если представить, что было проведено бесконечное число выборок равного объема из одной и той же генеральной совокупности, то показатели отдельных выборок образовали бы ряд возможных значений выборочных средних величин х,, х-,, х3,. … относительных величин / ,, р2, ръ. … дисперсий s, s 2, s . .., и т. д. Каждая выборка имеет свою ошибку репрезентативности. Следовательно, можно построить ряды распределения выборок по величине ошибки репрезентативности для каждого показателя для средней, относительной величины и т.д. В таких распределениях улавливается тенденция к концентрации ошибок около центрального значения. Число выборок с той или иной величиной ошибки репрезентативности может быть симметрично или асимметрично относительно этого центрального значения. При бесконечно большом числе выборок получится кривая частот, которая представляет кривую выборочного распределения. Свойства таких распределений используются для получения статистических заключений, установления вероятности той или иной величины ошибки репрезентативности.  [c.165]

    Фактическая ошибка репрезентативности
     [c.177]

    Фактическая ошибка репрезентативности составляет  [c.177]

    После проведения выборки рассчитывают возможные ошибки выборочных показателей (ошибки репрезентативности), которые используются для оценки результатов выборки и для получения характеристик генеральной совокупности.
     [c.185]

    Так как средняя величина имеет ошибку репрезентативности Ах, то можно считать, что итоговый подсчет в генеральной совокупности находится в пределах
     [c.188]

    Оценку генерального параметра получают на основе выборочного показателя с учетом ошибки репрезентативности. В другом случае в отношении свойств генеральной совокупности выдвигается некоторая гипотеза о величине средней, дисперсии, характере распределения, форме и тесноте связи между переменными. Проверка гипотезы осуществляется на основе выявления согласованности эмпирических данных с гипотетическими (теоретическими). Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу принимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Основой проверки статистических гипотез являются данные случайных выборок. При этом безразлично, оцениваются ли гипотезы в отношении реальной или гипотетической генеральной совокупности. Последнее открывает путь применения этого метода за пределами собственно выборки при анализе результатов эксперимента, данных сплошного наблюдения, но малой численности. В этом случае рекомендуется проверить, не вызвана ли установленная закономерность стечением случайных обстоятельств, насколько она характерна для того комплекса условий, в которых находится изучаемая совокупность.
     [c.193]

    Расхождение между расчетным и действительным значением изучаемых величин называется ошибкой наблюдения. В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности.
     [c.21]

    В отличие от ошибок регистрации ошибки репрезентативности характерны только для несплошного наблюдения. Они возникают потому, что отобранная и обследованная совокупность недостаточно точно воспроизводит генеральную совокупность в целом.
     [c.22]

    Отклонение значения показателя обследованной совокупности от его величины в генеральной совокупности называется ошибкой репрезентативности.
     [c.22]

    Ошибки репрезентативности также бывают случайными и систематическими. Случайные ошибки репрезентативности возникают, если отобранная совокупность неполно воспроизводит совокупность в целом. Величина этих ошибок может быть оценена.
     [c.22]

    Систематические ошибки репрезентативности появляются вследствие нарушения принципов отбора единиц из исходной совокупности, которые должны быть подвергнуты наблюдению. Для устранения ошибок наблюдения необходимо осуществить контроль полученной информации.
     [c.22]

    Поскольку / указывает на вероятность расхождения х-х , т.е. на вероятность того, на какую величину генеральная средняя будет отличаться от выборочной средней, то это может быть прочитано так с вероятностью 0,683 можно утверждать, что разность между выборочной и генеральной средними не превышает одной величины средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ц. С вероятностью 0,954 можно утверждать, что ошибка репрезентативности не превышает 2ц, (т.е. в 95% случаев). С вероятностью 0,997, т.е. довольно близкой к единице, можно ожидать, что разность между выборочной и генеральной средней не превзойдет трехкратной средней ошибки выборки и т.д. Логически связь здесь выглядит довольно ясно чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.
     [c.132]

    Среднее значение удельных приведенных затрат для внутризаводских сетей промышленной канализации на 1 м3 часовой суммарной пропускной способности равно 99,36 руб/м3/ч. Вследствие небольшого объема представленной выборки определили, можно ли пользоваться найденным средним значением, используя для определения ошибки репрезентативности малой выборки критерий t — Стьюдента. .  [c.39]

    Д, , — ошибка репрезентативности выборки, зависящая от уровня доверительной вероятности  [c.147]

    Степень варьирования оценивается дисперсией G 2, а ошибка репрезентативности
     [c.147]

    Разность между результатами выборочного и сплошного наблюдения называется ошибками репрезентативности. На основе применения математики можно заранее рассчитать репрезентативность выборки информации, ее соответствие генеральной совокупности.
     [c.481]

    Предельная ошибка выборки А= Л ц. Доверительное число t показывает, что расхождение не превышает кратную ему ошибку выборки. С вероятностью 0,954 можно утверждать, что разность между выборочной и генеральной не превысит двух величин средней ошибки выборки, т.е. в 954 случаях ошибка репрезентативности не выйдет за 2ц.
     [c.222]

    Ошибки наблюдения подразделяются на два вида ошибки регистрации и ошибки репрезентативности.
     [c.36]

    Ошибки репрезентативности возникают при несплошном обследовании в силу того, что состав отобранной для него части единиц совокупно-
     [c.36]

    Ошибки репрезентативности. Основные проблемы выборочного наблюдения сводятся к тому, что при его применении могут возникать определенные ошибки. Следовательно, аудиторы вынуждены учитывать риски, свойственные выборочному наблюдению, а также знать, как необходимо минимизировать эти риски. Аудиторы называют это риском ошибочного принятия (непринятия) результатов выборки. При этом в аудиторской практике различают риски первого и второго рода для тестов системы контроля и проверки верности оборотов и сальдо по счетам [там же].
     [c.49]

    Главные ошибки, возникающие при выборочном наблюдении, — это ошибки репрезентативности. Аудитор обязан обеспечить представительную (репрезентативную) выборку для данной совокупности. Проявляя должную тщательность в работе, он стремится точно установить и зарегистрировать в своей выборке факты хозяйственной жизни экономического субъекта, остатки по счетам, статьи баланса и т.д., но тем не менее по окончании всех
     [c.49]

    Случайные ошибки репрезентативности. Риск (опасность) возникновения этих ошибок проистекает из собственно случайных обстоятельств (типа арифметических ошибок при отсутствии контроля, описок и т.д.). Но мы сознательно оставляем в стороне и не анализируем здесь тривиальные ошибки наблюдения, которые выражаются, скажем, в описках и которые может допустить любой ассистент аудитора, осуществляющий выборку.
     [c.50]

    Систематические ошибки репрезентативности. Если же аудитор или его ассистент нарушают принцип случайности при отборе, то они рискуют получить систематические ошибки репрезентативности. Например, из всей совокупности дебиторской задолженности аудитор отобрал только просроченную (такой было 10%) и на основании других свидетельств установил, что половина отобранных им остатков по счетам — это задолженность безнадежная. Если на основе такой выборки аудитор будет считать, что безнадежная задолженность составляет 50% всех дебиторов проверяемого экономического субъекта, то скорее всего он глубоко ошибается (она вполне может быть на уровне, близком к 5%), поскольку уровень вероятности появления безнадежной задолженности намного выше именно в просроченной задолженности. Другими словами, аудитор рискует получить подобные погрешности в тех случаях, когда выборочная совокупность недостаточно точно воспроизводит те особенности и пропорции, которые имеются в проверяемой совокупности.
     [c.51]

    Систематические ошибки репрезентативности — это неточности, которые аудитор может получить в процессе статистического выборочного наблюдения по вполне определенным причинам. Такие ошибки могут возникнуть как следствие преднамеренного или непреднамеренного искажения информации. Систематические ошибки репрезентативности тоже могут привести к искажению полученных результатов (как в сторону увеличения, так и в сторону уменьшения), по которым аудитор будет судить о всей проверяемой совокупности. Таким образом, в основе систематических ошибок репрезентативности лежит именно выборка, именно сам несплошной характер наблюдения.
     [c.51]

    Ошибка репрезентативности — разница между результатами выборочного и сплошного наблюдения.
     [c.546]

    Выборочному обследованию свойственна некоторая погрешность в сравнении со сплошным, которая органически присуща вообще любому выборочному наблюдению. Указанная погрешность или ошибка носит название ошибки репрезентативности.
     [c.101]

    Выборочной средней и выборочной доле свойственны, как указано выше, ошибки репрезентативности. Теория выборочного метода дает возможность определить средние этих ошибок.
     [c.102]

    Сравнивая выборочную среднюю с генеральной средней, видим расхождение — 0,8 млн. руб. (11,6—10,8 = = 0,8). Это так называемая ошибка репрезентативности случайного бесповторного отбора.
     [c.106]

    В среднем объем строительно-монтажных работ по этим трестам составил 10,6 млн. руб. Ошибка репрезентативности — 1,0 млн. руб.
     [c.107]

    В среднем по 16 отобранным трестам объем строительно-монтажных работ составил 10,5 млн. руб. Ошибка репрезентативности 1,1 млн. руб.
     [c.108]

    Выше разобраны пять основных способов отбора выборочной совокупности. Каждый из них имеет свою ошибку репрезентативности. Наименьшие ошибки репрезентативности получены при механическом отборе и при случайной выборке и наибольшая — при серийном отборе. В других случаях результаты могут получиться иные. В учебниках по статистике указывается, что теоретически наименьшая ошибка должна наблюдаться при типическом, затем при механическом отборах и случайной выборке. Наибольшая ошибка — при серийном отборе.
     [c.108]

    Практически при пользовании выборочным методом остаются неизвестными ошибки репрезентативности, так как неизвестна бывает генеральная средняя. В связи с этим необходимо теоретически определить возможную величину этой ошибки.
     [c.108]

    Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.
     [c.22]

    Ошибки репрезентативности также могут быть систематическими и случайными. Систематические ошибки репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки — принцип случайности. Случайные ошибки репрезентативности означают, что, несмотря на принцип случайности отбора единиц, все же имеются расхождения между
     [c.22]

    Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности. Ошибки репрезентативности  [c.23]

    При определении ошибки репрезентативности и объема выборки
     [c.16]

    Как видно из приведенных расчетов, метод высшей и низшей точек довольно прост в применении. Его цель состоит в том, чтобы спрогнозировать поведение издержек при изменении деловой активности предприятия. Как и в любом прогнозе, здесь существует некоторая вероятность ошибки. Это связано с тем, что значение двух крайних показателей не всегда имеет репрезентативный характер. Поэтому из расчета следует исключать случайные, нехарактерные данные.
     [c.64]

    Эта величина меньше предельной ошибки выборки, гарантированной с принятой доверительной вероятностью, 0,36 < 0,55. Следовательно, выборка репрезентативна по этому признаку.
     [c.177]

    Ошибки репрезентативности, т.е. расхождения между данными выборочного наблюдения и данными всей совокупности, могут быть получены только при несплошном наблюдении, они про-изводны от самой сути выборочного наблюдения. При этом существуют и, соответственно, аудиторы должны различать две разные группы ошибок репрезентативности случайные и систематические.
     [c.50]

    В среднем объем по этим 16 трестам к = 12,2 млн. руб. Отклонение от генеральной средней — 0,6 млн. руб. (11,6 — 12,2 — — 0,6). Ошибка репрезентативности случайного повторного итоора получилась в данном случае несколько меньше, чем в бесповторпом.
     [c.106]

    Такая же опасность возникает при замене по какой-либо причине единиц, попавших в выборку, другими единицами (например, вместо отобранного домохозяйства, где в момент прихода интервьюера никто не открыл дверь, был проведен опрос в соседней квартире или интервьюер встретил решительный отказ участвовать в опросе и был вынужден пойти на замену домохозяйства). Как отмечает социолог В. И. Паниотто, систематические ошибки представляют собой некоторое постоянное смещение, которое не уменьшается с увеличением числа опрошенных и вызвано недостатками и просчетами в системе отбора респондентов. Если, например, для изучения общественного мнения жителей города в архитектурном управлении получить сведения о жилом фонде и из всех имеющихся в городе квартир отобрать случайным образом 400 квартир, а затем предложить интервьюерам опросить всех, кого они застанут в момент посещения в этих квартирах, то полученные данные не будут репрезентативны. Допущена систематическая ошибка более подвижная часть населения попадает в выборку в меньшей пропорции, а менее подвижная — в большей пропорции, чем в генеральной совокупности. Пенсионеров, например, можно чаще застать дома, чем студентов-вечерников. При увеличении выборки эта ошибка не устраняется если мы проведем опрос в 800 квартирах или даже во всех квартирах города (сплошной опрос), то полученные данные будут репрезентативны для населения, находящегося дома в момент прихода интервьюера, а не для всех жителей города.
     [c.164]

    Понравилась статья? Поделить с друзьями:
  • Величина ошибки выборки при типическом отборе
  • Величина относительной ошибки расчетов равна
  • Величина монумента поразила нас своим величием исправьте ошибки
  • Величина какой ошибки может быть определена расчетным путем
  • Величина допустимой ошибки выборки зависит от чего