Контур выборки неизбежно содержит ошибку

© 2008-2019 PR-агентство «Красное Слово».

Сетевое издание PR-агентство «КРАСНОЕ СЛОВО» / PR-agency «KRASNOE SLOVO» зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) 07 декабря 2018 г. Свидетельство о регистрации СМИ Эл № ФС77-74461.

Учредитель: Горжанкин В.В. Главный редактор: Горжанкин В.В. Адрес электронной почты редакции: [email protected] Телефон редакции: +7 (916) 360 12 12.

Политика персональных данных. Любое использование материалов допускается только при соблюдении правил перепечатки. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции. Отдельные публикации могут содержать информацию, не предназначенную для пользователей до 18 лет.

Генеральная
совокупность
[1] (в
англ. — population)
— совокупность всех объектов (единиц),
относительно которых учёный намерен
делать выводы при изучении конкретной
проблемы.

Генеральная
совокупность состоит из всех объектов,
которые подлежат изучению. Состав
генеральной совокупности зависит от
целей исследования. Иногда генеральная
совокупность — это все население
определённого региона (например, когда
изучается отношение потенциальных
избирателей к кандидату), чаще всего
задаётся несколько критериев, определяющих
объект исследования. Например, мужчины
30-50 лет, использующие бритву определённой
марки не реже раза в неделю, и имеющие
доход не ниже $100 на одного члена семьи.

Выборка или выборочная
совокупность
 —
множество случаев (испытуемых, объектов,
событий, образцов), с помощью определённой
процедуры выбранных из генеральной
совокупности для участия в исследовании.

Характеристики
выборки:

                  Качественная
характеристика выборки – кого именно
мы выбираем и какие способы построения
выборки мы для этого используем.

                  Количественная
характеристика выборки – сколько
случаев выбираем, другими словами объём
выборки.

Необходимость
выборки

                  Объект
исследования очень обширный. Например,
потребители продукции глобальной
компании – огромное количество
территориально разбросанных рынков.

                  Существует
необходимость в сборе первичной
информации.

Объём
выборки

Объём
выборки
 —
число случаев, включённых в выборочную
совокупность. Из статистических
соображений рекомендуется, чтобы число
случаев составляло не менее 30 – 35.

17. Основные способы формирования выборки

Формирование
выборки

прежде всего основывается на знании
контура выборки, под которым понимается
список всех единиц совокупности, из
которого выбираются единицы выборки.
Например, если в качестве совокупности
рассматривать все автосервисные
мастерские города Москвы, то надо иметь
список таких мастерских, рассматриваемый
как контур, в пределах которого формируется
выборка.

Контур
выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от
истинных размеров совокупности. Очевидно,
что не существует полно официального
списка всех автосервисных мастерских
г. Москвы. Исследователь должен
информировать заказчика работы о
размерах ошибки контура выборки.

При
формировании выборки используются
вероятностные (случайные) и невероятностные
(неслучайные) методы.

Если
все единицы выборки имеют известный
шанс (вероятность) быть включенными в
выборку, то выборка называется
вероятностной. Если эта вероятность
неизвестна, то выборка называется
невероятностной. К сожалению, в большинстве
маркетинговых исследований из-за
невозможности точного определения
размера совокупности не представляется
возможным точно рассчитать вероятности.
Поэтому термин «известная вероятность»
скорее основан на использовании
определенных методов формирования
выборки, чем на знании точных размеров
совокупности.

Вероятностные
методы включают в себя:


простой случайный отбор;


систематический отбор;


кластерный отбор;


стратифицированный отбор.

Невероятностные
методы:


отбор на основе принципа удобства;


отбор на основе суждений;


формирование выборки в процессе опроса;


формирование выборки на основе квот.

Смысл
метода отбора на основе принципа удобства
заключается в том, что формирование
выборки осуществляется самым удобным
с позиций исследователя образом, например
с позиций минимальных затрат времени
и усилий, с позиций доступности
респондентов. Выбор места исследования
и состава выборки производится
субъективным образом, например, опрос
покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в
опросе.

Формирование
выборки на основе суждения основано на
использовании мнения квалифицированных
специалистов, экспертов относительно
состава выборки. На основе такого подхода
часто формируется состав фокус-группы.

Формирование
выборки в процессе опроса основано на
расширении числа опрашиваемых исходя
из предложений респондентов, которые
уже приняли участие в обследовании.
Первоначально исследователь формирует
выборку намного меньшую, чем требуется
для исследования, затем она по мере
проведения расширяется.

Формирование
выборки на основе квот (квотный отбор)
предполагает предварительное, исходя
из целей исследования, определение
численности групп респондентов,
отвечающих определенным требованиям
(признакам). Например, в целях исследования
было принято решение, что в универмаге
должно быть опрошено пятьдесят мужчин
и пятьдесят женщин. Интервьюер проводит
опрос, пока не выберет установленную
квоту.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

5. Разработка и реализация плана исследований

5.1 Выбор методов сбора данных

Можно выделить следующие методы сбора данных при проведении опросов с участием интервьюеров или самостоятельном заполнении анкет респондентами:

1. Интервьюирование, осуществляемое на дому у респондента. Возможно предварительное согласование сроков интервью по телефону.

Обычно в этом случае легче установить доверительные отношения с опрашиваемым, возможен показ образцов товара, рекламных материалов и т.п. Домашняя обстановка настраивает на достаточно длительное интервью с высокой степенью концентрации внимания на проводимом обследовании. Однако это дорогой метод сбора данных.

2. Интервьюирование посетителей крупных магазинов. Компании, проводящие такие обследования, могут в крупных магазинах иметь свои офисы. Посетители магазина опрашиваются интервьюером в помещении магазина или могут приглашаться для дачи интервью в офис. C помощью данного метода, без использования специальных методических подходов, трудно обеспечить репрезентативность результатов обследования и вдумчивое отношение опрашиваемых к задаваемым вопросам. По сравнению с первым данный метод является более дешевым.

3. Интервью в офисах. Используется обычно при сборе информации о продукции производственно-технического и офисного назначения. Этот метод, по существу, обладает теми же достоинствами и недостатками, что и первый, однако имеет более высокую стоимость проведения, обусловленную использованием более квалифицированных интервьюеров.

4. Традиционное телефонное интервью. К числу достоинств данного метода сбора данных относятся: относительно низкая стоимость, возможность охватить большое число респондентов и обеспечить высокий уровень репрезентативности, возможность проведения за относительно короткий период времени. Методу присущи следующие недостатки: невозможность что-либо показать респонденту, невозможность получить личное впечатление от встречи с респондентами. (Правда, отсутствие личного контакта порой способствует получению правдивых ответов на вопросы о потреблении алкоголя, противозачаточных средств и т.п.) Далее – трудность получения пространных ответов на большое число вопросов, так как терпение респондента может иссякнуть. Кроме того, трудно проверить качество проведенного интервью и установить, все ли запланированные к опросу респонденты в реальности были им охвачены.

5. Телефонное интервью из специально оборудованного помещения, где одновременно работают несколько интервьюеров, к телефонам которых могут подсоединяться контролеры.

6. Телефонное интервью с помощью компьютера. Многие компании, занимающиеся опросом потребителей, специально оборудованные помещения для телефонного интервьюирования оснащают компьютерной техникой. Эта техника осуществляет автоматический набор телефонных номеров респондентов, далее на мониторе появляется вступительный текст, а затем – последовательно задаваемые вопросы с возможными вариантами ответов. Интервьюер зачитывает респонденту вопросы и с помощью кода фиксирует названный вариант ответа.

7. Полностью компьютеризованное интервью. В данном случае в дополнение к ранее описанному методу респондент отвечает на вопросы путем нажатия на кнопки своего телефона или вопросы появляются на мониторе его компьютера, а респондент вводит ответы, используя обычную компьютерную клавиатуру.

8. Групповое самостоятельное заполнение анкет. Такой подход используется для удобства и удешевления интервьюирования. Например, перед двадцатью-тридцатью членами группы демонстрируется рекламный ролик, после чего они индивидуально отвечают на вопросы анкеты, касающиеся оценки данного ролика. Участниками группы могут быть школьники одного класса, студенты одной учебной группы, отдыхающие дома отдыха и т.д.

9. Самостоятельное заполнение оставленных анкет. Является вариантом обследования на основе самостоятельного заполнения анкет. После предварительного устного разъяснения целей и задач проводимого обследования анкета оставляется у респондента. Заполненную анкету, спустя определенное время, или забирают у респондента, или он отсылает ее по почте в конверте с оплаченным ответом. Данный метод применяется при проведении опросов на ограниченной территории, не требующей от интервьюера значительных передвижений.

10. Обследование по почте. Вопросы и ответы на них посылаются по почте. Достоинства метода обусловлены тем, что не надо нанимать интервьюеров, легкостью формирования групп целевых респондентов, его дешевизной. Этот метод обладает теми же недостатками, что и методы самостоятельного заполнения анкет без участия интервьюера. Кроме того, он характеризуется низким процентом возвращенных ответов, ориентирован в основном на достаточно грамотных людей, проживающих к тому же в странах с эффективной почтовой системой.

Выбор конкретных методов обследований основан на учете следующих групп факторов: цели и ресурсы исследователя; характеристики респондентов; характеристики вопросов, задаваемых исследователем. Кратко охарактеризуем эти три группы факторов.

Цели сбора данных вытекают из целей проводимого маркетингового исследования. В основе их определения лежат требования получения информации желаемого качества. Последнее же обусловлено временем, отпущенным на принятие решения, и имеющимися ресурсами.

К числу наиболее быстро реализуемых методов относятся телефонный опрос и интервьюирование посетителей крупных магазинов. Отсутствие достаточных денежных средств также оказывает влияние на выбор метода сбора данных. Наиболее дешевым методом является телефонное интервьюирование.

Следует рассмотреть, по крайней мере, следующие характеристики целевой группы респондентов, влияющие на выбор метода сбора данных:

1. Процент респондентов, обладающих требуемыми характеристиками в общей совокупности опрашиваемых. Например, если исследуется концепция низкокалорийных продуктов питания, приготавливаемых в микроволновой печи, то в качестве целевых респондентов следует рассматривать домохозяек, имеющих микроволновые печи и которые в течение последних шести месяцев покупали низкокалорийные продукты питания.

2. Желание участвовать в опросе. Исследователя всегда беспокоит высокая степень отказа респондентов в участии в обследовании. Можно выделить два типа причин нежелания принять участие в любом обследовании. Первый обусловлен некими обобщенными чувствами подозрительности и стремлением никого не допускать в свою личную жизнь: определенная категория людей просто не хочет принимать участия в любом опросе. Второй связан со специфическими обстоятельствами проведения конкретного обследования. Например, некоторые респонденты не желают обсуждать определенные темы. Выбранный метод опроса влияет на степень желания участвовать в обследовании, Так, потенциальные респонденты находят более трудным отказаться от участия в личном интервью, чем в почтовом опросе.

3. Возможность принятия участия в опросе. Даже если потенциальный респондент удовлетворяет двум вышеизложенным требованиям, он в силу тех или иных причин может не принять участие в обследовании (командировка, болезнь, неожиданные семейные обстоятельства, забывчивость и т.п.).

Выбор методов сбора данных во многом определяется уровнем сложности вопросов. Существенное влияние на выбор метода сбора данных оказывает степень затрагивания личных интересов, взглядов, морально-этических аспектов Опыт изучения данных проблем говорит о том, что здесь менее всего подходит персональное интервью, а чаще всего наиболее приемлемым является телефонное интервью или интервью с помощью компьютера.

5.2 Вопросник и порядок его разработки

Главными инструментами реализации методов наблюдения и опроса являются анкета (вопросник) и механические устройства, например счетчики количества людей, кино- и видеокамеры. Далее будет чаше использоваться термин “вопросник”, поскольку он носит более общий характер – анкета применяется только при письменных ответах на поставленные вопросы.

Обычно процесс составления вопросника осуществляется в следующей последовательности:

  1. Определение целей опроса.
  2. Выбор методов сбора данных.
  3. Разработка вопросов.
  4. Оценка вопросов.
  5. Одобрение со стороны клиента.
  6. Тестирование.
  7. Уточнение анкет.

Определение целей опроса и выбор методов сбора данных были рассмотрены ранее. Ниже дается описание процесса непосредственного составления вопросника. Этот процесс носит итеративный характер и направлен на последовательное уточнение содержания вопросника, повышение вероятности получения достоверных ответов, исключение влияния содержания вопросов и их формата на получаемые ответы.

Вопросник обычно состоит из трех частей: введения, реквизитной части и основной части.

Главная задача введения– убедить респондента принять участие в опросе. Оно должно содержать цель проводимого опроса и призвано показать, какую пользу получит респондент, приняв в нем участие.

В реквизитной частиприводится информация, касающаяся респондентов. Кроме того, здесь идентифицируется сам вопросник, то есть ему дается название, указываются дата, время и место проведения опроса, фамилия интервьюера.

При разработке основной частивопросника следует обратить внимание на: тип вопросов (формат ответов), их содержание и число, последовательность представления вопросов в анкете, наличие контрольных вопросов.

Существуют три основных формата задаваемых вопросов: открытые вопросы, закрытые вопросы и вопросы со шкалой ответов.

Открытый вопрос– вопрос анкеты, позволяющий опрашиваемому отвечать на него “своими словами”. В таких вопросах отсутствует предвзятость, стремление навязать определенный ответ. Однако ответы на открытые вопросы требуют достаточно больших затрат времени. Кроме того, полученные ответы могут быть интерпретированы по-разному.

Закрытый вопросвключает все возможные варианты ответов, из которых опрашиваемый делает свой выбор. Использование данного типа вопросов активизирует деятельность респондентов по заполнению анкет, облегчает процесс ввода полученных данных. Главный недостаток вопросов с многовариантным выбором обусловлен трудностью формулирования всех возможных вариантов ответов, характеристик или факторов.

Вопросы со шкалой ответов содержат четкие, возможно количественные, дескрипторы, определяющие отдельные градации шкалы или ее конечные точки. На таких принципах, например, построены шкалы Лайкерта и семантической дифференциации.

Что касается метода сбора данных, то очевидно, что, скажем, телефонное интервью предполагает использование относительно простых вопросников по сравнению с опросами, проводимыми по почте.

Определяя содержание вопросов, необходимо учесть следующие обстоятельства.

Вопрос должен быть сфокусирован на одной проблеме или теме, быть кратким и понятным. Все респонденты должны понимать заданный вопрос однозначно и отвечать именно на него, а не на свои варианты его домысливания. Вопросы следует формулировать в нейтральной тональности, без некоей положительной или отрицательной оценки рассматриваемой проблемы, не должны склонять респондента к ответу, желаемому для исследователя.

При определении числа вопросов следует руководствоваться тезисом: чем их меньше, тем больше шансов получить на них ответы.

Желательно, чтобы вопросы излагались в определенной логической последовательности. Вначале следует задать вопросы, с помощью которых можно определить уровень компетентности респондентов в области проводимого исследования. Дальнейшие вопросы должны служить целям “разминки” респондентов. Эти вопросы должны быть относительно простыми, легкими для ответов, а кроме того, заинтересовывать опрашиваемых, показать им, что они легко справятся с ответами. За разминочными следуют основные вопросы.

Наиболее трудные вопросы, требующие для ответа использования специальных шкал и достаточных умственных усилий, рекомендуется ставить в середине или ближе к концу анкеты.

Вопросы, носящие чрезмерно личный характер (“Чистите ли Вы зубы каждый день?” “Часто ли Вы на своем автомобиле превышаете допустимую скорость?”), обычно помещаются среди “невинных” вопросов.

Описанное выше носит характер общих рекомендаций. Однако существуют, по крайней мере, два специальных подхода к проектированию вопросников: туннельный и секционный.

При использовании туннельного подходаимеет место постепенный переход от широких, общих вопросов к более узким, частным.

Секционный подходзаключается в том, что последовательно рассматриваются вопросы по отдельным темам, до их полного исчерпания.

На практике зачастую используется комбинация рассмотренных подходов.

Опрос может носить анонимный и конфиденциальный характер.

В первом случае респондент должен быть уверен, что его имя и другие реквизиты не будут известны исследователям. Во втором случае предполагается, что имя респондента известно только исследователю, но отнюдь не заказчику данного обследования. В телефонном опросе и при опросах, связанных с присутствием интервьюеров, опрос носит только конфиденциальный характер.

5.3 Рассмотрим понятия выборочных исследований

Рассмотрим основные понятия, используемые при проведении выборочных исследований.

Вся исследуемая группа в целом, например все потребители, купившие какой-нибудь продукт, в статистике называется генеральной совокупностьюили просто совокупностью. Иногда совокупность является достаточно малой по своей численности и можно изучить всех ее членов. Обычно же это сделать невозможно. Следовательно, проводится изучение только части совокупности, называемой выборкой.

Выборка является базовым уровнем проводимых исследований.

Необходимо отметить, что данные, полученные от выборки, скорее всего не будут в точности соответствовать данным, которые можно было бы получить от всех единиц совокупности. Различие между данными, полученными от выборки и истинными данными, называется ошибкой выборки. Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки. Эти вопросы будут рассмотрены ниже.

Формирование выборки основывается прежде всего на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области.

При формировании выборки используются вероятностные (cлучайные) и невероятностные (неслучайные) методы.

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности нельзя точно рассчитать вероятности. Поэтому термин “известная вероятность” скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.

Простой случайный отборпредполагает, что вероятность быть включенным в выборку известна и является одинаковой для всех единиц совокупности. Вероятность эта определяется отношением объема выборки к размеру совокупности.

Простой случайный отбор может осуществляться с помощью следующих методов: формирование выборки вслепую и с помощью таблицы случайных чисел.

При использовании метода формирования выборки вслепую единицы совокупности в соответствии с их фамилиями, названиями или другими признаками вносятся в карточки, которые в перемешанном виде помещаются в какую-то непрозрачную емкость (ящик, коробку и т.п.). Из данной емкости кто-то случайным образом вытягивает число карточек, определяемое объемом выборки.

В таблицах случайных чисел содержатся числа, порядок включения которых в таблицу осуществлен случайным образом. Единицам совокупности присваивают порядковые номера. В таблице случайных чисел выбирают любую начальную точку и, двигаясь в произвольном направлении и произвольно меняя направление движения, выбирают необходимое количество номеров из числа присвоенных, равное заранее установленному объему выборки.

Кроме того, используются генераторы случайных чисел. Например, при телефонном интервьюировании компьютер, имеющий генератор случайных чисел, может генерировать случайным образом телефонные номера.

Начальная часть метода систематического отборасоответствует начальному этапу проведения метода простого случайного отбора: необходимо получить полный список единиц генеральной совокупности. Однако далее вместо присвоения им порядковых номеров используется показатель “интервал скачка”, рассчитанный как отношение размера совокупности к объему выборки. Например, если используется телефонный справочник и интервал скачка определен равным 250, то это означает, что каждый 250-й телефонный номер включается в выборку. Однако для определения начальных страницы и колонки справочника используются случайные числа.

Особенно широко метод систематического отбора применяется, когда для различных видов совокупностей существуют различные справочники, списки, спецификации и иные подобные материалы.

Другим методом вероятностного отбора является кластерный отбор, основанный на делении совокупности на подгруппы, каждая из которых представляет совокупность в целом. Базовая концепция данного метода очень похожа на базовую концепцию метода систематического отбора, однако реализация этой концепции осуществляется по-другому.

Предположим, что исследуется мнение населения какого-то региона относительно марки какого-либо товара. Регион разбивается на четко определяемые части (кластеры), например области. Исследователь может считать, что выделенные кластеры являются идентичными и мнение населения этих областей характерно для региона в целом. Далее одна из областей (один кластер) выбирается случайным образом, определяется совокупность для этой области, в ней проводится соответствующее исследование, а выводы распространяются на совокупность всего региона (одноступенчатый подход).

В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик, – говоря иными словами, что каждая выборка достаточно полно характеризует всю совокупность и различные крайности в выборке уравновешивают друг друга. Однако такая ситуация на практике встречается крайне редко. Скажем, исследуется рыночный потенциал определенного региона для какого-то товара, но и население больших, средних и малых городов, сельской местности данного региона различается по уровню образования, доходу, образу жизни и т.п.

В случае несимметричного распределения совокупности последняя подразделяется на различные подгруппы (страты), например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит название стратифицированного отбора. Далее для каждой страты с помощью случайного отбора формируется выборка.

При применении невероятностных методов отбора формирование выборки осуществляется без использования понятий теории вероятности, вследствие чего невозможно рассчитать вероятность включения в выборку единицы совокупности.

Кратко охарактеризуем следующие невероятностные методы отбора: отбор на основе принципа удобства, отбор на основе суждений, формирование выборки в процессе обследования и формирование выборки на основе квот.

Смысл метода отбора на основе принципа удобствазаключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например, с позиций минимальных затрат времени и усилий, с позиции доступности респондентов.

Формирование выборки на основе сужденийосновано на использовании мнений квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

Формирование выборки в процессе обследования основано на расширении числа опрашиваемых на основе предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется в проводимом исследовании, затем она по мере проведения обследования расширяется.

Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования принимается решение, что в универсаме должно быть опрошено пятьдесят мужчин и пятьдесят женщин, и интервьюер проводит опрос, пока не выберет установленную квоту.

На практике имеет место одновременное использование нескольких методов формирования выборки.

5.4 Этапы разработки выборочного плана

Рассмотренные выше понятия встраиваются в определенную логическую последовательность отдельных шагов (этапов) по разработке выборочного плана, целью которого является получение конечного варианта выборки. Можно выделить следующие обобщенные этапы разработки выборочного плана:

  1. Определение соответствующей совокупности.
  2. Получение “списка” совокупности.
  3. Проектирование выборочного плана.
  4. Достижение нужного объема выборки или ее переформирование.

Кратко охарактеризует отдельные этапы разработки выборочного плана.

На первом этапе определяется совокупность исходя из целей исследования.

На втором этапе устанавливается, откуда может быть получен перечень единиц совокупности, – это нужно для определения контура выборки. На данном этапе также необходимо оценить ошибку контура выборки.

На третьем этапе с учетом ранее выполненных работ осуществляется проектирование самой выборки. Здесь необходимо найти баланс между структурой выборки, затратами на сбор данных и объемом выборки, а также в деталях обсудить выборочные методы.

Достижение нужного объема выборки осуществляется в два этапа. Прежде всего устанавливается единица выборки, затем, исходя из этой единицы, должна быть получена требуемая информация. Однако очевидно, что на ряд выбранных респондентов в силу тех или иных причин невозможно выйти и что не каждый выбранный респондент выразит желание отвечать на вопросы. Возникает проблема замены респондентов, которая может быть решена с помощью трех методов: выбор следующего по списку респондента (например, следующего номера в телефонном справочнике), использование первоначальной выборки больших размеров и формирование повторной выборки. В последнем случае, если процент ответов оказался намного ниже, чем ожидалось, контуры исходной выборки расширяются за счет дополнительных имен, найденных, скажем, случайным образом.

Переформирование выборки осуществляется тогда, когда проверка показала, что выборка не представляет совокупность в целом. В этом случае выбираются новые респонденты, и они добавляются к ранее использованной выборке, пока не достигается удовлетворительный уровень репрезентативности.

В реальности решение об объеме выборки является компромиссом между теоретическими предположениями о точности результатов обследования и возможностями их практической реализации – прежде всего имеются в виду затраты на проведение опроса.

На практике используется несколько подходов к определению объема выборки. Прежде всего опишем наиболее простые.

Произвольный подход основан на применении “правила большого пальца”. Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5% от совокупности. Данный подход является простым и легким в исполнении, однако при его применении не представляется возможным установить точность полученных результатов. При достаточно большой совокупности он к тому же может быть и весьма дорогим.

Объем выборки может быть установлен исходя их неких заранее оговоренных условий. Скажем, заказчик маркетингового исследования знает, что при изучении общественного мнения выборка обычно составляет 1000-1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры.

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать, и очевидно, что ценность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.

Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема выборки исходя из определенных требований к надежности и достоверности получаемых результатов.

Наиболее теоретически обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в основе которых лежит ряд базовых понятий математической статистики (вариация, среднее квадратическое отклонение, доверительный интервал, средняя квадратическая ошибка). Краткое описание данных понятий приводится в приложении.

На основе этих понятий с учетом ряда предположений выводятся формулы расчета объема выборки. Все формулы для расчета объема выборки предполагают, что репрезентативность гарантируется путем использования корректных вероятностных процедур формирования выборки. (Более подробную информацию по данным вопросам можно получить из работ [2, 3, 4].)

5.5 Организация и проведение сбора данных

Существуют по крайней мере три альтернативных подхода к сбору данных: осуществлять это самим, осуществлять путем создания специальной группы или путем привлечения коммерческих компаний, специализирующихся на сборе данных.

В первом случае сотрудники маркетинговой службы организации своими силами производят сбор данных – скажем, путем интервьюирования.

Специальная группа обычно комплектуется из специалистов не очень высокой квалификации, например студентов, для проведения телефонного или персонального интервьюирования.

Услуги специализированных компаний, осуществляющих маркетинговые исследования, в большинстве случаев обеспечивают быстрое и качественное получение маркетинговых данных. Однако стоимость их услуг в три-пять раз превышает стоимость других двух подходов к сбору данных. Поэтому ее необходимо сопоставлять с качеством и надежностью получаемой информации.

Большое значение имеет правильное проведение сбора данных. При личном интервьюировании необходимо представиться и сказать несколько слов о проводимом исследовании. При использовании анкеты данная информации должна содержаться в ее вводной части. Следует подчеркивать конфиденциальность ответов. Скажите, сколько времени займет опрос. Не начинайте с вопросов о доходах и других вопросов личного характера. Помогайте респонденту разобраться в сложных вопросах.

При сборе данных могут иметь место многие погрешности – другие, нежели ошибки выборки, называемые поэтому невыборочными ошибками.

Невыборочные ошибки включают: 1) типы ошибок, обусловленные тем, что не все респонденты дали ответы; 2) ошибки сбора данных; 3) ошибки обращения с полученными данными; 4) ошибки анализа собранных данных; 5) ошибки интерпретации полученных результатов. Кроме того, существуют ошибки, обусловленные нечетким выявлением проблем, использованием неоднозначных терминов, и т.п.

Невыборочные ошибки можно классифицировать на ошибки лиц, осуществляющих сбор данных, и ошибки респондентов. Кроме того, невыборочные ошибки подразделяются на преднамеренные и на непреднамеренные.

Преднамеренные ошибки лица, собирающего информацию, имеют место, когда оно сознательно нарушает установленные исследователем требования к сбору данных.

Непреднамеренная ошибка лица, собирающего информацию, главным образом определяется неправильным пониманием интервьюером отдельных аспектов сбора данных, изложенных в различных инструкциях, хотя ему и кажется, что он все делает правильно.

Существуют два вида преднамеренных ошибок респондентов.

Первый вид обусловлен стремлением респондента фальсифицировать свои ответы вследствие определенного замешательства, нежелания отвечать на персональные вопросы (об уровне дохода, о национальности, возрасте, семейном положении и т.п.), из-за подозрения, что интервьюер преследует какие-то свои цели.

Второй вид обусловлен отказом респондента отвечать на вопросы из-за своей занятости, нежелания открывать личные аспекты своей жизни, предубежденности к опросам.

Непреднамеренная ошибка респондента возникает в случае, когда респондент, думая, что говорит правду, на самом деле дает ошибочный ответ.

Контроль за преднамеренными ошибками интервьюеров осуществляется двумя способами: путем надзора за их работой и путем проверки выполненной работы. Надзор осуществляется, например, незаметным подключением к телефонной линии, по которой берется интервью. При устном интервьюировании интервьюера может сопровождать проверяющее лицо.

Контроль за преднамеренными ошибками респондентов направлен на снижение числа случаев лжи и отказа участвовать в обследовании. Для этого прежде всего необходимо сохранять анонимность и конфиденциальность.

Контроль за непреднамеренными ошибками респондентов осуществляется в различных формах. Необходимо тщательно составлять вопросники и инструкции к ним, использовать разнонаправленные шкалы измерений. Для уменьшения числа ответов-предположений в шкалы вводятся такие градации, как “не имею мнения”, “не могу вспомнить”, “не уверен”.

Можно выделить три типа ошибок, обусловленных нежеланием респондентов отвечать на вопросы: из-за отказа вообще принять участие в обследовании, из-за прекращения участия в нем и из-за отказа отвечать на определенные вопросы.

Перед тем как табулировать и анализировать данные проведенного обследования, целесообразно произвести их предварительную проверку и выявить ошибки респондентов. Жестких правил в данной области не существует, и они основаны на традициях, опыте и т.п., то есть на неформальных подходах к определению, какие анкеты пригодны для последующего анализа, а какие нет. Поэтому лучше ужесточить контроль за сбором анных, уменьшив таким образом проблемы предварительной оценки собранных данных.

5.6 Анализ данных и подготовка заключительного отчета

Анализ данных начинается с перевода полученных “сырых” сведений в осмысленную информацию и включает их введение в компьютер, проверку на предмет выявления ошибок, кодирование, представление в матричной форме (табулирование). Обычно закодированные исходные данные представляются в виде матрицы, столбцы которой содержат ответы на различные вопросы анкеты, а ряды – респондентов или изучаемые ситуации. Все это называется преобразованием исходных данных.

Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов.

Выделяют пять основных видов статистического анализа, используемых при проведении маркетинговых исследований: дескриптивный анализ, выводной анализ, анализ различий, анализ связей и предсказательный анализ. Иногда эти виды анализа используются по отдельности, иногда – одновременно.

В основе дескриптивного анализалежит использование двух групп статистических мер. Первая включает меры “центральной тенденции”, или меры, которые описывают типичного респондента или типичный ответ (средняя величина, мода, медиана). Вторая включает меры вариации, или меры, описывающие степень схожести или несхожести респондентов или ответов относительно “типичных” респондентов или ответов (распределение частот, размах вариации и среднее квадратическое отклонение).

Существуют и другие описательные меры, например меры асимметрии (насколько найденные кривые распределения отличаются от нормальных кривых распределения). Однако они используются не столь часто, как вышеупомянутые, и не представляют особого интереса для заказчика.

Анализ, в основе которого лежит использование статистических процедур (например, проверка гипотез) с целью обобщения полученных результатов на всю совокупность, называется выводным анализом. Вывод является видом логического анализа, направленного на получение общих заключений о всей совокупности на основе наблюдений за малой группой единиц данной совокупности.

Выводы делаются на основе анализа малого числа фактов. Например, если два ваших товарища, имеющие одну и ту же марку автомобиля, жалуются на его качество, то вы можете сделать вывод о низком качестве данной марки автомобиля в целом.

Статистический же вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В данном случае результаты выборочных исследований являются только отправной точкой для получения общих выводов. Например, автомобилестроительная компания провела два независимых исследования с целью определения степени удовлетворенности потребителей своими автомобилями. Первая выборка включала 100 потребителей, купивших данную модель в течение последних шести месяцев. Вторая выборка включала 1000 потребителей. В ходе телефонного интервьюирования респонденты отвечали на вопрос: “Удовлетворены или не удовлетворены вы купленной вами моделью автомобиля?” Первый опрос выявил 30% неудовлетворенных, второй – 35%.

Поскольку существуют ошибки выборки и в первом, и во втором случаях, то здесь можно рассуждать следующим образом. Для первого случая около 30% опрошенных выразили неудовлетворенность купленной моделью автомобиля, для второго случая – около 35% опрошенных. Какой же общий вывод можно сделать в данном случае? Как избавиться от слова “около”? Для этого введем показатель ошибки: 30% + x% и 35% + y% и сравним x и y. Используя логический анализ, можно прийти к заключению, что бо2льшая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потребителей. Видно, что решающим фактором для получения правильных выводов является размер выборки. Данный показатель присутствует во всех формулах, определяющих содержание различных методов статистического вывода.

Анализ различийиспользуется для сравнения результатов исследования двух групп (двух рыночных сегментов) с целью определения степени реального различия в их поведении, в реакции на одну и ту же рекламу и т.п.

Проверка существенности различий заключается в сопоставлении ответов на один и тот же вопрос, полученных для двух

Автор: Голубков Е.П.,
академик Международной академии информатизации,
д.э.н., профессор АНХ при Правительстве РФ
Источник: Опубликовано в журнале “Маркетинг в России и за рубежом” №1 за 2001

1. Методология маркетинговых исследований

Тема Процедура выборки

2. Вопросы лекции

Основные понятия, используемые при проведении
выборочных исследований. Генеральная совокупность.
Выборка. Контур выборки. Единица и объем выборки.
Ошибка выборки.
Проблемы формирования выборки
Репрезентативность выборки.
Типы выборок. Виды вероятностной выборки. Виды
невероятностной выборки.
Комбинация типов выборки при проведении
исследования. Многоступенчатая выборка.
Этапы разработки выборочного плана. Подходы к
определению объема выборки. Ошибка выборки.

3. Почему появляются выборки?

Для маркетинговых целей
в целях экономии времени
и средств весьма типично
подвергать исследованию
лишь небольшую часть
той группы людей или
предприятий
(генеральной
совокупности), которая
представляет интерес для
исследователей.
Она обычно составляет
несколько сотен, иногда
тысячу объектов.

4. Суть выборочного метода

Суть выборочного метода заключается в том, что
по определенным правилам из общей
численности генеральной совокупности
отбирается ограниченное число единиц, которое
призвано в качестве своеобразной модели
воспроизводить структуру всей генеральной
совокупности
Генеральная совокупность — та часть объекта
исследования, которая локализована по времени
и территориально, и на нее распространяются
все выводы исследования

5. Примеры генеральных совокупностей:

Все жители Нижнего Новгорода (1267760 человек
по данным 2015 года)
Юридические лица России (2,2 млн. на начало
2008 года)
Розничные торговые точки, осуществляющие
продажу продуктов питания (20 тысяч на начало
2008 года) и т.д.

6. Выборка. Контур выборки

Ограниченное число единиц, выбранное из
генеральной совокупности (равно как и процедура по
их определению) именуется выборкой.
Контур выборки – это наличие полного списка всех
элементов генеральной совокупности.
Контур выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от истинных
размеров совокупности.
Пример: Очевидно, что не существует полного официального списка всех
автосервисных мастерских города Москвы, включая полулегальный и
нелегальный бизнес в данной области. Исследователь должен
информировать заказчика работы о размерах ошибки контура выборки.

7.

8. Итак, основные понятия:

Генеральная совокупность – вся группа, про
которую необходимо собрать информацию;
Выборка – часть совокупности, базовый уровень
исследования;
Ошибка выборки – разница между полученными
данными и фактическими по совокупности;
Контур выборки – все единицы совокупности, из
которых будет формироваться выборка;
Ошибка контура выборки – степень отклонения
контура выборки от генеральной совокупности;
Единица выборки – объект исследования

9. Три главные проблемы формирования выборки

Прежде всего, исходя из сути рассматриваемой
задачи, необходимо определить, кто является
единицей выборки.
Очень важным является также определение
контура выборки.
В целях выполнения правила репрезентативности
проводимого исследования необходимо обратить
внимание на метод, с помощью которого
выбираются единицы выборки
И наконец, необходимо решить вопрос об объеме
выборки, который определяет число изучаемых
единиц выборки.

10. Репрезентативность выборки

Цель отбора объектов в состав выборки всегда
состоит в получении такой совокупности, которая
по своим качествам репрезентирует ту, которую мы
намереваемся изучить
Под репрезентативностью в маркетинговых
исследованиях понимают такие свойства выборки,
которые позволяют ей выступать на момент опроса
моделью, представителем генеральной
совокупности.
Важно понимать, что репрезентативность выборки и
ошибка выборки – разные явления. Репрезентативность,
в отличие от ошибки никак не зависит от размера
выборки

11. Репрезентативность выборки

Одна и та же выборка может быть репрезентативной
и нерепрезентативной для разных генеральных
совокупностей
Пример:
— Выборка, целиком состоящая из москвичей,
владеющих автомобилем, не репрезентирует все
население Москвы.
— Выборка из российских предприятий численностью
до 100 человек не репрезентирует все предприятия
России.
— Выборка из москвичей, совершающих покупки на
рынке, не репрезентирует покупательское поведение
всех москвичей.

12. Репрезентативность выборки

В то же время, указанные выборки (при
соблюдении прочих условий) могут отлично
репрезентировать москвичей-автовладельцев,
небольшие и средние российские
предприятия и покупателей, совершающих
покупки на рынках соответственно.
Как бы мы не увеличивали количество
опрошенных москвичей-автовладельцев, мы
не сможем репрезентировать этой выборкой
всех москвичей.

13. Группы выборочных методов (типы выборки)

Вероятностная выборка (случайная) –
это такая выборка, для которой каждый
элемент генеральной совокупности имеет
определенную, заранее заданную
вероятность быть отобранным.
Это позволяет исследователю рассчитать,
насколько правильно выборка отражает
популяцию, из которой она спроектирована
(рассчитать ошибку выборки).

14. Неслучайная (невероятностная) выборка Еще одно название -детерминированная

Неслучайная (невероятностная)
выборка – это такой способ отбора
единиц, при котором мы не можем заранее
рассчитать вероятность каждого элемента
попасть в состав выборочной
совокупности.
Данный тип выборки не дает возможности
рассчитать, насколько правильна
(репрезентативна) выборка
Иногда по условиям исследования
оказывается единственно возможным
провести неслучайную выборку.

15.

16. Метод простого случайного отбора

Метод простого случайного отбора
предполагает, что вероятность быть избранным в
выборку известна и является одинаковой для всех
единиц совокупности. Для этого используется:
— Лотерейный метод (жребия)
— Таблицы случайных чисел
Главное условие осуществления вероятностной
выборки – наличие полного списка (контура) всех
элементов генеральной совокупности.
Использование простого случайного отбора
гарантирует, что каждая единица совокупности
известна и имеет равные шансы быть включенной
в выборку.

17. Лотерейный метод (жребия)

При использовании лотерейного метода
(или метода жребия) жетоны с номерами
всех элементов помещают в урну,
тщательно перемешивают и извлекают
последовательно n жетонов, где n – число
элементов выборочной совокупности.
Элементы генеральной совокупности,
имеющие номера оказавшиеся на
извлеченных жетонах, будут составлять
выборочную совокупность.

18. Фрагмент таблицы случайных цифр

37
52
35
15
04
80
44
83
21
28
31
42
46
72
13
20
07
99
95
64
13
06
27
29
10
16
69
93
39
08
09
38
00
84
65
56
09
29
67
19

19. Комментарий к использованию таблицы случайных цифр

Если мы имеем, скажем, популяцию (то есть генеральную
совокупность) из 1507 элементов и хотим спроектировать выборку
численностью 150 элементов, мы можем выбирать любые два
смежных столбца в таблице случайных чисел: цифры, стоящие в
двух смежных ячейках будут образовывать четырехзначное число.
Каждый раз, когда будет появляться число от 0001 до 1507, мы
будем считать, что оно обозначает номер отбираемого элемента.
Когда число появляется более чем один раз, этот номер
игнорируется после первого раза.
Если мы начнем с первых четырех столбцов в таблице, спускаясь
по столбцам, то в выборку будут включены элементы под номерами
0799, 1016, 0084, 480, 1306, 929, 1320 и 938.
Поскольку мы не стремимся умышленно отыскать определенное
число, мы можем начать с любого места таблицы и использовать
любую систему для движения по таблице.
С тем же успехом случайные числа могут генерироваться
специальной программой компьютера.

20. Метод систематической (или механической) выборки

На практике чаще всего
используют метод
систематической (или
механической) выборки,
когда из
пронумерованного списка
через равные интервалы k
отбирается заданное число
респондентов. При этом
шаг выборки k (интервал
скачка) рассчитывается по
простой формуле:
N
k
n
где N – численность
генеральной совокупности
n – численность
выборочной совокупности.

21. Пример систематической (или механической) выборки

Предположим, что нам нужно спроектировать выборку
численностью 100 из списка 5000 студентов какого-то вуза.
Если мы намерены использовать систематическую выборку, то
должны вначале рассчитать интервал выборки делением числа
элементов в списке на размер выборки.
В данном случае, разделив общую численность студентов 5000 на
требуемый размер выборки 100 единиц, мы получим интервал
(шаг) выборки 50.
Далее будем систематически двигаться по списку и отбирать
каждого пятидесятого студента (отобрав таким образом 100 имен).
Определение того места в списке, с которого мы начнем,
проводится случайным образом, по таблице случайных чисел
(это называется случайный старт).
Таким образом, если случайно выбрана точка старта под номером
31, то в выборку будут включены студенты, стоящие под номерами
31, 81, 131, 181 и т.д.

22. Метод кластерного отбора. (гнездовая или серийная выборка)

Метод кластерного отбора основан на
делении совокупности на подгруппы, каждая
из которых представляет совокупность в
целом.
Здесь отбираются не объекты исследования
(например, люди), а группы. Группы отбираются
случайным образом, а внутри них проводится
сплошной опрос. Например, в ВУЗе с большим
количеством студенческих групп отбор можно
проводить путем случайного отбора этих групп и
дальнейшего сплошного опроса в этих группах

23. Пример кластерного отбора

Предположим, что исследуется мнение населения
какого-то региона относительно марки какого-то товара.
Регион разбивается на четко определяемые части
(кластеры), например области.
Исследователь может считать, что выделенные кластеры
являются идентичными и мнение населения этих
областей характерно для региона в целом.
Далее одна из областей (один кластер) выбирается
случайным образом, определяется совокупность для
этой области, в ней проводится соответствующее
исследование, а выводы обобщаются на совокупность
всего региона

24. Причины появления стратифицированного отбора (типической или районированной выборки)

В основе всех вероятностных методов лежит
предположение, что любая совокупность характеризуется
симметричным распределением ее ключевых
характеристик. Другими словами, каждая выборка
достаточно полно характеризует всю совокупность,
различные крайности в выборке уравновешивают друг
друга.
Но такая ситуация на практике встречается крайне редко.
Скажем, исследуется рыночный потенциал определенного
региона для какого-то товара. Население больших, средних
и малых городов, сельской местности данного региона
отличается по уровню образования, дохода, образу жизни
и т.п. В таком случае необходим стратифицированный
отбор

25. Понятие стратифицированной выборки

При наличии в составе генеральной
совокупности различных типов явлений с
разными уровнями изучаемых признаков
организуют стратифицированную выборку,
чтобы обеспечить более равномерное
представительство в выборочной совокупности
различных частей (типов) явления.
Генеральная совокупность разделяется на различные
подгруппы (страты), например по уровню доходов, и
выборки формируются из этих подгрупп, по сути
дела являющихся сегментами рынка.

26. Условия осуществления стратифицированной выборки

При использовании данного метода прежде всего
следует выбрать некоторую наблюдаемую
характеристику (признак), характеризующую каждую
единицу совокупности, например уровень дохода.
Далее для каждой страты с помощью случайного
отбора формируется выборка.
Стратифицированная выборка может быть применена
лишь при наличии дополнительной информации о
генеральной совокупности (например, нам необходимо
процентное соотношение мужчин и женщин, в случае,
если мы хотим стратифицировать выборку по полу).
Отсутствие такой информации делает применение
стратифицированной выборки невозможным

27. Методы (типы) невероятностной выборки

Отбор в такой выборке осуществляется не по
принципам случайности, а по субъективным
критериям – доступности, типичности,
равного представительства и т.д.
При применении невероятностных методов
отбора формирование выборки
осуществляется без использования понятий
теории вероятностей, вследствие чего
невозможно рассчитать вероятность
включения в выборку единицы
совокупности.

28. Нерепрезентативный отбор. Метод стихийной выборки: отбор на основе удобства и доступности

Смысл метода заключается в том, что
формирование выборки осуществляется
самым удобным с позиций исследователя
образом, например, с позиций минимальных
затрат времени и усилий, с позиции
доступности респондентов.
Выбор места исследования и состава выборки
производится субъективным образом, например,
опрос покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в опросе.

29. Метод экспертного отбора (на основе суждения)

Метод основан на использовании мнения
квалифицированных специалистов, экспертов
относительно состава выборки. На основе такого
подхода часто формируется состав фокус-группы.
Например, изучается потребность в издании
кулинарной книги для приготовления в
микроволновой печи низкокалорийной пищи. На
основе мнения исследователей в состав фокусгруппы было включено 12 домохозяек; шестеро из
них владело микроволновыми печами более трех
лет, трое — менее трех лет и трое только
собирались их купить.

30. Метод квотной выборки

Формирование выборки на основе квот
(квотный отбор) предполагает
предварительное, исходя из целей
исследования, определение состава и
численности групп респондентов, отвечающих
определенным требованиям (признакам).
Например, мужчины в возрасте 20-30 лет, 31-45
лет и 46-60 лет; лица с доходом до 30 тысяч
рублей, с доходом от 30 до 60 тысяч рублей и с
доходом свыше 60 тысяч рублей)

31. Метод квотной выборки

Для каждой группы задается количество объектов,
которые должны попасть выборку и быть обследованы.
Количество объектов, которые должны попасть в
каждую из групп, задается, чаще всего, либо
пропорционально заранее известной доле группы в
генеральной совокупности, либо одинаковым для
каждой группы.
Внутри групп объекты отбираются произвольно.
Квотные выборки используются в маркетинговых
исследованиях достаточно часто

32. Пример квотной выборки

Приведем пример расчета выборки по
таким параметрам квоты как пол и возраст.
В одном из маркетинговых исследований
при опросе населения, исследователи
опирались на данные Областного комитета
по статистике о половозрастной структуре
населения районов города.
Так, половозрастная структура населения
Советского района Нижнего Новгорода
выглядела следующим образом:

33.

Генеральная совокупность
численность
Выборочная
совокупность
Доля, %
число
Всего
муж.
жен.
муж.
жен.
всего
муж.
жен.
всего
128546
55757
72789
43,4
56,6
100,00
521
679
1200
20 — 24
11958
6009
5949
50,3
49,7
9,30
56
56
112
25 — 29
11858
6520
5338
55,0
45,0
9,22
61
50
111
30 — 34
12093
5861
6232
48,5
51,5
9,41
55
58
113
35 — 39
14360
6795
7565
47,3
52,7
11,17
63
71
134
40 — 44
14112
6598
7514
46,8
53,2
10,98
62
70
132
45— 49
12779
5840
6939
45,7
54,3
9,94
55
65
119
50 — 54
7274
3222
4052
44,3
55,7
5,66
30
38
68
55 — 59
11981
5035
6946
42,0
58,0
9,32
47
65
112
60 — 69
17503
6828
10675
39,0
61,0
13,62
64
100
163
70 и старше
14628
3049
11579
20,8
79,2
11,38
28
108
137
Основа выборки
Возраст (лет)

34. Пример квотной выборки

Изучая данные таблицы, нетрудно убедиться, что
численность каждой из половозрастных групп в
трех последних столбцах таблицы (объеме
выборки) пропорциональна численности каждой из
соответствующих групп в генеральной
совокупности. Такая выборка называется
пропорциональной.
Иногда используются и непропорциональные
выборки, если это необходимо исходя из целей
исследования
Таким образом на основе определенных заданных
параметров создается микромодель
генеральной совокупности

35. Метод снежного кома

Формирование выборки в процессе опроса основано на
расширении числа опрашиваемых на основе предложений
респондентов, которые уже приняли участие в
обследовании.
У каждого респондента, начиная с первого, просят
контакты его друзей, коллег, знакомых, которые подходили
бы под условия отбора и могли бы принять участие в
исследовании.
Таким образом, за исключением первого шага, выборка
формируется с участием самих объектов исследования.
Метод часто применяется, когда необходимо найти и
опросить труднодоступные группы респондентов
(например, респондентов, имеющих высокий доход,
респондентов, принадлежащих к одной профессиональной
группе, респондентов, имеющих какие-либо схожие
хобби/увлечения и т.д.)

36. Комбинация типов выборки при проведении исследования: многоступенчатая выборка

Многоступенчатая выборка –строится с
применением процедуры поэтапного отбора
объектов опроса.
При этом совокупность объектов, отобранных
на предыдущем этапе (ступени), становится
исходной для отбора на следующем.
Промежуточные объекты, составляющие
выборочную совокупность на высших
ступенях, называют единицами отбора.
Объекты самой нижней ступени, с которых
ведется непосредственный сбор информации,
называются единицами наблюдения.

37. Пример многоступенчатой выборки

Так, формирование выборки для оценки мнения населения России
относительно различных марок какого-либо товара, например
холодильника, может осуществляться по следующей схеме:
1. Россия, согласно ее административно — территориальному
делению, делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов
(исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в
зависимости от численности населения делятся на шесть групп:
до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100
000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из
девяти выбранных субъектов Федерации исследуются три города
и два поселка

38. Пример многоступенчатой выборки

Для этого берется каждый пятый населенный пункт из справочника
Госкомстата «Численность населения Российской Федерации по
городам, рабочим поселкам и районам и определяется, в какую из
категорий он попадет (систематический отбор). Так поступают
до тех пор, пока не наберется нужное количество населенных
пунктов. Если, дойдя до конца списка, не будет найдено квотное
число населенных пунктов, процесс выбора населенных пунктов
начинается сначала, но берется каждый четвертый населенный
пункт, и т.д.
5. Выбирается случайным образом в каждом выбранном городе и
поселке по меньшей мере 20 респондентов.
Таким образом, кроме Москвы и С.-Петербурга должно быть
проинтервьюировано 900 респондентов. В Москве и С.Петербурге опрашивается по 50 респондентов. В итоге должно
быть проинтервьюировано 1000 респондентов.

39. Этапы разработки выборочного плана

1. Определение соответствующей совокупности
согласно поставленным целям исследования.
2. Получение «списка» совокупности для
установления контура выборки.
3. Проектирование выборочного плана –
определение состава и объема выборки.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой
выборки.

40. Определение объема выборки

Исходным пунктом расчета объема выборки
становится вопрос об определении размеров
выборочной совокупности.
Численность выборочной совокупности зависит от
двух факторов:
(1) стоимости сбора информации
(2) стремления к определенной степени
статистической достоверности результатов,
которую надеется получить исследователь.
Чем больше размеры выборки, то есть чем ближе
они к размерам генеральной совокупности в
целом, тем более надежны и достоверны
полученные данные.

41. Определение объема выборки

Самый спорный вопрос по выборочному
плану.
На практике, решение о объеме выборки
всегда есть компромисс между точностью
результатов исследования и затратами на
проведение исследования.
Способ определения объема выборки
зависит от того, имеется ли у
исследователя информация о составе
генеральной совокупности

42. Связь между объемом выборки и репрезентативностью

Следует отметить, что объем выборки никак не
влияет на репрезентативность полученных
результатов.
Пример: Предположим, например, что в целях
изучения степени использования в России
персональных компьютеров в научной работе
проводился опрос на основе принципа удобства
на одном из московских перекрестков. И хотя
было опрошено 5000 респондентов, полученные
результаты не являются репрезентативными даже
для Москвы.
Это обусловлено тем, что был использован метод
формирования выборки, который в данном случае
применять было нельзя.

43. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Правило большого пальца –
бездоказательно принимается, что для
получения нужных результатов
выборка должна составлять, например,
5% от генеральной совокупности
Исходя из заранее оговоренных с
заказчиком условий (он рекомендует
цифры выборки)

44. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Многолетний опыт социологов-практиков. Он
свидетельствует о том, что при массовых опросах,
если величина генеральной совокупности
составляет менее 5000, то достаточный объем
выборочной совокупности должен быть не менее
500 человек.
Если величина генеральной совокупности
составляет более 5000, то для получения
статистически значимых результатов нужно
обследовать 10% ее состава, но не более 2000-2500
единиц.

45.

Зависимость объема выборки от ее ошибки
(размер генеральной совокупности составляет 20 тыс.
единиц)
Ошибка
выборки,
%
2
3
4
5
6
7
8
9
10
Объем
выборки,
ед.
2500
1100
620
400
280
200
160
110
100
12
67
14
50
17
30
20
25

46. Зависимость объема выборки от ее ошибки

В.И. Паниотто приводит следующие расчеты
репрезентативной выборки с допущением 5процентной ошибки:
Объем
генеральной
совокупности
500 1000 2000 3000
4000
5000
10000
100000
Объем
выборки
222 286
360
370
385
358
333
350

47. Комментарии к таблице

Суть данных, приведенных в этой таблице, состоит в
следующем. Если вы, опросив, предположим, 400
человек в районном городе, где численность взрослого
платежеспособного населения составляет 100 тысяч
человек, выявили, что 33 процента опрошенных
покупателей предпочитают продукцию местного
мясокомбината, то с 95-процентной степенью
вероятности можете утверждать, что постоянными
покупателями этой продукции являются 33 5% (то
есть от 28 до 38 процентов) жителей этого города.
Уровень уверенности в 95% – это условие, оно
показывает 95% уверенности в том, что параметр
популяции попадает в пределы допуска ошибки
выборочной статистики.

48. Методы определения объема выборки Если исходная информация о генеральной совокупности имеется, то:

Наиболее теоретически обоснованный и
корректный подход к определению
объемов выборки основан на расчете
доверительных интервалов.
Метод требует понимания некоторых
базовых понятий математической
статистики (закона нормального
распределения, меры вариации, среднего
квадратического отклонения,
доверительного интервала и т. д.)

49. Понятие вариации

Понятие вариации характеризует величину
несхожести (схожести) ответов респондентов на
определенный вопрос.
В более строгом плане вариацией значений какоголибо признака в совокупности называется различие
его значений у разных единиц данной совокупности
в один и тот же период или момент времени.
Результаты ответов на вопросы опроса обычно
представляются в форме кривой распределения.
При высокой схожести ответов говорят о малой
вариации (узкая кривая распределения) и при
низкой схожести ответов — о высокой вариации
(широкая кривая распределения).

50. Кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш автомобиль?»

51. Среднее квадратическое отклонение

В качестве меры вариации обычно принимается
среднее квадратическое отклонение, которое
характеризует среднее расстояние от средней
оценки ответов каждого респондента на
определенный вопрос.
Можно сравнить среднее квадратическое
отклонения для двух выборок и определить, для
какой из них вариация является меньшей.
Поскольку все маркетинговые решения
принимаются в условиях неопределенности, то
это обстоятельство целесообразно учесть при
определении объема выборки.

52. «Доверительный интервал»

Так как определение исследуемых величин для
совокупности в целом осуществляется на основе
выборочной статистики, то следует установить
диапазон (доверительный интервал), в который, как
ожидается, попадут оценки для совокупности в целом,
и ошибку их определения.
Понятие «доверительный интервал» — это диапазон,
крайним точкам которого соответствует определенный
процент определенных ответов на какой-то вопрос.
Данное понятие тесно связано с понятием «среднее
квадратическое отклонение изучаемого признака в
генеральной совокупности»: чем оно больше, тем шире
должен быть доверительный интервал, чтобы
включить в свой состав, например, 95% ответов.

53. Пример

Проведено исследование числа визитов
автовладельцев в сервисные мастерские за год.
Доверительный интервал для среднего числа
визитов был рассчитан равным 5—7 визитам при
99%-ном уровне доверительности (надежности
выборки).
Это означает, что если появится возможность
провести независимо 100 раз выборочные
исследования, то для 99 средних значений числа
визитов попадут в диапазон от 5 до 7 визитов —
другими словами, 99% автовладельцев попадут в
доверительный интервал. (в 99 случаях результат
будет находиться в указанных границах)

54. Важно понимать!

Выборка всегда дает более относительный
результат по сравнению с генеральной
совокупностью.
Всегда есть вероятность отклонения, которая
считается ошибкой выборки (измеряется в
процентах)

55. Средняя квадратическая ошибка выборки

Индикатором степени отличия оценки, истинной
для совокупности в целом, от оценки, которая
ожидается для типичной выборки, является
средняя квадратическая ошибка выборки.
Например, исследуется мнение потребителей о новом
продукте и заказчик данного исследования указал, что
его устроит точность полученных результатов,
равная ±5% (ошибка выборки)
Предположим, что 30% членов выборки высказалось за
новый продукт. Это означает, что диапазон возможных
оценок для всей совокупности составляет 25—35%.

56. Определение объема выборки на основе расчета доверительного интервала

Исходной информацией, необходимой для
реализации данного подхода, является:
Величина вариации, которой, как
считается, обладает совокупность.
Желаемая точность.
Уровень доверительности, которому
должны удовлетворять результаты
проводимого обследования.

57. Когда на заданный в анкете вопрос существует только два варианта ответа, выраженные в процентах (используется процентная мера), объем выбо

Когда на заданный в анкете вопрос существует только два
варианта ответа, выраженные в процентах (используется
процентная мера), объем выборки определяется по следующей
формуле:

58.

59. Пример расчета объема выборки

Фирмой, выпускающей покрышки, проводится опрос
автолюбителей. Целью обследования является
определение процента автолюбителей, использующих
радиальные покрышки, поэтому на вопрос:
«Используете ли вы радиальные покрышки?»
возможно только два ответа: «Да» или «Нет» (шкала
наименований).
Если предположить, что совокупность автолюбителей
обладает низким показателем вариации, то это
означает, что почти каждый опрошенный использует
радиальные покрышки. В этом случае может быть
сформирована выборка достаточно малых размеров. В
формуле (4.1) произведение pq выражает вариацию,
свойственную совокупности.

60. Пример расчета объема выборки

Предположим, что 90% единиц
совокупности используют радиальные
покрышки. Это означает, что рq = 900. Если
принять, что показатель вариации выше (р
= 70%), то рq = 2100.
Наибольшая вариация достигается в
случае, когда половина совокупности
(50%) используют радиальные покрышки, а
другая (50%) — не использует. В этом
случае произведение рq достигает
наибольшего значения, равного 2500

61. Пример расчета объема выборки

При проведении исследования следует
указать точность полученных оценок
(точность выборки).
Скажем, в результате исследования было
установлено, что 44% респондентов
используют радиальные покрышки.
В этом случае результаты измерения
желательно представить в виде: «Процент
автолюбителей, использующих
радиальные покрышки, составляет 44%
плюс-минус …%».

62. Пример расчета объема выборки

Что касается уровня доверительности, то при
проведении маркетинговых исследований, обычно
рассматриваются только два его значения: 95%
или 99%.
Первому значению соответствует значение z =
1,96, второму — z = 2,58.
Если выбирается уровень доверительности,
равный 99%, то это говорит о том, что мы
уверены на 99% (другими словами, доверительная
вероятность равна 0,99) в том, что процент
членов совокупности, попавших в диапазон ± е%,
равен проценту членов выборки, попавших в тот
же диапазон ошибки.

63. Пример расчета объема выборки

Принимая вариацию,
равную 50%,
точность, равную ± 10%,
при 95%-ном уровне
доверительности,
рассчитаем размер
выборки:
При уровне
доверительности,
равном 99%, и е =
±3% n = 1067.

64. Важно понимать!

Приведенные формулы расчета объема выборки
основаны на предположении, что все правила
формирования выборки были соблюдены и
единственной ошибкой выборки является ошибка,
обусловленная ее объемом.
Однако следует помнить, что объем выборки
определяет точность полученных результатов, но
не их представительность, которая определяется
методом формирования выборки.
Все формулы для расчета объема выборки
предполагают, что репрезентативность
гарантируется использованием корректных
процедур формирования выборки.

65. Систематическая ошибка выборки

Систематическая ошибка зависит от различных
факторов, оказывающих постоянное воздействие
на исследование и смещающих результаты
исследования в определенную сторону.
Пример:
— Использование любых вероятностных выборок
занижает долю людей с высоким доходом,
ведущих активный образ жизни. Происходит это в
силу того, что таких людей гораздо сложней
застать в каком-либо определенном месте
(например, дома).
— Проблема респондентов, отказывающихся
отвечать на вопросы анкеты (доля «отказников» в
Москве, для разных опросов, колеблется от 50%
до 80%)

66. Зависимость ошибки выборки от степени различий между единицами генеральной совокупности

Чем больше различия (или гетерогенности) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Например, если нам нужно узнать, какое количество
пива потребляется, то мы обнаружим, что внутри
нашей генеральной совокупности нормы
потребления у различных людей существенно
различаются (гетерогенная генеральная
совокупность).
В другом случае мы будем изучать потребление
хлеба и установим, что у разных людей оно
различается гораздо менее существенно (гомогенная
генеральная совокупность).

67. Важно понимать!

Помимо четкого планирования репрезентативности
выборки, нельзя распространять полученные результаты
за ее границы. Так, результаты исследования мнения
массового потребителя города Москвы о товарах
определенной фирмы нельзя распространять на всю Россию.
Можно быть поставленным в тупик разными результатами
обследования степени лояльности потенциальных
покупателей к определенной марке пылесоса (в одном
исследовании была названа цифра 10%, в другом случае —
25%).
Дело в том, что в первом случае цифра была получена от
общего числа опрошенных, а во втором случае — только от
числа тех покупателей, которые твердо решили приобрести
пылесос.

68. Из этого следует:

Для вдумчивого маркетолога очень
важными являются те пояснения,
которые сопровождают полученные
данные (как минимум, формулировки
вопросов и описание выборки)

69. Итак:

Объем выборки не влияет на репрезентативность
результатов (влияет метод ее формирования)
Чем больше величина выборки, тем меньше ее
возможная ошибка
Чем больше различий (гетерогенность) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Решение об объеме выборки является
компромиссом между точностью результатов
исследования и возможностями его практической
реализации.

Генеральная
совокупность
[1] (в
англ. — population)
— совокупность всех объектов (единиц),
относительно которых учёный намерен
делать выводы при изучении конкретной
проблемы.

Генеральная
совокупность состоит из всех объектов,
которые подлежат изучению. Состав
генеральной совокупности зависит от
целей исследования. Иногда генеральная
совокупность — это все население
определённого региона (например, когда
изучается отношение потенциальных
избирателей к кандидату), чаще всего
задаётся несколько критериев, определяющих
объект исследования. Например, мужчины
30-50 лет, использующие бритву определённой
марки не реже раза в неделю, и имеющие
доход не ниже $100 на одного члена семьи.

Выборка или выборочная
совокупность
 —
множество случаев (испытуемых, объектов,
событий, образцов), с помощью определённой
процедуры выбранных из генеральной
совокупности для участия в исследовании.

Характеристики
выборки:

                  Качественная
характеристика выборки – кого именно
мы выбираем и какие способы построения
выборки мы для этого используем.

                  Количественная
характеристика выборки – сколько
случаев выбираем, другими словами объём
выборки.

Необходимость
выборки

                  Объект
исследования очень обширный. Например,
потребители продукции глобальной
компании – огромное количество
территориально разбросанных рынков.

                  Существует
необходимость в сборе первичной
информации.

Объём
выборки

Объём
выборки
 —
число случаев, включённых в выборочную
совокупность. Из статистических
соображений рекомендуется, чтобы число
случаев составляло не менее 30 – 35.

17. Основные способы формирования выборки

Формирование
выборки

прежде всего основывается на знании
контура выборки, под которым понимается
список всех единиц совокупности, из
которого выбираются единицы выборки.
Например, если в качестве совокупности
рассматривать все автосервисные
мастерские города Москвы, то надо иметь
список таких мастерских, рассматриваемый
как контур, в пределах которого формируется
выборка.

Контур
выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от
истинных размеров совокупности. Очевидно,
что не существует полно официального
списка всех автосервисных мастерских
г. Москвы. Исследователь должен
информировать заказчика работы о
размерах ошибки контура выборки.

При
формировании выборки используются
вероятностные (случайные) и невероятностные
(неслучайные) методы.

Если
все единицы выборки имеют известный
шанс (вероятность) быть включенными в
выборку, то выборка называется
вероятностной. Если эта вероятность
неизвестна, то выборка называется
невероятностной. К сожалению, в большинстве
маркетинговых исследований из-за
невозможности точного определения
размера совокупности не представляется
возможным точно рассчитать вероятности.
Поэтому термин «известная вероятность»
скорее основан на использовании
определенных методов формирования
выборки, чем на знании точных размеров
совокупности.

Вероятностные
методы включают в себя:


простой случайный отбор;


систематический отбор;


кластерный отбор;


стратифицированный отбор.

Невероятностные
методы:


отбор на основе принципа удобства;


отбор на основе суждений;


формирование выборки в процессе опроса;


формирование выборки на основе квот.

Смысл
метода отбора на основе принципа удобства
заключается в том, что формирование
выборки осуществляется самым удобным
с позиций исследователя образом, например
с позиций минимальных затрат времени
и усилий, с позиций доступности
респондентов. Выбор места исследования
и состава выборки производится
субъективным образом, например, опрос
покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в
опросе.

Формирование
выборки на основе суждения основано на
использовании мнения квалифицированных
специалистов, экспертов относительно
состава выборки. На основе такого подхода
часто формируется состав фокус-группы.

Формирование
выборки в процессе опроса основано на
расширении числа опрашиваемых исходя
из предложений респондентов, которые
уже приняли участие в обследовании.
Первоначально исследователь формирует
выборку намного меньшую, чем требуется
для исследования, затем она по мере
проведения расширяется.

Формирование
выборки на основе квот (квотный отбор)
предполагает предварительное, исходя
из целей исследования, определение
численности групп респондентов,
отвечающих определенным требованиям
(признакам). Например, в целях исследования
было принято решение, что в универмаге
должно быть опрошено пятьдесят мужчин
и пятьдесят женщин. Интервьюер проводит
опрос, пока не выберет установленную
квоту.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Контур — выборка

Cтраница 1

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.
 [1]

Ниже приводятся четыре генеральные совокупности и контуры выборки для них.
 [2]

Формирование выборки прежде всего основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.
 [3]

На данном этапе также необходимо оценить ошибку контура выборки. Определить, насколько список людей ( юридических лиц), включенных в контур выборки, отличается от совокупности в целом.
 [4]

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.
 [5]

Можете ли вы определить для каждой генеральной совокупности, является ли ошибка контура выборки допустимой или недопустимой.
 [6]

Устанавливается, откуда может быть получен перечень единиц совокупности. Это нужно для установления контура выборки. Здесь используются соответствующие справочники и материалы различных консультационных организаций.
 [7]

На втором этапе устанавливается, откуда может быть получен перечень единиц совокупности. Это нужно для установления контура выборки. Здесь используются соответствующие справочники, данные переписи населения и местных органов власти, материалы различных консультационных организаций.
 [8]

На данном этапе также необходимо оценить ошибку контура выборки. Определить, насколько список людей ( юридических лиц), включенных в контур выборки, отличается от совокупности в целом.
 [9]

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.
 [10]

Страницы:  

   1

© 2008-2019 PR-агентство «Красное Слово».

Сетевое издание PR-агентство «КРАСНОЕ СЛОВО» / PR-agency «KRASNOE SLOVO» зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) 07 декабря 2018 г. Свидетельство о регистрации СМИ Эл № ФС77-74461.

Учредитель: Горжанкин В.В. Главный редактор: Горжанкин В.В. Адрес электронной почты редакции: info@pr-agentstvo.com Телефон редакции: +7 (916) 360 12 12.

Политика персональных данных. Любое использование материалов допускается только при соблюдении правил перепечатки. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции. Отдельные публикации могут содержать информацию, не предназначенную для пользователей до 18 лет.

1. Методология маркетинговых исследований

Тема Процедура выборки

2. Вопросы лекции

Основные понятия, используемые при проведении
выборочных исследований. Генеральная совокупность.
Выборка. Контур выборки. Единица и объем выборки.
Ошибка выборки.
Проблемы формирования выборки
Репрезентативность выборки.
Типы выборок. Виды вероятностной выборки. Виды
невероятностной выборки.
Комбинация типов выборки при проведении
исследования. Многоступенчатая выборка.
Этапы разработки выборочного плана. Подходы к
определению объема выборки. Ошибка выборки.

3. Почему появляются выборки?

Для маркетинговых целей
в целях экономии времени
и средств весьма типично
подвергать исследованию
лишь небольшую часть
той группы людей или
предприятий
(генеральной
совокупности), которая
представляет интерес для
исследователей.
Она обычно составляет
несколько сотен, иногда
тысячу объектов.

4. Суть выборочного метода

Суть выборочного метода заключается в том, что
по определенным правилам из общей
численности генеральной совокупности
отбирается ограниченное число единиц, которое
призвано в качестве своеобразной модели
воспроизводить структуру всей генеральной
совокупности
Генеральная совокупность — та часть объекта
исследования, которая локализована по времени
и территориально, и на нее распространяются
все выводы исследования

5. Примеры генеральных совокупностей:

Все жители Нижнего Новгорода (1267760 человек
по данным 2015 года)
Юридические лица России (2,2 млн. на начало
2008 года)
Розничные торговые точки, осуществляющие
продажу продуктов питания (20 тысяч на начало
2008 года) и т.д.

6. Выборка. Контур выборки

Ограниченное число единиц, выбранное из
генеральной совокупности (равно как и процедура по
их определению) именуется выборкой.
Контур выборки – это наличие полного списка всех
элементов генеральной совокупности.
Контур выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от истинных
размеров совокупности.
Пример: Очевидно, что не существует полного официального списка всех
автосервисных мастерских города Москвы, включая полулегальный и
нелегальный бизнес в данной области. Исследователь должен
информировать заказчика работы о размерах ошибки контура выборки.

7.

8. Итак, основные понятия:

Генеральная совокупность – вся группа, про
которую необходимо собрать информацию;
Выборка – часть совокупности, базовый уровень
исследования;
Ошибка выборки – разница между полученными
данными и фактическими по совокупности;
Контур выборки – все единицы совокупности, из
которых будет формироваться выборка;
Ошибка контура выборки – степень отклонения
контура выборки от генеральной совокупности;
Единица выборки – объект исследования

9. Три главные проблемы формирования выборки

Прежде всего, исходя из сути рассматриваемой
задачи, необходимо определить, кто является
единицей выборки.
Очень важным является также определение
контура выборки.
В целях выполнения правила репрезентативности
проводимого исследования необходимо обратить
внимание на метод, с помощью которого
выбираются единицы выборки
И наконец, необходимо решить вопрос об объеме
выборки, который определяет число изучаемых
единиц выборки.

10. Репрезентативность выборки

Цель отбора объектов в состав выборки всегда
состоит в получении такой совокупности, которая
по своим качествам репрезентирует ту, которую мы
намереваемся изучить
Под репрезентативностью в маркетинговых
исследованиях понимают такие свойства выборки,
которые позволяют ей выступать на момент опроса
моделью, представителем генеральной
совокупности.
Важно понимать, что репрезентативность выборки и
ошибка выборки – разные явления. Репрезентативность,
в отличие от ошибки никак не зависит от размера
выборки

11. Репрезентативность выборки

Одна и та же выборка может быть репрезентативной
и нерепрезентативной для разных генеральных
совокупностей
Пример:
— Выборка, целиком состоящая из москвичей,
владеющих автомобилем, не репрезентирует все
население Москвы.
— Выборка из российских предприятий численностью
до 100 человек не репрезентирует все предприятия
России.
— Выборка из москвичей, совершающих покупки на
рынке, не репрезентирует покупательское поведение
всех москвичей.

12. Репрезентативность выборки

В то же время, указанные выборки (при
соблюдении прочих условий) могут отлично
репрезентировать москвичей-автовладельцев,
небольшие и средние российские
предприятия и покупателей, совершающих
покупки на рынках соответственно.
Как бы мы не увеличивали количество
опрошенных москвичей-автовладельцев, мы
не сможем репрезентировать этой выборкой
всех москвичей.

13. Группы выборочных методов (типы выборки)

Вероятностная выборка (случайная) –
это такая выборка, для которой каждый
элемент генеральной совокупности имеет
определенную, заранее заданную
вероятность быть отобранным.
Это позволяет исследователю рассчитать,
насколько правильно выборка отражает
популяцию, из которой она спроектирована
(рассчитать ошибку выборки).

14. Неслучайная (невероятностная) выборка Еще одно название -детерминированная

Неслучайная (невероятностная)
выборка – это такой способ отбора
единиц, при котором мы не можем заранее
рассчитать вероятность каждого элемента
попасть в состав выборочной
совокупности.
Данный тип выборки не дает возможности
рассчитать, насколько правильна
(репрезентативна) выборка
Иногда по условиям исследования
оказывается единственно возможным
провести неслучайную выборку.

15.

16. Метод простого случайного отбора

Метод простого случайного отбора
предполагает, что вероятность быть избранным в
выборку известна и является одинаковой для всех
единиц совокупности. Для этого используется:
— Лотерейный метод (жребия)
— Таблицы случайных чисел
Главное условие осуществления вероятностной
выборки – наличие полного списка (контура) всех
элементов генеральной совокупности.
Использование простого случайного отбора
гарантирует, что каждая единица совокупности
известна и имеет равные шансы быть включенной
в выборку.

17. Лотерейный метод (жребия)

При использовании лотерейного метода
(или метода жребия) жетоны с номерами
всех элементов помещают в урну,
тщательно перемешивают и извлекают
последовательно n жетонов, где n – число
элементов выборочной совокупности.
Элементы генеральной совокупности,
имеющие номера оказавшиеся на
извлеченных жетонах, будут составлять
выборочную совокупность.

18. Фрагмент таблицы случайных цифр

37
52
35
15
04
80
44
83
21
28
31
42
46
72
13
20
07
99
95
64
13
06
27
29
10
16
69
93
39
08
09
38
00
84
65
56
09
29
67
19

19. Комментарий к использованию таблицы случайных цифр

Если мы имеем, скажем, популяцию (то есть генеральную
совокупность) из 1507 элементов и хотим спроектировать выборку
численностью 150 элементов, мы можем выбирать любые два
смежных столбца в таблице случайных чисел: цифры, стоящие в
двух смежных ячейках будут образовывать четырехзначное число.
Каждый раз, когда будет появляться число от 0001 до 1507, мы
будем считать, что оно обозначает номер отбираемого элемента.
Когда число появляется более чем один раз, этот номер
игнорируется после первого раза.
Если мы начнем с первых четырех столбцов в таблице, спускаясь
по столбцам, то в выборку будут включены элементы под номерами
0799, 1016, 0084, 480, 1306, 929, 1320 и 938.
Поскольку мы не стремимся умышленно отыскать определенное
число, мы можем начать с любого места таблицы и использовать
любую систему для движения по таблице.
С тем же успехом случайные числа могут генерироваться
специальной программой компьютера.

20. Метод систематической (или механической) выборки

На практике чаще всего
используют метод
систематической (или
механической) выборки,
когда из
пронумерованного списка
через равные интервалы k
отбирается заданное число
респондентов. При этом
шаг выборки k (интервал
скачка) рассчитывается по
простой формуле:
N
k
n
где N – численность
генеральной совокупности
n – численность
выборочной совокупности.

21. Пример систематической (или механической) выборки

Предположим, что нам нужно спроектировать выборку
численностью 100 из списка 5000 студентов какого-то вуза.
Если мы намерены использовать систематическую выборку, то
должны вначале рассчитать интервал выборки делением числа
элементов в списке на размер выборки.
В данном случае, разделив общую численность студентов 5000 на
требуемый размер выборки 100 единиц, мы получим интервал
(шаг) выборки 50.
Далее будем систематически двигаться по списку и отбирать
каждого пятидесятого студента (отобрав таким образом 100 имен).
Определение того места в списке, с которого мы начнем,
проводится случайным образом, по таблице случайных чисел
(это называется случайный старт).
Таким образом, если случайно выбрана точка старта под номером
31, то в выборку будут включены студенты, стоящие под номерами
31, 81, 131, 181 и т.д.

22. Метод кластерного отбора. (гнездовая или серийная выборка)

Метод кластерного отбора основан на
делении совокупности на подгруппы, каждая
из которых представляет совокупность в
целом.
Здесь отбираются не объекты исследования
(например, люди), а группы. Группы отбираются
случайным образом, а внутри них проводится
сплошной опрос. Например, в ВУЗе с большим
количеством студенческих групп отбор можно
проводить путем случайного отбора этих групп и
дальнейшего сплошного опроса в этих группах

23. Пример кластерного отбора

Предположим, что исследуется мнение населения
какого-то региона относительно марки какого-то товара.
Регион разбивается на четко определяемые части
(кластеры), например области.
Исследователь может считать, что выделенные кластеры
являются идентичными и мнение населения этих
областей характерно для региона в целом.
Далее одна из областей (один кластер) выбирается
случайным образом, определяется совокупность для
этой области, в ней проводится соответствующее
исследование, а выводы обобщаются на совокупность
всего региона

24. Причины появления стратифицированного отбора (типической или районированной выборки)

В основе всех вероятностных методов лежит
предположение, что любая совокупность характеризуется
симметричным распределением ее ключевых
характеристик. Другими словами, каждая выборка
достаточно полно характеризует всю совокупность,
различные крайности в выборке уравновешивают друг
друга.
Но такая ситуация на практике встречается крайне редко.
Скажем, исследуется рыночный потенциал определенного
региона для какого-то товара. Население больших, средних
и малых городов, сельской местности данного региона
отличается по уровню образования, дохода, образу жизни
и т.п. В таком случае необходим стратифицированный
отбор

25. Понятие стратифицированной выборки

При наличии в составе генеральной
совокупности различных типов явлений с
разными уровнями изучаемых признаков
организуют стратифицированную выборку,
чтобы обеспечить более равномерное
представительство в выборочной совокупности
различных частей (типов) явления.
Генеральная совокупность разделяется на различные
подгруппы (страты), например по уровню доходов, и
выборки формируются из этих подгрупп, по сути
дела являющихся сегментами рынка.

26. Условия осуществления стратифицированной выборки

При использовании данного метода прежде всего
следует выбрать некоторую наблюдаемую
характеристику (признак), характеризующую каждую
единицу совокупности, например уровень дохода.
Далее для каждой страты с помощью случайного
отбора формируется выборка.
Стратифицированная выборка может быть применена
лишь при наличии дополнительной информации о
генеральной совокупности (например, нам необходимо
процентное соотношение мужчин и женщин, в случае,
если мы хотим стратифицировать выборку по полу).
Отсутствие такой информации делает применение
стратифицированной выборки невозможным

27. Методы (типы) невероятностной выборки

Отбор в такой выборке осуществляется не по
принципам случайности, а по субъективным
критериям – доступности, типичности,
равного представительства и т.д.
При применении невероятностных методов
отбора формирование выборки
осуществляется без использования понятий
теории вероятностей, вследствие чего
невозможно рассчитать вероятность
включения в выборку единицы
совокупности.

28. Нерепрезентативный отбор. Метод стихийной выборки: отбор на основе удобства и доступности

Смысл метода заключается в том, что
формирование выборки осуществляется
самым удобным с позиций исследователя
образом, например, с позиций минимальных
затрат времени и усилий, с позиции
доступности респондентов.
Выбор места исследования и состава выборки
производится субъективным образом, например,
опрос покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в опросе.

29. Метод экспертного отбора (на основе суждения)

Метод основан на использовании мнения
квалифицированных специалистов, экспертов
относительно состава выборки. На основе такого
подхода часто формируется состав фокус-группы.
Например, изучается потребность в издании
кулинарной книги для приготовления в
микроволновой печи низкокалорийной пищи. На
основе мнения исследователей в состав фокусгруппы было включено 12 домохозяек; шестеро из
них владело микроволновыми печами более трех
лет, трое — менее трех лет и трое только
собирались их купить.

30. Метод квотной выборки

Формирование выборки на основе квот
(квотный отбор) предполагает
предварительное, исходя из целей
исследования, определение состава и
численности групп респондентов, отвечающих
определенным требованиям (признакам).
Например, мужчины в возрасте 20-30 лет, 31-45
лет и 46-60 лет; лица с доходом до 30 тысяч
рублей, с доходом от 30 до 60 тысяч рублей и с
доходом свыше 60 тысяч рублей)

31. Метод квотной выборки

Для каждой группы задается количество объектов,
которые должны попасть выборку и быть обследованы.
Количество объектов, которые должны попасть в
каждую из групп, задается, чаще всего, либо
пропорционально заранее известной доле группы в
генеральной совокупности, либо одинаковым для
каждой группы.
Внутри групп объекты отбираются произвольно.
Квотные выборки используются в маркетинговых
исследованиях достаточно часто

32. Пример квотной выборки

Приведем пример расчета выборки по
таким параметрам квоты как пол и возраст.
В одном из маркетинговых исследований
при опросе населения, исследователи
опирались на данные Областного комитета
по статистике о половозрастной структуре
населения районов города.
Так, половозрастная структура населения
Советского района Нижнего Новгорода
выглядела следующим образом:

33.

Генеральная совокупность
численность
Выборочная
совокупность
Доля, %
число
Всего
муж.
жен.
муж.
жен.
всего
муж.
жен.
всего
128546
55757
72789
43,4
56,6
100,00
521
679
1200
20 — 24
11958
6009
5949
50,3
49,7
9,30
56
56
112
25 — 29
11858
6520
5338
55,0
45,0
9,22
61
50
111
30 — 34
12093
5861
6232
48,5
51,5
9,41
55
58
113
35 — 39
14360
6795
7565
47,3
52,7
11,17
63
71
134
40 — 44
14112
6598
7514
46,8
53,2
10,98
62
70
132
45— 49
12779
5840
6939
45,7
54,3
9,94
55
65
119
50 — 54
7274
3222
4052
44,3
55,7
5,66
30
38
68
55 — 59
11981
5035
6946
42,0
58,0
9,32
47
65
112
60 — 69
17503
6828
10675
39,0
61,0
13,62
64
100
163
70 и старше
14628
3049
11579
20,8
79,2
11,38
28
108
137
Основа выборки
Возраст (лет)

34. Пример квотной выборки

Изучая данные таблицы, нетрудно убедиться, что
численность каждой из половозрастных групп в
трех последних столбцах таблицы (объеме
выборки) пропорциональна численности каждой из
соответствующих групп в генеральной
совокупности. Такая выборка называется
пропорциональной.
Иногда используются и непропорциональные
выборки, если это необходимо исходя из целей
исследования
Таким образом на основе определенных заданных
параметров создается микромодель
генеральной совокупности

35. Метод снежного кома

Формирование выборки в процессе опроса основано на
расширении числа опрашиваемых на основе предложений
респондентов, которые уже приняли участие в
обследовании.
У каждого респондента, начиная с первого, просят
контакты его друзей, коллег, знакомых, которые подходили
бы под условия отбора и могли бы принять участие в
исследовании.
Таким образом, за исключением первого шага, выборка
формируется с участием самих объектов исследования.
Метод часто применяется, когда необходимо найти и
опросить труднодоступные группы респондентов
(например, респондентов, имеющих высокий доход,
респондентов, принадлежащих к одной профессиональной
группе, респондентов, имеющих какие-либо схожие
хобби/увлечения и т.д.)

36. Комбинация типов выборки при проведении исследования: многоступенчатая выборка

Многоступенчатая выборка –строится с
применением процедуры поэтапного отбора
объектов опроса.
При этом совокупность объектов, отобранных
на предыдущем этапе (ступени), становится
исходной для отбора на следующем.
Промежуточные объекты, составляющие
выборочную совокупность на высших
ступенях, называют единицами отбора.
Объекты самой нижней ступени, с которых
ведется непосредственный сбор информации,
называются единицами наблюдения.

37. Пример многоступенчатой выборки

Так, формирование выборки для оценки мнения населения России
относительно различных марок какого-либо товара, например
холодильника, может осуществляться по следующей схеме:
1. Россия, согласно ее административно — территориальному
делению, делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов
(исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в
зависимости от численности населения делятся на шесть групп:
до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100
000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из
девяти выбранных субъектов Федерации исследуются три города
и два поселка

38. Пример многоступенчатой выборки

Для этого берется каждый пятый населенный пункт из справочника
Госкомстата «Численность населения Российской Федерации по
городам, рабочим поселкам и районам и определяется, в какую из
категорий он попадет (систематический отбор). Так поступают
до тех пор, пока не наберется нужное количество населенных
пунктов. Если, дойдя до конца списка, не будет найдено квотное
число населенных пунктов, процесс выбора населенных пунктов
начинается сначала, но берется каждый четвертый населенный
пункт, и т.д.
5. Выбирается случайным образом в каждом выбранном городе и
поселке по меньшей мере 20 респондентов.
Таким образом, кроме Москвы и С.-Петербурга должно быть
проинтервьюировано 900 респондентов. В Москве и С.Петербурге опрашивается по 50 респондентов. В итоге должно
быть проинтервьюировано 1000 респондентов.

39. Этапы разработки выборочного плана

1. Определение соответствующей совокупности
согласно поставленным целям исследования.
2. Получение «списка» совокупности для
установления контура выборки.
3. Проектирование выборочного плана –
определение состава и объема выборки.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой
выборки.

40. Определение объема выборки

Исходным пунктом расчета объема выборки
становится вопрос об определении размеров
выборочной совокупности.
Численность выборочной совокупности зависит от
двух факторов:
(1) стоимости сбора информации
(2) стремления к определенной степени
статистической достоверности результатов,
которую надеется получить исследователь.
Чем больше размеры выборки, то есть чем ближе
они к размерам генеральной совокупности в
целом, тем более надежны и достоверны
полученные данные.

41. Определение объема выборки

Самый спорный вопрос по выборочному
плану.
На практике, решение о объеме выборки
всегда есть компромисс между точностью
результатов исследования и затратами на
проведение исследования.
Способ определения объема выборки
зависит от того, имеется ли у
исследователя информация о составе
генеральной совокупности

42. Связь между объемом выборки и репрезентативностью

Следует отметить, что объем выборки никак не
влияет на репрезентативность полученных
результатов.
Пример: Предположим, например, что в целях
изучения степени использования в России
персональных компьютеров в научной работе
проводился опрос на основе принципа удобства
на одном из московских перекрестков. И хотя
было опрошено 5000 респондентов, полученные
результаты не являются репрезентативными даже
для Москвы.
Это обусловлено тем, что был использован метод
формирования выборки, который в данном случае
применять было нельзя.

43. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Правило большого пальца –
бездоказательно принимается, что для
получения нужных результатов
выборка должна составлять, например,
5% от генеральной совокупности
Исходя из заранее оговоренных с
заказчиком условий (он рекомендует
цифры выборки)

44. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Многолетний опыт социологов-практиков. Он
свидетельствует о том, что при массовых опросах,
если величина генеральной совокупности
составляет менее 5000, то достаточный объем
выборочной совокупности должен быть не менее
500 человек.
Если величина генеральной совокупности
составляет более 5000, то для получения
статистически значимых результатов нужно
обследовать 10% ее состава, но не более 2000-2500
единиц.

45.

Зависимость объема выборки от ее ошибки
(размер генеральной совокупности составляет 20 тыс.
единиц)
Ошибка
выборки,
%
2
3
4
5
6
7
8
9
10
Объем
выборки,
ед.
2500
1100
620
400
280
200
160
110
100
12
67
14
50
17
30
20
25

46. Зависимость объема выборки от ее ошибки

В.И. Паниотто приводит следующие расчеты
репрезентативной выборки с допущением 5процентной ошибки:
Объем
генеральной
совокупности
500 1000 2000 3000
4000
5000
10000
100000
Объем
выборки
222 286
360
370
385
358
333
350

47. Комментарии к таблице

Суть данных, приведенных в этой таблице, состоит в
следующем. Если вы, опросив, предположим, 400
человек в районном городе, где численность взрослого
платежеспособного населения составляет 100 тысяч
человек, выявили, что 33 процента опрошенных
покупателей предпочитают продукцию местного
мясокомбината, то с 95-процентной степенью
вероятности можете утверждать, что постоянными
покупателями этой продукции являются 33 5% (то
есть от 28 до 38 процентов) жителей этого города.
Уровень уверенности в 95% – это условие, оно
показывает 95% уверенности в том, что параметр
популяции попадает в пределы допуска ошибки
выборочной статистики.

48. Методы определения объема выборки Если исходная информация о генеральной совокупности имеется, то:

Наиболее теоретически обоснованный и
корректный подход к определению
объемов выборки основан на расчете
доверительных интервалов.
Метод требует понимания некоторых
базовых понятий математической
статистики (закона нормального
распределения, меры вариации, среднего
квадратического отклонения,
доверительного интервала и т. д.)

49. Понятие вариации

Понятие вариации характеризует величину
несхожести (схожести) ответов респондентов на
определенный вопрос.
В более строгом плане вариацией значений какоголибо признака в совокупности называется различие
его значений у разных единиц данной совокупности
в один и тот же период или момент времени.
Результаты ответов на вопросы опроса обычно
представляются в форме кривой распределения.
При высокой схожести ответов говорят о малой
вариации (узкая кривая распределения) и при
низкой схожести ответов — о высокой вариации
(широкая кривая распределения).

50. Кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш автомобиль?»

51. Среднее квадратическое отклонение

В качестве меры вариации обычно принимается
среднее квадратическое отклонение, которое
характеризует среднее расстояние от средней
оценки ответов каждого респондента на
определенный вопрос.
Можно сравнить среднее квадратическое
отклонения для двух выборок и определить, для
какой из них вариация является меньшей.
Поскольку все маркетинговые решения
принимаются в условиях неопределенности, то
это обстоятельство целесообразно учесть при
определении объема выборки.

52. «Доверительный интервал»

Так как определение исследуемых величин для
совокупности в целом осуществляется на основе
выборочной статистики, то следует установить
диапазон (доверительный интервал), в который, как
ожидается, попадут оценки для совокупности в целом,
и ошибку их определения.
Понятие «доверительный интервал» — это диапазон,
крайним точкам которого соответствует определенный
процент определенных ответов на какой-то вопрос.
Данное понятие тесно связано с понятием «среднее
квадратическое отклонение изучаемого признака в
генеральной совокупности»: чем оно больше, тем шире
должен быть доверительный интервал, чтобы
включить в свой состав, например, 95% ответов.

53. Пример

Проведено исследование числа визитов
автовладельцев в сервисные мастерские за год.
Доверительный интервал для среднего числа
визитов был рассчитан равным 5—7 визитам при
99%-ном уровне доверительности (надежности
выборки).
Это означает, что если появится возможность
провести независимо 100 раз выборочные
исследования, то для 99 средних значений числа
визитов попадут в диапазон от 5 до 7 визитов —
другими словами, 99% автовладельцев попадут в
доверительный интервал. (в 99 случаях результат
будет находиться в указанных границах)

54. Важно понимать!

Выборка всегда дает более относительный
результат по сравнению с генеральной
совокупностью.
Всегда есть вероятность отклонения, которая
считается ошибкой выборки (измеряется в
процентах)

55. Средняя квадратическая ошибка выборки

Индикатором степени отличия оценки, истинной
для совокупности в целом, от оценки, которая
ожидается для типичной выборки, является
средняя квадратическая ошибка выборки.
Например, исследуется мнение потребителей о новом
продукте и заказчик данного исследования указал, что
его устроит точность полученных результатов,
равная ±5% (ошибка выборки)
Предположим, что 30% членов выборки высказалось за
новый продукт. Это означает, что диапазон возможных
оценок для всей совокупности составляет 25—35%.

56. Определение объема выборки на основе расчета доверительного интервала

Исходной информацией, необходимой для
реализации данного подхода, является:
Величина вариации, которой, как
считается, обладает совокупность.
Желаемая точность.
Уровень доверительности, которому
должны удовлетворять результаты
проводимого обследования.

57. Когда на заданный в анкете вопрос существует только два варианта ответа, выраженные в процентах (используется процентная мера), объем выбо

Когда на заданный в анкете вопрос существует только два
варианта ответа, выраженные в процентах (используется
процентная мера), объем выборки определяется по следующей
формуле:

58.

59. Пример расчета объема выборки

Фирмой, выпускающей покрышки, проводится опрос
автолюбителей. Целью обследования является
определение процента автолюбителей, использующих
радиальные покрышки, поэтому на вопрос:
«Используете ли вы радиальные покрышки?»
возможно только два ответа: «Да» или «Нет» (шкала
наименований).
Если предположить, что совокупность автолюбителей
обладает низким показателем вариации, то это
означает, что почти каждый опрошенный использует
радиальные покрышки. В этом случае может быть
сформирована выборка достаточно малых размеров. В
формуле (4.1) произведение pq выражает вариацию,
свойственную совокупности.

60. Пример расчета объема выборки

Предположим, что 90% единиц
совокупности используют радиальные
покрышки. Это означает, что рq = 900. Если
принять, что показатель вариации выше (р
= 70%), то рq = 2100.
Наибольшая вариация достигается в
случае, когда половина совокупности
(50%) используют радиальные покрышки, а
другая (50%) — не использует. В этом
случае произведение рq достигает
наибольшего значения, равного 2500

61. Пример расчета объема выборки

При проведении исследования следует
указать точность полученных оценок
(точность выборки).
Скажем, в результате исследования было
установлено, что 44% респондентов
используют радиальные покрышки.
В этом случае результаты измерения
желательно представить в виде: «Процент
автолюбителей, использующих
радиальные покрышки, составляет 44%
плюс-минус …%».

62. Пример расчета объема выборки

Что касается уровня доверительности, то при
проведении маркетинговых исследований, обычно
рассматриваются только два его значения: 95%
или 99%.
Первому значению соответствует значение z =
1,96, второму — z = 2,58.
Если выбирается уровень доверительности,
равный 99%, то это говорит о том, что мы
уверены на 99% (другими словами, доверительная
вероятность равна 0,99) в том, что процент
членов совокупности, попавших в диапазон ± е%,
равен проценту членов выборки, попавших в тот
же диапазон ошибки.

63. Пример расчета объема выборки

Принимая вариацию,
равную 50%,
точность, равную ± 10%,
при 95%-ном уровне
доверительности,
рассчитаем размер
выборки:
При уровне
доверительности,
равном 99%, и е =
±3% n = 1067.

64. Важно понимать!

Приведенные формулы расчета объема выборки
основаны на предположении, что все правила
формирования выборки были соблюдены и
единственной ошибкой выборки является ошибка,
обусловленная ее объемом.
Однако следует помнить, что объем выборки
определяет точность полученных результатов, но
не их представительность, которая определяется
методом формирования выборки.
Все формулы для расчета объема выборки
предполагают, что репрезентативность
гарантируется использованием корректных
процедур формирования выборки.

65. Систематическая ошибка выборки

Систематическая ошибка зависит от различных
факторов, оказывающих постоянное воздействие
на исследование и смещающих результаты
исследования в определенную сторону.
Пример:
— Использование любых вероятностных выборок
занижает долю людей с высоким доходом,
ведущих активный образ жизни. Происходит это в
силу того, что таких людей гораздо сложней
застать в каком-либо определенном месте
(например, дома).
— Проблема респондентов, отказывающихся
отвечать на вопросы анкеты (доля «отказников» в
Москве, для разных опросов, колеблется от 50%
до 80%)

66. Зависимость ошибки выборки от степени различий между единицами генеральной совокупности

Чем больше различия (или гетерогенности) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Например, если нам нужно узнать, какое количество
пива потребляется, то мы обнаружим, что внутри
нашей генеральной совокупности нормы
потребления у различных людей существенно
различаются (гетерогенная генеральная
совокупность).
В другом случае мы будем изучать потребление
хлеба и установим, что у разных людей оно
различается гораздо менее существенно (гомогенная
генеральная совокупность).

67. Важно понимать!

Помимо четкого планирования репрезентативности
выборки, нельзя распространять полученные результаты
за ее границы. Так, результаты исследования мнения
массового потребителя города Москвы о товарах
определенной фирмы нельзя распространять на всю Россию.
Можно быть поставленным в тупик разными результатами
обследования степени лояльности потенциальных
покупателей к определенной марке пылесоса (в одном
исследовании была названа цифра 10%, в другом случае —
25%).
Дело в том, что в первом случае цифра была получена от
общего числа опрошенных, а во втором случае — только от
числа тех покупателей, которые твердо решили приобрести
пылесос.

68. Из этого следует:

Для вдумчивого маркетолога очень
важными являются те пояснения,
которые сопровождают полученные
данные (как минимум, формулировки
вопросов и описание выборки)

69. Итак:

Объем выборки не влияет на репрезентативность
результатов (влияет метод ее формирования)
Чем больше величина выборки, тем меньше ее
возможная ошибка
Чем больше различий (гетерогенность) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Решение об объеме выборки является
компромиссом между точностью результатов
исследования и возможностями его практической
реализации.

1. Методология маркетинговых исследований

Тема Процедура выборки

2. Вопросы лекции

Основные понятия, используемые при проведении
выборочных исследований. Генеральная совокупность.
Выборка. Контур выборки. Единица и объем выборки.
Ошибка выборки.
Проблемы формирования выборки
Репрезентативность выборки.
Типы выборок. Виды вероятностной выборки. Виды
невероятностной выборки.
Комбинация типов выборки при проведении
исследования. Многоступенчатая выборка.
Этапы разработки выборочного плана. Подходы к
определению объема выборки. Ошибка выборки.

3. Почему появляются выборки?

Для маркетинговых целей
в целях экономии времени
и средств весьма типично
подвергать исследованию
лишь небольшую часть
той группы людей или
предприятий
(генеральной
совокупности), которая
представляет интерес для
исследователей.
Она обычно составляет
несколько сотен, иногда
тысячу объектов.

4. Суть выборочного метода

Суть выборочного метода заключается в том, что
по определенным правилам из общей
численности генеральной совокупности
отбирается ограниченное число единиц, которое
призвано в качестве своеобразной модели
воспроизводить структуру всей генеральной
совокупности
Генеральная совокупность — та часть объекта
исследования, которая локализована по времени
и территориально, и на нее распространяются
все выводы исследования

5. Примеры генеральных совокупностей:

Все жители Нижнего Новгорода (1267760 человек
по данным 2015 года)
Юридические лица России (2,2 млн. на начало
2008 года)
Розничные торговые точки, осуществляющие
продажу продуктов питания (20 тысяч на начало
2008 года) и т.д.

6. Выборка. Контур выборки

Ограниченное число единиц, выбранное из
генеральной совокупности (равно как и процедура по
их определению) именуется выборкой.
Контур выборки – это наличие полного списка всех
элементов генеральной совокупности.
Контур выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от истинных
размеров совокупности.
Пример: Очевидно, что не существует полного официального списка всех
автосервисных мастерских города Москвы, включая полулегальный и
нелегальный бизнес в данной области. Исследователь должен
информировать заказчика работы о размерах ошибки контура выборки.

7.

8. Итак, основные понятия:

Генеральная совокупность – вся группа, про
которую необходимо собрать информацию;
Выборка – часть совокупности, базовый уровень
исследования;
Ошибка выборки – разница между полученными
данными и фактическими по совокупности;
Контур выборки – все единицы совокупности, из
которых будет формироваться выборка;
Ошибка контура выборки – степень отклонения
контура выборки от генеральной совокупности;
Единица выборки – объект исследования

9. Три главные проблемы формирования выборки

Прежде всего, исходя из сути рассматриваемой
задачи, необходимо определить, кто является
единицей выборки.
Очень важным является также определение
контура выборки.
В целях выполнения правила репрезентативности
проводимого исследования необходимо обратить
внимание на метод, с помощью которого
выбираются единицы выборки
И наконец, необходимо решить вопрос об объеме
выборки, который определяет число изучаемых
единиц выборки.

10. Репрезентативность выборки

Цель отбора объектов в состав выборки всегда
состоит в получении такой совокупности, которая
по своим качествам репрезентирует ту, которую мы
намереваемся изучить
Под репрезентативностью в маркетинговых
исследованиях понимают такие свойства выборки,
которые позволяют ей выступать на момент опроса
моделью, представителем генеральной
совокупности.
Важно понимать, что репрезентативность выборки и
ошибка выборки – разные явления. Репрезентативность,
в отличие от ошибки никак не зависит от размера
выборки

11. Репрезентативность выборки

Одна и та же выборка может быть репрезентативной
и нерепрезентативной для разных генеральных
совокупностей
Пример:
— Выборка, целиком состоящая из москвичей,
владеющих автомобилем, не репрезентирует все
население Москвы.
— Выборка из российских предприятий численностью
до 100 человек не репрезентирует все предприятия
России.
— Выборка из москвичей, совершающих покупки на
рынке, не репрезентирует покупательское поведение
всех москвичей.

12. Репрезентативность выборки

В то же время, указанные выборки (при
соблюдении прочих условий) могут отлично
репрезентировать москвичей-автовладельцев,
небольшие и средние российские
предприятия и покупателей, совершающих
покупки на рынках соответственно.
Как бы мы не увеличивали количество
опрошенных москвичей-автовладельцев, мы
не сможем репрезентировать этой выборкой
всех москвичей.

13. Группы выборочных методов (типы выборки)

Вероятностная выборка (случайная) –
это такая выборка, для которой каждый
элемент генеральной совокупности имеет
определенную, заранее заданную
вероятность быть отобранным.
Это позволяет исследователю рассчитать,
насколько правильно выборка отражает
популяцию, из которой она спроектирована
(рассчитать ошибку выборки).

14. Неслучайная (невероятностная) выборка Еще одно название -детерминированная

Неслучайная (невероятностная)
выборка – это такой способ отбора
единиц, при котором мы не можем заранее
рассчитать вероятность каждого элемента
попасть в состав выборочной
совокупности.
Данный тип выборки не дает возможности
рассчитать, насколько правильна
(репрезентативна) выборка
Иногда по условиям исследования
оказывается единственно возможным
провести неслучайную выборку.

15.

16. Метод простого случайного отбора

Метод простого случайного отбора
предполагает, что вероятность быть избранным в
выборку известна и является одинаковой для всех
единиц совокупности. Для этого используется:
— Лотерейный метод (жребия)
— Таблицы случайных чисел
Главное условие осуществления вероятностной
выборки – наличие полного списка (контура) всех
элементов генеральной совокупности.
Использование простого случайного отбора
гарантирует, что каждая единица совокупности
известна и имеет равные шансы быть включенной
в выборку.

17. Лотерейный метод (жребия)

При использовании лотерейного метода
(или метода жребия) жетоны с номерами
всех элементов помещают в урну,
тщательно перемешивают и извлекают
последовательно n жетонов, где n – число
элементов выборочной совокупности.
Элементы генеральной совокупности,
имеющие номера оказавшиеся на
извлеченных жетонах, будут составлять
выборочную совокупность.

18. Фрагмент таблицы случайных цифр

37
52
35
15
04
80
44
83
21
28
31
42
46
72
13
20
07
99
95
64
13
06
27
29
10
16
69
93
39
08
09
38
00
84
65
56
09
29
67
19

19. Комментарий к использованию таблицы случайных цифр

Если мы имеем, скажем, популяцию (то есть генеральную
совокупность) из 1507 элементов и хотим спроектировать выборку
численностью 150 элементов, мы можем выбирать любые два
смежных столбца в таблице случайных чисел: цифры, стоящие в
двух смежных ячейках будут образовывать четырехзначное число.
Каждый раз, когда будет появляться число от 0001 до 1507, мы
будем считать, что оно обозначает номер отбираемого элемента.
Когда число появляется более чем один раз, этот номер
игнорируется после первого раза.
Если мы начнем с первых четырех столбцов в таблице, спускаясь
по столбцам, то в выборку будут включены элементы под номерами
0799, 1016, 0084, 480, 1306, 929, 1320 и 938.
Поскольку мы не стремимся умышленно отыскать определенное
число, мы можем начать с любого места таблицы и использовать
любую систему для движения по таблице.
С тем же успехом случайные числа могут генерироваться
специальной программой компьютера.

20. Метод систематической (или механической) выборки

На практике чаще всего
используют метод
систематической (или
механической) выборки,
когда из
пронумерованного списка
через равные интервалы k
отбирается заданное число
респондентов. При этом
шаг выборки k (интервал
скачка) рассчитывается по
простой формуле:
N
k
n
где N – численность
генеральной совокупности
n – численность
выборочной совокупности.

21. Пример систематической (или механической) выборки

Предположим, что нам нужно спроектировать выборку
численностью 100 из списка 5000 студентов какого-то вуза.
Если мы намерены использовать систематическую выборку, то
должны вначале рассчитать интервал выборки делением числа
элементов в списке на размер выборки.
В данном случае, разделив общую численность студентов 5000 на
требуемый размер выборки 100 единиц, мы получим интервал
(шаг) выборки 50.
Далее будем систематически двигаться по списку и отбирать
каждого пятидесятого студента (отобрав таким образом 100 имен).
Определение того места в списке, с которого мы начнем,
проводится случайным образом, по таблице случайных чисел
(это называется случайный старт).
Таким образом, если случайно выбрана точка старта под номером
31, то в выборку будут включены студенты, стоящие под номерами
31, 81, 131, 181 и т.д.

22. Метод кластерного отбора. (гнездовая или серийная выборка)

Метод кластерного отбора основан на
делении совокупности на подгруппы, каждая
из которых представляет совокупность в
целом.
Здесь отбираются не объекты исследования
(например, люди), а группы. Группы отбираются
случайным образом, а внутри них проводится
сплошной опрос. Например, в ВУЗе с большим
количеством студенческих групп отбор можно
проводить путем случайного отбора этих групп и
дальнейшего сплошного опроса в этих группах

23. Пример кластерного отбора

Предположим, что исследуется мнение населения
какого-то региона относительно марки какого-то товара.
Регион разбивается на четко определяемые части
(кластеры), например области.
Исследователь может считать, что выделенные кластеры
являются идентичными и мнение населения этих
областей характерно для региона в целом.
Далее одна из областей (один кластер) выбирается
случайным образом, определяется совокупность для
этой области, в ней проводится соответствующее
исследование, а выводы обобщаются на совокупность
всего региона

24. Причины появления стратифицированного отбора (типической или районированной выборки)

В основе всех вероятностных методов лежит
предположение, что любая совокупность характеризуется
симметричным распределением ее ключевых
характеристик. Другими словами, каждая выборка
достаточно полно характеризует всю совокупность,
различные крайности в выборке уравновешивают друг
друга.
Но такая ситуация на практике встречается крайне редко.
Скажем, исследуется рыночный потенциал определенного
региона для какого-то товара. Население больших, средних
и малых городов, сельской местности данного региона
отличается по уровню образования, дохода, образу жизни
и т.п. В таком случае необходим стратифицированный
отбор

25. Понятие стратифицированной выборки

При наличии в составе генеральной
совокупности различных типов явлений с
разными уровнями изучаемых признаков
организуют стратифицированную выборку,
чтобы обеспечить более равномерное
представительство в выборочной совокупности
различных частей (типов) явления.
Генеральная совокупность разделяется на различные
подгруппы (страты), например по уровню доходов, и
выборки формируются из этих подгрупп, по сути
дела являющихся сегментами рынка.

26. Условия осуществления стратифицированной выборки

При использовании данного метода прежде всего
следует выбрать некоторую наблюдаемую
характеристику (признак), характеризующую каждую
единицу совокупности, например уровень дохода.
Далее для каждой страты с помощью случайного
отбора формируется выборка.
Стратифицированная выборка может быть применена
лишь при наличии дополнительной информации о
генеральной совокупности (например, нам необходимо
процентное соотношение мужчин и женщин, в случае,
если мы хотим стратифицировать выборку по полу).
Отсутствие такой информации делает применение
стратифицированной выборки невозможным

27. Методы (типы) невероятностной выборки

Отбор в такой выборке осуществляется не по
принципам случайности, а по субъективным
критериям – доступности, типичности,
равного представительства и т.д.
При применении невероятностных методов
отбора формирование выборки
осуществляется без использования понятий
теории вероятностей, вследствие чего
невозможно рассчитать вероятность
включения в выборку единицы
совокупности.

28. Нерепрезентативный отбор. Метод стихийной выборки: отбор на основе удобства и доступности

Смысл метода заключается в том, что
формирование выборки осуществляется
самым удобным с позиций исследователя
образом, например, с позиций минимальных
затрат времени и усилий, с позиции
доступности респондентов.
Выбор места исследования и состава выборки
производится субъективным образом, например,
опрос покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в опросе.

29. Метод экспертного отбора (на основе суждения)

Метод основан на использовании мнения
квалифицированных специалистов, экспертов
относительно состава выборки. На основе такого
подхода часто формируется состав фокус-группы.
Например, изучается потребность в издании
кулинарной книги для приготовления в
микроволновой печи низкокалорийной пищи. На
основе мнения исследователей в состав фокусгруппы было включено 12 домохозяек; шестеро из
них владело микроволновыми печами более трех
лет, трое — менее трех лет и трое только
собирались их купить.

30. Метод квотной выборки

Формирование выборки на основе квот
(квотный отбор) предполагает
предварительное, исходя из целей
исследования, определение состава и
численности групп респондентов, отвечающих
определенным требованиям (признакам).
Например, мужчины в возрасте 20-30 лет, 31-45
лет и 46-60 лет; лица с доходом до 30 тысяч
рублей, с доходом от 30 до 60 тысяч рублей и с
доходом свыше 60 тысяч рублей)

31. Метод квотной выборки

Для каждой группы задается количество объектов,
которые должны попасть выборку и быть обследованы.
Количество объектов, которые должны попасть в
каждую из групп, задается, чаще всего, либо
пропорционально заранее известной доле группы в
генеральной совокупности, либо одинаковым для
каждой группы.
Внутри групп объекты отбираются произвольно.
Квотные выборки используются в маркетинговых
исследованиях достаточно часто

32. Пример квотной выборки

Приведем пример расчета выборки по
таким параметрам квоты как пол и возраст.
В одном из маркетинговых исследований
при опросе населения, исследователи
опирались на данные Областного комитета
по статистике о половозрастной структуре
населения районов города.
Так, половозрастная структура населения
Советского района Нижнего Новгорода
выглядела следующим образом:

33.

Генеральная совокупность
численность
Выборочная
совокупность
Доля, %
число
Всего
муж.
жен.
муж.
жен.
всего
муж.
жен.
всего
128546
55757
72789
43,4
56,6
100,00
521
679
1200
20 — 24
11958
6009
5949
50,3
49,7
9,30
56
56
112
25 — 29
11858
6520
5338
55,0
45,0
9,22
61
50
111
30 — 34
12093
5861
6232
48,5
51,5
9,41
55
58
113
35 — 39
14360
6795
7565
47,3
52,7
11,17
63
71
134
40 — 44
14112
6598
7514
46,8
53,2
10,98
62
70
132
45— 49
12779
5840
6939
45,7
54,3
9,94
55
65
119
50 — 54
7274
3222
4052
44,3
55,7
5,66
30
38
68
55 — 59
11981
5035
6946
42,0
58,0
9,32
47
65
112
60 — 69
17503
6828
10675
39,0
61,0
13,62
64
100
163
70 и старше
14628
3049
11579
20,8
79,2
11,38
28
108
137
Основа выборки
Возраст (лет)

34. Пример квотной выборки

Изучая данные таблицы, нетрудно убедиться, что
численность каждой из половозрастных групп в
трех последних столбцах таблицы (объеме
выборки) пропорциональна численности каждой из
соответствующих групп в генеральной
совокупности. Такая выборка называется
пропорциональной.
Иногда используются и непропорциональные
выборки, если это необходимо исходя из целей
исследования
Таким образом на основе определенных заданных
параметров создается микромодель
генеральной совокупности

35. Метод снежного кома

Формирование выборки в процессе опроса основано на
расширении числа опрашиваемых на основе предложений
респондентов, которые уже приняли участие в
обследовании.
У каждого респондента, начиная с первого, просят
контакты его друзей, коллег, знакомых, которые подходили
бы под условия отбора и могли бы принять участие в
исследовании.
Таким образом, за исключением первого шага, выборка
формируется с участием самих объектов исследования.
Метод часто применяется, когда необходимо найти и
опросить труднодоступные группы респондентов
(например, респондентов, имеющих высокий доход,
респондентов, принадлежащих к одной профессиональной
группе, респондентов, имеющих какие-либо схожие
хобби/увлечения и т.д.)

36. Комбинация типов выборки при проведении исследования: многоступенчатая выборка

Многоступенчатая выборка –строится с
применением процедуры поэтапного отбора
объектов опроса.
При этом совокупность объектов, отобранных
на предыдущем этапе (ступени), становится
исходной для отбора на следующем.
Промежуточные объекты, составляющие
выборочную совокупность на высших
ступенях, называют единицами отбора.
Объекты самой нижней ступени, с которых
ведется непосредственный сбор информации,
называются единицами наблюдения.

37. Пример многоступенчатой выборки

Так, формирование выборки для оценки мнения населения России
относительно различных марок какого-либо товара, например
холодильника, может осуществляться по следующей схеме:
1. Россия, согласно ее административно — территориальному
делению, делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов
(исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в
зависимости от численности населения делятся на шесть групп:
до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100
000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из
девяти выбранных субъектов Федерации исследуются три города
и два поселка

38. Пример многоступенчатой выборки

Для этого берется каждый пятый населенный пункт из справочника
Госкомстата «Численность населения Российской Федерации по
городам, рабочим поселкам и районам и определяется, в какую из
категорий он попадет (систематический отбор). Так поступают
до тех пор, пока не наберется нужное количество населенных
пунктов. Если, дойдя до конца списка, не будет найдено квотное
число населенных пунктов, процесс выбора населенных пунктов
начинается сначала, но берется каждый четвертый населенный
пункт, и т.д.
5. Выбирается случайным образом в каждом выбранном городе и
поселке по меньшей мере 20 респондентов.
Таким образом, кроме Москвы и С.-Петербурга должно быть
проинтервьюировано 900 респондентов. В Москве и С.Петербурге опрашивается по 50 респондентов. В итоге должно
быть проинтервьюировано 1000 респондентов.

39. Этапы разработки выборочного плана

1. Определение соответствующей совокупности
согласно поставленным целям исследования.
2. Получение «списка» совокупности для
установления контура выборки.
3. Проектирование выборочного плана –
определение состава и объема выборки.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой
выборки.

40. Определение объема выборки

Исходным пунктом расчета объема выборки
становится вопрос об определении размеров
выборочной совокупности.
Численность выборочной совокупности зависит от
двух факторов:
(1) стоимости сбора информации
(2) стремления к определенной степени
статистической достоверности результатов,
которую надеется получить исследователь.
Чем больше размеры выборки, то есть чем ближе
они к размерам генеральной совокупности в
целом, тем более надежны и достоверны
полученные данные.

41. Определение объема выборки

Самый спорный вопрос по выборочному
плану.
На практике, решение о объеме выборки
всегда есть компромисс между точностью
результатов исследования и затратами на
проведение исследования.
Способ определения объема выборки
зависит от того, имеется ли у
исследователя информация о составе
генеральной совокупности

42. Связь между объемом выборки и репрезентативностью

Следует отметить, что объем выборки никак не
влияет на репрезентативность полученных
результатов.
Пример: Предположим, например, что в целях
изучения степени использования в России
персональных компьютеров в научной работе
проводился опрос на основе принципа удобства
на одном из московских перекрестков. И хотя
было опрошено 5000 респондентов, полученные
результаты не являются репрезентативными даже
для Москвы.
Это обусловлено тем, что был использован метод
формирования выборки, который в данном случае
применять было нельзя.

43. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Правило большого пальца –
бездоказательно принимается, что для
получения нужных результатов
выборка должна составлять, например,
5% от генеральной совокупности
Исходя из заранее оговоренных с
заказчиком условий (он рекомендует
цифры выборки)

44. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Многолетний опыт социологов-практиков. Он
свидетельствует о том, что при массовых опросах,
если величина генеральной совокупности
составляет менее 5000, то достаточный объем
выборочной совокупности должен быть не менее
500 человек.
Если величина генеральной совокупности
составляет более 5000, то для получения
статистически значимых результатов нужно
обследовать 10% ее состава, но не более 2000-2500
единиц.

45.

Зависимость объема выборки от ее ошибки
(размер генеральной совокупности составляет 20 тыс.
единиц)
Ошибка
выборки,
%
2
3
4
5
6
7
8
9
10
Объем
выборки,
ед.
2500
1100
620
400
280
200
160
110
100
12
67
14
50
17
30
20
25

46. Зависимость объема выборки от ее ошибки

В.И. Паниотто приводит следующие расчеты
репрезентативной выборки с допущением 5процентной ошибки:
Объем
генеральной
совокупности
500 1000 2000 3000
4000
5000
10000
100000
Объем
выборки
222 286
360
370
385
358
333
350

47. Комментарии к таблице

Суть данных, приведенных в этой таблице, состоит в
следующем. Если вы, опросив, предположим, 400
человек в районном городе, где численность взрослого
платежеспособного населения составляет 100 тысяч
человек, выявили, что 33 процента опрошенных
покупателей предпочитают продукцию местного
мясокомбината, то с 95-процентной степенью
вероятности можете утверждать, что постоянными
покупателями этой продукции являются 33 5% (то
есть от 28 до 38 процентов) жителей этого города.
Уровень уверенности в 95% – это условие, оно
показывает 95% уверенности в том, что параметр
популяции попадает в пределы допуска ошибки
выборочной статистики.

48. Методы определения объема выборки Если исходная информация о генеральной совокупности имеется, то:

Наиболее теоретически обоснованный и
корректный подход к определению
объемов выборки основан на расчете
доверительных интервалов.
Метод требует понимания некоторых
базовых понятий математической
статистики (закона нормального
распределения, меры вариации, среднего
квадратического отклонения,
доверительного интервала и т. д.)

49. Понятие вариации

Понятие вариации характеризует величину
несхожести (схожести) ответов респондентов на
определенный вопрос.
В более строгом плане вариацией значений какоголибо признака в совокупности называется различие
его значений у разных единиц данной совокупности
в один и тот же период или момент времени.
Результаты ответов на вопросы опроса обычно
представляются в форме кривой распределения.
При высокой схожести ответов говорят о малой
вариации (узкая кривая распределения) и при
низкой схожести ответов — о высокой вариации
(широкая кривая распределения).

50. Кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш автомобиль?»

51. Среднее квадратическое отклонение

В качестве меры вариации обычно принимается
среднее квадратическое отклонение, которое
характеризует среднее расстояние от средней
оценки ответов каждого респондента на
определенный вопрос.
Можно сравнить среднее квадратическое
отклонения для двух выборок и определить, для
какой из них вариация является меньшей.
Поскольку все маркетинговые решения
принимаются в условиях неопределенности, то
это обстоятельство целесообразно учесть при
определении объема выборки.

52. «Доверительный интервал»

Так как определение исследуемых величин для
совокупности в целом осуществляется на основе
выборочной статистики, то следует установить
диапазон (доверительный интервал), в который, как
ожидается, попадут оценки для совокупности в целом,
и ошибку их определения.
Понятие «доверительный интервал» — это диапазон,
крайним точкам которого соответствует определенный
процент определенных ответов на какой-то вопрос.
Данное понятие тесно связано с понятием «среднее
квадратическое отклонение изучаемого признака в
генеральной совокупности»: чем оно больше, тем шире
должен быть доверительный интервал, чтобы
включить в свой состав, например, 95% ответов.

53. Пример

Проведено исследование числа визитов
автовладельцев в сервисные мастерские за год.
Доверительный интервал для среднего числа
визитов был рассчитан равным 5—7 визитам при
99%-ном уровне доверительности (надежности
выборки).
Это означает, что если появится возможность
провести независимо 100 раз выборочные
исследования, то для 99 средних значений числа
визитов попадут в диапазон от 5 до 7 визитов —
другими словами, 99% автовладельцев попадут в
доверительный интервал. (в 99 случаях результат
будет находиться в указанных границах)

54. Важно понимать!

Выборка всегда дает более относительный
результат по сравнению с генеральной
совокупностью.
Всегда есть вероятность отклонения, которая
считается ошибкой выборки (измеряется в
процентах)

55. Средняя квадратическая ошибка выборки

Индикатором степени отличия оценки, истинной
для совокупности в целом, от оценки, которая
ожидается для типичной выборки, является
средняя квадратическая ошибка выборки.
Например, исследуется мнение потребителей о новом
продукте и заказчик данного исследования указал, что
его устроит точность полученных результатов,
равная ±5% (ошибка выборки)
Предположим, что 30% членов выборки высказалось за
новый продукт. Это означает, что диапазон возможных
оценок для всей совокупности составляет 25—35%.

56. Определение объема выборки на основе расчета доверительного интервала

Исходной информацией, необходимой для
реализации данного подхода, является:
Величина вариации, которой, как
считается, обладает совокупность.
Желаемая точность.
Уровень доверительности, которому
должны удовлетворять результаты
проводимого обследования.

57. Когда на заданный в анкете вопрос существует только два варианта ответа, выраженные в процентах (используется процентная мера), объем выбо

Когда на заданный в анкете вопрос существует только два
варианта ответа, выраженные в процентах (используется
процентная мера), объем выборки определяется по следующей
формуле:

58.

59. Пример расчета объема выборки

Фирмой, выпускающей покрышки, проводится опрос
автолюбителей. Целью обследования является
определение процента автолюбителей, использующих
радиальные покрышки, поэтому на вопрос:
«Используете ли вы радиальные покрышки?»
возможно только два ответа: «Да» или «Нет» (шкала
наименований).
Если предположить, что совокупность автолюбителей
обладает низким показателем вариации, то это
означает, что почти каждый опрошенный использует
радиальные покрышки. В этом случае может быть
сформирована выборка достаточно малых размеров. В
формуле (4.1) произведение pq выражает вариацию,
свойственную совокупности.

60. Пример расчета объема выборки

Предположим, что 90% единиц
совокупности используют радиальные
покрышки. Это означает, что рq = 900. Если
принять, что показатель вариации выше (р
= 70%), то рq = 2100.
Наибольшая вариация достигается в
случае, когда половина совокупности
(50%) используют радиальные покрышки, а
другая (50%) — не использует. В этом
случае произведение рq достигает
наибольшего значения, равного 2500

61. Пример расчета объема выборки

При проведении исследования следует
указать точность полученных оценок
(точность выборки).
Скажем, в результате исследования было
установлено, что 44% респондентов
используют радиальные покрышки.
В этом случае результаты измерения
желательно представить в виде: «Процент
автолюбителей, использующих
радиальные покрышки, составляет 44%
плюс-минус …%».

62. Пример расчета объема выборки

Что касается уровня доверительности, то при
проведении маркетинговых исследований, обычно
рассматриваются только два его значения: 95%
или 99%.
Первому значению соответствует значение z =
1,96, второму — z = 2,58.
Если выбирается уровень доверительности,
равный 99%, то это говорит о том, что мы
уверены на 99% (другими словами, доверительная
вероятность равна 0,99) в том, что процент
членов совокупности, попавших в диапазон ± е%,
равен проценту членов выборки, попавших в тот
же диапазон ошибки.

63. Пример расчета объема выборки

Принимая вариацию,
равную 50%,
точность, равную ± 10%,
при 95%-ном уровне
доверительности,
рассчитаем размер
выборки:
При уровне
доверительности,
равном 99%, и е =
±3% n = 1067.

64. Важно понимать!

Приведенные формулы расчета объема выборки
основаны на предположении, что все правила
формирования выборки были соблюдены и
единственной ошибкой выборки является ошибка,
обусловленная ее объемом.
Однако следует помнить, что объем выборки
определяет точность полученных результатов, но
не их представительность, которая определяется
методом формирования выборки.
Все формулы для расчета объема выборки
предполагают, что репрезентативность
гарантируется использованием корректных
процедур формирования выборки.

65. Систематическая ошибка выборки

Систематическая ошибка зависит от различных
факторов, оказывающих постоянное воздействие
на исследование и смещающих результаты
исследования в определенную сторону.
Пример:
— Использование любых вероятностных выборок
занижает долю людей с высоким доходом,
ведущих активный образ жизни. Происходит это в
силу того, что таких людей гораздо сложней
застать в каком-либо определенном месте
(например, дома).
— Проблема респондентов, отказывающихся
отвечать на вопросы анкеты (доля «отказников» в
Москве, для разных опросов, колеблется от 50%
до 80%)

66. Зависимость ошибки выборки от степени различий между единицами генеральной совокупности

Чем больше различия (или гетерогенности) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Например, если нам нужно узнать, какое количество
пива потребляется, то мы обнаружим, что внутри
нашей генеральной совокупности нормы
потребления у различных людей существенно
различаются (гетерогенная генеральная
совокупность).
В другом случае мы будем изучать потребление
хлеба и установим, что у разных людей оно
различается гораздо менее существенно (гомогенная
генеральная совокупность).

67. Важно понимать!

Помимо четкого планирования репрезентативности
выборки, нельзя распространять полученные результаты
за ее границы. Так, результаты исследования мнения
массового потребителя города Москвы о товарах
определенной фирмы нельзя распространять на всю Россию.
Можно быть поставленным в тупик разными результатами
обследования степени лояльности потенциальных
покупателей к определенной марке пылесоса (в одном
исследовании была названа цифра 10%, в другом случае —
25%).
Дело в том, что в первом случае цифра была получена от
общего числа опрошенных, а во втором случае — только от
числа тех покупателей, которые твердо решили приобрести
пылесос.

68. Из этого следует:

Для вдумчивого маркетолога очень
важными являются те пояснения,
которые сопровождают полученные
данные (как минимум, формулировки
вопросов и описание выборки)

69. Итак:

Объем выборки не влияет на репрезентативность
результатов (влияет метод ее формирования)
Чем больше величина выборки, тем меньше ее
возможная ошибка
Чем больше различий (гетерогенность) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Решение об объеме выборки является
компромиссом между точностью результатов
исследования и возможностями его практической
реализации.

академик Международной академии информатизации,
д.э.н., профессор АНХ при Правительстве РФ

(Продолжение. Начало журнал «Маркетинг в России и за рубежом» в №№ 1, 2, 3, 5 и 6 за 2000 г.)

Маркетинговые исследования

5. Разработка и реализация плана исследований

5.1 Выбор методов сбора данных

Можно выделить следующие методы сбора данных при проведении опросов с участием интервьюеров или самостоятельном заполнении анкет респондентами:

1. Интервьюирование, осуществляемое на дому у респондента. Возможно предварительное согласование сроков интервью по телефону.

Обычно в этом случае легче установить доверительные отношения с опрашиваемым, возможен показ образцов товара, рекламных материалов и т.п. Домашняя обстановка настраивает на достаточно длительное интервью с высокой степенью концентрации внимания на проводимом обследовании. Однако это дорогой метод сбора данных.

2. Интервьюирование посетителей крупных магазинов. Компании, проводящие такие обследования, могут в крупных магазинах иметь свои офисы. Посетители магазина опрашиваются интервьюером в помещении магазина или могут приглашаться для дачи интервью в офис. C помощью данного метода, без использования специальных методических подходов, трудно обеспечить репрезентативность результатов обследования и вдумчивое отношение опрашиваемых к задаваемым вопросам. По сравнению с первым данный метод является более дешевым.

3. Интервью в офисах. Используется обычно при сборе информации о продукции производственно-технического и офисного назначения. Этот метод, по существу, обладает теми же достоинствами и недостатками, что и первый, однако имеет более высокую стоимость проведения, обусловленную использованием более квалифицированных интервьюеров.

4. Традиционное телефонное интервью. К числу достоинств данного метода сбора данных относятся: относительно низкая стоимость, возможность охватить большое число респондентов и обеспечить высокий уровень репрезентативности, возможность проведения за относительно короткий период времени. Методу присущи следующие недостатки: невозможность что-либо показать респонденту, невозможность получить личное впечатление от встречи с респондентами. (Правда, отсутствие личного контакта порой способствует получению правдивых ответов на вопросы о потреблении алкоголя, противозачаточных средств и т.п.) Далее — трудность получения пространных ответов на большое число вопросов, так как терпение респондента может иссякнуть. Кроме того, трудно проверить качество проведенного интервью и установить, все ли запланированные к опросу респонденты в реальности были им охвачены.

5. Телефонное интервью из специально оборудованного помещения, где одновременно работают несколько интервьюеров, к телефонам которых могут подсоединяться контролеры.

6. Телефонное интервью с помощью компьютера. Многие компании, занимающиеся опросом потребителей, специально оборудованные помещения для телефонного интервьюирования оснащают компьютерной техникой. Эта техника осуществляет автоматический набор телефонных номеров респондентов, далее на мониторе появляется вступительный текст, а затем — последовательно задаваемые вопросы с возможными вариантами ответов. Интервьюер зачитывает респонденту вопросы и с помощью кода фиксирует названный вариант ответа.

7. Полностью компьютеризованное интервью. В данном случае в дополнение к ранее описанному методу респондент отвечает на вопросы путем нажатия на кнопки своего телефона или вопросы появляются на мониторе его компьютера, а респондент вводит ответы, используя обычную компьютерную клавиатуру.

8. Групповое самостоятельное заполнение анкет. Такой подход используется для удобства и удешевления интервьюирования. Например, перед двадцатью-тридцатью членами группы демонстрируется рекламный ролик, после чего они индивидуально отвечают на вопросы анкеты, касающиеся оценки данного ролика. Участниками группы могут быть школьники одного класса, студенты одной учебной группы, отдыхающие дома отдыха и т.д.

9. Самостоятельное заполнение оставленных анкет. Является вариантом обследования на основе самостоятельного заполнения анкет. После предварительного устного разъяснения целей и задач проводимого обследования анкета оставляется у респондента. Заполненную анкету, спустя определенное время, или забирают у респондента, или он отсылает ее по почте в конверте с оплаченным ответом. Данный метод применяется при проведении опросов на ограниченной территории, не требующей от интервьюера значительных передвижений.

10. Обследование по почте. Вопросы и ответы на них посылаются по почте. Достоинства метода обусловлены тем, что не надо нанимать интервьюеров, легкостью формирования групп целевых респондентов, его дешевизной. Этот метод обладает теми же недостатками, что и методы самостоятельного заполнения анкет без участия интервьюера. Кроме того, он характеризуется низким процентом возвращенных ответов, ориентирован в основном на достаточно грамотных людей, проживающих к тому же в странах с эффективной почтовой системой.

Выбор конкретных методов обследований основан на учете следующих групп факторов: цели и ресурсы исследователя; характеристики респондентов; характеристики вопросов, задаваемых исследователем. Кратко охарактеризуем эти три группы факторов.

Цели сбора данных вытекают из целей проводимого маркетингового исследования. В основе их определения лежат требования получения информации желаемого качества. Последнее же обусловлено временем, отпущенным на принятие решения, и имеющимися ресурсами.

К числу наиболее быстро реализуемых методов относятся телефонный опрос и интервьюирование посетителей крупных магазинов. Отсутствие достаточных денежных средств также оказывает влияние на выбор метода сбора данных. Наиболее дешевым методом является телефонное интервьюирование.

Следует рассмотреть, по крайней мере, следующие характеристики целевой группы респондентов, влияющие на выбор метода сбора данных:

1. Процент респондентов, обладающих требуемыми характеристиками в общей совокупности опрашиваемых. Например, если исследуется концепция низкокалорийных продуктов питания, приготавливаемых в микроволновой печи, то в качестве целевых респондентов следует рассматривать домохозяек, имеющих микроволновые печи и которые в течение последних шести месяцев покупали низкокалорийные продукты питания.

2. Желание участвовать в опросе. Исследователя всегда беспокоит высокая степень отказа респондентов в участии в обследовании. Можно выделить два типа причин нежелания принять участие в любом обследовании. Первый обусловлен некими обобщенными чувствами подозрительности и стремлением никого не допускать в свою личную жизнь: определенная категория людей просто не хочет принимать участия в любом опросе. Второй связан со специфическими обстоятельствами проведения конкретного обследования. Например, некоторые респонденты не желают обсуждать определенные темы. Выбранный метод опроса влияет на степень желания участвовать в обследовании, Так, потенциальные респонденты находят более трудным отказаться от участия в личном интервью, чем в почтовом опросе.

3. Возможность принятия участия в опросе. Даже если потенциальный респондент удовлетворяет двум вышеизложенным требованиям, он в силу тех или иных причин может не принять участие в обследовании (командировка, болезнь, неожиданные семейные обстоятельства, забывчивость и т.п.).

Выбор методов сбора данных во многом определяется уровнем сложности вопросов. Существенное влияние на выбор метода сбора данных оказывает степень затрагивания личных интересов, взглядов, морально-этических аспектов Опыт изучения данных проблем говорит о том, что здесь менее всего подходит персональное интервью, а чаще всего наиболее приемлемым является телефонное интервью или интервью с помощью компьютера.

5.2 Вопросник и порядок его разработки

Главными инструментами реализации методов наблюдения и опроса являются анкета (вопросник) и механические устройства, например счетчики количества людей, кино- и видеокамеры. Далее будет чаше использоваться термин «вопросник», поскольку он носит более общий характер — анкета применяется только при письменных ответах на поставленные вопросы.

Обычно процесс составления вопросника осуществляется в следующей последовательности:

1. Определение целей опроса.

2. Выбор методов сбора данных.

3. Разработка вопросов.

4. Оценка вопросов.

5. Одобрение со стороны клиента.

6. Тестирование.

7. Уточнение анкет.

Определение целей опроса и выбор методов сбора данных были рассмотрены ранее. Ниже дается описание процесса непосредственного составления вопросника. Этот процесс носит итеративный характер и направлен на последовательное уточнение содержания вопросника, повышение вероятности получения достоверных ответов, исключение влияния содержания вопросов и их формата на получаемые ответы.

Вопросник обычно состоит из трех частей: введения, реквизитной части и основной части.

Главная задача введения — убедить респондента принять участие в опросе. Оно должно содержать цель проводимого опроса и призвано показать, какую пользу получит респондент, приняв в нем участие.

В реквизитной части приводится информация, касающаяся респондентов. Кроме того, здесь идентифицируется сам вопросник, то есть ему дается название, указываются дата, время и место проведения опроса, фамилия интервьюера.

При разработке основной части вопросника следует обратить внимание на: тип вопросов (формат ответов), их содержание и число, последовательность представления вопросов в анкете, наличие контрольных вопросов.

Существуют три основных формата задаваемых вопросов: открытые вопросы, закрытые вопросы и вопросы со шкалой ответов.

Открытый вопрос — вопрос анкеты, позволяющий опрашиваемому отвечать на него «своими словами». В таких вопросах отсутствует предвзятость, стремление навязать определенный ответ. Однако ответы на открытые вопросы требуют достаточно больших затрат времени. Кроме того, полученные ответы могут быть интерпретированы по-разному.

Закрытый вопрос включает все возможные варианты ответов, из которых опрашиваемый делает свой выбор. Использование данного типа вопросов активизирует деятельность респондентов по заполнению анкет, облегчает процесс ввода полученных данных. Главный недостаток вопросов с многовариантным выбором обусловлен трудностью формулирования всех возможных вариантов ответов, характеристик или факторов.

Вопросы со шкалой ответов содержат четкие, возможно количественные, дескрипторы, определяющие отдельные градации шкалы или ее конечные точки. На таких принципах, например, построены шкалы Лайкерта и семантической дифференциации.

Что касается метода сбора данных, то очевидно, что, скажем, телефонное интервью предполагает использование относительно простых вопросников по сравнению с опросами, проводимыми по почте.

Определяя содержание вопросов, необходимо учесть следующие обстоятельства.

Вопрос должен быть сфокусирован на одной проблеме или теме, быть кратким и понятным. Все респонденты должны понимать заданный вопрос однозначно и отвечать именно на него, а не на свои варианты его домысливания. Вопросы следует формулировать в нейтральной тональности, без некоей положительной или отрицательной оценки рассматриваемой проблемы, не должны склонять респондента к ответу, желаемому для исследователя.

При определении числа вопросов следует руководствоваться тезисом: чем их меньше, тем больше шансов получить на них ответы.

Желательно, чтобы вопросы излагались в определенной логической последовательности. Вначале следует задать вопросы, с помощью которых можно определить уровень компетентности респондентов в области проводимого исследования. Дальнейшие вопросы должны служить целям «разминки» респондентов. Эти вопросы должны быть относительно простыми, легкими для ответов, а кроме того, заинтересовывать опрашиваемых, показать им, что они легко справятся с ответами. За разминочными следуют основные вопросы.

Наиболее трудные вопросы, требующие для ответа использования специальных шкал и достаточных умственных усилий, рекомендуется ставить в середине или ближе к концу анкеты.

Вопросы, носящие чрезмерно личный характер («Чистите ли Вы зубы каждый день?» «Часто ли Вы на своем автомобиле превышаете допустимую скорость?»), обычно помещаются среди «невинных» вопросов.

Описанное выше носит характер общих рекомендаций. Однако существуют, по крайней мере, два специальных подхода к проектированию вопросников: туннельный и секционный.

При использовании туннельного подхода имеет место постепенный переход от широких, общих вопросов к более узким, частным.

Секционный подход заключается в том, что последовательно рассматриваются вопросы по отдельным темам, до их полного исчерпания.

На практике зачастую используется комбинация рассмотренных подходов.

Опрос может носить анонимный и конфиденциальный характер.

В первом случае респондент должен быть уверен, что его имя и другие реквизиты не будут известны исследователям. Во втором случае предполагается, что имя респондента известно только исследователю, но отнюдь не заказчику данного обследования. В телефонном опросе и при опросах, связанных с присутствием интервьюеров, опрос носит только конфиденциальный характер.

5.3 Рассмотрим понятия выборочных исследований

Рассмотрим основные понятия, используемые при проведении выборочных исследований.

Вся исследуемая группа в целом, например все потребители, купившие какой-нибудь продукт, в статистике называется генеральной совокупностью или просто совокупностью. Иногда совокупность является достаточно малой по своей численности и можно изучить всех ее членов. Обычно же это сделать невозможно. Следовательно, проводится изучение только части совокупности, называемой выборкой.

Выборка является базовым уровнем проводимых исследований.

Необходимо отметить, что данные, полученные от выборки, скорее всего не будут в точности соответствовать данным, которые можно было бы получить от всех единиц совокупности. Различие между данными, полученными от выборки и истинными данными, называется ошибкой выборки. Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки. Эти вопросы будут рассмотрены ниже.

Формирование выборки основывается прежде всего на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полного официального списка всех автосервисных мастерских города Москвы, включая полулегальный и нелегальный бизнес в данной области.

При формировании выборки используются вероятностные (cлучайные) и невероятностные (неслучайные) методы.

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности нельзя точно рассчитать вероятности. Поэтому термин «известная вероятность» скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.

Простой случайный отбор предполагает, что вероятность быть включенным в выборку известна и является одинаковой для всех единиц совокупности. Вероятность эта определяется отношением объема выборки к размеру совокупности.

Простой случайный отбор может осуществляться с помощью следующих методов: формирование выборки вслепую и с помощью таблицы случайных чисел.

При использовании метода формирования выборки вслепую единицы совокупности в соответствии с их фамилиями, названиями или другими признаками вносятся в карточки, которые в перемешанном виде помещаются в какую-то непрозрачную емкость (ящик, коробку и т.п.). Из данной емкости кто-то случайным образом вытягивает число карточек, определяемое объемом выборки.

В таблицах случайных чисел содержатся числа, порядок включения которых в таблицу осуществлен случайным образом. Единицам совокупности присваивают порядковые номера. В таблице случайных чисел выбирают любую начальную точку и, двигаясь в произвольном направлении и произвольно меняя направление движения, выбирают необходимое количество номеров из числа присвоенных, равное заранее установленному объему выборки.

Кроме того, используются генераторы случайных чисел. Например, при телефонном интервьюировании компьютер, имеющий генератор случайных чисел, может генерировать случайным образом телефонные номера.

Начальная часть метода систематического отбора соответствует начальному этапу проведения метода простого случайного отбора: необходимо получить полный список единиц генеральной совокупности. Однако далее вместо присвоения им порядковых номеров используется показатель «интервал скачка», рассчитанный как отношение размера совокупности к объему выборки. Например, если используется телефонный справочник и интервал скачка определен равным 250, то это означает, что каждый 250-й телефонный номер включается в выборку. Однако для определения начальных страницы и колонки справочника используются случайные числа.

Особенно широко метод систематического отбора применяется, когда для различных видов совокупностей существуют различные справочники, списки, спецификации и иные подобные материалы.

Другим методом вероятностного отбора является кластерный отбор, основанный на делении совокупности на подгруппы, каждая из которых представляет совокупность в целом. Базовая концепция данного метода очень похожа на базовую концепцию метода систематического отбора, однако реализация этой концепции осуществляется по-другому.

Предположим, что исследуется мнение населения какого-то региона относительно марки какого-либо товара. Регион разбивается на четко определяемые части (кластеры), например области. Исследователь может считать, что выделенные кластеры являются идентичными и мнение населения этих областей характерно для региона в целом. Далее одна из областей (один кластер) выбирается случайным образом, определяется совокупность для этой области, в ней проводится соответствующее исследование, а выводы распространяются на совокупность всего региона (одноступенчатый подход).

В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик, — говоря иными словами, что каждая выборка достаточно полно характеризует всю совокупность и различные крайности в выборке уравновешивают друг друга. Однако такая ситуация на практике встречается крайне редко. Скажем, исследуется рыночный потенциал определенного региона для какого-то товара, но и население больших, средних и малых городов, сельской местности данного региона различается по уровню образования, доходу, образу жизни и т.п.

В случае несимметричного распределения совокупности последняя подразделяется на различные подгруппы (страты), например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит название стратифицированного отбора. Далее для каждой страты с помощью случайного отбора формируется выборка.

При применении невероятностных методов отбора формирование выборки осуществляется без использования понятий теории вероятности, вследствие чего невозможно рассчитать вероятность включения в выборку единицы совокупности.

Кратко охарактеризуем следующие невероятностные методы отбора: отбор на основе принципа удобства, отбор на основе суждений, формирование выборки в процессе обследования и формирование выборки на основе квот.

Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например, с позиций минимальных затрат времени и усилий, с позиции доступности респондентов.

Формирование выборки на основе суждений основано на использовании мнений квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

Формирование выборки в процессе обследования основано на расширении числа опрашиваемых на основе предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется в проводимом исследовании, затем она по мере проведения обследования расширяется.

Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования принимается решение, что в универсаме должно быть опрошено пятьдесят мужчин и пятьдесят женщин, и интервьюер проводит опрос, пока не выберет установленную квоту.

На практике имеет место одновременное использование нескольких методов формирования выборки.

5.4 Этапы разработки выборочного плана

Рассмотренные выше понятия встраиваются в определенную логическую последовательность отдельных шагов (этапов) по разработке выборочного плана, целью которого является получение конечного варианта выборки. Можно выделить следующие обобщенные этапы разработки выборочного плана:

1. Определение соответствующей совокупности.

2. Получение «списка» совокупности.

3. Проектирование выборочного плана.

4. Достижение нужного объема выборки или ее переформирование.

Кратко охарактеризует отдельные этапы разработки выборочного плана.

На первом этапе определяется совокупность исходя из целей исследования.

На втором этапе устанавливается, откуда может быть получен перечень единиц совокупности, — это нужно для определения контура выборки. На данном этапе также необходимо оценить ошибку контура выборки.

На третьем этапе с учетом ранее выполненных работ осуществляется проектирование самой выборки. Здесь необходимо найти баланс между структурой выборки, затратами на сбор данных и объемом выборки, а также в деталях обсудить выборочные методы.

Достижение нужного объема выборки осуществляется в два этапа. Прежде всего устанавливается единица выборки, затем, исходя из этой единицы, должна быть получена требуемая информация. Однако очевидно, что на ряд выбранных респондентов в силу тех или иных причин невозможно выйти и что не каждый выбранный респондент выразит желание отвечать на вопросы. Возникает проблема замены респондентов, которая может быть решена с помощью трех методов: выбор следующего по списку респондента (например, следующего номера в телефонном справочнике), использование первоначальной выборки больших размеров и формирование повторной выборки. В последнем случае, если процент ответов оказался намного ниже, чем ожидалось, контуры исходной выборки расширяются за счет дополнительных имен, найденных, скажем, случайным образом.

Переформирование выборки осуществляется тогда, когда проверка показала, что выборка не представляет совокупность в целом. В этом случае выбираются новые респонденты, и они добавляются к ранее использованной выборке, пока не достигается удовлетворительный уровень репрезентативности.

В реальности решение об объеме выборки является компромиссом между теоретическими предположениями о точности результатов обследования и возможностями их практической реализации — прежде всего имеются в виду затраты на проведение опроса.

На практике используется несколько подходов к определению объема выборки. Прежде всего опишем наиболее простые.

Произвольный подход основан на применении «правила большого пальца». Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5% от совокупности. Данный подход является простым и легким в исполнении, однако при его применении не представляется возможным установить точность полученных результатов. При достаточно большой совокупности он к тому же может быть и весьма дорогим.

Объем выборки может быть установлен исходя их неких заранее оговоренных условий. Скажем, заказчик маркетингового исследования знает, что при изучении общественного мнения выборка обычно составляет 1000-1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры.

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать, и очевидно, что ценность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.

Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема выборки исходя из определенных требований к надежности и достоверности получаемых результатов.

Наиболее теоретически обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в основе которых лежит ряд базовых понятий математической статистики (вариация, среднее квадратическое отклонение, доверительный интервал, средняя квадратическая ошибка). Краткое описание данных понятий приводится в приложении.

На основе этих понятий с учетом ряда предположений выводятся формулы расчета объема выборки. Все формулы для расчета объема выборки предполагают, что репрезентативность гарантируется путем использования корректных вероятностных процедур формирования выборки. (Более подробную информацию по данным вопросам можно получить из работ [2, 3, 4].)

5.5 Организация и проведение сбора данных

Существуют по крайней мере три альтернативных подхода к сбору данных: осуществлять это самим, осуществлять путем создания специальной группы или путем привлечения коммерческих компаний, специализирующихся на сборе данных.

В первом случае сотрудники маркетинговой службы организации своими силами производят сбор данных — скажем, путем интервьюирования.

Специальная группа обычно комплектуется из специалистов не очень высокой квалификации, например студентов, для проведения телефонного или персонального интервьюирования.

Услуги специализированных компаний, осуществляющих маркетинговые исследования, в большинстве случаев обеспечивают быстрое и качественное получение маркетинговых данных. Однако стоимость их услуг в три-пять раз превышает стоимость других двух подходов к сбору данных. Поэтому ее необходимо сопоставлять с качеством и надежностью получаемой информации.

Большое значение имеет правильное проведение сбора данных. При личном интервьюировании необходимо представиться и сказать несколько слов о проводимом исследовании. При использовании анкеты данная информации должна содержаться в ее вводной части. Следует подчеркивать конфиденциальность ответов. Скажите, сколько времени займет опрос. Не начинайте с вопросов о доходах и других вопросов личного характера. Помогайте респонденту разобраться в сложных вопросах.

При сборе данных могут иметь место многие погрешности — другие, нежели ошибки выборки, называемые поэтому невыборочными ошибками.

Невыборочные ошибки включают: 1) типы ошибок, обусловленные тем, что не все респонденты дали ответы; 2) ошибки сбора данных; 3) ошибки обращения с полученными данными; 4) ошибки анализа собранных данных; 5) ошибки интерпретации полученных результатов. Кроме того, существуют ошибки, обусловленные нечетким выявлением проблем, использованием неоднозначных терминов, и т.п.

Невыборочные ошибки можно классифицировать на ошибки лиц, осуществляющих сбор данных, и ошибки респондентов. Кроме того, невыборочные ошибки подразделяются на преднамеренные и на непреднамеренные.

Преднамеренные ошибки лица, собирающего информацию, имеют место, когда оно сознательно нарушает установленные исследователем требования к сбору данных.

Непреднамеренная ошибка лица, собирающего информацию, главным образом определяется неправильным пониманием интервьюером отдельных аспектов сбора данных, изложенных в различных инструкциях, хотя ему и кажется, что он все делает правильно.

Существуют два вида преднамеренных ошибок респондентов.

Первый вид обусловлен стремлением респондента фальсифицировать свои ответы вследствие определенного замешательства, нежелания отвечать на персональные вопросы (об уровне дохода, о национальности, возрасте, семейном положении и т.п.), из-за подозрения, что интервьюер преследует какие-то свои цели.

Второй вид обусловлен отказом респондента отвечать на вопросы из-за своей занятости, нежелания открывать личные аспекты своей жизни, предубежденности к опросам.

Непреднамеренная ошибка респондента возникает в случае, когда респондент, думая, что говорит правду, на самом деле дает ошибочный ответ.

Контроль за преднамеренными ошибками интервьюеров осуществляется двумя способами: путем надзора за их работой и путем проверки выполненной работы. Надзор осуществляется, например, незаметным подключением к телефонной линии, по которой берется интервью. При устном интервьюировании интервьюера может сопровождать проверяющее лицо.

Контроль за преднамеренными ошибками респондентов направлен на снижение числа случаев лжи и отказа участвовать в обследовании. Для этого прежде всего необходимо сохранять анонимность и конфиденциальность.

Контроль за непреднамеренными ошибками респондентов осуществляется в различных формах. Необходимо тщательно составлять вопросники и инструкции к ним, использовать разнонаправленные шкалы измерений. Для уменьшения числа ответов-предположений в шкалы вводятся такие градации, как «не имею мнения», «не могу вспомнить», «не уверен».

Можно выделить три типа ошибок, обусловленных нежеланием респондентов отвечать на вопросы: из-за отказа вообще принять участие в обследовании, из-за прекращения участия в нем и из-за отказа отвечать на определенные вопросы.

Перед тем как табулировать и анализировать данные проведенного обследования, целесообразно произвести их предварительную проверку и выявить ошибки респондентов. Жестких правил в данной области не существует, и они основаны на традициях, опыте и т.п., то есть на неформальных подходах к определению, какие анкеты пригодны для последующего анализа, а какие нет. Поэтому лучше ужесточить контроль за сбором анных, уменьшив таким образом проблемы предварительной оценки собранных данных.

5.6 Анализ данных и подготовка заключительного отчета

Анализ данных начинается с перевода полученных «сырых» сведений в осмысленную информацию и включает их введение в компьютер, проверку на предмет выявления ошибок, кодирование, представление в матричной форме (табулирование). Обычно закодированные исходные данные представляются в виде матрицы, столбцы которой содержат ответы на различные вопросы анкеты, а ряды — респондентов или изучаемые ситуации. Все это называется преобразованием исходных данных.

Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов.

Выделяют пять основных видов статистического анализа, используемых при проведении маркетинговых исследований: дескриптивный анализ, выводной анализ, анализ различий, анализ связей и предсказательный анализ. Иногда эти виды анализа используются по отдельности, иногда — одновременно.

В основе дескриптивного анализа лежит использование двух групп статистических мер. Первая включает меры «центральной тенденции», или меры, которые описывают типичного респондента или типичный ответ (средняя величина, мода, медиана). Вторая включает меры вариации, или меры, описывающие степень схожести или несхожести респондентов или ответов относительно «типичных» респондентов или ответов (распределение частот, размах вариации и среднее квадратическое отклонение).

Существуют и другие описательные меры, например меры асимметрии (насколько найденные кривые распределения отличаются от нормальных кривых распределения). Однако они используются не столь часто, как вышеупомянутые, и не представляют особого интереса для заказчика.

Анализ, в основе которого лежит использование статистических процедур (например, проверка гипотез) с целью обобщения полученных результатов на всю совокупность, называется выводным анализом. Вывод является видом логического анализа, направленного на получение общих заключений о всей совокупности на основе наблюдений за малой группой единиц данной совокупности.

Выводы делаются на основе анализа малого числа фактов. Например, если два ваших товарища, имеющие одну и ту же марку автомобиля, жалуются на его качество, то вы можете сделать вывод о низком качестве данной марки автомобиля в целом.

Статистический же вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В данном случае результаты выборочных исследований являются только отправной точкой для получения общих выводов. Например, автомобилестроительная компания провела два независимых исследования с целью определения степени удовлетворенности потребителей своими автомобилями. Первая выборка включала 100 потребителей, купивших данную модель в течение последних шести месяцев. Вторая выборка включала 1000 потребителей. В ходе телефонного интервьюирования респонденты отвечали на вопрос: «Удовлетворены или не удовлетворены вы купленной вами моделью автомобиля?» Первый опрос выявил 30% неудовлетворенных, второй — 35%.

Поскольку существуют ошибки выборки и в первом, и во втором случаях, то здесь можно рассуждать следующим образом. Для первого случая около 30% опрошенных выразили неудовлетворенность купленной моделью автомобиля, для второго случая — около 35% опрошенных. Какой же общий вывод можно сделать в данном случае? Как избавиться от слова «около»? Для этого введем показатель ошибки: 30% ± x% и 35% ± y% и сравним x и y. Используя логический анализ, можно прийти к заключению, что бо2льшая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потребителей. Видно, что решающим фактором для получения правильных выводов является размер выборки. Данный показатель присутствует во всех формулах, определяющих содержание различных методов статистического вывода.

Анализ различий используется для сравнения результатов исследования двух групп (двух рыночных сегментов) с целью определения степени реального различия в их поведении, в реакции на одну и ту же рекламу и т.п.

Проверка существенности различий заключается в сопоставлении ответов на один и тот же вопрос, полученных для двух или более независимых групп респондентов. Кроме того, в ряде случаев представляет интерес сравнение ответов на два или более независимых вопросов для одной и той же выборки.

Примером первого случая может служить изучение вопроса: что предпочитают пить по утрам жители определенного региона — кофе или чай. Первоначально было опрошено на основе формирования случайной выборки 100 респондентов, 60% которых отдают предпочтение кофе; через год исследование было повторено, и только 40% из 300 опрошенных человек высказались за кофе. Как можно сопоставить результаты этих двух исследований? Прямым арифметическим путем сравнивать 40 и 60% нельзя из-за разных ошибок выборок. Хотя в случае больших различий в цифрах, скажем 20 и 80%, легче сделать вывод об изменении вкусов в пользу кофе. Однако если есть уверенность, что эта большая разница обусловлена прежде всего тем, что в первом случае использовалась очень малая выборка, то такой вывод может оказаться сомнительным. Таким образом, при проведении подобного сравнения в расчет необходимо принять два критических фактора: степень существенности различий между величинами параметра для двух выборок и средние квадратические ошибки двух выборок, определяемые их объемами.

Анализ связей направлен на определение систематических связей (их направленности и силы) переменных. Например, его предметом можеть быть определение, как увеличение затрат на рекламу влияет на рост сбыта.

Очень часто маркетолог ищет ответы на вопросы типа: «Увеличится ли показатель рыночной доли при увеличении числа дилеров?», «Есть ли связь между объемом сбыта и рекламой?» Такие связи не всегда имеют причинно-следственный характер, а могут иметь просто статистическую природу. В приведенных выше вопросах можно определенно говорить о влиянии одного фактора на другой. Однако степень влияния изучаемых факторов может быть различной; скорее всего, влияние при этом могут оказывать также какие-то другие факторы.

Предсказательный анализ используется в целях прогнозирования развития событий в будущем — например, путем анализа временных рядов.

Маркетолог хорошо знает, насколько важна хорошая упаковка для продаваемого товара. Результаты маркетинговых исследований также являются товаром и поэтому должны быть хорошо «упакованы».

Прежде всего, структура заключительного отчета должна соответствовать особым требованиям заказчика. Если их нет, то можно рекомендовать при подготовке заключительного отчета разделить его на три части: вводную, основную и заключительную.

Вводная часть включает начальный лист, титульный лист, договор на проведение исследования, меморандум, оглавление, перечень иллюстраций и аннотацию.

Основная цель меморандума заключается в ориентации читателя на изученную проблему и в создании у отчета положительного имиджа. Меморандум имеет персональный и слегка неформальный стиль. В нем кратко говорится о характере исследования и об исполнителях, комментируются результаты исследования, делаются предложения о дальнейших исследованиях. Объем меморандума — одна страница.

Аннотация ориентирована прежде всего на руководителей, которых не интересуют детальные результаты проведенного исследования. Иногда ее называют поэтому «генеральским отчетом». Кроме того, аннотация должна настроить читателя на восприятие основного содержания отчета. В ней должны быть охарактеризованы: предмет исследования, круг рассмотренных вопросов, методология исследования, основные выводы и рекомендации. Объем аннотации — не более одной страницы.

Основная часть отчета состоит из введения, характеристики методологии исследования, обсуждения полученных результатов, констатации ограничений, а также выводов и рекомендаций.

Введение ориентирует читателя на ознакомление с результатами отчета. Оно содержит описание общей цели отчета и целей исследования, актуальности его проведения.

В методологическом разделе с необходимой степенью детализации описываются: кто или что явилось объектом исследования, используемые методы. Дополнительная информация помещается в приложение. Приводятся ссылки на авторов и источники использованных методов. Читатель должен понять, как были собраны и обработаны данные, почему был использован выбранный метод, а не другие.

Главным разделом отчета является раздел, в котором излагаются полученные результаты. Рекомендуется строить его содержание, имея в виду цели исследования. Зачастую логика данного раздела определяется структурой вопросника, так как вопросы в нем приводятся в определенной логической последовательности.

Поскольку не следует маскировать проблемы, которые возникли при проведении исследований, то в заключительный отчет обычно включается раздел «Ограничения исследования». В нем описывается степень влияния ограничений (недостаток времени, денежных и технических средств, недостаточная квалификация персонала и т.д.) на полученные результаты. Например, эти ограничения могли оказать влияние на формирование выборки только для ограниченного числа регионов. Следовательно, относить полученные результаты ко всей стране в целом следует с большой осторожностью или вообще этого не делать.

Выводы и рекомендации могут быть изложены как в одном, так и в отдельных разделах.

Выводы основываются на результатах проведенного исследования. Рекомендации представляют собой предположения относительно того, какие следует предпринять действия исходя из изложенных выводов. Осуществление рекомендаций может предполагать использование знаний, выходящих за рамки полученных результатов.

В заключительной части приводятся приложения, содержащие дополнительную информацию, необходимую для более глубокого осмысления полученных результатов.

Помимо написания отчета исследователи часто также устраивают для клиентов устную презентацию о методах исследования и полученных результатах. В данном случае имеется возможность ответить на возникшие вопросы и обсудить полученные результаты.

Вопросы для повторения и обсуждения

1. Изложите главные преимущества и недостатки методов опроса по сравнению с качественными методами.

2. Какие особенности метода опроса, осуществляемого с помощью компьютера, являются наиболее привлекательными?

3. Что является общим и в чем заключается различие между интервьюированием, осуществленным на дому, в магазине и в офисе?

4. Почему так популярны опросы по телефону?

5. Какие три фактора ресурсного характера влияют на выбор метода опроса?

6. Фирма-производитель охранной сигнализации выбирает метод опроса владельцев квартир относительно предлагаемой системы сигнализации. В случае проникновения вора в квартиру включается звуковой сигнал и имитируется лай сторожевой собаки. Фирма хотела бы знать, какое число потенциальных клиентов знают о существовании данной системы, что они о ней думают и собираются ли они ее приобрести в следующем году. Какой из рассмотренных методов опроса наиболее пригоден в данном случае и почему?

7. Что понимается под итеративным характером процесса разработки вопросника?

8. В какой последовательности разрабатывается вопросник?

9. Какие типы вопросов используются при составлении анкет?

10. Каковы основные требования к формулированию вопросов?

11. Предположим, вам поручили провести опрос отдохнувших на Кавказе, которые ожидают своего вылета в аэропорту Адлера. Используя туннельный и секционный подходы, сформулируйте вопросы для поиска ответов в следующих направлениях:

· Определите, почему отдохнувшие выбрали именно этот регион для отдыха.

· В каком конкретно месте они отдыхали, как долго и почему выбрали именно его.

· Узнайте, какие сувениры они купили, где, когда и почему были сделаны эти покупки и по какой цене.

· Обрисуйте демографический профиль опрошенных.

12. Сформулируйте три главные проблемы формирования выборки.

13. Определите различия между вероятностным и невероятностным методами формирования выборки.

14. По каким аспектам систематическая выборка является более эффективной по сравнению со случайной выборкой?

15. Кратко опишите каждый из четырех невероятностных выборочных методов.

16. Ниже приводятся четыре генеральные совокупности и контуры выборки для них. Для каждой пары определите:

· членов генеральной совокупности, не вошедших в контур выборки;

· единицы контура выборки, которые не являются частью генеральной совокупности.

Можете ли вы определить для каждой генеральной совокупности, является ли ошибка контура выборки допустимой или недопустимой?

17. Какие существуют подходы к сбору данных?

18. Охарактеризуйте природу вневыборочных ошибок.

19. Какие виды статистического анализа используются в маркетинговых исследованиях?

20. Сформулируйте главные требования к написанию заключительного отчета по результатам маркетинговых исследований.

Литература

1. Burns Alvin C., Bush Ronald F. Marketing Research. — New Jersey: Prentice Hall, 1995.

2. Голубков Е.П. Маркетинговые исследования: теория, методология и практика. — Изд. 2-е. — М.: Финпресс, 2000.

3. Голубков Е.П. Маркетинг: Словарь-справочник. — М.: Дело, 2000.

4. Черчилль Г.А. Маркетинговые исследования. — СПб.: Питер, 2000.

Приложение

1. Средние величины

Средняя величина (среднее, среднее значение) дает представление о наиболее «типичном» или «центральном» значении (центральной тенденции) в интервале изменения переменной (переменной величины). Например, средняя цена, средний объем продаж — подобные термины часто используются в практической работе маркетолога. В качестве средней величины чаще всего рассматриваются мода, медиана, средняя арифметическая и средняя геометрическая.

Мода — наиболее часто встречаемая величина в наборе данных. Это наиболее «типичное» значение среди данных. Оно может быть определено непосредственно из данных таблицы или графика. В графическом изображении данная величина соответствует величине на оси абсцисс, при которой соответствующая величина у является наибольшей. Недостаток наиболее часто встречаемой величины состоит в том, что она учитывает только соотношения величин, изменения же величин за пределами моды остаются неучтенными.

Пример расчета моды.

Упаковочная машина упаковывает по 100 канцелярских скрепок в маленькие пластмассовые футляры. Проверка 25 пластмассовых футляров дала следующий результат:

Наиболее часто встречаемой здесь величиной со значением признака 7 является количество в 100 штук.

Медиана (центральная величина) — это среднее, полученное путем выявления «центрального» значения в перечне данных, расположенных в ранжированном порядке. Медиана не учитывает экстремальных значений. Если налицо нечетное количество величин, например N = 9, то центральная величина рассчитывается следующим образом:

центральная величина

В предыдущем примере наиболее часто встречаемая величина определялась среди следующих величин: 92, 95, 97, 98, 99, 100, 101, 102, 107. Медианой является здесь 99 (5-я величина).

Средняя арифметическая учитывает каждое значение признака, в том числе экстремальные и случайные величины. Каждое изменение значений признака влияет на среднюю величину. Выделяют невзвешенную среднюю арифметическую и взвешенную среднюю арифметическую.

Невзвешенная средняя арифметическая получается путем деления суммы всех значений на их количество:

Невзвешенная средняя арифметическая

Средняя арифметическая чисел 2, 3, 5, 7 и 8 следующая:

Средняя арифметическая

Во взвешенной средней арифметической у отдельных значений учитывается определенный признак, например количество или вес:

взвешенной средней арифметической

Предположим, что отдельным значениям признака xi (х1, х2, х3 … хn) соответствует разный вес или разная частотность fi:

Если сумму умноженных на соответствующий вес значений признака =36 разделить на сумму частотностей =12 , то в результате получится взвешенная средняя арифметическая, равная 3.

Пример расчета средних арифметических.

За 1 кг нескольких товаров были рассчитаны соответственно следующие цены: товар А — 12 руб., товар Б — 40 руб., товар В — 60 руб. и товар Г — 70 руб.

Проданное количество товаров составило:

товар А — 500 кг товар В — 600 кг

товар Б — 2500 кг товар Г — 1400 кг

а) невзвешенная средняя арифметическая равна:

невзвешенная средняя арифметическая

б) расчет взвешенной средней арифметической

расчет взвешенной средней арифметической

Средняя геометрическая также учитывает все значения признака в наборе данных. Знак корня способствует, правда, тому, что в средней геометрической менее сильно, чем в средней арифметической, сказывается влияние экстремальных значений. Средняя геометрическая применяется в большинстве случаев для расчета средних темпов роста:

Средняя геометрическая

Например, объем продаж предприятия за последние четыре года изменялся следующим образом:

1-й год — увеличение 7%: 1 + 0,07 = 1,07;

2-й год — увеличение 9%: 1 + 0,09 = 1,09;

3-й год — уменьшение 3%: 1 — 0,03 = 0,97;

Средняя геометрическая

Mg = 1,0364

Средний темп роста составляет 0,0364 (если предварительно вычесть 1). Обороты предприятия за последние четыре года увеличились, таким образом, в среднем на 3,64%.

2. Показатели выриации

Совокупность изучаемых данных (статистической массы) может иметь разную структуру. Например, две совокупности могут иметь совпадающие средние значения, и, несмотря на это, у них может быть разная структура:

Средняя арифметическая и медиана составляют в обоих рядах соответственно 15, и, несмотря на это, у них разная структура. Значения признака ряда Б отчетливо больше рассеяны, чем ряда А.

Вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени. В маркетинге понятие вариации часто характеризует величину несхожести (схожести) ответов респондентов на определенный вопрос. Результаты ответов на вопросы опроса обычно представляются в форме кривой распределения. При высокой схожести ответов говорят о малой вариации (узкая кривая распределения), а при низкой схожести ответов — о высокой вариации (широкая кривая распределения).

Обычно используют следующие меры вариации (рассеивания): размах вариации, среднее отклонение, среднее квадратическое отклонение, дисперсию и коэффициент вариации.

Размахом вариации является разница между наибольшим и наименьшим значениями признака.

Размахом вариации

Размах вариации в ряду А: 20-10=10 и в ряду Б: 28-2=26.

Размах вариации легко рассчитывается. Однако он имеет недостаток, который состоит в том, что учитываются только оба экстремальных значения.

Среднее отклонение учитывает отдельное отклонение каждого значения признака статистической массы от среднего значения этой массы.

Простое среднее отклонение d статистической массы из n элементов со значениями признака от x1 до хn рассчитывается по следующей формуле:

Простое среднее отклонение

Разница | хiМ | представляет собой абсолютную разницу между значением признака хi и средним значением М). Сумма отдельных отклонений всех значений признака от среднего арифметического делится на число значений признака.

Пример расчета простого среднего отклонения.

Среднее отклонение ряда Б от среднего значения = 15 может быть рассчитано следующим образом:

Среднее отклонение ряда

В среднем значения отклоняются от среднего арифметического или от центральной величины на 5,5.

Взвешенное среднее отклонение учитывает тот факт, что разные значения признака возникают с разными частотами:

Взвешенное среднее отклонени

Отдельное отклонение каждого значения признака от среднего значения умножается на соответствующую частоту. Сумма всех этих результатов делится на сумму частот.

Пример расчета взвешенного среднего отклонения ряда А от среднего значения = 15:

ример расчета взвешенного среднего отклонения

Среднее квадратическое отклонение (стандартное отклонение), обычно обозначаемое 23.jpg (806 bytes) или s, соотносит отклонения отдельных величин признака только со средним арифметическим. Расчет здесь похож на расчет среднего отклонения. Отдельные отклонения от среднего арифметического возводятся в квадрат, и затем извлекается квадратный корень:

Простое среднее квадратическое отклонение рассчитывается по формуле

Простое среднее квадратическое отклонение

Взвешенное среднее квадратическое отклонение рассчитывается по формуле

Взвешенное среднее квадратическое отклонение

Например, взвешенное среднее квадратическое отклонение s ряда А от среднего арифметического 19.jpg (854 bytes) =15 рассчитывается следующим образом:

Дисперсия s2 получается путем возведения в квадрат среднего квадратического отклонения. В предыдущем примере дисперсия

Среднее квадратическое отклонение имеет такую же размерность, как и признаки статистической массы, например рубли, килограммы, поэтому их нельзя объединять напрямую. Такое объединение можно делать в случае использования дисперсии. В то время как дисперсия используется преимущественно в теоретической статистике, стандартное отклонение s имеет большее значение для практических расчетов.

При нормальном распределении по Гауссу, на основе теории выборок, элементы ряда следующим образом располагаются вокруг среднего арифметического:

68,3% в границах от х ± 1;

95,5% в границах от х ± 2;

99,7% в границах от х ± 3.

Коэффициент вариации V является частным от среднего квадратического отклонения и средней арифметической:

Коэффициент вариации

В отличие от других мер вариации коэффициент вариации не является «овеществленной» мерой разброса. Размерность значений признака статистической массы теряется, но распределения с различными единицами сопоставимы.

Система выборочных исследований


Основные понятия, используемые при проведении выборочных исследований. Виды выборки

Проанализируем основные понятия, используемые при
проведении маркетинговых исследований. На этом этапе необходимо получить информацию
о параметрах «группы», среди членов которой будут проводиться маркетинговые
исследования. Такая «группа» в статистике называется генеральной совокупностью
или просто совокупностью. Если быть более точным, то под генеральной
совокупностью понимаются все представители, носители какого-либо важного
признака всех избирателей, всех потребителей товаров и т.п. Иногда совокупность
бывает небольшой, и ее изучают целиком. Реально всю совокупность охватить невозможно,
поэтому изучают только ее часть, которая и называется выборкой.

Выборка – основное понятие маркетинговых исследований.
Так как выборка составляет только часть совокупности, то полученные данные от
выборки естественно не будут точными. И это различие данных от выборки и от
обследования всей совокупности будут называться ошибкой выборки.

Ошибка выборки обуславливается двумя факторами:

·  методом
формирования выборки;

·  размером выборки.

Формирование выборки, основывается на знании контура
выборки, под которым понимается список всех единиц совокупности, из которых
выбираются единицы выборки. Контур выборки обычно содержит ошибку, называемую
ошибкой контура выборки. Она характеризует степень отклонения от истинных
размеров совокупности. Исследователь обязан проинформировать заказчика работы о
размерах ошибки контура выборки.

В процессе формирования выборки исследователи
сталкиваются с рядом проблем. Необходимо в первую очередь определить, кто является
единицей выборки. Также важно правильно найти метод, с помощью которого
выбираются единицы выборки из контура выборки. И в завершении необходимо решить
вопрос об объеме выборки, о числе изучаемых единиц выборки.

В процессе формирования выборки используют
вероятностные случайные и не вероятностные (неслучайные) методы.

Если все единицы выборки имеют вероятность быть включенными
в выборку, то выборка называется вероятностной. Если вероятность неизвестна, то
выборка называется неслучайной (невероятностной).

Вероятностные методы включают в свой состав:

·  простой случайный
отбор;

·  систематический
отбор;

·  кластерный отбор;

·  стратифицированный
отбор.

Простой случайный отбор означает, что вероятность быть
избранным в выборку известна и является одинаковой для всех единиц совокупности.

Вероятность быть включенными в выборку определяется
отношением объема выборки к размеру совокупности.

Простой случайный отбор осуществляется с помощью
следующих методов:

·  формированием
выборки вслепую;

·  с помощью таблицы
случайных чисел.

В процессе формирования выборки вслепую единицы
совокупности в соответствии с их фамилиями, названиями или другими признаками
вносятся в карточки, которые в перемешанном виде помещаются в какую-то
непрозрачную емкость (ящик, коробку и т.п.) Из этой емкости кто-то случайным
образом вытягивает число карточек, определяемых объемом выборки. Использование
таблицы случайных чисел имеет свои особенности. В ней содержатся числа, порядок
включения которых в таблицу осуществлен случайным образом. Затем единицам
совокупности присваивают порядковые номера. В таблице случайных чисел выбирают
любую начальную точку, и двигаясь в произвольном направлении и произвольно
меняя направления движения, выбирают необходимое количество номеров из числа
присвоенных, равное заранее установленному объему выборки.

Использование простого случайного отбора гарантирует,
что каждая единица совокупности известна и имеет равные шансы быть включенным в
выборку. Но использование этих методов требует предварительного определения
каждой единицы совокупности. Сформировать больших размеров совокупность
достаточно сложно, а часто и невозможно.

Этот недостаток существенно снижается при
использовании компьютера для присвоения единицам совокупности номеров.
Последнее заметно облегчает формирование выборки. При телефонном интервью компьютер
может генерировать случайным образом телефонные номера: он имеет генератор
случайных чисел.

В процессе использования метода систематического
отбора, также как и при использовании простого случайного отбора, необходимо получить
полный список единиц генеральной совокупности. В дальнейшем вместо присвоения
порядковых номеров используется показатель

«

интервал
скачка», рассчитываемый как отношение
размера совокупности к объему выборки.

Например, если использовать телефонный справочник и
интервал скачка был бы определен равным 250, то это означает, что каждый 250-й
телефонный номер включается в выборку.

Для определения начальных страниц и колонки
справочника используются случайные числа.

Метод систематического отбора является наиболее
экономичным и требует меньше затрат времени в сравнении с методом простого
случайного отбора. Вместе с тем, данный метод дает менее репрезентативные результаты
в сравнении с методами простого случайного отбора. Метод систематического
отбора может широко использоваться, когда для различных совокупностей
существуют справочники, списки и другие материалы.

Метод кластерного отбора основан на делении
совокупности на подгруппы, каждая из которых представляет совокупность в целом.

Для уяснения этого метода рассмотрим простой пример:
исследуется мнение населения какого-либо региона относительно какого-то товара.
Регион разбивается на четко определяемые части, например области. Исследователь
предполагает, что выделенные кластеры являются идентичными и мнения населения
этих областей характерно для региона в целом. Далее одна из областей
выбирается  случайным образом, определяется
совокупность для этой области, проводится в ней соответствующие исследования, а
выводы обобщаются на совокупность всего региона. В основе рассмотренных выше
методов лежит предположение, что любая совокупность характеризуется
симметричным распределением ее важнейших характеристик. И каждая выборка
достаточно полно характеризует всю совокупность, различные крайности в выборке
уравновешивают друг друга. Но такая ситуация в реальной жизни встречается
редко. К примеру, население больших, средних и малых городов сельской местности
данного региона отличается по уровню образования, дохода, образу жизни и т.п.

При несимметричном распределении совокупности
последняя разделяется на различные подгруппы, например, по уровню дохода.
Выборки сформированные из этих подгрупп являются по существу сегментами рынка.
Такой метод носит название стратифицированного отбора.

В процессе использования данного метода, следует
выбрать некоторую наблюдаемую характеристику (признак), характеризующую каждую
единицу совокупности, например, уровень дохода. В дальнейшем для каждой страты
(подгруппы) с помощью случайного отбора формируется выборка. Если размер
выборки для определенной страты пропорционален размеру страты по отношению ко
всей совокупности, то выборка называется пропорционально стратифицированной.

В случае непропорционально стратифицированной выборки
необходимо использовать весовые коэффициенты, уравновешивающие размеры страт.

При применении невероятностных методов отбора
формирование выборки осуществляется без использования понятий теории вероятностей,
вследствие чего невозможно рассчитать вероятность включения в выборку единиц
совокупности.

Остановимся на следующих невероятностных методах
отбора:

·  отбор на основе
принципа удобства;

·  отбор на основе
суждений;

·  формирование
выборки в процессе обследования, опроса;

·  формирование
выборки на основе квот.

Суть метода отбора на основе принципа удобства состоит
в том, что формирование выборки осуществляется наиболее удобным с позиции
исследователя образом, например, с точки зрения минимизации затрат или
доступности респондентов. Выбор места исследования, состав выборки производится
субъективным образом (например, опрос покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя).

Данный метод чаще применяется для поиска респондентов
с заданными характеристиками. Например, в магазине после заданных вопросов
выясняют, что из себя представляют опрашиваемые и только некоторые из их числа
подвергаются дальнейшему обследованию. Данный метод относительно дешев и прост.

Формирование выборки на основе суждения – опирается на
использовании мнения квалифицированных специалистов, экспертов относительно
состава выборки. Этот подход может служить для формирования фокус-групп.
Формирование выборки в процессе опроса опирается на расширение числа
опрашиваемых на основе предложений респондентов, принимавших участие в
обследованиях.

Первоначально формируется выборка намного меньшая, чем
требуется в проводимом исследовании, затем она по мере проведения обследования
расширяется. Данный метод чаще всего используется при ограниченном контуре
выборки (например, при исследовании продукции производственно-технического назначения).

Формирование выборки на основе квот (квотный отбор)
предполагает предварительное, исходя из целей исследования, определение численности
групп респондентов, отвечающих определенным требованиям.

К примеру, принимается решение исследовать семейных и
несемейных покупателей. Интервьюер проводит опрос пока не выберет установленную
квоту. Такой метод используется, когда существуют четкие суждения о
характеристиках респондентов, мнение которых целесообразно изучить в проводимом
исследовании. Этот метод дает возможность контролировать деятельность
интервьюеров, ограничивая выбор респондентов определенными требованиями. В
реальной практике часто используют параллельно несколько методов формирования
выборки.


Основные
этапы проектирования выборки

Маркетологи выделяют следующие этапы разработки
выборки:

·  определение
соответствующей совокупности;

·  получение
«списка» совокупности;

·  проектирование
выборочного плана;

·  определение
методов доступа к совокупности;

·  достижение нужной
численности выборки;

·  проверка выборки
на соответствие требованиям;

·  если необходимо
формируется новая выборка.

На первом этапе определяется целевая совокупность,
зависящая от целей исследования, здесь важно установить характеристики, которым
должны удовлетворять единицы совокупности и которые позволяет ее отличать от
других совокупностей.

На втором этапе устанавливается, откуда может быть
получен перечень единиц совокупности (это важно для определения контура выборки).
На этом этапе необходимо использовать соответствующие справочники, данные
переписи населения и местных органов власти, материалы различных
консультационных организаций.

На втором этапе также оценивается ошибка контура
выборки, для чего важно и в этих целях необходимо:

·  определить
насколько список людей (юридических лиц), включенных в контур выборки
отличается от совокупности в целом;

·  установить, какой
континент людей не вошел в состав контура выборки.

На третьем этапе с учетом ранее выполненных работ
осуществляется проектирование самой выборки. В этом случае важно найти баланс
между:

·  структурой
выборки;

·  затратами на сбор
данных;

·  и объемом
выборки.

Достижение нужной численности выборки требует
выполнения двух шагов операций:   установления
единицы выборки и от одной единицы должна быть получена требуемая информация.

На ряд выбранных респондентов невозможно выйти и что
не каждый выбранный респондент выразит желание отвечать на вопросы. Таких
респондентов необходимо заменить. И это обычно решается: во-первых, выбором
следующего по списку респондента; либо, во-вторых, использованием выборки
больших размеров; либо, в-третьих, формированием повторной выборки.

Первый метод наиболее часто применяется в случае систематической
выборки, Например, в качестве контура выборки используется телефонный
справочник и необходимо опросить каждого сотого абонента. Если  не удается получить ответ от первого респондента,
то звонят абоненту, следующему по справочнику, и так делают, пока не удастся
получить ответы на задаваемые вопросы. Только после этого осуществляется скачок
в 100 номеров.

Второй метод это использование выборки больших
размеров и осуществляется он в случае, когда заранее известен процент
респондентов, не принимавших участие в опросе. К примеру известно, что на
письма при почтовом опросе отвечает только 20 % респондентов (во многих случаях
этот процент и того меньше). Поэтому, чтобы получить окончательную выборку
численностью в 200 человек, письма необходимо отправить тысяче потенциальных
респондентов.

Суть третьего метода – метода формирования повторной
выборки заключается в том, что если процент ответов намного ниже, чем ожидалось,
то контуры исходной выборки расширяются за счет дополнительных имен, найденных,
например, случайным образом.


Определение
объема выборки

На практике решение вопроса об объеме выборки является
компромиссным между предположением о точности результатов обследования и
возможностями их практической реализации (т.е. исходя из затрат на проведение
опроса).

На практике используется несколько подходов к
определению объема выборки. Обратим внимание на самые простые из них. Первый из
них называется произвольным подходом и основан он на применении «правила
большого пальца».

Например, бездоказательно принимается, что для
получения точных результатов выборка должна составлять 5 % от совокупности.
Данный подход простой и доступный в исполнении, не позволяет получать точные
результаты. Его достоинством является относительная дешевизна затрат. В соответствии
со вторым подходом объем выборки может быть установлен исходя из заранее
оговоренных условий. Заказчик маркетингового исследования, например, знает, что
при изучении общественного мнения выборка обычно составляет 1000 – 1200
человек, поэтому он рекомендует исследователю придерживаться данной цифры.

Третий подход означает, что в некоторых случаях
главным аргументом при определении объема выборки может быть стоимость проведения
опроса. Хотя при этом ценность и достоверность получаемой информации не принимается
в расчет.

В случае четвертого подхода объем выборки определяется
на основе статистического анализа. Данный подход предполагает определение минимального
объема выборки с учетом требований к надежности и достоверности получаемых
результатов.

Пятый подход считается наиболее теоретически
обоснованным и правильным подходом в определении объема выборки. Он основан на
расчете доверительного интервала.

Доверительный интервал – это диапазон, крайние точки
которого характеризуют процент определенных ответов на какой-то вопрос. Данное
понятие тесто связано с понятием «среднее квадратичное отклонение получаемого
признака в генеральной совокупности». Чем оно больше, тем шире должен быть
доверительный интервал, чтобы включить в свой состав, например 9,5 % ответов.

Из свойств нормальной кривой распределения вытекает,
что конечные точки доверительного интервала, равного к примеру 9,5 % определяются
как произведение: 1,96 (нормированное отклонение) и среднего квадратичного
отклонения.

Числа 1,96 и 2,58 (для 99 % доверительного интервала)
обозначаются как z.

Существуют таблицы «Значение интеграла вероятности»,
которые дают возможность определить величины z для различных доверительных интервалов. Доверительный
интервал равный 95% или 99% является стандартным при проведении маркетинговых исследований.

Например, проведено исследование числа визитов
автовладельцев в сервисные мастерские за год. Доверительный интервал для
среднего числа визитов был рассчитан равным 5 – 7 визитам при 99 % уровне доверительности.
Это означает, что если появится возможность, провести независимо 100 раз
выборочные исследования, то для 99 выборочных исследований среднее значение
числа визитов попадут в диапазон от 5 до 7 визитов, Если сказать иначе, то 99 %
автовладельцев попадут в доверительный интервал.

Допустим, было проведено исследование до 50
независимых выборок. Средние оценки для этих выборок образовали нормальную
кривую распределения, которое называется


выборочным распределением.

Средняя оценка для совокупности в целом равна средней
оценке кривой распределения. Понятие «выборочное распределение» рассматривается
также в качестве одного из базовых понятий теоретической концепции, лежащее в
основе определения V выборки.

Естественно ни одна компания не в состоянии
сформировать 10, 20, 50 независимых выборок. Обычно используется только одна
выборка.

Математическая статистика позволяет получить некую
информацию о выборочном распределении, владея точными данными о вариации единственной
выборки.

Индикатором степени отличия оценки, истинной для совокупности
в целом, которая ожидается для типичной выборки, является


средне квадратическая ошибка

.

К примеру, исследуется мнение
потребителей о новом товаре и заказчик данного исследования указал, что его
устроит точность полученных результатов, равная плюс минус 5%.

Предположим, что 30 % членов выборки высказались за
новый продукт. Это означает, что диапазон возможных оценок для всей совокупности
составляет 25 – 35 %. Причем, чем больше объем выборки, тем меньше ошибка.
Высокое значение вариации обусловливает высокое значение ошибки и наоборот.

Определим объем выборки на основе расчета
доверительного интервала. Исходной информацией, необходимой для реализации
данного подхода, является:

·  величина
вариации, которой, как считается, обладает совокупность;

·  желаемая
точность;

·  уровень
достоверности, которому должны удовлетворять результаты проводимого
обследования.

Когда на заданный вопрос существует только два
варианта ответов, выраженных в процентах (используется процентная мера), объем
выборки определяется по следующей формуле:

где n – объем
выборки;

z –
нормированное отклонение, определяемое исходя из выбранного уровня доверительности
(табл. 1);

р – найденная вариация для выборки;

q = (100 – p);

е – допустимая ошибка.

Таблица1

Значение нормированного отклонения оценки z от среднего значения

в зависимости от доверительной вероятности (а)
полученного результата

а,
%
60 70 80 90 90 95 97 99,0 99,7
z 0,84 1,03 1,29 1,44 1,65 1,96 2,18 2,58 3,0

Например, предприятием, выпускающим покрышки,
проводится опрос автолюбителей, использующих радиальные покрышки.

Поэтому на вопрос: «Используете ли Вы радиальные
покрышки?» возможны только 2 ответа: «Да» или «Нет». Если предположить, что совокупность
автолюбителей обладает низким показателем вариации, то это означает, что почти
каждый опрошенный использует радиальные покрышки. В данном случае может быть
сформирована выборка достаточно малых размеров. В формуле (1) произведение pg выражает вариацию, свойственную совокупности.
Например, пусть 90 % единиц совокупности используют радиальные покрышки. Это
означает, что pg = 900. Если принять, что
показатель вариации выше (р = 70 %), то pg = 2100. Наибольшая вариация достигается в случае,
когда одна половина совокупности (50 %) использует радиальные покрышки, а
другие не используют. В этом случае произведение достигает значения равного
2500.

При проведении опроса важно указывать точность
полученных оценок. Например, было установлено, что 44 % респондентов используют
радиальные покрышки. Результаты измерения необходимо представить в виде: процент
автолюбителей, использующих радиальные покрышки, составляет 44 плюс – минус е
%. Величина допустимой ошибки заранее совместно определяется заказчиком
исследования и исполнителем.

Уровень достоверности при проведении маркетинговых
исследований обычно оценивается с учетом двух его значений: 95% или 99%.
Первому значению соответствует значение  z = 1,96; второму – z = 2,58. Если выбирается уровень доверительности
равный 99 %, то это говорит о следующем: мы уверены на 99 % (иными словами
доверительная вероятность равна 0,99) в том, что процент членов совокупности,
попавший в диапазон плюс – минус е %, равен проценту членов выборки, попавших в
тот же диапазон ошибки. Принимая вариацию равной 50 %, точность равной 10 % при
95 %-м уровне доверительности рассчитаем размер выборки:

n = 1,96

2

(50 х 50) /
10

2

= 96.

При уровне доверительности равном 99 %, и е = ±3 %, n = 1067.

При определении показателя вариации для конкретной
совокупности целесообразно проводить предварительно качественный анализ исследуемой
совокупности и установить схожесть единиц совокупности в демографическом,
социальном и других отношениях, представляющих интерес для исследователя.
Возможно определение объема выборки на основе использования средних значений, а
не процентных величин. Предположим, что выбран уровень достоверности равный 95
% (z = 1.96,), среднеквадратическое отклонение (S) рассчитано и равно 100, и желаемая точность
(погрешность) составляет ±10. Тогда объем выборки составит




Реально на практике, если выборка формируется заново и
схожие опросы не проводились, S неизвестно.

В этом случае целесообразно задавать погрешность е в
долях от среднеквадратического отклонения. Расчетная формула преобразуется и приобретает
следующий вид:

Мы в основном говорили о совокупности очень больших
размеров, характерных для рынков потребительских товаров. Но в отдельных случаях
совокупности не являются столь большим, и например на рынках отдельных видов
продукции производственного назначения.

Обычно, если выборка составляет менее 5 %
совокупности, то совокупность считается большой, и расчеты проводятся по
вышеприведенным правилам.

Если же V выборки
превышает 5 % совокупности, то последняя считается малой, и в вышеприведенные
формулы вводится поправочный коэффициент. Объем выборки в данном случае
определяется следующим образом:


,

где n

1

– объем выборки для малой совокупности,

n – объем выборки (или для процентных мер или для средних),
рассчитанный по приведенным выше формулам,

N – объем генеральной совокупности.

Например, изучается мнение членов совокупности,
состоящей из 1000 компаний, относительно строительства химического комбината в
границах города Томска. Вследствие отсутствия информации о вариации принимается
наихудший случай: 50:50. Исследователь вынес решение использовать уровень
доверительности равный 95 %. Заказчик исследования указал, что его устроит
точность результатов плюс минус 5 %. В этом случае используется следующая
формула для процентной меры:

Данный подход к формированию V выборки с определенными оговорками может быть
использован и при расчете численности панели и экспертной группы.

Приведенные формулы расчета выборки основаны на
предположении, что все правила формирования выборки были соблюдены, и единственной
ошибкой является ошибка, обусловленная ее объемом.

1. Методология маркетинговых исследований

Тема Процедура выборки

2. Вопросы лекции

Основные понятия, используемые при проведении
выборочных исследований. Генеральная совокупность.
Выборка. Контур выборки. Единица и объем выборки.
Ошибка выборки.
Проблемы формирования выборки
Репрезентативность выборки.
Типы выборок. Виды вероятностной выборки. Виды
невероятностной выборки.
Комбинация типов выборки при проведении
исследования. Многоступенчатая выборка.
Этапы разработки выборочного плана. Подходы к
определению объема выборки. Ошибка выборки.

3. Почему появляются выборки?

Для маркетинговых целей
в целях экономии времени
и средств весьма типично
подвергать исследованию
лишь небольшую часть
той группы людей или
предприятий
(генеральной
совокупности), которая
представляет интерес для
исследователей.
Она обычно составляет
несколько сотен, иногда
тысячу объектов.

4. Суть выборочного метода

Суть выборочного метода заключается в том, что
по определенным правилам из общей
численности генеральной совокупности
отбирается ограниченное число единиц, которое
призвано в качестве своеобразной модели
воспроизводить структуру всей генеральной
совокупности
Генеральная совокупность — та часть объекта
исследования, которая локализована по времени
и территориально, и на нее распространяются
все выводы исследования

5. Примеры генеральных совокупностей:

Все жители Нижнего Новгорода (1267760 человек
по данным 2015 года)
Юридические лица России (2,2 млн. на начало
2008 года)
Розничные торговые точки, осуществляющие
продажу продуктов питания (20 тысяч на начало
2008 года) и т.д.

6. Выборка. Контур выборки

Ограниченное число единиц, выбранное из
генеральной совокупности (равно как и процедура по
их определению) именуется выборкой.
Контур выборки – это наличие полного списка всех
элементов генеральной совокупности.
Контур выборки неизбежно содержит ошибку,
называемую ошибкой контура выборки и
характеризующую степень отклонения от истинных
размеров совокупности.
Пример: Очевидно, что не существует полного официального списка всех
автосервисных мастерских города Москвы, включая полулегальный и
нелегальный бизнес в данной области. Исследователь должен
информировать заказчика работы о размерах ошибки контура выборки.

7.

8. Итак, основные понятия:

Генеральная совокупность – вся группа, про
которую необходимо собрать информацию;
Выборка – часть совокупности, базовый уровень
исследования;
Ошибка выборки – разница между полученными
данными и фактическими по совокупности;
Контур выборки – все единицы совокупности, из
которых будет формироваться выборка;
Ошибка контура выборки – степень отклонения
контура выборки от генеральной совокупности;
Единица выборки – объект исследования

9. Три главные проблемы формирования выборки

Прежде всего, исходя из сути рассматриваемой
задачи, необходимо определить, кто является
единицей выборки.
Очень важным является также определение
контура выборки.
В целях выполнения правила репрезентативности
проводимого исследования необходимо обратить
внимание на метод, с помощью которого
выбираются единицы выборки
И наконец, необходимо решить вопрос об объеме
выборки, который определяет число изучаемых
единиц выборки.

10. Репрезентативность выборки

Цель отбора объектов в состав выборки всегда
состоит в получении такой совокупности, которая
по своим качествам репрезентирует ту, которую мы
намереваемся изучить
Под репрезентативностью в маркетинговых
исследованиях понимают такие свойства выборки,
которые позволяют ей выступать на момент опроса
моделью, представителем генеральной
совокупности.
Важно понимать, что репрезентативность выборки и
ошибка выборки – разные явления. Репрезентативность,
в отличие от ошибки никак не зависит от размера
выборки

11. Репрезентативность выборки

Одна и та же выборка может быть репрезентативной
и нерепрезентативной для разных генеральных
совокупностей
Пример:
— Выборка, целиком состоящая из москвичей,
владеющих автомобилем, не репрезентирует все
население Москвы.
— Выборка из российских предприятий численностью
до 100 человек не репрезентирует все предприятия
России.
— Выборка из москвичей, совершающих покупки на
рынке, не репрезентирует покупательское поведение
всех москвичей.

12. Репрезентативность выборки

В то же время, указанные выборки (при
соблюдении прочих условий) могут отлично
репрезентировать москвичей-автовладельцев,
небольшие и средние российские
предприятия и покупателей, совершающих
покупки на рынках соответственно.
Как бы мы не увеличивали количество
опрошенных москвичей-автовладельцев, мы
не сможем репрезентировать этой выборкой
всех москвичей.

13. Группы выборочных методов (типы выборки)

Вероятностная выборка (случайная) –
это такая выборка, для которой каждый
элемент генеральной совокупности имеет
определенную, заранее заданную
вероятность быть отобранным.
Это позволяет исследователю рассчитать,
насколько правильно выборка отражает
популяцию, из которой она спроектирована
(рассчитать ошибку выборки).

14. Неслучайная (невероятностная) выборка Еще одно название -детерминированная

Неслучайная (невероятностная)
выборка – это такой способ отбора
единиц, при котором мы не можем заранее
рассчитать вероятность каждого элемента
попасть в состав выборочной
совокупности.
Данный тип выборки не дает возможности
рассчитать, насколько правильна
(репрезентативна) выборка
Иногда по условиям исследования
оказывается единственно возможным
провести неслучайную выборку.

15.

16. Метод простого случайного отбора

Метод простого случайного отбора
предполагает, что вероятность быть избранным в
выборку известна и является одинаковой для всех
единиц совокупности. Для этого используется:
— Лотерейный метод (жребия)
— Таблицы случайных чисел
Главное условие осуществления вероятностной
выборки – наличие полного списка (контура) всех
элементов генеральной совокупности.
Использование простого случайного отбора
гарантирует, что каждая единица совокупности
известна и имеет равные шансы быть включенной
в выборку.

17. Лотерейный метод (жребия)

При использовании лотерейного метода
(или метода жребия) жетоны с номерами
всех элементов помещают в урну,
тщательно перемешивают и извлекают
последовательно n жетонов, где n – число
элементов выборочной совокупности.
Элементы генеральной совокупности,
имеющие номера оказавшиеся на
извлеченных жетонах, будут составлять
выборочную совокупность.

18. Фрагмент таблицы случайных цифр

37
52
35
15
04
80
44
83
21
28
31
42
46
72
13
20
07
99
95
64
13
06
27
29
10
16
69
93
39
08
09
38
00
84
65
56
09
29
67
19

19. Комментарий к использованию таблицы случайных цифр

Если мы имеем, скажем, популяцию (то есть генеральную
совокупность) из 1507 элементов и хотим спроектировать выборку
численностью 150 элементов, мы можем выбирать любые два
смежных столбца в таблице случайных чисел: цифры, стоящие в
двух смежных ячейках будут образовывать четырехзначное число.
Каждый раз, когда будет появляться число от 0001 до 1507, мы
будем считать, что оно обозначает номер отбираемого элемента.
Когда число появляется более чем один раз, этот номер
игнорируется после первого раза.
Если мы начнем с первых четырех столбцов в таблице, спускаясь
по столбцам, то в выборку будут включены элементы под номерами
0799, 1016, 0084, 480, 1306, 929, 1320 и 938.
Поскольку мы не стремимся умышленно отыскать определенное
число, мы можем начать с любого места таблицы и использовать
любую систему для движения по таблице.
С тем же успехом случайные числа могут генерироваться
специальной программой компьютера.

20. Метод систематической (или механической) выборки

На практике чаще всего
используют метод
систематической (или
механической) выборки,
когда из
пронумерованного списка
через равные интервалы k
отбирается заданное число
респондентов. При этом
шаг выборки k (интервал
скачка) рассчитывается по
простой формуле:
N
k
n
где N – численность
генеральной совокупности
n – численность
выборочной совокупности.

21. Пример систематической (или механической) выборки

Предположим, что нам нужно спроектировать выборку
численностью 100 из списка 5000 студентов какого-то вуза.
Если мы намерены использовать систематическую выборку, то
должны вначале рассчитать интервал выборки делением числа
элементов в списке на размер выборки.
В данном случае, разделив общую численность студентов 5000 на
требуемый размер выборки 100 единиц, мы получим интервал
(шаг) выборки 50.
Далее будем систематически двигаться по списку и отбирать
каждого пятидесятого студента (отобрав таким образом 100 имен).
Определение того места в списке, с которого мы начнем,
проводится случайным образом, по таблице случайных чисел
(это называется случайный старт).
Таким образом, если случайно выбрана точка старта под номером
31, то в выборку будут включены студенты, стоящие под номерами
31, 81, 131, 181 и т.д.

22. Метод кластерного отбора. (гнездовая или серийная выборка)

Метод кластерного отбора основан на
делении совокупности на подгруппы, каждая
из которых представляет совокупность в
целом.
Здесь отбираются не объекты исследования
(например, люди), а группы. Группы отбираются
случайным образом, а внутри них проводится
сплошной опрос. Например, в ВУЗе с большим
количеством студенческих групп отбор можно
проводить путем случайного отбора этих групп и
дальнейшего сплошного опроса в этих группах

23. Пример кластерного отбора

Предположим, что исследуется мнение населения
какого-то региона относительно марки какого-то товара.
Регион разбивается на четко определяемые части
(кластеры), например области.
Исследователь может считать, что выделенные кластеры
являются идентичными и мнение населения этих
областей характерно для региона в целом.
Далее одна из областей (один кластер) выбирается
случайным образом, определяется совокупность для
этой области, в ней проводится соответствующее
исследование, а выводы обобщаются на совокупность
всего региона

24. Причины появления стратифицированного отбора (типической или районированной выборки)

В основе всех вероятностных методов лежит
предположение, что любая совокупность характеризуется
симметричным распределением ее ключевых
характеристик. Другими словами, каждая выборка
достаточно полно характеризует всю совокупность,
различные крайности в выборке уравновешивают друг
друга.
Но такая ситуация на практике встречается крайне редко.
Скажем, исследуется рыночный потенциал определенного
региона для какого-то товара. Население больших, средних
и малых городов, сельской местности данного региона
отличается по уровню образования, дохода, образу жизни
и т.п. В таком случае необходим стратифицированный
отбор

25. Понятие стратифицированной выборки

При наличии в составе генеральной
совокупности различных типов явлений с
разными уровнями изучаемых признаков
организуют стратифицированную выборку,
чтобы обеспечить более равномерное
представительство в выборочной совокупности
различных частей (типов) явления.
Генеральная совокупность разделяется на различные
подгруппы (страты), например по уровню доходов, и
выборки формируются из этих подгрупп, по сути
дела являющихся сегментами рынка.

26. Условия осуществления стратифицированной выборки

При использовании данного метода прежде всего
следует выбрать некоторую наблюдаемую
характеристику (признак), характеризующую каждую
единицу совокупности, например уровень дохода.
Далее для каждой страты с помощью случайного
отбора формируется выборка.
Стратифицированная выборка может быть применена
лишь при наличии дополнительной информации о
генеральной совокупности (например, нам необходимо
процентное соотношение мужчин и женщин, в случае,
если мы хотим стратифицировать выборку по полу).
Отсутствие такой информации делает применение
стратифицированной выборки невозможным

27. Методы (типы) невероятностной выборки

Отбор в такой выборке осуществляется не по
принципам случайности, а по субъективным
критериям – доступности, типичности,
равного представительства и т.д.
При применении невероятностных методов
отбора формирование выборки
осуществляется без использования понятий
теории вероятностей, вследствие чего
невозможно рассчитать вероятность
включения в выборку единицы
совокупности.

28. Нерепрезентативный отбор. Метод стихийной выборки: отбор на основе удобства и доступности

Смысл метода заключается в том, что
формирование выборки осуществляется
самым удобным с позиций исследователя
образом, например, с позиций минимальных
затрат времени и усилий, с позиции
доступности респондентов.
Выбор места исследования и состава выборки
производится субъективным образом, например,
опрос покупателей осуществляется в магазине,
ближайшем к месту жительства исследователя.
Очевидно, что многие представители
совокупности не принимают участия в опросе.

29. Метод экспертного отбора (на основе суждения)

Метод основан на использовании мнения
квалифицированных специалистов, экспертов
относительно состава выборки. На основе такого
подхода часто формируется состав фокус-группы.
Например, изучается потребность в издании
кулинарной книги для приготовления в
микроволновой печи низкокалорийной пищи. На
основе мнения исследователей в состав фокусгруппы было включено 12 домохозяек; шестеро из
них владело микроволновыми печами более трех
лет, трое — менее трех лет и трое только
собирались их купить.

30. Метод квотной выборки

Формирование выборки на основе квот
(квотный отбор) предполагает
предварительное, исходя из целей
исследования, определение состава и
численности групп респондентов, отвечающих
определенным требованиям (признакам).
Например, мужчины в возрасте 20-30 лет, 31-45
лет и 46-60 лет; лица с доходом до 30 тысяч
рублей, с доходом от 30 до 60 тысяч рублей и с
доходом свыше 60 тысяч рублей)

31. Метод квотной выборки

Для каждой группы задается количество объектов,
которые должны попасть выборку и быть обследованы.
Количество объектов, которые должны попасть в
каждую из групп, задается, чаще всего, либо
пропорционально заранее известной доле группы в
генеральной совокупности, либо одинаковым для
каждой группы.
Внутри групп объекты отбираются произвольно.
Квотные выборки используются в маркетинговых
исследованиях достаточно часто

32. Пример квотной выборки

Приведем пример расчета выборки по
таким параметрам квоты как пол и возраст.
В одном из маркетинговых исследований
при опросе населения, исследователи
опирались на данные Областного комитета
по статистике о половозрастной структуре
населения районов города.
Так, половозрастная структура населения
Советского района Нижнего Новгорода
выглядела следующим образом:

33.

Генеральная совокупность
численность
Выборочная
совокупность
Доля, %
число
Всего
муж.
жен.
муж.
жен.
всего
муж.
жен.
всего
128546
55757
72789
43,4
56,6
100,00
521
679
1200
20 — 24
11958
6009
5949
50,3
49,7
9,30
56
56
112
25 — 29
11858
6520
5338
55,0
45,0
9,22
61
50
111
30 — 34
12093
5861
6232
48,5
51,5
9,41
55
58
113
35 — 39
14360
6795
7565
47,3
52,7
11,17
63
71
134
40 — 44
14112
6598
7514
46,8
53,2
10,98
62
70
132
45— 49
12779
5840
6939
45,7
54,3
9,94
55
65
119
50 — 54
7274
3222
4052
44,3
55,7
5,66
30
38
68
55 — 59
11981
5035
6946
42,0
58,0
9,32
47
65
112
60 — 69
17503
6828
10675
39,0
61,0
13,62
64
100
163
70 и старше
14628
3049
11579
20,8
79,2
11,38
28
108
137
Основа выборки
Возраст (лет)

34. Пример квотной выборки

Изучая данные таблицы, нетрудно убедиться, что
численность каждой из половозрастных групп в
трех последних столбцах таблицы (объеме
выборки) пропорциональна численности каждой из
соответствующих групп в генеральной
совокупности. Такая выборка называется
пропорциональной.
Иногда используются и непропорциональные
выборки, если это необходимо исходя из целей
исследования
Таким образом на основе определенных заданных
параметров создается микромодель
генеральной совокупности

35. Метод снежного кома

Формирование выборки в процессе опроса основано на
расширении числа опрашиваемых на основе предложений
респондентов, которые уже приняли участие в
обследовании.
У каждого респондента, начиная с первого, просят
контакты его друзей, коллег, знакомых, которые подходили
бы под условия отбора и могли бы принять участие в
исследовании.
Таким образом, за исключением первого шага, выборка
формируется с участием самих объектов исследования.
Метод часто применяется, когда необходимо найти и
опросить труднодоступные группы респондентов
(например, респондентов, имеющих высокий доход,
респондентов, принадлежащих к одной профессиональной
группе, респондентов, имеющих какие-либо схожие
хобби/увлечения и т.д.)

36. Комбинация типов выборки при проведении исследования: многоступенчатая выборка

Многоступенчатая выборка –строится с
применением процедуры поэтапного отбора
объектов опроса.
При этом совокупность объектов, отобранных
на предыдущем этапе (ступени), становится
исходной для отбора на следующем.
Промежуточные объекты, составляющие
выборочную совокупность на высших
ступенях, называют единицами отбора.
Объекты самой нижней ступени, с которых
ведется непосредственный сбор информации,
называются единицами наблюдения.

37. Пример многоступенчатой выборки

Так, формирование выборки для оценки мнения населения России
относительно различных марок какого-либо товара, например
холодильника, может осуществляться по следующей схеме:
1. Россия, согласно ее административно — территориальному
делению, делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов
(исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в
зависимости от численности населения делятся на шесть групп:
до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100
000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из
девяти выбранных субъектов Федерации исследуются три города
и два поселка

38. Пример многоступенчатой выборки

Для этого берется каждый пятый населенный пункт из справочника
Госкомстата «Численность населения Российской Федерации по
городам, рабочим поселкам и районам и определяется, в какую из
категорий он попадет (систематический отбор). Так поступают
до тех пор, пока не наберется нужное количество населенных
пунктов. Если, дойдя до конца списка, не будет найдено квотное
число населенных пунктов, процесс выбора населенных пунктов
начинается сначала, но берется каждый четвертый населенный
пункт, и т.д.
5. Выбирается случайным образом в каждом выбранном городе и
поселке по меньшей мере 20 респондентов.
Таким образом, кроме Москвы и С.-Петербурга должно быть
проинтервьюировано 900 респондентов. В Москве и С.Петербурге опрашивается по 50 респондентов. В итоге должно
быть проинтервьюировано 1000 респондентов.

39. Этапы разработки выборочного плана

1. Определение соответствующей совокупности
согласно поставленным целям исследования.
2. Получение «списка» совокупности для
установления контура выборки.
3. Проектирование выборочного плана –
определение состава и объема выборки.
4. Определение методов доступа к совокупности.
5. Достижение нужной численности выборки.
6. Проверка выборки на соответствие требованиям.
7. В случае необходимости формирование новой
выборки.

40. Определение объема выборки

Исходным пунктом расчета объема выборки
становится вопрос об определении размеров
выборочной совокупности.
Численность выборочной совокупности зависит от
двух факторов:
(1) стоимости сбора информации
(2) стремления к определенной степени
статистической достоверности результатов,
которую надеется получить исследователь.
Чем больше размеры выборки, то есть чем ближе
они к размерам генеральной совокупности в
целом, тем более надежны и достоверны
полученные данные.

41. Определение объема выборки

Самый спорный вопрос по выборочному
плану.
На практике, решение о объеме выборки
всегда есть компромисс между точностью
результатов исследования и затратами на
проведение исследования.
Способ определения объема выборки
зависит от того, имеется ли у
исследователя информация о составе
генеральной совокупности

42. Связь между объемом выборки и репрезентативностью

Следует отметить, что объем выборки никак не
влияет на репрезентативность полученных
результатов.
Пример: Предположим, например, что в целях
изучения степени использования в России
персональных компьютеров в научной работе
проводился опрос на основе принципа удобства
на одном из московских перекрестков. И хотя
было опрошено 5000 респондентов, полученные
результаты не являются репрезентативными даже
для Москвы.
Это обусловлено тем, что был использован метод
формирования выборки, который в данном случае
применять было нельзя.

43. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Правило большого пальца –
бездоказательно принимается, что для
получения нужных результатов
выборка должна составлять, например,
5% от генеральной совокупности
Исходя из заранее оговоренных с
заказчиком условий (он рекомендует
цифры выборки)

44. Методы определения объема выборки Если исходная информация о генеральной совокупности отсутствует, то используется:

Многолетний опыт социологов-практиков. Он
свидетельствует о том, что при массовых опросах,
если величина генеральной совокупности
составляет менее 5000, то достаточный объем
выборочной совокупности должен быть не менее
500 человек.
Если величина генеральной совокупности
составляет более 5000, то для получения
статистически значимых результатов нужно
обследовать 10% ее состава, но не более 2000-2500
единиц.

45.

Зависимость объема выборки от ее ошибки
(размер генеральной совокупности составляет 20 тыс.
единиц)
Ошибка
выборки,
%
2
3
4
5
6
7
8
9
10
Объем
выборки,
ед.
2500
1100
620
400
280
200
160
110
100
12
67
14
50
17
30
20
25

46. Зависимость объема выборки от ее ошибки

В.И. Паниотто приводит следующие расчеты
репрезентативной выборки с допущением 5процентной ошибки:
Объем
генеральной
совокупности
500 1000 2000 3000
4000
5000
10000
100000
Объем
выборки
222 286
360
370
385
358
333
350

47. Комментарии к таблице

Суть данных, приведенных в этой таблице, состоит в
следующем. Если вы, опросив, предположим, 400
человек в районном городе, где численность взрослого
платежеспособного населения составляет 100 тысяч
человек, выявили, что 33 процента опрошенных
покупателей предпочитают продукцию местного
мясокомбината, то с 95-процентной степенью
вероятности можете утверждать, что постоянными
покупателями этой продукции являются 33 5% (то
есть от 28 до 38 процентов) жителей этого города.
Уровень уверенности в 95% – это условие, оно
показывает 95% уверенности в том, что параметр
популяции попадает в пределы допуска ошибки
выборочной статистики.

48. Методы определения объема выборки Если исходная информация о генеральной совокупности имеется, то:

Наиболее теоретически обоснованный и
корректный подход к определению
объемов выборки основан на расчете
доверительных интервалов.
Метод требует понимания некоторых
базовых понятий математической
статистики (закона нормального
распределения, меры вариации, среднего
квадратического отклонения,
доверительного интервала и т. д.)

49. Понятие вариации

Понятие вариации характеризует величину
несхожести (схожести) ответов респондентов на
определенный вопрос.
В более строгом плане вариацией значений какоголибо признака в совокупности называется различие
его значений у разных единиц данной совокупности
в один и тот же период или момент времени.
Результаты ответов на вопросы опроса обычно
представляются в форме кривой распределения.
При высокой схожести ответов говорят о малой
вариации (узкая кривая распределения) и при
низкой схожести ответов — о высокой вариации
(широкая кривая распределения).

50. Кривые распределения результатов ответа на вопрос: «Сколько миль за год проходит ваш автомобиль?»

51. Среднее квадратическое отклонение

В качестве меры вариации обычно принимается
среднее квадратическое отклонение, которое
характеризует среднее расстояние от средней
оценки ответов каждого респондента на
определенный вопрос.
Можно сравнить среднее квадратическое
отклонения для двух выборок и определить, для
какой из них вариация является меньшей.
Поскольку все маркетинговые решения
принимаются в условиях неопределенности, то
это обстоятельство целесообразно учесть при
определении объема выборки.

52. «Доверительный интервал»

Так как определение исследуемых величин для
совокупности в целом осуществляется на основе
выборочной статистики, то следует установить
диапазон (доверительный интервал), в который, как
ожидается, попадут оценки для совокупности в целом,
и ошибку их определения.
Понятие «доверительный интервал» — это диапазон,
крайним точкам которого соответствует определенный
процент определенных ответов на какой-то вопрос.
Данное понятие тесно связано с понятием «среднее
квадратическое отклонение изучаемого признака в
генеральной совокупности»: чем оно больше, тем шире
должен быть доверительный интервал, чтобы
включить в свой состав, например, 95% ответов.

53. Пример

Проведено исследование числа визитов
автовладельцев в сервисные мастерские за год.
Доверительный интервал для среднего числа
визитов был рассчитан равным 5—7 визитам при
99%-ном уровне доверительности (надежности
выборки).
Это означает, что если появится возможность
провести независимо 100 раз выборочные
исследования, то для 99 средних значений числа
визитов попадут в диапазон от 5 до 7 визитов —
другими словами, 99% автовладельцев попадут в
доверительный интервал. (в 99 случаях результат
будет находиться в указанных границах)

54. Важно понимать!

Выборка всегда дает более относительный
результат по сравнению с генеральной
совокупностью.
Всегда есть вероятность отклонения, которая
считается ошибкой выборки (измеряется в
процентах)

55. Средняя квадратическая ошибка выборки

Индикатором степени отличия оценки, истинной
для совокупности в целом, от оценки, которая
ожидается для типичной выборки, является
средняя квадратическая ошибка выборки.
Например, исследуется мнение потребителей о новом
продукте и заказчик данного исследования указал, что
его устроит точность полученных результатов,
равная ±5% (ошибка выборки)
Предположим, что 30% членов выборки высказалось за
новый продукт. Это означает, что диапазон возможных
оценок для всей совокупности составляет 25—35%.

56. Определение объема выборки на основе расчета доверительного интервала

Исходной информацией, необходимой для
реализации данного подхода, является:
Величина вариации, которой, как
считается, обладает совокупность.
Желаемая точность.
Уровень доверительности, которому
должны удовлетворять результаты
проводимого обследования.

57. Когда на заданный в анкете вопрос существует только два варианта ответа, выраженные в процентах (используется процентная мера), объем выбо

Когда на заданный в анкете вопрос существует только два
варианта ответа, выраженные в процентах (используется
процентная мера), объем выборки определяется по следующей
формуле:

58.

59. Пример расчета объема выборки

Фирмой, выпускающей покрышки, проводится опрос
автолюбителей. Целью обследования является
определение процента автолюбителей, использующих
радиальные покрышки, поэтому на вопрос:
«Используете ли вы радиальные покрышки?»
возможно только два ответа: «Да» или «Нет» (шкала
наименований).
Если предположить, что совокупность автолюбителей
обладает низким показателем вариации, то это
означает, что почти каждый опрошенный использует
радиальные покрышки. В этом случае может быть
сформирована выборка достаточно малых размеров. В
формуле (4.1) произведение pq выражает вариацию,
свойственную совокупности.

60. Пример расчета объема выборки

Предположим, что 90% единиц
совокупности используют радиальные
покрышки. Это означает, что рq = 900. Если
принять, что показатель вариации выше (р
= 70%), то рq = 2100.
Наибольшая вариация достигается в
случае, когда половина совокупности
(50%) используют радиальные покрышки, а
другая (50%) — не использует. В этом
случае произведение рq достигает
наибольшего значения, равного 2500

61. Пример расчета объема выборки

При проведении исследования следует
указать точность полученных оценок
(точность выборки).
Скажем, в результате исследования было
установлено, что 44% респондентов
используют радиальные покрышки.
В этом случае результаты измерения
желательно представить в виде: «Процент
автолюбителей, использующих
радиальные покрышки, составляет 44%
плюс-минус …%».

62. Пример расчета объема выборки

Что касается уровня доверительности, то при
проведении маркетинговых исследований, обычно
рассматриваются только два его значения: 95%
или 99%.
Первому значению соответствует значение z =
1,96, второму — z = 2,58.
Если выбирается уровень доверительности,
равный 99%, то это говорит о том, что мы
уверены на 99% (другими словами, доверительная
вероятность равна 0,99) в том, что процент
членов совокупности, попавших в диапазон ± е%,
равен проценту членов выборки, попавших в тот
же диапазон ошибки.

63. Пример расчета объема выборки

Принимая вариацию,
равную 50%,
точность, равную ± 10%,
при 95%-ном уровне
доверительности,
рассчитаем размер
выборки:
При уровне
доверительности,
равном 99%, и е =
±3% n = 1067.

64. Важно понимать!

Приведенные формулы расчета объема выборки
основаны на предположении, что все правила
формирования выборки были соблюдены и
единственной ошибкой выборки является ошибка,
обусловленная ее объемом.
Однако следует помнить, что объем выборки
определяет точность полученных результатов, но
не их представительность, которая определяется
методом формирования выборки.
Все формулы для расчета объема выборки
предполагают, что репрезентативность
гарантируется использованием корректных
процедур формирования выборки.

65. Систематическая ошибка выборки

Систематическая ошибка зависит от различных
факторов, оказывающих постоянное воздействие
на исследование и смещающих результаты
исследования в определенную сторону.
Пример:
— Использование любых вероятностных выборок
занижает долю людей с высоким доходом,
ведущих активный образ жизни. Происходит это в
силу того, что таких людей гораздо сложней
застать в каком-либо определенном месте
(например, дома).
— Проблема респондентов, отказывающихся
отвечать на вопросы анкеты (доля «отказников» в
Москве, для разных опросов, колеблется от 50%
до 80%)

66. Зависимость ошибки выборки от степени различий между единицами генеральной совокупности

Чем больше различия (или гетерогенности) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Например, если нам нужно узнать, какое количество
пива потребляется, то мы обнаружим, что внутри
нашей генеральной совокупности нормы
потребления у различных людей существенно
различаются (гетерогенная генеральная
совокупность).
В другом случае мы будем изучать потребление
хлеба и установим, что у разных людей оно
различается гораздо менее существенно (гомогенная
генеральная совокупность).

67. Важно понимать!

Помимо четкого планирования репрезентативности
выборки, нельзя распространять полученные результаты
за ее границы. Так, результаты исследования мнения
массового потребителя города Москвы о товарах
определенной фирмы нельзя распространять на всю Россию.
Можно быть поставленным в тупик разными результатами
обследования степени лояльности потенциальных
покупателей к определенной марке пылесоса (в одном
исследовании была названа цифра 10%, в другом случае —
25%).
Дело в том, что в первом случае цифра была получена от
общего числа опрошенных, а во втором случае — только от
числа тех покупателей, которые твердо решили приобрести
пылесос.

68. Из этого следует:

Для вдумчивого маркетолога очень
важными являются те пояснения,
которые сопровождают полученные
данные (как минимум, формулировки
вопросов и описание выборки)

69. Итак:

Объем выборки не влияет на репрезентативность
результатов (влияет метод ее формирования)
Чем больше величина выборки, тем меньше ее
возможная ошибка
Чем больше различий (гетерогенность) внутри
генеральной совокупности, тем больше величина
возможной ошибки выборки
Решение об объеме выборки является
компромиссом между точностью результатов
исследования и возможностями его практической
реализации.

Понравилась статья? Поделить с друзьями:
  • Контроль ошибок modbus
  • Контроллер rittal ошибки
  • Контроль датчика кислорода ошибка или не завершен
  • Контроль незакрытых ошибок пд текущего периода что это
  • Контроллер remak коды ошибок