Повышенная надежность исследования допускает ошибку выборки

В подавляющем
большинстве случаев социолог использует
тот или иной способ выделения из большой
совокупности явлений и объектов изучения
некоторую их часть в надежде, что на
этой выборочной совокупности могут
быть выявлены свойства объекта
исследования в целом.

Тип и способы
выборки прямо зависят от целей исследования
и его гипотез.
Чем
конкретнее цель и чем яснее сформулированы
гипотезы, тем правильнее будет решен
вопрос о выборке.

Наиболее строгие
требования предъявляются к выборкам
дескриптивных и аналитико-экспериментальных
исследований, наименее строгие — к
исследованиям по разведывательному
плану. В последнем случае отбор «единиц
наблюдения» на объекте подчиняется
довольно простым правилам: следует
выделять полярные группы по существенным
для анализа критериям. Численность
таких несистематических выборок строго
не определяется. Все зависит от состояния
получаемой информации. Наблюдение или
опрос в таком исследовании продолжаются
до тех пор, пока не обнаружится, что
получена информация, достаточно
разнообразная для формулировки гипотез.
Следовательно, состав и объем выборки
заранее не фиксируются, а устанавливаются
опытным путем по мере развития
исследования.

В исследовании
дескриптивного плана выборка, напротив,
должна быть строго репрезентативной.

Требования
репрезентативности выборки означают,
что по выделенным параметрам (критериям)
состав обследуемых должен приближаться
к соответствующим пропорциям в генеральной
совокупности.
Между
тем строго репрезентативную выборку
по всем важным для проблематики
исследования параметрам обеспечить
невозможно, и поэтому следует гарантировать
репрезентацию по главному направлению
анализа данных.

Прежде
всего, надо уяснить, какие из имеющихся
сведений о характеристиках генеральной
совокупности существенны для целей
исследования. Во многих случаях это
половозрастной и социально-профессиональный
состав обследуемых, их пространственная
локализация. Половозрастная структура
«замыкает» на себя многие показатели
семейного состояния, уже известные по
другим данным. Возраст содержит указания
на жизненный опыт и, как правило, на
рабочий или профессиональный стаж.
Социально-профессиональные характеристики
— это свидетельства рода занятий, с чем
связаны интересы, особенности режима
труда и отдыха, многие другие важные
показатели деятельности людей.
Пространственная локализация (по
территории, подразделениям предприятий
и учреждений, по другим административным
и производственным «локалам») важна
и с точки зрения особенностей условий
этой деятельности (например, центр и
периферия, основные и вспомогательные
службы), и с точки зрения адресности
итоговых выводов и рекомендаций, которые
должны быть «привязаны» к
административным или производственным
ячейкам, имеющим четкие границы и часто
самоуправляемым. В сочетании трех
названных параметров — половозрастной
структуры, социально-профессионального
состава, пространственной локализации
— можно, как правило, быть уверенным,
что выборка будет представительна для
решения многих социальных проблем.
Понятно, что это правило имеет исключения
в зависимости от конкретных условий и
особых целей исследования (например, в
этнически  неоднородной среде
существенно иметь в виду репрезентацию
по критерию национальной принадлежности).

Мера подобия
выборочной модели структуре генеральной
совокупности оценивается ошибкой
выборки, а пределы допустимой ошибки
опять-таки зависят от цели исследования.

Иногда требуется
повышенная надежность, как это имеет
место в экономических и демографических
обследованиях, например при переписях
населения. Здесь существенные ошибки
оборачиваются миллионными потерями
материальных ресурсов и просчетами
планирования. Гораздо чаще социологические
обследования проводятся для уяснения
общих тенденций, общей ориентировки в
сфере социальной политики.

Весьма полезна
следующая приблизительная оценка
надежности результатов выборочного
обследования [289, с. 36]. Повышенная
надежность допускает ошибку выборки
до 3%, обыкновенная — до 3—10% (доверительный
интервал распределений на уровне
0,03—0,1), приближенная — от 10 до 20%,
ориентировочная — от 20 до 40%, а прикидочная
— более 40%.

В аналитических
и экспериментальных исследованиях
проблема статистической репрезентативности
выборки оказывается второстепенной в
сравнении с необходимостью обеспечить
качественное представительство изучаемых
социальных объектов.

Рассмотрим следующий пример. В изучении
образа жизни населения некоторого
города мы, следуя правилам дескриптивного
обследования, хотим обеспечить
представительство всех групп населения
соответственно их пропорциям в составе
генеральной совокупности с отклонением
±5% от истинного распределения. Такая
выборка, представительная в качественном
отношении, будет также и статистически
репрезентативной, но следует решить,
нужно ли это.

Напомним, что репрезентативные выборки
необходимы лишь в том случае, если целью
исследования является получение
суммарных данных в отношении изучаемого
объекта в целом. В нашем примере — это
все население данного города. Тогда в
выводах социолог имеет право сообщить,
что в среднем горожане так-то оценивают
различные условия жизни и деятельности,
в среднем такая-то доля населения
проявляет высокую активность в таких-то
видах деятельности, а такая-то — низкую
и т.п. Но с практической точки зрения,
не говоря уже о теоретических задачах
изучения образа жизни, нам гораздо
важнее выявить специфику условий и
образа жизни различных групп населения,
и в том числе тех, которые, будучи
малочисленными нуждаются в специальном
внимании.

Допустим, что в составе населения города
имеется 3% ветеранов Отечественной
войны. Чтобы получить более или менее
достоверную информацию об условиях их
жизни и их проблемах, надо обеспечить
должное численное представительство
этой категории граждан в выборочной
совокупности. Но поскольку выборка
статистически репрезентативна, то при
численности населения города, скажем,
100 тыс. и численности выборочной
совокупности в 2 тыс., т.е. при двухпроцентной
выборке, доля ветеранов в выборочной
совокупности составит 60 человек. Много
это или мало? Возможно, этой численности
достаточно для того, чтобы сделать
статистически достоверные заключения
о простейших частных показателях условий
их жизни, например об уровне обеспеченности
жилищем ветеранов войны в сравнении со
среднестатистическими показателями
на всю выборку населения города. Но, как
только мы захотим углубить анализ, мы
обнаружим, что численность подвыборки
ветеранов явно мала. К примеру, важно
установить, какова доля ветеранов войны,
проживающих в отдельной квартире и без
семьи, т.е. одиноких. В таком случае
придется составить табличку размерностью
2X2 (две градации «проживают с семьей»
и «одиночки» + две градации по
критерию наличия своей комнаты или
квартиры). В каждой клеточке этой таблицы
может быть в пределе по 15 единиц наблюдения
(60 / 4 = 15). Конечно, реальное распределение
окажется иным. Так, ветеранов-одиночек,
не имеющих собственной комнаты, не будет
вовсе. Зато одиночек, проживающих в
отдельной квартире, может оказаться,
допустим, 5-10 человек. Вместе с тем именно
эта категория ветеранов и составляет
предмет особого внимания. Однако при
численности подвыборки в 10 человек
никакой дальнейший статистический
анализ уже невозможен.

Следовательно,
если мы хотим изучить в статистических
показателях особенности условий и
образа жизни каких-то определенных
групп населения, репрезентативная
выборка должна быть заменена целевой,
в которой численность каждой интересующей
нас группы будет достаточна для более
основательного анализа. Такая выборка,
будучи качественно представительной
в отношении целей исследования, не
является статистически репрезентативной
в отношении генеральной совокупности.

Во
многих случаях необходимы именно
целевые 
выборки
.
Особенно это важно в исследованиях
экспериментального плана. Скажем,
проверяется эффективность введения
новой формы организации труда. Ясно,
что для этого следует отобрать
подразделения, где введена новая
организация, и для сравнения — аналогичные,
где работа идет по-старому. Следует
гарантировать в выборке равную численность
экспериментальных подразделений
(например, пять бригад) и «контрольных»,
работающих по прежней системе. При этом
важно так подобрать эти подразделения,
чтобы они были аналогичны по всем
существенным характеристикам, кроме
факта наличия или отсутствия новой
формы организации труда. Характер
работы, профессиональный и квалификационный
состав работников, их половозрастная
структура и, возможно, другие показатели
должны быть сопоставимы. Решающее
значение имеет здесь отнюдь не
пропорциональность выборочной доли
экспериментальных бригад в отношении
к их доле в генеральной совокупности,
но именно качественное представительство
экспериментальных и контрольных бригад
соответственно цели исследования.

Численность
(объем) выборки зависит от уровня
однородности или разнородности изучаемых
объектов.
Чем
более они однородны, тем меньшая
численность может обеспечить статистически
достоверные выводы. Но степень однородности
социального объекта зависит, в сущности,
от того, насколько детально мы намерены
его исследовать. Практически любой,
самый «элементарный» объект
оказывается чрезвычайно сложным. Лишь
в анализе мы представляем его как
относительно простой, выделяя те или
иные его свойства. Чем более основательным
и детальным будет анализ, чем больше
свойств данного объекта мы намерены
принять во внимание в их сочетании, а
не изолированно, тем больше должен быть
объем выборки.

Для решения такого
рода задач как раз и необходимы целевые
аналитические выборки. В них учитывается
не только структура изучаемой совокупности,
но и ограничения, накладываемые на объем
выборки целями исследования, глубиной
анализа проблем.

Используя
статистический критерий Стьюдента,
можно рассчитать объем выборок в
зависимости от заданного уровня
доверительного интервала ошибки вывода
[212, с. 19—21]. Чем меньше объем сравниваемых
подвыборок (пусть это будут ветераны-одиночки
и семейные), тем больше должно быть
различие каждой пары сопоставляемых
статистик (например, процентные различия
оценок условий быта теми и другими).
Если численность сравниваемых подвыборок
неодинакова, за базу определения
допустимой ошибки следует брать
наименьшую подвыборку.

В зависимости от
объема подвыборки существенность
процентных различий определяется
таблицей:

Допустим, что удовлетворительно оценивают
условия быта 85% ветеранов женщин и 76%
мужчин, проживающих с семьями, и
соответственно 32% женщин и 42% мужчин-одиночек.
Разности в процессах составляют здесь
85 — 76 = 9 и 42 32 = 10%. При численности 
подвыборок  до  150 человек и при
5-процентном уровне ошибки эти различия
нельзя признать существенными, так как
они должны перекрывать 11,5%. Но различия
между  соответствующими оценками
одиночек и семейных будут существенны.
Они составят для женщин    85 — 32
= 53%  и  76 — 42 = 22%  для мужчин. 
Такие различия значимы уже при выборках
около 50 человек. Достоверный вывод
звучит так: решающей является ситуация
проживания ветеранов с семьей или оди- 
ноко. В какой мере эти обстоятельства
больше переживаются мужчинами или
женщинами, сказать трудно; наших данных
для этого недостаточно.

Авторы приведенных
расчетов отмечают, что выборки на уровне
500 человек позволяют анализировать
таблицы сопряженности с 4 признаками
из трех градаций каждый, а выборки в
1000 единиц расширяют возможности
уверенного анализа до таблиц с 6 признаками
из пяти  градаций. Все это при условии
обеспечения доверительного интервала,
не превышающего 5% статистически значимой
ошибки.

Общее правило
таково: объем выборки при заданном
уровне доверительного интервала должен
быть не менее чем пК
единиц
наблюдения, где п
объем
подвыборки по столбцу, а К
— число
столбцов.

Объем выборки
зависит также от уровня доверительного
интервала допустимой ошибки, каковая,
как уже говорилось, задается целесообразной
точностью итоговых обобщений: от
повышенной до ориентировочной. Однако
здесь имеются в виду так называемые
случайные
ошибки,
связанные с природой любых статистических
погрешностей. Именно они и вычисляются
как ошибки репрезентативности
вероятностных выборок. В.И. Паниотто
приводит следующие расчеты репрезентативной
выборки с допущением 5 -процентной ошибки
[181,с.81].

Для совокупности
более 100000 выборка составляет 400 единиц.
Если же иметь в виду генеральные
совокупности численностью от 5 тыс. и
больше, то, по расчетам того же автора,
можно указать величины фактической
ошибки выборки в зависимости от ее
объема [181, с. 82], что для нас весьма важно,
памятуя, что величина допустимой ошибки
зависит от цели исследования и не
обязательно должна приближаться к
5-процентному уровню.

Наряду со случайными
возможны ошибки систематического
характера.
Они
зависят от организации выборочного
обследования. Это разнообразные смещения
выборки
в
сторону одного из полюсов выборочного
параметра. Например, при обследовании
на предприятии — в сторону тех работников,
которые заняты в утренней смене, при
этом работающие в вечернюю или ночную
смену выборкой не охвачены. Между тем
в утренней смене будет сосредоточено
большинство учащихся-вечерников,
работающие матери, имеющие малолетних
детей, и т.д. Смещение
выборки

наиболее типичная систематическая
ошибка, устранение которой достигается
путем безусловного выполнения правила
обеспечения потенциальной возможности
попадания в выборку каждой «единицы
наблюдения», в приведенном примере
— каждого из потенциально обследуемых
работников предприятия. С этой целью
используют списочный состав работников,
отбирая с определенным интервалом (шаг
выборки)
каждого
п-го
по списку.

Систематическая
ошибка может иметь место при игнорировании
какого-то важного параметра (характеристики)
обследуемой совокупности, каковой вовсе
не контролируется при оценке статистических
погрешностей выборки и обнаруживается
лишь в ходе анализа данных. Например,
может оказаться, что во время обследования
телевизионной аудитории. Для изучения
отношения зрителей к различным
телепрограммам какие-то важные рубрики
телепередач в обследуемый период вовсе
не были представлены в передачах, так
что произойдет смещение оценок из-за
неполноты   самих объектов
оценивания.

Все эти обстоятельства
значительно усложняют проблему расчета
ошибки  и нередко могут привести к
тому, что формально-статистически
репрезентативная выборка окажется
качественно непредставительной.

Итак, объем
выборки зависит от трех условий: (а) от
меры однородности социальных объектов
по наиболее существенным для исследования
характеристикам;   (б)  от степени
дробности группировок анализа, планируемых
по задачам исследования;   (в) от
целесообразного уровня
 надежности
выводов из предпринимаемого исследования.

Очень часто
малоопытный социолог не улавливает
разницы между проблемой ошибки
репрезентативности выборки и ошибки
вывода из данного конкретного распределения
в рамках выборочной совокупности.

Пусть выборка
достаточно  репрезентативна и ошибка
по тому или  иному параметру выборки
незначительна. Оценка уровня достоверности 
вывода по каждому конкретному распределению
остается при этом проблемой самостоятельного
анализа.

Несколько
заключительных замечаний.
Из
сказанного выше может показаться, что
обеспечить представительство данных
в выборочном  обследовании если и
удается, то ценой непомерных усилий,
разумность затрат которых часто
сомнительна. Рекомендуем, во-первых, не
отчаиваться  и, во-вторых, рассуждать
здраво, имея в виду программные цели
исследования.

Если перед нами
стоит задача выполнить дескриптивное
обследование  большой общественной
значимости, в итоге которого должны
быть сделаны заключения относительно
генеральной совокупности в целом,
следует,  конечно, максимально
реализовать все требования репрезентативной
выборочной процедуры. Затраченные
усилия будут не только оправданны, они 
просто необходимы, так как ошибки в
выводах такого исследования 
недопустимы. Здесь ложная информация
опаснее  ее отсутствия.

Если
же задачи исследования более скромные,
уровень надежности  планируемых
выводов с точки зрения их статистической
точности можно  смело понизить, но
надо принять все меры к качественному
представительству выборочной совокупности.
Преувеличенное внимание к
формально-статистическим критериям
достоверности выводов (и тем более их
абсолютизация) за счет качества исходной
информации и качества анализа —
свидетельство профессиональной
неопытности социолога. Подчеркивая
статистическую надежность данных, он
вводит в заблуждение и себя  и хуже 
того — тех,  кто привык верить в
убедительность математических 
расчетов. Нельзя забывать о реальной
природе того, что кроется за цифрами и
математическими формулами. Ведь сами
исходные характеристики, получаемые
исследователем путем опросов или другими
способами, лишь условно переводятся в
количественные показатели. Часто эти
количественные сведения весьма
приблизительно отражают существо
социальных процессов. Поэтому усилия,
направленные на строгость статистического
обоснования результатов, приобретают
смысл только при условии серьезного
качественного анализа проблемы,
содержательного ее изучения. Бывает и
так, что непредставительные в статистическом
смысле данные, многократно повторяемые
на разных подвыборках, как раз
свидетельствуют об определенной
социальной тенденции лучше, чем
статистически достоверный вывод,
сделанный на одной единственной выборке
или ее части.

Следует постоянно
помнить, что социолог призван сосредоточить
внимание именно на существе социальных
проблем, активно привлекать к постановке
задач исследования других специалистов,
практиков и теоретиков, внимательно
следить за литературой по широкому
кругу вопросов, относящихся к предмету
исследования в экономике, психологии,
социологии. Наконец, для решения
собственно статистических задач,
касающихся типа и объема выборки, 
он прежде всего обязан максимально
четко сформулировать конкретные вопросы,
подлежащие решению, и уже после этого
обращаться к соответствующим расчетам
разнообразных статистик.

Соседние файлы в папке госы_2011

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Требования к выборке становятся актуальными при проведении психологических исследований, когда получаемые результаты и выводы в дальнейшем планируется распространить на генеральную совокупность, а также в случае необходимости получения статистически достоверных результатов.

Важнейшим требованием к качеству выборки является обеспечение ее репрезентативности. Требование репрезентативности выборки означает, что по выделенным параметрам (критериям) состав выборки обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности. Между тем, строго репрезентативную выборку по всем важным для проблематики исследования параметрам обеспечить невозможно, и поэтому следует гарантировать репрезентацию по главному направлению анализа данных.

Прежде всего, надо уяснить, какие из имеющихся сведений о характеристиках генеральной совокупности существенны для целей исследования. Во многих случаях это половозрастной и социально-профессиональный состав обследуемых, их пространственная локализация. Исходя из этого, основными этапами формирования выборки (выборочной совокупности) являются следующие:

– обоснование структуры выборочной совокупности в соответствии с характером задач и гипотез исследования;

– уточнение структуры выборки с учетом информации, полученной при анализе первичных результатов исследований, данных пробных и пилотажных исследований, их доработка на основе гипотез;

– определение типа и объема выборки.

В наиболее общем виде по типу выборочные совокупности делят на целенаправленные (из генеральной совокупности выбираются типичные элементы, воспроизводящие ее структуру) и случайные (вероятностные), когда все элементы генеральной совокупности имеют одинаковую вероятность попадания в выборочную совокупность.

В зависимости от характера исследования может применяться тот или иной тип выборки:

1. Простая случайная. Из однородной совокупности, все элементы которой известны и могут быть пронумерованы, осуществляется отбор единиц выборки с помощью таблиц случайных чисел.

2. Систематическая. Для ее определения необходим полный список единиц генеральной совокупности. В выборку отбирается по одному объекту через интервал, равный шагу отбора – отношению объема генеральной совокупности к объему выборки.

3. Гнездовая. Выборочные единицы отбираются с помощью одного из способов случайного отбора. Единицы отбора представляют собой статистические группы (гнезда), которые целиком или выборочно подвергаются обследованию.

4. Стратифицированная районированная выборка. Исследуемая совокупность предварительно разделяется на страты (слои) в соответствии с генеральным распределением известных и значимых для исследования признаков.

а) Пропорциональное размещение – объем выборки из страты пропорционален размеру страты в генеральной совокупности;

б) Оптимальное размещение – объем выборки из страты пропорционален в страте среднеквадратичному отклонению признака и обратно пропорционален издержкам на получение выборки.

5. Многоступенчатая. Процедура построения выборки разбивается на ряд этапов (ступеней). На каждой ступени меняется единица отбора.

а) Случайная – на каждой ступени единицы отбираются одним из способов случайного отбора.

б) Комбинированная – отбор на каждой из ступеней может осуществляться любым из вышеописанных способов.

6. Квотная. Производится разбиение генеральной совокупности на классы согласно нескольким распределениям выбранных признаков. На основе знания статистического объема каждого класса и заданной доли отбора из него определяется “квота” – объем выборки соответствующего класса.

Объем выборки – число элементов, включенных в выборочную совокупность. Численность (объем) выборки определяется:

– уровнем однородности или разнородности изучаемых объектов – генеральной совокупности (чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы);

– величиной доверительной вероятности (Р);

– требуемой точностью результатов, т.е. величиной допускаемой ошибки репрезентативности.

Весьма полезна следующая приблизительная оценка надежности результатов выборочного обследования. Повышенная надежность допускает ошибку выборки до 3%, обыкновенная – до 3-10%, приближенная – от 10 до 20%, ориентировочная – от 20 до 40%, а прикидочная – более 40%.

Для достижения необходимого качества выборки необходимо осуществить следующие шаги:

1. Опpеделить стpуктуpу генеpальной совокупности – количественные пpопоpции подгpупп (квот) по pазличным социально-демогpафическим хаpактеpистикам.

2. Опpеделяется объем пpедставительной выбоpки.

3. Объем пpопоpционально делится на квоты, так чтобы стpуктуpа выбоpки моделиpовала стpуктуpу генеpальной совокупности.

Половозрастная структура “замыкает” на себя многие показатели семейного состояния. При конструировании заданий для теста необходимо учитывать, что весьма вероятны различия в ответах на них в зависимости от пола испытуемых. Так, обычно при выполнении тестов способностей детьми до 16 лет девочки демонстрируют превосходство в словесно-логических навыках, а мальчики – в работе с цифрами. Вероятнее всего, что задания из этих областей будут иметь различные статистические оценки. Различия испытуемых по полу обнаруживаются во многих заданиях личностных тестов, например, тех, которые касаются интереса к одежде, спорту, своей внешности, вождению автомобиля, рисованию, верховой езде.

Одним из решений этой проблемы было бы разделить мужчин и женщин на отдельные выборки, а затем отобрать задания, удовлетворяющие критериям процедуры анализа заданий для обеих групп. Хотя при этом возникают некоторые трудности.

Первая проблема состоит в том, что хотя задания почти всегда могут быть сформулированы так, что они пройдут процедуру анализа (с корреляцией задание/общий показатель 0,2 и долей Р, ответивших в соответствии с ключом испытуемых в пределах от 0,2 до 0,8) в обеих группах, даже для эффективных заданий эти оценки могут быть не идентичными. Особенно важным здесь является коэффициент Р, так как если он всегда больше, скажем, для мужчин, чем для женщин, на большом количестве заданий, то это может привести к влиянию пола испытуемых на результаты тестирования.

Вторая проблема является более фундаментальной. Если мы отберем задания, получившие в процедуре их анализа одинаковые оценки для мужчин и для женщин, мы фактически создадим тест, на результаты которого пол испытуемых не влияет. С другой стороны, мы могли бы отобрать задания, по которым женщины показывают более высокие результаты. Каково, однако, значение такой идентичности или различия в показателях? Чтобы вычленить эту проблему, следует вспомнить, что средние значения и дисперсии для тестов являются функциями отдельных наборов заданий. Так что не имеет смысла утверждать, что исходя из показателей по тесту девочки выполняют его лучше, или хуже, или так же, как мальчики. Это должно быть функцией конкретного набора заданий.

На практике это означает, что если у нас нет некоторой веской причины ожидать влияния пола испытуемых на тест, то должны отбираться те задания, которые не выявляют половых различий. В случае большинства личностных и мотивационных переменных это наиболее оптимальный подход. Следует заметить, что если по данной переменной существует реальные различия между полами, то не имеет значения, сколько заданий испытывается – это проявится в статистических оценках заданий. Так, если постоянно для каждого задания обнаруживается устойчивая тенденция, то тогда лучше всего будет использовать эти задания, пусть даже тест и показывает теперь различия между полами.

Возраст содержит указания на жизненный опыт и, как правило, на рабочий или профессиональный стаж. При испытании заданий существенно, чтобы вся сформированная выборка была подобной той, для которой тест предназначен. Однако полезно также провести анализ заданий данного теста отдельно для различных возрастных групп в рамках одной выборки.

Социально-профессиональные характеристики – это свидетельства особого рода занятий, с чем связаны интересы, особенности режима труда и отдыха, многие другие важные показатели деятельности людей. Пространственная локализация (по территории, подразделениям предприятий, учреждений) важна с точки зрения особенностей условий жизнедеятельности определенной группы людей.

В ряде случаев значимым фактором, влияющим на результаты тестирования является т.н. тестовая искушенность. Тестовая искушенность – индивидуальный опыт обследуемого, приобретенный в ходе выполнения различных психологических тестов. По мнению А.Анастази, преимущества человека, ранее участвующего в обследовании перед новичком складываются из ранее преодоленного чувства неизвестности, сформировавшейся уверенности в себе, сложившегося отношения к тестовой ситуации, приобретенных навыков работы с тестовыми заданиями, осознания исходности принципов решения задач в определенных группах тестов, снижение мотива экспертизы и проявления различного рода установок, снижающих достоверность получаемых диагностических данных.

Таблица 4. Зависимость объема выбоpки от объема генереальной совокупности пpи допустимой ошибке 5% (довеpительная веpоятность – 0,95)

Несмотря на наличие ссылок по тексту, автор все же рекомендует прочесть раздел целиком — для более последовательного понимания материала.

Определения и пояснения:

1. Ген еральная совокупность и выборка.

Под выборочным методом понимается следующее. Та категория исследовательских задач, которая требует изучения каких-либо психологических, социальных явлений, свойственных, например, всем жителям города, всем студентам, всем владельцам автомобилей такой-то марки и т. п. накладывает объективные ограничения на возможность проведения эксперимента. Действительно: если требуется, скажем, узнать какова доля женщин среди жителей города, очень трудоемко и нецелесообразно искать эти сведения во всех паспортных столах или устраивать собственную «перепись населения». С этой целью исследователем подсчитывается процент женщин в какой-либо относительно небольшой группе случайно (или периодически) отобранных граждан, а на основании результата делается заключение о том, какова доля женщин среди жителей города.

В таком случае всех жителей будем считать ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЬЮ, а экспериментальную группу граждан – ВЫБОРКОЙ.

2. Тр ебования, предъявляемые к выборке.

К генеральной совокупности обычно применимо требование правильного определения ее КОНТУРА. Это означает, что исследователь обязан ответить на два вопроса: охватывает ли он в своих предположениях все возможные элементы генеральной совокупности, и нет ли элементов избыточных, лишних.

Приведем пример. Пусть перед нами стоит исследовательская задача определить, велик ли в некоем городе процент женщин, считающих свою семейную жизнь удовлетворительной? Не касаясь способов, как именно оценивать степень удовлетворенности, займемся определением характера самой генеральной совокупности. Очевидно, что мы получим искаженную картину, если примем за генеральную совокупность всех лиц женского пола, включая младенцев, детей и незамужних девушек. (Речь идет об удовлетворенности собственной семьей.) Однако мы так же ошиблись бы, если бы исключили вдов, престарелых женщин или женщин, состоящих в разводе, ведь мы помним, что по условию «задачи» нас интересует удовлетворенность семейной жизнью, а не только супружеством. Стало быть, не следует исключать из рассмотрения неполные семьи.

К выборке обычно предъявляются требования ВАЛИДНОСТИ и РЕПРЕЗЕНТАТИВНОСТИ.

Под ВАЛИДНОСТЬЮ понимается следующее. Буквально: выборка должна работать, то есть отражать все характеристики генеральной совокупности. Она не может быть «с живой картины списком бледным», в выборке не должны пропадать какие-то свойства, присущие генеральной совокупности в целом. Выборка – это модель того, что она представляет. (Нельзя выносить суждение о том, что все дно мирового океана покрыто галькой – на том основании, что вы сидите на пляже и перебираете в руках камешки.)

Пример. Вспомним нашего гипотетического наблюдателя, стоящего на улице и подсчитывающего процент проходящих мимо него мужчин и женщин. Если его задача в том, чтобы узнать: лица какого пола чаще ходят по этой улице, то он действует правильно. Но если задача в другом : определить больше ли ходит вообще по городу мужчин или женщин, то нашему экспериментатору надо бы пригласить помощников, которых он должен расставить и на центральных улицах и в «спальных районах» города, и на темных переулках. После подсчета ему придется объединить данные, причем в тех пропорциях, в каких описанные категории улиц представлены в его городе. Если же задача нашего любознательного исследователя состоит в том, чтобы узнать, кого вообще в городе больше – мужчин или женщин, то ему придется покинуть свой пост и лучше вместе с помощниками отправиться по разным домоуправлениям или паспортным столам. Это справедливо вот почему: если на дворе белый день, причем, рабочий, то вряд ли мимо наблюдателя будет ходить много служащих, матерей с грудными младенцами, дряхлых стариков и т.п. Иными словами, сформированная им выборка не будет отражать характеристик всей генеральной совокупности.

Требование РЕПРЕЗЕНТАТИВНОСТИ состоит в том, чтобы любой исследователь, желающий повторить этот эксперимент, имел возможность при сходных условиях сформировать подобную выборку (то есть выборку с теми же свойствами) и получить результат. Будет ли результат почти таким же или отличным – дело другое. Важно то, что условия эксперимента должны иметь возможность быть воспроизведенными.

Существует также требование НАДЕЖНОСТИ, но оно имеет отношение скорее к эксперименту в целом, нежели к формированию выборки. Состоит оно, во-первых, в возможности повторения эксперимента с получением близких (тех же) результатов, и, во-вторых, — в степени доверия к полученным результатам – точность, с какой эксперимент описал действительное положение вещей. Этот момент тесно связан с таким понятием, как «уровень статистической значимости».

3. Уро вни статистической значимости.

Основной вопрос, на который нужно дать ответ при проведении любого статистического исследования, это – достоверны ли различия между чем-то и чем-то. Этим «чем-то» может быть, например средний уровень интеллекта в двух группах людей; возможно, мы хотим узнать, все ли цвета в тесте Люшера выбираются, в среднем, одинаково часто на все позиции (то есть хотим сравнить экспериментальное распределение с равномерным); случайно или нет после воздействия суггестора на экспериментальную группу изменилось ее усредненное отношение к какому-то вопросу, и т.п. Во всех этих (и во всех прочих) случаях мы всегда определяем достоверность различий.

УРОВЕНЬ ЗНАЧИМОСТИ – это вероятность того, что мы сочли различия достоверными, а они на самом деле случайны.

Часто в научной литературе, особенно в периодических изданиях, можно встретить такую запись:

Эта запись обозначает, что полученные в описываемом эксперименте различия достоверны на 5%-м или 1%-м уровне, то есть вероятность, что они окажутся недостоверны, равна 5/100 (0,05%) или 1/100 (0,01%).

Пятипроцентный уровень и однопроцентный уровень – общепринятые «стандарты». Обычно приводится сравнение именно с этими двумя числами.

Если уровень значимости указан:

более 10 процентов, — гипотезу, как правило, признают не подтвердившейся, а различия – недостоверными;

если в диапазоне от 5 до 10 процентов – тенденция достоверности;

меньше 5% — результатам можно доверять;

меньше 1% — практически, гарантия достоверности.

4. Нулевая и альтернативная гипо тезы.

Формулирование гипотез – важный этап всякого исследования. Правильно сформулированные, они помогают исследователю придерживаться выбранной линии. После проведения эксперимента и осуществления всех подсчетов ему легче понять, что же все-таки он обнаружил.

Существуют два общепринятых, стандартных, типа гипотез:

Нулевая гипотеза (обозначается Н о ) предполагает, что в эксперименте не будет выявлено различий. Например: «Между учениками 1 класса А и 1 класса Б нет различий по уровню интеллекта».

Альтернативная гипотеза (обозначается Н 1 ) предполагает, что будут выявлены различия (что различия будут достоверны). Например: «Ученики 1 класса А и 1 класса Б отличаются по уровню интеллекта»

Гипотезы так же могут быть ненаправленными (см. предыдущий пример) и направленными: «Ученики 1 класса А превосходят по уровню интеллекта учеников 1 класса Б»

5. Шка лы измерения.

Измерение – приписывание числовых форм объектам или событиям в соответствии с какими-либо правилами.

Различают четыре типа измерительных шкал.

1) НОМИНАТИВНАЯ (номинальная, шкала наименований). Эта шкала классифицирует объекты по названию, по принадлежности. Она не измеряет объекты количественно, а лишь «расставляет» по надлежащим местам. Например, взяв группу граждан, мы можем классифицировать их по национальностям, по профессии. Простейший случай номинальной шкалы – дихотомическая . Она содержит только два варианта значений: «ответил – не ответил на вопрос анкеты»; «холост – женат»; «работает – безработный»; «мужчина – женщина» и т.п.

2) ПОРЯДКОВАЯ шкала классифицирует по принципу «больше – меньше». Классифицированные объекты располагаются по мере возрастания признака, от самого малого – до самого большого. Ячейки здесь играют роль «классов». Однако порядковая шкала не дает ответа на вопрос, насколько один объект больше или меньше другого (каково между ними расстояние, выраженное в каких-либо единицах). Порядковая шкала должна содержать не меньше трех классов (разрядов), (в противном случае она сводится к дихотомической шкале). Пример: уровень благосостояния населения – мы можем сказать, что «средний класс» обеспеченнее бедных и беднее богатых, но не имеем возможности определить эту разницу количественно. Еще пример – уровень образования. Ясно, что высшее образование «лучше», чем среднее и среднее-специальное , но нет таких единиц, в которых можно было бы указать, насколько именно «лучше». Третий пример: тест СЖО (смысло-жизненных ориентаций) Леонтьева, и вообще, все методики, в которых требуется оценить что-либо по схеме «нравится – не знаю – не нравится» или «всегда – обычно – иногда – никогда».

3) ИНТЕРВАЛЬНАЯ шкала – шкала, классифицирующая по принципу «больше/меньше на определенное количество единиц». Однако эта шкала не устанавливает точки начального отсчета, некоего «абсолютного нуля», зная который, можно сравнивать между собой два любых объекта, признаки которых измерены в этой шкале. Например, измеряем время решения учебной задачи при приеме на работу. Пусть имеется четыре испытуемых А , Б, В и Г. Пусть А решил задачу за 100 секунд, Б – за 110, В – за 200, а Г – за 210. Ясно, что в этом случае нельзя утверждать, что А настолько же успешнее Б, насколько В успешнее Г, хотя между этими парами испытуемых одна и та же разница во времени решения задач – 10 секунд.

4) ШКАЛА РАВНЫХ ОТНОШЕНИЙ – это шкала, классифицирующая объекты пропорционально степени выраженности исследуемого свойства. Здесь классы или градации выражены числами, пропорциональными друг другу. Иными словами, такая шкала имеет абсолютную точку отсчета. В психологии примером шкалы равных отношений могут служить пороги абсолютной чувствительности. В сравнении с предыдущей шкалой, можно сказать, что та являлась шкалой температуры по Цельсию, а эта – по Кельвину, где есть абсолютный нуль.

Выборочное исследование должно обеспечивать необходимую точность результатов относительного объекта исследования, при этом, как было отмечено в предыдущем разделе, оно должно обеспечить экономию исследовательских ресурсов. Перечислим основные критерии, предъявляемые к выборке.

1. Выборка должна обеспечивать расчет несмещенных оценок изучаемого явления, т. е. быть репрезентативной.

2. Выборка должна обеспечивать расчет ошибок выборки, сопровождающих любое выборочное обследование.

3. Построение выборки должно быть относительно быстрым и легким (т. е. модель формирования выборки не должна быть чересчур сложной, громоздкой).

4. Выборка должна обеспечивать максимально возможной точности исследования в рамках имеющихся средств. Т. е., построение и реализация выборки не должны быть излишне затратными.

5. Выборка должна быть четко письменно задокументирована таким образом, чтобы эксперты могли оценить, насколько она соответствует вышеприведенным критериям.

Ключевым требованием к выборочной совокупности является требование репрезентативности.

Репрезентативной называют выборку, представляющую генеральную совокупность с приемлемой степенью точности. Репрезентативность — свойство выборки отражать, моделировать характеристики генеральной совокупности. Мера подобия выборочной модели структуре генеральной совокупности оценивается ошибкой выборки. Ошибка выборки характеризует расхождение между оценкой показателя, сделанной на основании изучения выборки, и оценкой этого же показателя на основе изучения генеральной совокупности.

Допустимые пределы ошибки выборки зависят от цели исследования и определяют степень надежности получаемых результатов. Так для поисковых исследований надежность может быть приближенной и даже ориентировочной (т. е. в пределах 10–20 и 20–40% ошибки репрезентативности соответственно), для описательных и аналитических исследований должна быть обеспечена нормальная надежность результатов исследования (в пределах 3–10% ошибки репрезентативности, обычно — 5%).

Ошибки репрезентативности могут быть случайными и систематическими. Случайные ошибки не отражают существенной связи между объектом, субъектом и условиями проведения исследования. Они возникают непреднамеренно, например, вследствие описок, неточности сообщаемых респондентами данных. В целом по всему массиву данных такие ошибки имеют тенденцию к взаимному погашению и не влияют на результаты исследования.

Систематические ошибкиотражают существенную связь между объектом, субъектом и условиями проведения исследования и могут значительно исказить результаты исследования, вызывая так называемые систематические смещения. Причины возникновения систематических ошибок репрезентативности связаны существенными недочетами при формировании и реализации плана выборки. К их числу относятся:

– неверно выбранный метод формирования выборочной совокупности и/или неправильно рассчитанный ее объем;

– неполный охват единиц выборочной совокупности;

– произвольная замена единиц выборочной совокупности.

Следует отметить еще одну причину появления систематических ошибок, хотя именно эта причина никак не связана сущностью выборочного метода. Это некорректно разработанный инструментарий исследования.

Таким образом, обеспечение репрезентативности выборки осуществляется за счет:

– корректного определения необходимого объема выборочной совокупности и…

– . метода ее формирования, адекватного объекту, целям и задачам исследования;

– тщательного контроля реализации плана выборки.

Чтобы избежать грубых ошибок выборки, следует обратить внимание на следующие рекомендации:

1. Определите, что представляет собой генеральная совокупность: уточните, какие именно объекты попадают в ее состав, какие характеристики им присущи; оцените, насколько соотносятся между собой идеальная (задаваемая теоретическими параметрами) и реальная (определяемая жизнью) совокупности[1].

2. Уяснить, какие характеристики единиц генеральной совокупности существенны для исследования, чтобы они нашли точное отражение в выборке.

3. Выбрать оптимальную модель формирования выборки и определить необходимый ее объем.

4. Провести инструктаж лиц, привлекаемых к проведению исследования, по вопросам отбора единиц выборочной совокупности.

5. В процессе исследования контролировать соответствие формируемой выборки ее плану.

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Для студента самое главное не сдать экзамен, а вовремя вспомнить про него. 10684 — | 7833 — или читать все.

Выборка — это метод исследования, когда из общей изучаемой (генеральной) совокупности однородных единиц отбирается некоторая его часть (выборочная совокупность), и только эта часть подвергается обследованию.

Генеральная и выборочная совокупности должны сопоставляться по некоторым важным признакам, которые легко проверяются статистическими методами. Если они совпадают, то выборка называется представительной, или репрезентативной. Понятно и то, что, чем больше размер выборки, тем больше и достоверность. Прежде всего, надо уяснить, какие из имеющихся сведений о характеристике генеральной совокупности, объекте исследования существенны для целей исследования. Во многих случаях это половозрастной, социально-профессиональный, имущественный состав обследуемых, их пространственная локализация. Пол и возраст замыкают на себе многие показатели семейного состояния: возраст, к примеру, указывает на жизненный опыт, профессиональный стаж. Пространственная локализация (по территории, по месту работы) важна с точки зрения адресности выводов и рекомендаций, которые должны быть привязаны к административным или производственным показателям. При сочетании этих трех параметров: половозрастной структуры, социального состава и пространственной локализации — можно быть уверенным, что выборка будет представительной для изучения многих социальных проблем. Понятно, что это правило имеет исключения в зависимости от конкретных условий и особых целей исследования. Например, при изучении политических ориентации населения уже не обойтись без учета имущественного положения, а студенческих проблем — без знания вуза и курса обучения студентов.

Очень важно при формировании выборки обеспечить равномерный отбор из всей генеральной совокупности. При небольших по численности генеральных совокупностях применяют случайные выборки. Их можно использовать, когда известны основные параметры генеральной совокупности. Случайная систематическая выборка — отбор идет через определенные интервалы, например, по спискам студентов, клиентов банка, избирателей и т. п. Имея список работников предприятия и определив объем необходимой выборки, можно установить шаг выборки, например, каждый десятый или сотый из списка. Серийная или гнездовая выборка реализуется в том случае, если есть внутренняя структура объекта. На предприятии выбираются не все подразделения, а наиболее типичные, например, в области — отдельные города и районы, но опять же типичные; в городе это могут быть отдельные микрорайоны. Целевой называется выборка, в которой идет выделение на основе каких-либо признаков, например, по полу, национальности, имущественному положению, принадлежности к политическим партиям и т. п. Целенаправленная квотная выборка предполагает пропорциональный отбор на основании статистики распределения среди генеральной совокупности заданных сочетаний паспортных данных респондентов — квот. В социологии также используется выборка как метод основного массива — опрос всех присутствующих (или 60-70 % всей численности). Посредством этого метода, например, осуществляется «зондаж» общественного мнения. Выборки бывают одноступенчатыми и многоступенчатыми, комбинированными. На каждой ступени отбора следует обеспечить требование представительности. Например, при опросе населения города на первом этапе отбираются типичные микрорайоны, а затем опрашиваются жители каждой двадцатой или пятидесятой квартиры, дома. При опросе населения области на первой ступени выбираются типичные районы и города. Примером стихийной выборки могут быть опросы по почте, интервью встречных, прохожих, пассажиров. Здесь может применяться квотный принцип, когда в конкретном здании необходимо опросить определенное количество человек по некоторым признакам, к примеру, по полу, возрасту.

К выборке применяется ряд обязательных требований, опре­деленных, прежде всего, целями и задачами исследования. Плани­рование эксперимента должно включать в себя учет как объема выборки, так и ряда ее особенностей. Так, в психологических ис­следованиях важно требование однородности выборки. Оно озна­чает, что психолог, изучая, например, подростков, не может, включать в эту же выборку взрослых людей. Напротив, исследо­вание, выполненное методом возрастных срезов, принципиаль­но предполагает наличие разновозрастных испытуемых. Однако и в этом случае должна соблюдаться однородность выборки, но уже по другим критериям, в первую очередь таким, как возраст, пол. Основаниями для формирования однородной выборки могут служить разные характеристики, такие, как уровень интеллекта, национальность, отсутствие определенных заболеваний и т.д., в зависимости от целей исследования.

В общей статистике имеется понятие повторной и бесповторной выборки, или, иначе говоря, выборки с возвратом и без возврата. В качестве примера приводится, как правило, выбор шара, доставаемого из какой-либо емкости. В случае выборки с возвратом каждый выбранный шар опять возвращается в емкость и, следовательно, может быть выбран снова. При бесповторном выборе однажды выбранный шар откладывается в сторону и больше не может участвовать в выборке. В психологических ис­следованиях можно найти аналоги подобного рода способам организации выборочного исследования, поскольку психологу нередко приходится несколько раз тестировать одних и тех же испытуемых при помощи одной и той же методики. Однако, строго говоря, повторной в этом случае является процедура тес­тирования. Выборка испытуемых при полной тождественности состава в случае повторных исследований всегда будет иметь не­которые отличия, обусловленные функциональной и возрастной изменчивостью, присущей всем людям. Подобная выборка по ха­рактеру проведения процедуры является повторной, хотя смысл термина здесь, очевидно, иной, чем в случае с шарами.

Важно подчеркнуть, что все требования, предъявляемые к любой выборке, сводятся к тому, что на ее основе психологом должна быть получена наиболее полная, неискаженная информация об особенностях генеральной совокупности, из которой взята эта выборка. Иными словами, выборка должна как можно более полно отражать характеристики изучаемой генеральной со­вокупности.

6.4 Репрезентативность выборки

Состав экспериментальной выборки должен представлять (моделировать) генеральную совокупность, поскольку выводы, полученные в эксперименте, предполагается в дальнейшем пе­ренести на всю генеральную совокупность. Поэтому выборка должна обладать особым качеством – репрезентативностью, позволяющей распространить полученные на ней выводы на всю генеральную совокупность.

Репрезентативность выборки очень важна, тем не менее по объективным причинам соблюдать её крайне сложно. Так, хоро­шо известен факт, что от 70% до 90% всех психологических ис­следований поведения человека проводились в США в 60-х годах XX века с испытуемыми – студентами колледжей, причем боль­шинство из них были студентами психологами. В лабораторных исследованиях, выполняемых на животных, наиболее распрост­раненным объектом изучения являются крысы. Поэтому неслу­чайно психологию называли раньше «наукой о студентах-второ­курсниках и белых крысах». Студенты коллед­жей составляют всего 3% от общей численности населения США. Очевидно, что выборка студентов нерепрезентативна в качестве модели, претендующей на представительство всего населения страны.

Репрезентативная выборка, или, как еще говорят, предста­вительная выборка, – это такая выборка, в которой все основ­ные признаки генеральной совокупности представлены прибли­зительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной сово­купности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большой долей уверенности считать применимыми ко всей генеральной совокупности. Это распространение результатов называется генерализуемостью.

В идеале репрезентативная выборка должна быть такой, чтобы каждая из основных изучаемых психологом характерис­тик, черт, особенностей личности и т.п. была бы представлена в ней пропорционально этим же особенностям в генеральной совокупности. Согласно этим требованиям процедура форми­рования выборки должна иметь внутреннюю логику, способ­ную убедить исследователя, что при сравнении с генеральной совокупностью она действительно окажется репрезентатив­ной, представительной.

Нарушение принципов случайного выбора порой приводило к серьезным ошибкам. Стал знаменитым своей неудачей опрос, проведенный американским журналом «Литературное обозрение» относительно исхода президентских вы­боров в США в 1936 году.

Кандидатами на этих выборах были Ф.Д.Рузвельт и А.М.Ландон. В качестве генеральной совокупности редакция журнала использовала телефонные книги. Отобрав случайно 4 миллиона адресов, она разослала по всей стране открытки с вопросом об отношении к кандидатам в президенты. Затратив большую сумму на рассылку и обработку открыток, журнал объявил, что на предстоящих выборах президентом США с большим перевесом будет избран Ландон. Результат выборов оказался противоположным этому прогнозу.

Здесь были совершены сразу две ошибки – во-первых, телефонные книги сами по себе дают не репрезентативную выборку из населения страны, хотя бы потому, что абоненты– в основном зажиточные главы семейств. Во-вторых, прислали ответы не все, а люди, не только достаточно уверенные в своем мнении, но и привыкшие отвечать на письма, т.е. в значительной части представители делового мира, которые и поддерживали Ландона. Если бы редакция критически подошла к своей работе, она поняла бы, что методика опроса страдает изъянами.

Явление, подобное только что описанному, когда выборка представляет не всю генеральную совокупность, а лишь какой-то ее слой, какую-то ее часть, называется смещением выборки. Смещение – один из основных источников ошибок при использовании выборочного метода.

Однако для тех же самых президентских выборов социологи Дж.Гэллап и Э.Роупер правильно предсказали победу Рузвельта, основываясь только на 4 тысячах анкет. Причиной этого успеха, прославившего его авторов, было не только правильное составление выборки. Они учли, что общество распадает­ся на социальные группы, которые более однородны, в том числе по своим политическим взглядам. Поэтому выборка из слоя может быть относительно малочисленной с тем же результатом точности. Имея результаты обследования по слоям, можно характеризовать общество в целом. Сейчас такая методика является общепринятой.

В своей конкретной деятельности психолог действует следую­щим образом: устанавливает подгруппу (выборку) внутри гене­ральной совокупности, подробно изучает эту выборку (проводит с ней экспериментальную работу), а затем, если позволяют результаты статистического анализа, распространяет полученные выводы на всю генеральную совокупность. Это и есть основные этапы работы психолога с выборкой.

Начинающий психолог должен иметь в виду часто повторяю­щуюся ошибку: каждый раз, когда он осуществляет сбор любых данных любым методом и из любого источника, у него всегда появляется соблазн распространить свои выводы на всю гене­ральную совокупность. Для того чтобы избежать подобной ошиб­ки, надо не просто обладать здравым смыслом, но, прежде все­го, хорошо владеть основными понятиями математической ста­тистики.

Формирование выборки — это процесс определения целевой аудитории и отбора из всей совокупности потенциальных респондентов группы, имеющей все свойства генеральной совокупности.

“Методология и результаты расчета основных параметров выборки непосредственно зависят от способа отбора единиц из генеральной совокупности. Применение того или иного способа зависит от цели исследования, условий выборки, специфики объекта исследования, необходимой точности и оперативности результатов и от средств выделенных на исследования” [40, с. 268].

Различают две основных группы методов построения выборки:

  • 1. Вероятностные.
  • 2. Детерминированные.
  • Вероятностные выборки

    Вероятностные методы формирования выборки предполагают, что каждая единица генеральной совокупности имеет определенную вероятность включения в выборку. Использование таких методов позволяет исследователю распространять полученные результаты на всю генеральную совокупность.

    Существуют различные вероятностные методы формирования выборки:

  • • простая случайная выборка;
  • • систематическая (механическая) выборка;
  • • стратифицированная случайная выборка;
  • • кластерная выборка.
  • Простая случайная выборка

    Простая случайная выборка предполагает, что каждой единице генеральной совокупности обеспечивается равная вероятность (возможность) попасть в выборочную совокупность. Более того, каждая возможная выборка данного объема имеет известную и равную вероятность того, что именно она станет реально обследуемой выборкой.

    Процедура построения простой случайной выборки включает в себя следующие шаги [15, с. 205—206]:

  • • во-первых, нужно получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список называется основой выборки;
  • • во-вторых, следует определить предполагаемый объем выборки, т. е. ожидаемое число опрошенных;
  • • в-третьих, нужно извлечь из справочной таблицы случайных чисел или с помощью датчика случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел;
  • • в-четвертых, нужно выбрать из списка основы те наблюдения, номера которых соответствуют выписанным случайным числам. Отбор заканчивается, когда отобрано заранее заданное количество элементов выборочной совокупности.
  • Достоинством данного метода является полное соблюдение принципа случайности и, как следствие — избежание систематических ошибок. Затрудняют применение простого случайного отбора на практике необходимость наличия списка элементов генеральной совокупности, сложность проведения опроса и требования к объему выборки (для получения результатов со сравнительно высокой степенью точности собственно случайный отбор требует достаточно большого объема выборки по сравнению с другими видами отбора).

    Систематическая (механическая) выборка предусматривает отбор заданного числа респондентов через равные интервалы (шаги). В соответствии с данным методом сначала задают произвольную отправную точку, а затем из основы выборки последовательно выбирают каждую г-ю единицу. Интервал выборки к определяется как отношение объема генеральной совокупности N к объему выборочной совокупности п, с округлением результата до ближайшего целого числа. Первый респондент отбирается случайным образом, по таблице случайных чисел. Так как такой отбор производится из основы выборки, данный метод требует полного списка или заданного упорядочения совокупности.

    Например, генеральная совокупность состоит из 100 тысяч элементов, а желательный объем выборки равен 1000 респондентов. В этом случае интервал выборки к равен 100. Выбирается случайное число между 1 и 100. Если, например, это число равно 23, то выборка состоит из таких единиц: 23,123, 223, 323,423,523 и т. д. Общей чертой систематического и простого случайного отбора является то, что каждый элемент генеральной совокупности имеет известную и равную вероятность отбора.

    Когда генеральная совокупность слишком велика или исследователю известен не полный ее список, необходимо знать правило упорядочивания элементов в генеральной совокупности, так как интервал отбора может совпасть со скрытой периодичностью распределения признака в генеральной совокупности, а это приведет в свою очередь к смещениям. Если элементы совокупности расположены по принципу, не связанному с исследуемой характеристикой, результаты систематического отбора аналогичны результатам простого случайного отбора.

    Если принцип расположения элементов связан с исследуемой характеристикой, систематический отбор увеличивает репрезентативность выборки. Так, например, если фирмы какой- либо отрасли расположены по принципу увеличения годового объема продаж, систематическая выборка будет включать как мелкие, так и крупные фирмы. Простой случайный отбор в этой ситуации может быть нерепрезентативным, приводя, например, к попаданию в выборку только мелких фирм, которых может к тому же оказаться непропорционально много.

    Из-за простой техники отбора данный метод позволяет даже при небольшом объеме выборки изучать достаточно большие генеральные совокупности. Систематический отбор часто применяется при проведении почтовых и телефонных опросов, опросов в торговых центрах и в Интернет.

    Стратифицированная случайная выборка

    Стратифицированная случайная выборка — это вероятностная выборка, которая формируется в два этапа. На первом этапе генеральная совокупность подразделяется (расслаивается) на подгруппы (страты), взаимно исключающие и дополняющие одна другую таким образом, чтобы каждая единица совокупности относилась только к одной подгруппе и ни одна единица не была бы пропущена. Например, респондентов можно разбить по полу (мужчины и женщины), по возрасту (до 30 лет, с 31 до 50 лет, свыше 50 лет).

    На втором этапе из каждой страты производится отбор единиц с помощью простого случайного отбора или других вероятностных методов. Если стратификация проводится по территориальному принципу, стратифицированную выборку называют районированной. Отличие стратифицированной выборки от квотной состоит в том, что единицы генеральной совокупности выбираются случайно, а не экспертным или нерепрезентативным методом. Примеры формирования стратифицированных выборок подробно рассмотрены в [15, 31, 34].

    Стратифицированная выборка может быть пропорциональной и непропорциональной. При пропорциональном стратифицированном отборе объем выборки, полученной из каждой страты, пропорционален доле этой страты в объеме генеральной совокупности.

    “При непропорциональном стратифицированном отборе объем выборки, полученной из каждой страты, пропорционален доле этого слоя в объеме генеральной совокупности и среднеквадратичному отклонению распределения исследуемой характеристики среди всех элементов этой страты” [31, с. 529] Так как данный метод отбора обеспечивает наличие в выборке всех важных подгрупп, он применяется при неоднородных генеральных совокупностях. Однако этот метод можно применять лишь при наличии дополнительной информации о генеральной совокупности (например, необходимо процентное соотношение мужчин и женщин в случае, если надо стратифицировать выборку по полу). Отсутствие такой информации делает применение стратифицированной выборки невозможным. Другим недостатком стратифицированной выборки является возможность систематической ошибки.

    Кластерная выборка — вероятностный метод формирования выборки, предусматривающий реализацию двух этапов. На первом этапе генеральная совокупность подразделяется на кластеры — взаимоисключающие и взаимодополняющие подгруппы. По однородности критерии формирования кластеров прямо противоположны критериям формирования страт. Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности.

    На втором этапе с помощью простого случайного отбора формируется случайная выборка кластеров. В выборку либо включаются все элементы отобранного кластера, либо проводится их отбор вероятностным методом. Если в выборку включаются все единицы каждого отобранного кластера, то такой метод называется одноступенчатым кластерным отбором. Если выборка получена с помощью вероятностного отбора из каждого выбранного кластера, такая процедура называется двухступенчатым кластерным отбором.

    Применение кластерной процедуры основано на четырех обязательных условиях [15, с. 219-222]:

  • 1) каждый элемент генеральной совокупности может принадлежать только к одному кластеру;
  • 2) должно быть известно или поддаваться оценке с приемлемой степенью точности число элементов генеральной совокупности каждого кластера;
  • 3) кластеры должны быть не разбросаны пространственно и не слишком велики, иначе кластерная выборка теряет свои преимущества в финансовом смысле;
  • 4) выбор кластеров должен быть осуществлен так, чтобы рост выборочной ошибки был минимальным (разные кластеры не должны быть однородными по исследуемому признаку и слишком большими).

“Основное различие между кластерным и стратифицированным отбором состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как при стратифицированном отборе все подгруппы (страты) используются для дальнейшего отбора. Эти методы преследуют разные цели: цель кластерного отбора — увеличить эффективность отбора, уменьшив затраты на его проведение, а цель стратифицированного отбора — увеличить точность отбора” [31, с. 525]. Примеры формирования кластерных выборок подробно рассмотрены в [15, 31, 34].

“Одним из распространенных форм кластерного отбора является территориальный отбор, в котором кластеры состоят из округов, жилых районов, кварталов или других географических территорий. Если отбор основных элементов проводится в один этап (например, исследователь выбирает некоторые кварталы, а затем все проживающие там семьи включаются в выборку), такой выборочный метод называется одноступенчатым территориальным отбором. Отличительная черта одноступенчатого территориального отбора заключается в том, что все семьи из выбранных кварталов (или географических регионов) включаются в выборку. Если отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выборку), такой метод называется двухступенчатым (или многоступенчатым) территориальным отбором” [31, с. 525].

Достоинствами кластерного отбора является простота, оперативность и относительная дешевизна, а также удобство опроса респондентов, которые находятся вместе, а не разбросаны пространственно, а также то, что респонденты изучаются в их естественном окружении, что, конечно, влияет на качество получаемой первичной информации. Однако необходимо следить, чтобы количество групп в генеральной совокупности было достаточно большим, иначе не будет соблюдаться принцип случайности отбора. Также на практике бывает сложно сформировать неоднородные кластеры (например, семьи, живущие в одном квартале, имеют больше схожих признаков, чем различий) и на момент опроса застать всех членов кластера.

Чтобы посредством опроса получить максимально точные данные о какой-либо группе людей, например, о ее поведении и предпочтениях, было бы логично опросить эту группу целиком. Но что, если интересующая нас группа очень велика? Опрос всех потребителей молока в России или всех жителей Южного административного округа Москвы займет много времени и обойдется в астрономическую сумму денег. А нужно ли опрашивать их всех?
О размере выборки и статистической ошибке измерений подробно написано в статье «Выборка. Размер – не главное. Или главное» . В этой статье будет рассмотрено второе требование к выборке, также обеспечивающее качество исследования – репрезентативность.

Согласно теории выборочного метода, неоднократно подтвержденной практикой, опрашивать всех нет необходимости, а можно опросить лишь часть группы, которая может быть в тысячи раз меньше. Эта маленькая часть называется выборкой (или выборочной совокупностью), а большая группа, которую она представляет, называется генеральной совокупностью.

При этом если выборка сформирована правильно, выводы, полученные на основе изучения выборки, могут быть перенесены и на генеральную совокупность. Например, если в выборке женщины значимо чаще, чем мужчины, пользуются дезодорантами, то делается вывод, что и в генеральной совокупности (например, в исследованном городе) присутствует такая закономерность. Процесс переноса выводов с выборки на генеральную совокупность называется генерализацией. А свойство выборки отражать характеристики генеральной совокупности называется репрезентативностью. Для более комфортного запоминания термина на рис.1. приведены иллюстрации, когда выборка отражает свойства генеральной совокупности и когда свойства выборки отличаются от свойств генеральной совокупности.

Рис.1. Иллюстративные примеры соответствия (несоответствия) свойств генеральной совокупности и выборки

Не стоит путать понятие репрезентативности с такими понятиями как валидность и релевантность, хотя они тоже относятся к характеристикам качества исследования. В социальных науках валидность понимается довольно широко, но чаще всего – как обоснованность. Понятие валидности относится не к выборке, а к исследовательской методике. Методика или измерение (анкета, блок вопросов, тест) считается валидным, если фиксирует именно то понятие или свойство, которое планируется измерить. Например, если мы захотим оценить уровень лояльности клиента к магазину и выберем для этого лишь показатель частоты посещения магазина, валидность этого подхода будет неполной: возможно, респондент часто заходит в магазин только из-за банкомата, который там установлен. Валидная методика в данном примере должна включать и другие показатели: предпочтение магазина, суммы покупок в этом и других магазинах, готовность переключиться на другие магазины, готовность рекомендовать магазин и др.

При установлении валидности решающую роль играет обоснование и последующая проверка гипотезы релевантности, то есть соответствия измеряемых параметров характеристикам исследуемого объекта. Житейский пример нерелевантности – измерять уровень счастья человека количеством денег у него (хотя, наверное, не все с этим согласятся). Очевидный пример нерелевантности – попытка измерить массу тела по его температуре.

Но вернемся к понятию репрезентативности. В то время как точность измерений зависит от размера выборки, размер выборки не гарантирует ее репрезентативности. Репрезентативность выборки главным образом обеспечивается способом отбора ее участников (респондентов). Примером явного нарушения репрезентативности может послужить шутка о том, что интернет-опрос показал, что 100% людей пользуется интернетом.

Можно выделить несколько вариантов нарушения репрезентативности выборки: когда опрошены не те люди и когда опрошено слишком много (или мало) определенных людей (например, женщин намного больше, чем мужчин). Кроме того, чем меньше размер выборки, тем меньше вероятность того, что она будет репрезентативной. Например, допустим, 1% населения мог бы заинтересоваться новой услугой. Это 1 из 100 людей. Если размер выборки составляет всего 60 человек, то в вашей выборке может отсутствовать человек, который, скорее всего, будет заинтересован в услуге. Ваша выборка менее репрезентативна, потому что она меньше. Ваши результаты будут разными в зависимости от того, содержит ли ваша выборка одного из этих людей или нет. Пример репрезентативной и нерепрезентативной выборки показан на рис.2.

Рис.2. Пример репрезентативной и нерепрезентативной выборки

На рис.3 показана та же по составу генеральная совокупность, но с другим расположением объектов внутри круга.

Рис.3. Пример репрезентативной и нерепрезентативной выборки при другом расположении объектов генеральной совокупности

Говоря простым языком, репрезентативная выборка – это такая выборка, в которой представлены все подгруппы, важные для исследования. Помимо этого, характер распределения рассматриваемых параметров в выборке должен быть таким же, как в генеральной совокупности.

Простой случайный отбор респондентов представляется оптимальным способом формирования репрезентативной выборки. Поскольку в этом случае у любого представителя генеральной совокупности одинаковая вероятность попасть в выборку, в нее попадут люди с разными характеристиками пропорционально их долям в генеральной совокупности. В итоге выборка будет представлять собой нечто вроде уменьшенной копии генеральной совокупности.

Случайность отбора респондентов в выборку обеспечивается разными способами. Например, для телефонного опроса жителей города берется база данных всех телефонных номеров, и номера респондентов случайным образом выбираются компьютером (с использованием генератора случайных чисел). При уличном опросе интервьюеров распределяют по случайно выбранным точкам и инструктируют опрашивать каждого N-ного прохожего.

Наглядным примером репрезентативной выборки может служить пицца. Если целая пицца – это генеральная совокупность, которую мы хотим изучить, то кусок пиццы – это выборка. Как правило, достаточно одного куска пиццы, чтобы судить обо всей пицце (при условии, что ингредиенты равномерно распределены по ее поверхности). Таким образом, кусок пиццы пиццы на рис.4 – это репрезентативная выборка из пиццы.

Рис.4. Наглядный пример репрезентативной выборки (пицца)

Важно отметить, что не любой кусок пиццы будет репрезентативной выборкой. Разные способы получения куска пиццы могут принципиально повлиять на качество исследования и выводы, которые будут получены при анализе каждого варианта выборки (рис.4)

(рисунок в сушильной камере, готовится к публикации)

Рис.5. Наглядный пример формирования репрезентативной и нерепрезентативной выборки.

Еще один показательный пример формирования репрезентативной выборки – кастрюля, содержимое которой мы должны узнать (допустим, там скрывается борщ). Мы только один раз можем зачерпнуть из кастрюли ложкой (провести исследование). В нашем примере ложка – это выборка, а содержимое кастрюли – генеральная совокупность.

Если мы зачерпнем сверху, то придем к выводу, что в кастрюле бульон. Если снизу – решим, что в кастрюле мясо. Зачерпнув где-то посередине, мы получим картошку или капусту. В любом из трех случаев выводы будут неверны. Чтобы получить достоверный результат, нам стоит хорошенько перемешать содержимое кастрюли, перед тем как пробовать его. Перемешивание в данном случае – аналог процедуры простого случайного отбора, поскольку оно предоставляет всем ингредиентам примерно равную вероятность попадания в ложку-выборку (или тарелку-выборку).

Рис.6. Борщ как модель, демонстрирующая репрезентативность выборки.

В реальности применить простой случайный отбор респондентов не всегда удается в полной мере. Например, мы можем абсолютно корректно отобрать в выборку нужное количество номеров домашних телефонов случайным образом, но при их прозвоне выяснится, что дозвониться и поговорить удается преимущественно с пенсионерами, а «поймать» дома молодежь и работающих людей получается плохо.

Возвращаясь к примеру с борщом, если у нас вместо кастрюли – огромный ресторанный котел, а в руках все та же обычная ложка, перемешивание будет неэффективным. Чтобы решить задачу, потребуются иные подходы. Например, мы можем теоретически разделить глубину котла на несколько слоев и постараться зачерпнуть содержимое из каждого слоя (из случайного места слоя: не только в центре, но и по краям). Таким образом, наша итоговая выборка будет состоять уже из нескольких выборок и при этом адекватно отражать содержимое всех слоев котла. Подобные альтернативные подходы называются типами выборки, которых придумано достаточно много для того, чтобы максимизировать репрезентативность выборки в сложных условиях реального мира.

Последствия нарушения репрезентативности выборки: некорректные выводы исследования, выброшенный на ветер бюджет исследования, финансовые потери вследствие применения неправильных выводов. Вы можете выбрать валидную исследовательскую методику, рассчитать объем выборки, обеспечивающий приемлемую точность измерений, но, если выборка исследования нерепрезентативна, получить достоверную информацию не удастся.

Самым известным примером нарушения репрезентативности выборки является история провала американского журнала «Литературный дайджест».

В 1936 году журнал в очередной раз провел почтовый опрос общественного мнения о вероятных результатах грядущих президентских выборов в США. До 1936 года опрос всегда правильно предсказывал победителя. Опрос 1936 года показал, что победителем с большим отрывом станет кандидат от республиканцев, но в итоге победителем оказался представитель демократов.

Таким образом, гигантская выборка (около 2,4 млн. человек) не обеспечила достоверных результатов. В чем же заключалась причина ошибки?

Называются две основные причины провала: смещение при формировании выборки и смещение вследствие отказа респондентов от участия в опросе.

Прежде всего, журнал включил своих подписчиков в список для рассылки анкет и, желая расширить выборку, использовал два других доступных тогда списка граждан: зарегистрированных автовладельцев и пользователей телефонов. Во времена Великой Депрессии представители этих групп отличались от остального населения более высоким доходом, как и подписчики самого журнала. Таким образом, полученная база для рассылки не являлась корректным отражением структуры населения США.

Вторая проблема с опросом заключалась в том, что из 10 миллионов человек, чьи имена были в первоначальном списке рассылки, только 2,4 миллиона ответили на опрос. Вероятно, высокий процент отказов был связан с тем, что опрос проводился по почте. Уже в те времена американцы относились к почтовым рассылкам как к спаму. Таким образом, размер выборки составил примерно одну четверть от того, что первоначально планировалось. Когда доля ответивших низка (как это было в данном случае), считается, что исследование страдает от необъективности ответов.

У этой истории две морали: Большая, но неправильно сформированная выборка гораздо хуже маленькой, но правильно сформированной выборки. При проведении опроса не упускайте из внимания смещение отбора и смещение в результате отказов.

Пример из военной практики. Во Вторую мировую войну американские военные столкнулись со следующей проблемой. Не все американские бомбардировщики после задания возвращались на базу. На вернувшихся самолетах оставалось множество пробоин от выстрелов противника, но распределены они были неравномерно: больше всего на фюзеляже и прочих частях, меньше в топливной системе и гораздо меньше — в двигателе. Командованию казалось логичным, что в наиболее поврежденных местах нужно установить больше брони.
Привлеченный к решению задачи математик возразил: данные как раз показывают, что самолет, получивший пробоины в этих местах, еще может вернуться на базу. А самолет, которому попали в бензобак или двигатель, выходит из строя и не возвращается. Поэтому укреплять следует те места, которые у вернувшихся самолетов повреждены меньше всего.

Рис .7. Пробоины на вернувшихся самолётах.
Получившие повреждения в других местах не смогли вернуться на базу

Эта задача служит примером нарушения репрезентативности выборки, когда в нее включены не те респонденты: в данном случае, вернувшиеся самолеты, в то время как не вернувшиеся проигнорированы.

Применительно к маркетинговым исследованиям, эта ситуация подобна следующей. При опросе клиентов бизнеса будет ошибкой опрашивать только текущих клиентов и не опрашивать потерянных клиентов (а какие «пробоины» получили они?).

При опросе посетителей ТРЦ важно правильно расставить интервьюеров. Например, если поставить интервьюеров только у главного входа, в выборку не попадут посетители, приехавшие в ТРЦ на автомобиле и попавшие в него через парковку. Как следствие, выводы, полученные на собранных данных, будут корректны только для той части посетителей, которые приходят в ТРЦ пешком, а значит, делают меньше покупок, не покупают габаритные товары, живут ближе к ТРЦ, чем приезжающие на автомобиле.

Другой пример. Бывает, что в разных районах города сбор анкет идет с разной скоростью: где-то (например, в центре города) большой пешеходный поток и у людей есть время на участие в опросе (отдыхающие, в отпуске, офисные сотрудники на обеде), а на окраинах либо мало людей на улицах, либо все спешат на работу и отказываются участвовать. В результате, если не ограничивать доли районов, в выборке будут преобладать люди из центрального района, которые могут значимо отличаться от остальных людей родом занятий, уровнем дохода и образования, уровнем осведомленности о магазинах и др. Таким образом, собранная выборка уже не будет репрезентативной по отношению к населению всего города.

Несмотря на многие положительные стороны онлайн-опросов, такие как экономичность, оперативность сбора информации, удобство ее обработки и т. д., некоторые их особенности напрямую угрожают репрезентативности исследования:

Во-первых, участники онлайн-опросов – это, как правило, активные пользователи интернета, хорошо в нем разбирающиеся и больше подверженные влиянию интернет-культуры, чем обычные люди.

Во-вторых, люди, у которых есть время и желание регулярно участвовать в онлайн-опросах за небольшое вознаграждение, скорее всего, значительно отличаются от остальных людей как по социально-демографическим, так и по психографическим характеристикам.

В-третьих, профессиональное участие в опросах приводит к так называемой профессиональной деформации, когда ответы респондентов на вопросы новых исследований обусловлены предыдущим опытом, но не жизненным, а опытом участия в других опросах.

Таким образом, в данном случае возникает та ситуация, когда опрашиваются не те люди, хотя по формальным характеристикам они подходят под описание целевой аудитории.

Итак, чтобы получить достаточно точные данные об интересующей нас группе людей, необязательно опрашивать их всех, благодаря свойству репрезентативности выборки.

«Чем больше, тем лучше» – неправильный подход к формированию выборки.

Небольшая репрезентативная выборка лучше большой, но нерепрезентативной выборки. Применительно к выборке не стоит пугаться слова «случайная». Это вовсе не значит, что в исследовании будут получены случайные результаты. Напротив, случайный подход к формированию выборки делает ее максимально похожей на генеральную совокупность, а значит, репрезентативной.

При проектировании выборки следует учитывать опасность смещения структуры выборки вследствие особенностей сбора информации и других условий.

Исследователь при
применении данного метода в некоторой
степени контролирует выборку (например,
публикуя анкету в журнале, он обращается
только к читателям этого журнала), но
решение о включении в выборку принимает
сам респондент. То есть, её размер заранее
часто не известен, а определяется
конкретным условием — активностью
респондентов. Значит, нельзя и заранее
определить структуру массива респондентов,
которые заполнят и вернут анкеты. Поэтому
этот метод не претендует на репрезентативность
выборки, а выводы исследования очень
часто распространяются только на
опрошенную совокупность.

Сферы применения
стихийной выборки:

  1. анкеты, публикуемые
    в газетах и журналах;

  2. почтовые опросы1;

  3. опросы покупателей
    в залах супермаркетов;

  4. опрос пассажиров
    на остановках и в общественном
    транспорте2.

2.3. Многоступенчатая и одноступенчатая выборки.

Выборка делится
на одноступенчатую и многоступенчатую
по количеству ступеней в отборе.
Одноступенчатая выборка предполагает,
что из генеральной совокупности сразу
осуществляется отбор респондентов для
опроса. Процедура же многоступенчатой
выборки включает несколько ступеней,
при этом на каждой из них единица отбора
меняется. «Различают единицы отбора
первой ступени (первичные единицы),
единицы отбора вторичной ступени
(вторичные единицы) и так далее. Объекты
самой нижней ступени, с которых ведется
непосредственный сбор информации,
называются единицами наблюдения»3.
Например, задача исследования – изучение
свободного времени студентов всей
страны.

Процедура будет
строиться следующим образом:

  1. отбор регионов;

  2. отбор города в
    них, где есть вузы;

  3. отбор учебных
    заведений, в которых будет проводиться
    исследование;

  4. выбор академических
    групп;

  5. отбор студентов.

Многоступенчатая
выборка осуществляется не в локальных
масштабах, а в региональных, общенациональных,
международных. Использовать одноступенчатую
выборку в таких масштабах нерационально,
да и очень дорого обойдётся такое
исследование. Многоступенчатая выборка
в этом плане экономична и упрощает
подход к выбору объекта.

Но нужно
учитывать, что чем больше ступеней в
выборке, тем больше будет ошибка
репрезентативности, возрастёт вероятность
погрешностей, что приведёт к искажению
результатов исследования4.

Рассмотрев
некоторые типы выборок, необходимо
также уяснить, что такое объем выборки
и какие бывают ошибки выборки и как их
избежать.

  1. Репрезентативность выборки. Объем и ошибка выборки.

В
формировании выборочной совокупности
важную роль играет определение ее объема
и обеспечение репрезентативности.

«Если тип выборки
говорит о том, как попадают люди в
выборочную совокупность, то объём
выборки сообщает о том, какое их
количество попало сюда»2.
То есть объем выборки – это количество
единиц попавших в выборочную совокупность.
И очень важно, чтобы выборка была
репрезентативной, то есть не искажала
представлений о генеральной совокупности
вцелом3.
«Требования репрезентативности выборки
означают, что по выделенным параметрам
(критериям) состав обследуемых должен
приближаться к соответствующим пропорциям
в генеральной совокупности»4.

Одна из ключевых
проблем, встающих, как правило, перед
социологом, решающим: доверять полученным
в ходе него данным или нет, это то, сколько
же человек должно быть опрошено для
того, чтобы получить действительно
репрезентативную информацию. К сожалению,
единой и четкой формулы, используя
которую можно было бы рассчитать
оптимальный объем выборочной совокупности,
не существует в природе. И объясняется
это весьма просто. Дело в том, что
определение объема выборочной совокупности
– это проблема не столько статистическая,
сколько содержательная.

Иными словами,
объем выборочной совокупности зависит
от множества факторов, основные из них
следующие:

  1. затраты на сбор
    информации, включая временные;

  2. стремление к
    определённой статистической достоверности
    результатов, которую надеется получить
    исследователь;

  3. ценность и новизна
    информации, получаемой в результате
    опроса5.

Объем
выборки обусловлен степенью однородности
или неоднородности, генеральной
совокупности, количеством характеризующих
ее признаков.
Однородной считается совокупность,
в которой контролируемый признак,
например уровень грамотности, распределён
равномерно, то есть не образует пустот
и сгущений, тогда опросив лишь несколько
человек, можно сделать вывод о том, что
большинство людей грамотны. Чем более
однородна генеральная совокупность,
тем меньше объем выборки. Например,
«допустим, мы осуществляем отбор из
генеральной совокупности в 2000 человек,
контролируя состав выборочной совокупности
по признаку «пол»»: 70% мужчин и 30% женщин.
Согласно теории вероятности, можно
предположить, что примерно среди каждых
десяти отбираемых респондентов встретятся
три женщины. Если мы хотим опросить по
крайней мерее 90 женщин, то исходя из
вышеупомянутого соотношения, нам
необходимо отобрать не менее 300 человек.
А теперь предположим, что в генеральной
совокупности 90% мужчин и 10% женщин. В
этом случае, чтобы в выборочную
совокупность попало 90 женщин, необходимо
отобрать уже не менее 900 человек»1.
Из примера видно, что объем выборки
зависит от разброса признака (дисперсии),
и его нужно вычислять по признаку,
дисперсия значений которого наибольшая.

«Степень
однородности социального объекта
зависит, в сущности, от того, насколько
детально мы намерены его исследовать.
Практически любой, самый «элементарный»
объект оказывается чрезвычайно сложным.
Лишь в анализе мы представляем его как
относительно простой, выделяя те или
иные его свойства. Чем более основательным
и детальным будет анализ, чем больше
свойств данного объекта мы намерены
принять во внимание в их сочетании, а
не изолированно, тем больше должен быть
объем выборки»2.

Существуют, так
называемые «правила левой руки» для
определения размера выборки (таблица
1)»3:

Размер
выборки растёт

Размер
выборки уменьшается


при необходимости опубликовать данные
для отдельных подгрупп (размеры
подвыборок при этом суммируются, и
выборка в целом растёт пропорционально
числу подгрупп);


при исследовании организаций, институтов
и прочих «первичных единиц отбора»,
если сравнительно невелика величина
генеральной совокупности, из которой
производится отбор(например, совокупности
сотрудников рекламных агентств,
школьников, пациентов и т.п.);


при проведении общенациональных
обследований, когда велика генеральная
совокупность;


при проведении локальных и региональных
исследований;


если уже имеющаяся информация по
ключевым вопросам (например, о намерениях
избирателей голосовать за ту или иную
партию) явно недостаточна и степень
неопределённости значительна.


если уже существующая информация
относительно полна и всё ещё остающаяся
степень неопределенности незначительна.

В репрезентативной
выборке все элементы генеральной
совокупности представлены в той же
пропорции. Но как бы тщательно не
соблюдать этот принцип, случайные ошибки
все же будут. Мы имеем возможность
определять ошибку репрезентативности.
Ошибкой репрезентативности, как правило,
называют «расхождение между двумя
совокупностями – генеральной, на которую
направлен теоретический интерес
социолога и представление о свойствах
которой он хочет получить в конечном
итоге, и выборочной, на которую направлен
практический интерес социолога, которая
выступает одновременно как объект
обследования и средство получить
информацию о генеральной совокупности»1.
Важно учитывать, что при помощи выборочного
метода никогда нельзя получить абсолютно
точную оценку наблюдаемого признака,
всегда существует вероятность ошибки,
но, если вероятность ошибки мала, то она
скорее всего не произойдет. В отечественной
литературе наряду с термином «ошибка
репрезентативности» встречается и
другой – «ошибка выборки». Обычно они
используются как синонимы, но понятие
«ошибка выборки» количественно более
точное, чем «ошибка репрезентативности».
Ошибка выборки – это «отклонение средних
характеристик выборочной совокупности
от средних характеристик генеральной
совокупности. На практике она определяется
путём сравнения известных характеристик
генеральной совокупности с выборочными
средними».2

Репрезентативность
выборки определяется двумя компонентами:
систематическими и случайными ошибками.
Случайные ошибки связаны «со статистическими
погрешностями (зависят от динамики
исследуемых признаков) и непредвиденными
нарушениями процедуры сбора информации
(процедурные ошибки, допущенные при
регистрации признаков)»3.
Случайные ошибки уменьшаются с увеличением
объема выборочной совокупности. Случайную
ошибку можно измерить методами
математической статистики, если при
формировании выборочной совокупности
соблюдался принцип случайности,
обеспечивающийся строго определенными
правилами, которые составляют метод
формирования выборочной совокупности,
и устранить.

На практике
принцип случайности соблюсти очень
сложно, а иногда просто невозможно, что
приводит к появлению систематической
ошибки, которые возникают «из-за неполной
объективности выборки генеральной
совокупности (недостаток информации о
генеральной совокупности, отбор наиболее
«удобных» для исследования элементов
генеральной совокупности), а так же
из-за несоответствия выборки целям и
задачам исследования»1.
Иногда такие ошибки называют ошибками
смещения. Они возникают при различных
телевизионных опросах, когда телеведущий
предлагает телезрителям позвонить по
определённым номерам телефонов, послать
смс-сообщение и высказать своё мнение
по какой-то проблеме. Естественно мы не
можем утверждать что эти люди отражают
мнение всего населения страны, и даже
телеаудитории. Вероятнее всего в таких
опросах участвуют более образованные
и активные люди, чем вся генеральная
совокупность, поэтому любой телевизионный
опрос содержит в себе систематическое
искажение и носит поверхностный характер.

Но систематические
ошибки возникают и в ходе корректно
организованного опроса. Например, на
улице на вопросы интервьюера отвечают
только те, кто никуда не спешит. Искажения
можно избежать, если соблюдать принципы
случайного отбора и опрашивать, к
примеру, каждого десятого прохожего2.

Причины
возникновения систематических ошибок:

  1. «в ходе исследования
    была не правильно составлена основа
    выборки (использовались устаревшие,
    неполные данные либо отсутствовала
    статистика по некоторым важным для
    формирования выборки признакам),

  2. неудачно выбран
    способ отбора единиц наблюдения,

  3. часть респондентов
    по разным причинам «выпала» из опроса
    (отсутствовала, отказалась отвечать)
    и так далее»3.

При помощи
математических средств такие ошибки
устранить невозможно, поэтому необходимо
осуществить логический анализ причин
появления систематических ошибок и
разработать меры, которые смогли бы их
устранить. «Величину ошибок смещения
определить при помощи математических
формул практически не возможно, поэтому
они автоматически переходят на результаты
и выводы исследования. Ошибки смещения
бывают обычно следствием:

  • неверных исходных
    статистических данных о параметрах
    контрольных признаков генеральной
    совокупности;

  • слишком малого
    (статистически не значимого) объёма
    выборочной совокупности;

  • неверного
    применения способа отбора единиц
    анализа (например, отбор из неверно
    составленного списка, неудачный выбор
    места и времени проведения опроса)»1.

Существуют
определённые пределы ошибки выборки,
которые зависят от цели исследования.
В экономических и демографических
прогнозах, например при переписи
населения, требуется повышенная
надёжность и точность. Для таких прогнозов
существенные ошибки оборачиваются
миллионными потерями материальных
ресурсов и просчетами в прогнозах и
планировании. Но чаще поводятся
социологические исследования для
уяснения общих тенденций, общей
ориентировки в социальной сфере не
требующие стопроцентной надёжности.
Существует приблизительная оценка на
надёжность результатов исследования:
«повышенная надёжность допускает ошибку
выборки до 3%. Обыкновенная – до 3-10%,
приближенная – то 10 до 20%, ориентировочная
– от 20 до 40%, а прикидочная – более 40%»2.

Таким образом,
существует несколько способов, чтобы
избежать ошибки:

  • каждый элемент
    генеральной совокупности должен иметь
    одинаковую вероятность попасть в
    выборочную совокупность;

  • генеральная
    совокупность должна быть желательно
    однородной;

  • необходимо иметь
    сведения о структуре генеральной
    совокупности и её характерные черты;

  • при составлении
    выборочной совокупности заранее учесть
    случайные и систематические ошибки.

«В.И. Паниотто
приводит следующие расчёты репрезентативной
выборки с допущением 5-процентной ошибки
(здесь имеются ввиду систематические
ошибки) (таблица 2)»3:

Размеры выборки
для различных генеральных совокупностей

Объём
генеральной совокупности

500

1000

2000

3000

4000

5000

10000

100000

Объем
выборки

222

286

333

350

360

370

385

458

Например,
если опросив 380 человек в поселении, где
общая численность платёжеспособного
населения 10 тысяч человек, мы выявили
что 36% опрошенных покупателей, предпочитают
отечественную продукцию, то с 95-процентной
степенью вероятности мы можем утверждать,
что отечественную продукцию постоянно
покупают 46±5% (то есть от 41 до 51%) жителей
этого поселения.

«Можно было
также воспользоваться расчётами
института Гэллапа для оценки соотношения
размеров выборки и ошибки выборки
(таблица 3)»1:

Размер
выборки

Интервал
доверия, %

4000

±2

1500

±3

1000

±4

600

±5

400

±6

200

±8

100

±11

Многие
обстоятельства усложняют проблему
расчёта выборки и нередко могут привести
к тому, что формально-статистически
репрезентативная

выборка окажется
качественно непредставительной»2.

Качество выборки
оценивают по двум показателям:
репрезентативность и надежность. О
репрезентативности уже говорилось
выше. А чтобы создать надежную выборку
необходимо правильно построить ее
основу. Для этого соблюдаются следующие
требования:

  1. Полнота выборки,
    которая требует наличия всех элементов
    генеральной совокупности в основе
    выборки. Если в выборку не включены
    многие единицы наблюдения, тем более,
    несущие в себе существенные особенности
    и характеристики объекта, то результаты
    исследования будут неполными и
    однобокими.

  2. Отсутствие
    дублирования, которое подразумевает
    недопустимость повторного включения
    в выборку одной и той же единицы
    наблюдения (например, ученик перешел
    учиться в другую школу, его включили в
    новый список, не вычеркнув при этом из
    старого, таким образом, он дважды попал
    в выборку).

  3. Точность информации
    выборки, предполагающая исключение
    несуществующих единиц наблюдения из
    основы выборки. Например, в избирательных
    списках, которые готовятся для очередных
    выборов депутатов различного уровня,
    нередко остаются умершие люди или
    жильцы снесенных домов.

  4. Адекватность,
    которая означает, что основа составленной
    выборки должна соотноситься с решением
    поставленных в исследовании задач.
    Например, полный список всех учащихся
    школы — хорошая основа для того, чтобы
    сформировать выборку при изучении
    проблемы общей успеваемости. Но если
    нас интересует отношение старшеклассников
    к основным учебным дисциплинам, то этот
    список может быть использован только
    для формирования новой основы выборки
    — списка старшеклассников.

  5. Удобство работы
    с основой выборки, при котором необходимо
    четко пронумеровать все элементы,
    которые в нее входят, а составленные
    списки централизованно хранить1.

«Существует два
основных подхода к обоснованию
репрезентативности выборки:

  1. При статистическом
    подходе репрезентативность обеспечивается
    специальными вероятностными методами
    извлечения выборки. Для обобщения
    результатов исследования на генеральную
    совокупность применяются строгие
    индуктивные процедуры статистического
    вывода, оценивается ошибка выборки с
    заданной вероятностью.

  2. Внестатистическое
    обоснование репрезентативности
    предполагает теоретическое доказательство
    того, что выборка достаточно хорошо
    представляет генеральную совокупность.
    При использовании этого подхода
    статистическое оценивание ошибок
    выборки не производится»2.

На первый взгляд,
кажется, что обеспечить репрезентативность
выборки на практике просто невозможно,
но на самом деле всё зависит от программных
целей и задач исследования.

Если мы проводим
обследование большой общественной
значимости, по завершению которого
нужно будет сделать выводы обо всей
генеральной совокупности, то необходимо
чётко следовать всем требования
репрезентативной выборочной процедуры,
так как ошибки в таких исследованиях
недопустимы.

Если перед нами
стоят более скромные задачи и уровень
надежности выводов можно смело понизить,
то необходимо следовать всем требованиям
по качественному представительству
выборочной совокупности. Если мы решим
подчёркивать статистическую надёжность
данных, то введём в заблуждение тех
людей, кто привык верить математическим
расчётам. Нельзя забывать, что та
информация, которую мы получаем путём
опросов и других способов, лишь условно
переводится в количественные показатели.
И не редкость когда количественные
показатели только приблизительно
отражают существо социальных процессов.
«Поэтому усилия, направленные на
строгость статистического обоснования
результатов, приобретают смысл только
при условии серьёзного качественного
анализа проблемы, содержательного её
изучения»1.

Необходимо
помнить, что социолог должен сосредотачивать
своё внимание именно на существе
социальных проблем, привлекать к работе
других специалистов, практиков и
теоретиков, внимательно изучать
литературу в области экономики,
психологии, социологии о предмете
исследования. И для решения статистических
задач, по поводу типа и объема выборки,
он сначала должен чётко сформулировать
конкретные вопросы, которые необходимо
решить, а уже потом обращаться к
соответствующим расчётам различных
статистик2.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Требования к выборке становятся актуальными при проведении психологических исследований, когда получаемые результаты и выводы в дальнейшем планируется распространить на генеральную совокупность, а также в случае необходимости получения статистически достоверных результатов.

Важнейшим требованием к качеству выборки является обеспечение ее репрезентативности. Требование репрезентативности выборки означает, что по выделенным параметрам (критериям) состав выборки обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности. Между тем, строго репрезентативную выборку по всем важным для проблематики исследования параметрам обеспечить невозможно, и поэтому следует гарантировать репрезентацию по главному направлению анализа данных.

Прежде всего, надо уяснить, какие из имеющихся сведений о характеристиках генеральной совокупности существенны для целей исследования. Во многих случаях это половозрастной и социально-профессиональный состав обследуемых, их пространственная локализация. Исходя из этого, основными этапами формирования выборки (выборочной совокупности) являются следующие:

– обоснование структуры выборочной совокупности в соответствии с характером задач и гипотез исследования;

– уточнение структуры выборки с учетом информации, полученной при анализе первичных результатов исследований, данных пробных и пилотажных исследований, их доработка на основе гипотез;

– определение типа и объема выборки.

В наиболее общем виде по типу выборочные совокупности делят на целенаправленные (из генеральной совокупности выбираются типичные элементы, воспроизводящие ее структуру) и случайные (вероятностные), когда все элементы генеральной совокупности имеют одинаковую вероятность попадания в выборочную совокупность.

В зависимости от характера исследования может применяться тот или иной тип выборки:

1. Простая случайная. Из однородной совокупности, все элементы которой известны и могут быть пронумерованы, осуществляется отбор единиц выборки с помощью таблиц случайных чисел.

2. Систематическая. Для ее определения необходим полный список единиц генеральной совокупности. В выборку отбирается по одному объекту через интервал, равный шагу отбора – отношению объема генеральной совокупности к объему выборки.

3. Гнездовая. Выборочные единицы отбираются с помощью одного из способов случайного отбора. Единицы отбора представляют собой статистические группы (гнезда), которые целиком или выборочно подвергаются обследованию.

4. Стратифицированная районированная выборка. Исследуемая совокупность предварительно разделяется на страты (слои) в соответствии с генеральным распределением известных и значимых для исследования признаков.

а) Пропорциональное размещение – объем выборки из страты пропорционален размеру страты в генеральной совокупности;

б) Оптимальное размещение – объем выборки из страты пропорционален в страте среднеквадратичному отклонению признака и обратно пропорционален издержкам на получение выборки.

5. Многоступенчатая. Процедура построения выборки разбивается на ряд этапов (ступеней). На каждой ступени меняется единица отбора.

а) Случайная – на каждой ступени единицы отбираются одним из способов случайного отбора.

б) Комбинированная – отбор на каждой из ступеней может осуществляться любым из вышеописанных способов.

6. Квотная. Производится разбиение генеральной совокупности на классы согласно нескольким распределениям выбранных признаков. На основе знания статистического объема каждого класса и заданной доли отбора из него определяется “квота” – объем выборки соответствующего класса.

Объем выборки – число элементов, включенных в выборочную совокупность. Численность (объем) выборки определяется:

– уровнем однородности или разнородности изучаемых объектов – генеральной совокупности (чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы);

– величиной доверительной вероятности (Р);

– требуемой точностью результатов, т.е. величиной допускаемой ошибки репрезентативности.

Весьма полезна следующая приблизительная оценка надежности результатов выборочного обследования. Повышенная надежность допускает ошибку выборки до 3%, обыкновенная – до 3-10%, приближенная – от 10 до 20%, ориентировочная – от 20 до 40%, а прикидочная – более 40%.

Для достижения необходимого качества выборки необходимо осуществить следующие шаги:

1. Опpеделить стpуктуpу генеpальной совокупности – количественные пpопоpции подгpупп (квот) по pазличным социально-демогpафическим хаpактеpистикам.

2. Опpеделяется объем пpедставительной выбоpки.

3. Объем пpопоpционально делится на квоты, так чтобы стpуктуpа выбоpки моделиpовала стpуктуpу генеpальной совокупности.

Половозрастная структура “замыкает” на себя многие показатели семейного состояния. При конструировании заданий для теста необходимо учитывать, что весьма вероятны различия в ответах на них в зависимости от пола испытуемых. Так, обычно при выполнении тестов способностей детьми до 16 лет девочки демонстрируют превосходство в словесно-логических навыках, а мальчики – в работе с цифрами. Вероятнее всего, что задания из этих областей будут иметь различные статистические оценки. Различия испытуемых по полу обнаруживаются во многих заданиях личностных тестов, например, тех, которые касаются интереса к одежде, спорту, своей внешности, вождению автомобиля, рисованию, верховой езде.

Одним из решений этой проблемы было бы разделить мужчин и женщин на отдельные выборки, а затем отобрать задания, удовлетворяющие критериям процедуры анализа заданий для обеих групп. Хотя при этом возникают некоторые трудности.

Первая проблема состоит в том, что хотя задания почти всегда могут быть сформулированы так, что они пройдут процедуру анализа (с корреляцией задание/общий показатель 0,2 и долей Р, ответивших в соответствии с ключом испытуемых в пределах от 0,2 до 0,8) в обеих группах, даже для эффективных заданий эти оценки могут быть не идентичными. Особенно важным здесь является коэффициент Р, так как если он всегда больше, скажем, для мужчин, чем для женщин, на большом количестве заданий, то это может привести к влиянию пола испытуемых на результаты тестирования.

Вторая проблема является более фундаментальной. Если мы отберем задания, получившие в процедуре их анализа одинаковые оценки для мужчин и для женщин, мы фактически создадим тест, на результаты которого пол испытуемых не влияет. С другой стороны, мы могли бы отобрать задания, по которым женщины показывают более высокие результаты. Каково, однако, значение такой идентичности или различия в показателях? Чтобы вычленить эту проблему, следует вспомнить, что средние значения и дисперсии для тестов являются функциями отдельных наборов заданий. Так что не имеет смысла утверждать, что исходя из показателей по тесту девочки выполняют его лучше, или хуже, или так же, как мальчики. Это должно быть функцией конкретного набора заданий.

На практике это означает, что если у нас нет некоторой веской причины ожидать влияния пола испытуемых на тест, то должны отбираться те задания, которые не выявляют половых различий. В случае большинства личностных и мотивационных переменных это наиболее оптимальный подход. Следует заметить, что если по данной переменной существует реальные различия между полами, то не имеет значения, сколько заданий испытывается – это проявится в статистических оценках заданий. Так, если постоянно для каждого задания обнаруживается устойчивая тенденция, то тогда лучше всего будет использовать эти задания, пусть даже тест и показывает теперь различия между полами.

Возраст содержит указания на жизненный опыт и, как правило, на рабочий или профессиональный стаж. При испытании заданий существенно, чтобы вся сформированная выборка была подобной той, для которой тест предназначен. Однако полезно также провести анализ заданий данного теста отдельно для различных возрастных групп в рамках одной выборки.

Социально-профессиональные характеристики – это свидетельства особого рода занятий, с чем связаны интересы, особенности режима труда и отдыха, многие другие важные показатели деятельности людей. Пространственная локализация (по территории, подразделениям предприятий, учреждений) важна с точки зрения особенностей условий жизнедеятельности определенной группы людей.

В ряде случаев значимым фактором, влияющим на результаты тестирования является т.н. тестовая искушенность. Тестовая искушенность – индивидуальный опыт обследуемого, приобретенный в ходе выполнения различных психологических тестов. По мнению А.Анастази, преимущества человека, ранее участвующего в обследовании перед новичком складываются из ранее преодоленного чувства неизвестности, сформировавшейся уверенности в себе, сложившегося отношения к тестовой ситуации, приобретенных навыков работы с тестовыми заданиями, осознания исходности принципов решения задач в определенных группах тестов, снижение мотива экспертизы и проявления различного рода установок, снижающих достоверность получаемых диагностических данных.

Таблица 4. Зависимость объема выбоpки от объема генереальной совокупности пpи допустимой ошибке 5% (довеpительная веpоятность – 0,95)

Несмотря на наличие ссылок по тексту, автор все же рекомендует прочесть раздел целиком — для более последовательного понимания материала.

Определения и пояснения:

1. Ген еральная совокупность и выборка.

Под выборочным методом понимается следующее. Та категория исследовательских задач, которая требует изучения каких-либо психологических, социальных явлений, свойственных, например, всем жителям города, всем студентам, всем владельцам автомобилей такой-то марки и т. п. накладывает объективные ограничения на возможность проведения эксперимента. Действительно: если требуется, скажем, узнать какова доля женщин среди жителей города, очень трудоемко и нецелесообразно искать эти сведения во всех паспортных столах или устраивать собственную «перепись населения». С этой целью исследователем подсчитывается процент женщин в какой-либо относительно небольшой группе случайно (или периодически) отобранных граждан, а на основании результата делается заключение о том, какова доля женщин среди жителей города.

В таком случае всех жителей будем считать ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЬЮ, а экспериментальную группу граждан – ВЫБОРКОЙ.

2. Тр ебования, предъявляемые к выборке.

К генеральной совокупности обычно применимо требование правильного определения ее КОНТУРА. Это означает, что исследователь обязан ответить на два вопроса: охватывает ли он в своих предположениях все возможные элементы генеральной совокупности, и нет ли элементов избыточных, лишних.

Приведем пример. Пусть перед нами стоит исследовательская задача определить, велик ли в некоем городе процент женщин, считающих свою семейную жизнь удовлетворительной? Не касаясь способов, как именно оценивать степень удовлетворенности, займемся определением характера самой генеральной совокупности. Очевидно, что мы получим искаженную картину, если примем за генеральную совокупность всех лиц женского пола, включая младенцев, детей и незамужних девушек. (Речь идет об удовлетворенности собственной семьей.) Однако мы так же ошиблись бы, если бы исключили вдов, престарелых женщин или женщин, состоящих в разводе, ведь мы помним, что по условию «задачи» нас интересует удовлетворенность семейной жизнью, а не только супружеством. Стало быть, не следует исключать из рассмотрения неполные семьи.

К выборке обычно предъявляются требования ВАЛИДНОСТИ и РЕПРЕЗЕНТАТИВНОСТИ.

Под ВАЛИДНОСТЬЮ понимается следующее. Буквально: выборка должна работать, то есть отражать все характеристики генеральной совокупности. Она не может быть «с живой картины списком бледным», в выборке не должны пропадать какие-то свойства, присущие генеральной совокупности в целом. Выборка – это модель того, что она представляет. (Нельзя выносить суждение о том, что все дно мирового океана покрыто галькой – на том основании, что вы сидите на пляже и перебираете в руках камешки.)

Пример. Вспомним нашего гипотетического наблюдателя, стоящего на улице и подсчитывающего процент проходящих мимо него мужчин и женщин. Если его задача в том, чтобы узнать: лица какого пола чаще ходят по этой улице, то он действует правильно. Но если задача в другом : определить больше ли ходит вообще по городу мужчин или женщин, то нашему экспериментатору надо бы пригласить помощников, которых он должен расставить и на центральных улицах и в «спальных районах» города, и на темных переулках. После подсчета ему придется объединить данные, причем в тех пропорциях, в каких описанные категории улиц представлены в его городе. Если же задача нашего любознательного исследователя состоит в том, чтобы узнать, кого вообще в городе больше – мужчин или женщин, то ему придется покинуть свой пост и лучше вместе с помощниками отправиться по разным домоуправлениям или паспортным столам. Это справедливо вот почему: если на дворе белый день, причем, рабочий, то вряд ли мимо наблюдателя будет ходить много служащих, матерей с грудными младенцами, дряхлых стариков и т.п. Иными словами, сформированная им выборка не будет отражать характеристик всей генеральной совокупности.

Требование РЕПРЕЗЕНТАТИВНОСТИ состоит в том, чтобы любой исследователь, желающий повторить этот эксперимент, имел возможность при сходных условиях сформировать подобную выборку (то есть выборку с теми же свойствами) и получить результат. Будет ли результат почти таким же или отличным – дело другое. Важно то, что условия эксперимента должны иметь возможность быть воспроизведенными.

Существует также требование НАДЕЖНОСТИ, но оно имеет отношение скорее к эксперименту в целом, нежели к формированию выборки. Состоит оно, во-первых, в возможности повторения эксперимента с получением близких (тех же) результатов, и, во-вторых, — в степени доверия к полученным результатам – точность, с какой эксперимент описал действительное положение вещей. Этот момент тесно связан с таким понятием, как «уровень статистической значимости».

3. Уро вни статистической значимости.

Основной вопрос, на который нужно дать ответ при проведении любого статистического исследования, это – достоверны ли различия между чем-то и чем-то. Этим «чем-то» может быть, например средний уровень интеллекта в двух группах людей; возможно, мы хотим узнать, все ли цвета в тесте Люшера выбираются, в среднем, одинаково часто на все позиции (то есть хотим сравнить экспериментальное распределение с равномерным); случайно или нет после воздействия суггестора на экспериментальную группу изменилось ее усредненное отношение к какому-то вопросу, и т.п. Во всех этих (и во всех прочих) случаях мы всегда определяем достоверность различий.

УРОВЕНЬ ЗНАЧИМОСТИ – это вероятность того, что мы сочли различия достоверными, а они на самом деле случайны.

Часто в научной литературе, особенно в периодических изданиях, можно встретить такую запись:

Эта запись обозначает, что полученные в описываемом эксперименте различия достоверны на 5%-м или 1%-м уровне, то есть вероятность, что они окажутся недостоверны, равна 5/100 (0,05%) или 1/100 (0,01%).

Пятипроцентный уровень и однопроцентный уровень – общепринятые «стандарты». Обычно приводится сравнение именно с этими двумя числами.

Если уровень значимости указан:

более 10 процентов, — гипотезу, как правило, признают не подтвердившейся, а различия – недостоверными;

если в диапазоне от 5 до 10 процентов – тенденция достоверности;

меньше 5% — результатам можно доверять;

меньше 1% — практически, гарантия достоверности.

4. Нулевая и альтернативная гипо тезы.

Формулирование гипотез – важный этап всякого исследования. Правильно сформулированные, они помогают исследователю придерживаться выбранной линии. После проведения эксперимента и осуществления всех подсчетов ему легче понять, что же все-таки он обнаружил.

Существуют два общепринятых, стандартных, типа гипотез:

Нулевая гипотеза (обозначается Н о ) предполагает, что в эксперименте не будет выявлено различий. Например: «Между учениками 1 класса А и 1 класса Б нет различий по уровню интеллекта».

Альтернативная гипотеза (обозначается Н 1 ) предполагает, что будут выявлены различия (что различия будут достоверны). Например: «Ученики 1 класса А и 1 класса Б отличаются по уровню интеллекта»

Гипотезы так же могут быть ненаправленными (см. предыдущий пример) и направленными: «Ученики 1 класса А превосходят по уровню интеллекта учеников 1 класса Б»

5. Шка лы измерения.

Измерение – приписывание числовых форм объектам или событиям в соответствии с какими-либо правилами.

Различают четыре типа измерительных шкал.

1) НОМИНАТИВНАЯ (номинальная, шкала наименований). Эта шкала классифицирует объекты по названию, по принадлежности. Она не измеряет объекты количественно, а лишь «расставляет» по надлежащим местам. Например, взяв группу граждан, мы можем классифицировать их по национальностям, по профессии. Простейший случай номинальной шкалы – дихотомическая . Она содержит только два варианта значений: «ответил – не ответил на вопрос анкеты»; «холост – женат»; «работает – безработный»; «мужчина – женщина» и т.п.

2) ПОРЯДКОВАЯ шкала классифицирует по принципу «больше – меньше». Классифицированные объекты располагаются по мере возрастания признака, от самого малого – до самого большого. Ячейки здесь играют роль «классов». Однако порядковая шкала не дает ответа на вопрос, насколько один объект больше или меньше другого (каково между ними расстояние, выраженное в каких-либо единицах). Порядковая шкала должна содержать не меньше трех классов (разрядов), (в противном случае она сводится к дихотомической шкале). Пример: уровень благосостояния населения – мы можем сказать, что «средний класс» обеспеченнее бедных и беднее богатых, но не имеем возможности определить эту разницу количественно. Еще пример – уровень образования. Ясно, что высшее образование «лучше», чем среднее и среднее-специальное , но нет таких единиц, в которых можно было бы указать, насколько именно «лучше». Третий пример: тест СЖО (смысло-жизненных ориентаций) Леонтьева, и вообще, все методики, в которых требуется оценить что-либо по схеме «нравится – не знаю – не нравится» или «всегда – обычно – иногда – никогда».

3) ИНТЕРВАЛЬНАЯ шкала – шкала, классифицирующая по принципу «больше/меньше на определенное количество единиц». Однако эта шкала не устанавливает точки начального отсчета, некоего «абсолютного нуля», зная который, можно сравнивать между собой два любых объекта, признаки которых измерены в этой шкале. Например, измеряем время решения учебной задачи при приеме на работу. Пусть имеется четыре испытуемых А , Б, В и Г. Пусть А решил задачу за 100 секунд, Б – за 110, В – за 200, а Г – за 210. Ясно, что в этом случае нельзя утверждать, что А настолько же успешнее Б, насколько В успешнее Г, хотя между этими парами испытуемых одна и та же разница во времени решения задач – 10 секунд.

4) ШКАЛА РАВНЫХ ОТНОШЕНИЙ – это шкала, классифицирующая объекты пропорционально степени выраженности исследуемого свойства. Здесь классы или градации выражены числами, пропорциональными друг другу. Иными словами, такая шкала имеет абсолютную точку отсчета. В психологии примером шкалы равных отношений могут служить пороги абсолютной чувствительности. В сравнении с предыдущей шкалой, можно сказать, что та являлась шкалой температуры по Цельсию, а эта – по Кельвину, где есть абсолютный нуль.

Выборочное исследование должно обеспечивать необходимую точность результатов относительного объекта исследования, при этом, как было отмечено в предыдущем разделе, оно должно обеспечить экономию исследовательских ресурсов. Перечислим основные критерии, предъявляемые к выборке.

1. Выборка должна обеспечивать расчет несмещенных оценок изучаемого явления, т. е. быть репрезентативной.

2. Выборка должна обеспечивать расчет ошибок выборки, сопровождающих любое выборочное обследование.

3. Построение выборки должно быть относительно быстрым и легким (т. е. модель формирования выборки не должна быть чересчур сложной, громоздкой).

4. Выборка должна обеспечивать максимально возможной точности исследования в рамках имеющихся средств. Т. е., построение и реализация выборки не должны быть излишне затратными.

5. Выборка должна быть четко письменно задокументирована таким образом, чтобы эксперты могли оценить, насколько она соответствует вышеприведенным критериям.

Ключевым требованием к выборочной совокупности является требование репрезентативности.

Репрезентативной называют выборку, представляющую генеральную совокупность с приемлемой степенью точности. Репрезентативность — свойство выборки отражать, моделировать характеристики генеральной совокупности. Мера подобия выборочной модели структуре генеральной совокупности оценивается ошибкой выборки. Ошибка выборки характеризует расхождение между оценкой показателя, сделанной на основании изучения выборки, и оценкой этого же показателя на основе изучения генеральной совокупности.

Допустимые пределы ошибки выборки зависят от цели исследования и определяют степень надежности получаемых результатов. Так для поисковых исследований надежность может быть приближенной и даже ориентировочной (т. е. в пределах 10–20 и 20–40% ошибки репрезентативности соответственно), для описательных и аналитических исследований должна быть обеспечена нормальная надежность результатов исследования (в пределах 3–10% ошибки репрезентативности, обычно — 5%).

Ошибки репрезентативности могут быть случайными и систематическими. Случайные ошибки не отражают существенной связи между объектом, субъектом и условиями проведения исследования. Они возникают непреднамеренно, например, вследствие описок, неточности сообщаемых респондентами данных. В целом по всему массиву данных такие ошибки имеют тенденцию к взаимному погашению и не влияют на результаты исследования.

Систематические ошибкиотражают существенную связь между объектом, субъектом и условиями проведения исследования и могут значительно исказить результаты исследования, вызывая так называемые систематические смещения. Причины возникновения систематических ошибок репрезентативности связаны существенными недочетами при формировании и реализации плана выборки. К их числу относятся:

– неверно выбранный метод формирования выборочной совокупности и/или неправильно рассчитанный ее объем;

– неполный охват единиц выборочной совокупности;

– произвольная замена единиц выборочной совокупности.

Следует отметить еще одну причину появления систематических ошибок, хотя именно эта причина никак не связана сущностью выборочного метода. Это некорректно разработанный инструментарий исследования.

Таким образом, обеспечение репрезентативности выборки осуществляется за счет:

– корректного определения необходимого объема выборочной совокупности и…

– . метода ее формирования, адекватного объекту, целям и задачам исследования;

– тщательного контроля реализации плана выборки.

Чтобы избежать грубых ошибок выборки, следует обратить внимание на следующие рекомендации:

1. Определите, что представляет собой генеральная совокупность: уточните, какие именно объекты попадают в ее состав, какие характеристики им присущи; оцените, насколько соотносятся между собой идеальная (задаваемая теоретическими параметрами) и реальная (определяемая жизнью) совокупности[1].

2. Уяснить, какие характеристики единиц генеральной совокупности существенны для исследования, чтобы они нашли точное отражение в выборке.

3. Выбрать оптимальную модель формирования выборки и определить необходимый ее объем.

4. Провести инструктаж лиц, привлекаемых к проведению исследования, по вопросам отбора единиц выборочной совокупности.

5. В процессе исследования контролировать соответствие формируемой выборки ее плану.

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Для студента самое главное не сдать экзамен, а вовремя вспомнить про него. 10684 — | 7833 — или читать все.

Выборка — это метод исследования, когда из общей изучаемой (генеральной) совокупности однородных единиц отбирается некоторая его часть (выборочная совокупность), и только эта часть подвергается обследованию.

Генеральная и выборочная совокупности должны сопоставляться по некоторым важным признакам, которые легко проверяются статистическими методами. Если они совпадают, то выборка называется представительной, или репрезентативной. Понятно и то, что, чем больше размер выборки, тем больше и достоверность. Прежде всего, надо уяснить, какие из имеющихся сведений о характеристике генеральной совокупности, объекте исследования существенны для целей исследования. Во многих случаях это половозрастной, социально-профессиональный, имущественный состав обследуемых, их пространственная локализация. Пол и возраст замыкают на себе многие показатели семейного состояния: возраст, к примеру, указывает на жизненный опыт, профессиональный стаж. Пространственная локализация (по территории, по месту работы) важна с точки зрения адресности выводов и рекомендаций, которые должны быть привязаны к административным или производственным показателям. При сочетании этих трех параметров: половозрастной структуры, социального состава и пространственной локализации — можно быть уверенным, что выборка будет представительной для изучения многих социальных проблем. Понятно, что это правило имеет исключения в зависимости от конкретных условий и особых целей исследования. Например, при изучении политических ориентации населения уже не обойтись без учета имущественного положения, а студенческих проблем — без знания вуза и курса обучения студентов.

Очень важно при формировании выборки обеспечить равномерный отбор из всей генеральной совокупности. При небольших по численности генеральных совокупностях применяют случайные выборки. Их можно использовать, когда известны основные параметры генеральной совокупности. Случайная систематическая выборка — отбор идет через определенные интервалы, например, по спискам студентов, клиентов банка, избирателей и т. п. Имея список работников предприятия и определив объем необходимой выборки, можно установить шаг выборки, например, каждый десятый или сотый из списка. Серийная или гнездовая выборка реализуется в том случае, если есть внутренняя структура объекта. На предприятии выбираются не все подразделения, а наиболее типичные, например, в области — отдельные города и районы, но опять же типичные; в городе это могут быть отдельные микрорайоны. Целевой называется выборка, в которой идет выделение на основе каких-либо признаков, например, по полу, национальности, имущественному положению, принадлежности к политическим партиям и т. п. Целенаправленная квотная выборка предполагает пропорциональный отбор на основании статистики распределения среди генеральной совокупности заданных сочетаний паспортных данных респондентов — квот. В социологии также используется выборка как метод основного массива — опрос всех присутствующих (или 60-70 % всей численности). Посредством этого метода, например, осуществляется «зондаж» общественного мнения. Выборки бывают одноступенчатыми и многоступенчатыми, комбинированными. На каждой ступени отбора следует обеспечить требование представительности. Например, при опросе населения города на первом этапе отбираются типичные микрорайоны, а затем опрашиваются жители каждой двадцатой или пятидесятой квартиры, дома. При опросе населения области на первой ступени выбираются типичные районы и города. Примером стихийной выборки могут быть опросы по почте, интервью встречных, прохожих, пассажиров. Здесь может применяться квотный принцип, когда в конкретном здании необходимо опросить определенное количество человек по некоторым признакам, к примеру, по полу, возрасту.

К выборке применяется ряд обязательных требований, опре­деленных, прежде всего, целями и задачами исследования. Плани­рование эксперимента должно включать в себя учет как объема выборки, так и ряда ее особенностей. Так, в психологических ис­следованиях важно требование однородности выборки. Оно озна­чает, что психолог, изучая, например, подростков, не может, включать в эту же выборку взрослых людей. Напротив, исследо­вание, выполненное методом возрастных срезов, принципиаль­но предполагает наличие разновозрастных испытуемых. Однако и в этом случае должна соблюдаться однородность выборки, но уже по другим критериям, в первую очередь таким, как возраст, пол. Основаниями для формирования однородной выборки могут служить разные характеристики, такие, как уровень интеллекта, национальность, отсутствие определенных заболеваний и т.д., в зависимости от целей исследования.

В общей статистике имеется понятие повторной и бесповторной выборки, или, иначе говоря, выборки с возвратом и без возврата. В качестве примера приводится, как правило, выбор шара, доставаемого из какой-либо емкости. В случае выборки с возвратом каждый выбранный шар опять возвращается в емкость и, следовательно, может быть выбран снова. При бесповторном выборе однажды выбранный шар откладывается в сторону и больше не может участвовать в выборке. В психологических ис­следованиях можно найти аналоги подобного рода способам организации выборочного исследования, поскольку психологу нередко приходится несколько раз тестировать одних и тех же испытуемых при помощи одной и той же методики. Однако, строго говоря, повторной в этом случае является процедура тес­тирования. Выборка испытуемых при полной тождественности состава в случае повторных исследований всегда будет иметь не­которые отличия, обусловленные функциональной и возрастной изменчивостью, присущей всем людям. Подобная выборка по ха­рактеру проведения процедуры является повторной, хотя смысл термина здесь, очевидно, иной, чем в случае с шарами.

Важно подчеркнуть, что все требования, предъявляемые к любой выборке, сводятся к тому, что на ее основе психологом должна быть получена наиболее полная, неискаженная информация об особенностях генеральной совокупности, из которой взята эта выборка. Иными словами, выборка должна как можно более полно отражать характеристики изучаемой генеральной со­вокупности.

6.4 Репрезентативность выборки

Состав экспериментальной выборки должен представлять (моделировать) генеральную совокупность, поскольку выводы, полученные в эксперименте, предполагается в дальнейшем пе­ренести на всю генеральную совокупность. Поэтому выборка должна обладать особым качеством – репрезентативностью, позволяющей распространить полученные на ней выводы на всю генеральную совокупность.

Репрезентативность выборки очень важна, тем не менее по объективным причинам соблюдать её крайне сложно. Так, хоро­шо известен факт, что от 70% до 90% всех психологических ис­следований поведения человека проводились в США в 60-х годах XX века с испытуемыми – студентами колледжей, причем боль­шинство из них были студентами психологами. В лабораторных исследованиях, выполняемых на животных, наиболее распрост­раненным объектом изучения являются крысы. Поэтому неслу­чайно психологию называли раньше «наукой о студентах-второ­курсниках и белых крысах». Студенты коллед­жей составляют всего 3% от общей численности населения США. Очевидно, что выборка студентов нерепрезентативна в качестве модели, претендующей на представительство всего населения страны.

Репрезентативная выборка, или, как еще говорят, предста­вительная выборка, – это такая выборка, в которой все основ­ные признаки генеральной совокупности представлены прибли­зительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной сово­купности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большой долей уверенности считать применимыми ко всей генеральной совокупности. Это распространение результатов называется генерализуемостью.

В идеале репрезентативная выборка должна быть такой, чтобы каждая из основных изучаемых психологом характерис­тик, черт, особенностей личности и т.п. была бы представлена в ней пропорционально этим же особенностям в генеральной совокупности. Согласно этим требованиям процедура форми­рования выборки должна иметь внутреннюю логику, способ­ную убедить исследователя, что при сравнении с генеральной совокупностью она действительно окажется репрезентатив­ной, представительной.

Нарушение принципов случайного выбора порой приводило к серьезным ошибкам. Стал знаменитым своей неудачей опрос, проведенный американским журналом «Литературное обозрение» относительно исхода президентских вы­боров в США в 1936 году.

Кандидатами на этих выборах были Ф.Д.Рузвельт и А.М.Ландон. В качестве генеральной совокупности редакция журнала использовала телефонные книги. Отобрав случайно 4 миллиона адресов, она разослала по всей стране открытки с вопросом об отношении к кандидатам в президенты. Затратив большую сумму на рассылку и обработку открыток, журнал объявил, что на предстоящих выборах президентом США с большим перевесом будет избран Ландон. Результат выборов оказался противоположным этому прогнозу.

Здесь были совершены сразу две ошибки – во-первых, телефонные книги сами по себе дают не репрезентативную выборку из населения страны, хотя бы потому, что абоненты– в основном зажиточные главы семейств. Во-вторых, прислали ответы не все, а люди, не только достаточно уверенные в своем мнении, но и привыкшие отвечать на письма, т.е. в значительной части представители делового мира, которые и поддерживали Ландона. Если бы редакция критически подошла к своей работе, она поняла бы, что методика опроса страдает изъянами.

Явление, подобное только что описанному, когда выборка представляет не всю генеральную совокупность, а лишь какой-то ее слой, какую-то ее часть, называется смещением выборки. Смещение – один из основных источников ошибок при использовании выборочного метода.

Однако для тех же самых президентских выборов социологи Дж.Гэллап и Э.Роупер правильно предсказали победу Рузвельта, основываясь только на 4 тысячах анкет. Причиной этого успеха, прославившего его авторов, было не только правильное составление выборки. Они учли, что общество распадает­ся на социальные группы, которые более однородны, в том числе по своим политическим взглядам. Поэтому выборка из слоя может быть относительно малочисленной с тем же результатом точности. Имея результаты обследования по слоям, можно характеризовать общество в целом. Сейчас такая методика является общепринятой.

В своей конкретной деятельности психолог действует следую­щим образом: устанавливает подгруппу (выборку) внутри гене­ральной совокупности, подробно изучает эту выборку (проводит с ней экспериментальную работу), а затем, если позволяют результаты статистического анализа, распространяет полученные выводы на всю генеральную совокупность. Это и есть основные этапы работы психолога с выборкой.

Начинающий психолог должен иметь в виду часто повторяю­щуюся ошибку: каждый раз, когда он осуществляет сбор любых данных любым методом и из любого источника, у него всегда появляется соблазн распространить свои выводы на всю гене­ральную совокупность. Для того чтобы избежать подобной ошиб­ки, надо не просто обладать здравым смыслом, но, прежде все­го, хорошо владеть основными понятиями математической ста­тистики.

Формирование выборки — это процесс определения целевой аудитории и отбора из всей совокупности потенциальных респондентов группы, имеющей все свойства генеральной совокупности.

“Методология и результаты расчета основных параметров выборки непосредственно зависят от способа отбора единиц из генеральной совокупности. Применение того или иного способа зависит от цели исследования, условий выборки, специфики объекта исследования, необходимой точности и оперативности результатов и от средств выделенных на исследования” [40, с. 268].

Различают две основных группы методов построения выборки:

  • 1. Вероятностные.
  • 2. Детерминированные.
  • Вероятностные выборки

    Вероятностные методы формирования выборки предполагают, что каждая единица генеральной совокупности имеет определенную вероятность включения в выборку. Использование таких методов позволяет исследователю распространять полученные результаты на всю генеральную совокупность.

    Существуют различные вероятностные методы формирования выборки:

  • • простая случайная выборка;
  • • систематическая (механическая) выборка;
  • • стратифицированная случайная выборка;
  • • кластерная выборка.
  • Простая случайная выборка

    Простая случайная выборка предполагает, что каждой единице генеральной совокупности обеспечивается равная вероятность (возможность) попасть в выборочную совокупность. Более того, каждая возможная выборка данного объема имеет известную и равную вероятность того, что именно она станет реально обследуемой выборкой.

    Процедура построения простой случайной выборки включает в себя следующие шаги [15, с. 205—206]:

  • • во-первых, нужно получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список называется основой выборки;
  • • во-вторых, следует определить предполагаемый объем выборки, т. е. ожидаемое число опрошенных;
  • • в-третьих, нужно извлечь из справочной таблицы случайных чисел или с помощью датчика случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел;
  • • в-четвертых, нужно выбрать из списка основы те наблюдения, номера которых соответствуют выписанным случайным числам. Отбор заканчивается, когда отобрано заранее заданное количество элементов выборочной совокупности.
  • Достоинством данного метода является полное соблюдение принципа случайности и, как следствие — избежание систематических ошибок. Затрудняют применение простого случайного отбора на практике необходимость наличия списка элементов генеральной совокупности, сложность проведения опроса и требования к объему выборки (для получения результатов со сравнительно высокой степенью точности собственно случайный отбор требует достаточно большого объема выборки по сравнению с другими видами отбора).

    Систематическая (механическая) выборка предусматривает отбор заданного числа респондентов через равные интервалы (шаги). В соответствии с данным методом сначала задают произвольную отправную точку, а затем из основы выборки последовательно выбирают каждую г-ю единицу. Интервал выборки к определяется как отношение объема генеральной совокупности N к объему выборочной совокупности п, с округлением результата до ближайшего целого числа. Первый респондент отбирается случайным образом, по таблице случайных чисел. Так как такой отбор производится из основы выборки, данный метод требует полного списка или заданного упорядочения совокупности.

    Например, генеральная совокупность состоит из 100 тысяч элементов, а желательный объем выборки равен 1000 респондентов. В этом случае интервал выборки к равен 100. Выбирается случайное число между 1 и 100. Если, например, это число равно 23, то выборка состоит из таких единиц: 23,123, 223, 323,423,523 и т. д. Общей чертой систематического и простого случайного отбора является то, что каждый элемент генеральной совокупности имеет известную и равную вероятность отбора.

    Когда генеральная совокупность слишком велика или исследователю известен не полный ее список, необходимо знать правило упорядочивания элементов в генеральной совокупности, так как интервал отбора может совпасть со скрытой периодичностью распределения признака в генеральной совокупности, а это приведет в свою очередь к смещениям. Если элементы совокупности расположены по принципу, не связанному с исследуемой характеристикой, результаты систематического отбора аналогичны результатам простого случайного отбора.

    Если принцип расположения элементов связан с исследуемой характеристикой, систематический отбор увеличивает репрезентативность выборки. Так, например, если фирмы какой- либо отрасли расположены по принципу увеличения годового объема продаж, систематическая выборка будет включать как мелкие, так и крупные фирмы. Простой случайный отбор в этой ситуации может быть нерепрезентативным, приводя, например, к попаданию в выборку только мелких фирм, которых может к тому же оказаться непропорционально много.

    Из-за простой техники отбора данный метод позволяет даже при небольшом объеме выборки изучать достаточно большие генеральные совокупности. Систематический отбор часто применяется при проведении почтовых и телефонных опросов, опросов в торговых центрах и в Интернет.

    Стратифицированная случайная выборка

    Стратифицированная случайная выборка — это вероятностная выборка, которая формируется в два этапа. На первом этапе генеральная совокупность подразделяется (расслаивается) на подгруппы (страты), взаимно исключающие и дополняющие одна другую таким образом, чтобы каждая единица совокупности относилась только к одной подгруппе и ни одна единица не была бы пропущена. Например, респондентов можно разбить по полу (мужчины и женщины), по возрасту (до 30 лет, с 31 до 50 лет, свыше 50 лет).

    На втором этапе из каждой страты производится отбор единиц с помощью простого случайного отбора или других вероятностных методов. Если стратификация проводится по территориальному принципу, стратифицированную выборку называют районированной. Отличие стратифицированной выборки от квотной состоит в том, что единицы генеральной совокупности выбираются случайно, а не экспертным или нерепрезентативным методом. Примеры формирования стратифицированных выборок подробно рассмотрены в [15, 31, 34].

    Стратифицированная выборка может быть пропорциональной и непропорциональной. При пропорциональном стратифицированном отборе объем выборки, полученной из каждой страты, пропорционален доле этой страты в объеме генеральной совокупности.

    “При непропорциональном стратифицированном отборе объем выборки, полученной из каждой страты, пропорционален доле этого слоя в объеме генеральной совокупности и среднеквадратичному отклонению распределения исследуемой характеристики среди всех элементов этой страты” [31, с. 529] Так как данный метод отбора обеспечивает наличие в выборке всех важных подгрупп, он применяется при неоднородных генеральных совокупностях. Однако этот метод можно применять лишь при наличии дополнительной информации о генеральной совокупности (например, необходимо процентное соотношение мужчин и женщин в случае, если надо стратифицировать выборку по полу). Отсутствие такой информации делает применение стратифицированной выборки невозможным. Другим недостатком стратифицированной выборки является возможность систематической ошибки.

    Кластерная выборка — вероятностный метод формирования выборки, предусматривающий реализацию двух этапов. На первом этапе генеральная совокупность подразделяется на кластеры — взаимоисключающие и взаимодополняющие подгруппы. По однородности критерии формирования кластеров прямо противоположны критериям формирования страт. Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности.

    На втором этапе с помощью простого случайного отбора формируется случайная выборка кластеров. В выборку либо включаются все элементы отобранного кластера, либо проводится их отбор вероятностным методом. Если в выборку включаются все единицы каждого отобранного кластера, то такой метод называется одноступенчатым кластерным отбором. Если выборка получена с помощью вероятностного отбора из каждого выбранного кластера, такая процедура называется двухступенчатым кластерным отбором.

    Применение кластерной процедуры основано на четырех обязательных условиях [15, с. 219-222]:

  • 1) каждый элемент генеральной совокупности может принадлежать только к одному кластеру;
  • 2) должно быть известно или поддаваться оценке с приемлемой степенью точности число элементов генеральной совокупности каждого кластера;
  • 3) кластеры должны быть не разбросаны пространственно и не слишком велики, иначе кластерная выборка теряет свои преимущества в финансовом смысле;
  • 4) выбор кластеров должен быть осуществлен так, чтобы рост выборочной ошибки был минимальным (разные кластеры не должны быть однородными по исследуемому признаку и слишком большими).

“Основное различие между кластерным и стратифицированным отбором состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как при стратифицированном отборе все подгруппы (страты) используются для дальнейшего отбора. Эти методы преследуют разные цели: цель кластерного отбора — увеличить эффективность отбора, уменьшив затраты на его проведение, а цель стратифицированного отбора — увеличить точность отбора” [31, с. 525]. Примеры формирования кластерных выборок подробно рассмотрены в [15, 31, 34].

“Одним из распространенных форм кластерного отбора является территориальный отбор, в котором кластеры состоят из округов, жилых районов, кварталов или других географических территорий. Если отбор основных элементов проводится в один этап (например, исследователь выбирает некоторые кварталы, а затем все проживающие там семьи включаются в выборку), такой выборочный метод называется одноступенчатым территориальным отбором. Отличительная черта одноступенчатого территориального отбора заключается в том, что все семьи из выбранных кварталов (или географических регионов) включаются в выборку. Если отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выборку), такой метод называется двухступенчатым (или многоступенчатым) территориальным отбором” [31, с. 525].

Достоинствами кластерного отбора является простота, оперативность и относительная дешевизна, а также удобство опроса респондентов, которые находятся вместе, а не разбросаны пространственно, а также то, что респонденты изучаются в их естественном окружении, что, конечно, влияет на качество получаемой первичной информации. Однако необходимо следить, чтобы количество групп в генеральной совокупности было достаточно большим, иначе не будет соблюдаться принцип случайности отбора. Также на практике бывает сложно сформировать неоднородные кластеры (например, семьи, живущие в одном квартале, имеют больше схожих признаков, чем различий) и на момент опроса застать всех членов кластера.

Чтобы посредством опроса получить максимально точные данные о какой-либо группе людей, например, о ее поведении и предпочтениях, было бы логично опросить эту группу целиком. Но что, если интересующая нас группа очень велика? Опрос всех потребителей молока в России или всех жителей Южного административного округа Москвы займет много времени и обойдется в астрономическую сумму денег. А нужно ли опрашивать их всех?
О размере выборки и статистической ошибке измерений подробно написано в статье «Выборка. Размер – не главное. Или главное» . В этой статье будет рассмотрено второе требование к выборке, также обеспечивающее качество исследования – репрезентативность.

Согласно теории выборочного метода, неоднократно подтвержденной практикой, опрашивать всех нет необходимости, а можно опросить лишь часть группы, которая может быть в тысячи раз меньше. Эта маленькая часть называется выборкой (или выборочной совокупностью), а большая группа, которую она представляет, называется генеральной совокупностью.

При этом если выборка сформирована правильно, выводы, полученные на основе изучения выборки, могут быть перенесены и на генеральную совокупность. Например, если в выборке женщины значимо чаще, чем мужчины, пользуются дезодорантами, то делается вывод, что и в генеральной совокупности (например, в исследованном городе) присутствует такая закономерность. Процесс переноса выводов с выборки на генеральную совокупность называется генерализацией. А свойство выборки отражать характеристики генеральной совокупности называется репрезентативностью. Для более комфортного запоминания термина на рис.1. приведены иллюстрации, когда выборка отражает свойства генеральной совокупности и когда свойства выборки отличаются от свойств генеральной совокупности.

Рис.1. Иллюстративные примеры соответствия (несоответствия) свойств генеральной совокупности и выборки

Не стоит путать понятие репрезентативности с такими понятиями как валидность и релевантность, хотя они тоже относятся к характеристикам качества исследования. В социальных науках валидность понимается довольно широко, но чаще всего – как обоснованность. Понятие валидности относится не к выборке, а к исследовательской методике. Методика или измерение (анкета, блок вопросов, тест) считается валидным, если фиксирует именно то понятие или свойство, которое планируется измерить. Например, если мы захотим оценить уровень лояльности клиента к магазину и выберем для этого лишь показатель частоты посещения магазина, валидность этого подхода будет неполной: возможно, респондент часто заходит в магазин только из-за банкомата, который там установлен. Валидная методика в данном примере должна включать и другие показатели: предпочтение магазина, суммы покупок в этом и других магазинах, готовность переключиться на другие магазины, готовность рекомендовать магазин и др.

При установлении валидности решающую роль играет обоснование и последующая проверка гипотезы релевантности, то есть соответствия измеряемых параметров характеристикам исследуемого объекта. Житейский пример нерелевантности – измерять уровень счастья человека количеством денег у него (хотя, наверное, не все с этим согласятся). Очевидный пример нерелевантности – попытка измерить массу тела по его температуре.

Но вернемся к понятию репрезентативности. В то время как точность измерений зависит от размера выборки, размер выборки не гарантирует ее репрезентативности. Репрезентативность выборки главным образом обеспечивается способом отбора ее участников (респондентов). Примером явного нарушения репрезентативности может послужить шутка о том, что интернет-опрос показал, что 100% людей пользуется интернетом.

Можно выделить несколько вариантов нарушения репрезентативности выборки: когда опрошены не те люди и когда опрошено слишком много (или мало) определенных людей (например, женщин намного больше, чем мужчин). Кроме того, чем меньше размер выборки, тем меньше вероятность того, что она будет репрезентативной. Например, допустим, 1% населения мог бы заинтересоваться новой услугой. Это 1 из 100 людей. Если размер выборки составляет всего 60 человек, то в вашей выборке может отсутствовать человек, который, скорее всего, будет заинтересован в услуге. Ваша выборка менее репрезентативна, потому что она меньше. Ваши результаты будут разными в зависимости от того, содержит ли ваша выборка одного из этих людей или нет. Пример репрезентативной и нерепрезентативной выборки показан на рис.2.

Рис.2. Пример репрезентативной и нерепрезентативной выборки

На рис.3 показана та же по составу генеральная совокупность, но с другим расположением объектов внутри круга.

Рис.3. Пример репрезентативной и нерепрезентативной выборки при другом расположении объектов генеральной совокупности

Говоря простым языком, репрезентативная выборка – это такая выборка, в которой представлены все подгруппы, важные для исследования. Помимо этого, характер распределения рассматриваемых параметров в выборке должен быть таким же, как в генеральной совокупности.

Простой случайный отбор респондентов представляется оптимальным способом формирования репрезентативной выборки. Поскольку в этом случае у любого представителя генеральной совокупности одинаковая вероятность попасть в выборку, в нее попадут люди с разными характеристиками пропорционально их долям в генеральной совокупности. В итоге выборка будет представлять собой нечто вроде уменьшенной копии генеральной совокупности.

Случайность отбора респондентов в выборку обеспечивается разными способами. Например, для телефонного опроса жителей города берется база данных всех телефонных номеров, и номера респондентов случайным образом выбираются компьютером (с использованием генератора случайных чисел). При уличном опросе интервьюеров распределяют по случайно выбранным точкам и инструктируют опрашивать каждого N-ного прохожего.

Наглядным примером репрезентативной выборки может служить пицца. Если целая пицца – это генеральная совокупность, которую мы хотим изучить, то кусок пиццы – это выборка. Как правило, достаточно одного куска пиццы, чтобы судить обо всей пицце (при условии, что ингредиенты равномерно распределены по ее поверхности). Таким образом, кусок пиццы пиццы на рис.4 – это репрезентативная выборка из пиццы.

Рис.4. Наглядный пример репрезентативной выборки (пицца)

Важно отметить, что не любой кусок пиццы будет репрезентативной выборкой. Разные способы получения куска пиццы могут принципиально повлиять на качество исследования и выводы, которые будут получены при анализе каждого варианта выборки (рис.4)

(рисунок в сушильной камере, готовится к публикации)

Рис.5. Наглядный пример формирования репрезентативной и нерепрезентативной выборки.

Еще один показательный пример формирования репрезентативной выборки – кастрюля, содержимое которой мы должны узнать (допустим, там скрывается борщ). Мы только один раз можем зачерпнуть из кастрюли ложкой (провести исследование). В нашем примере ложка – это выборка, а содержимое кастрюли – генеральная совокупность.

Если мы зачерпнем сверху, то придем к выводу, что в кастрюле бульон. Если снизу – решим, что в кастрюле мясо. Зачерпнув где-то посередине, мы получим картошку или капусту. В любом из трех случаев выводы будут неверны. Чтобы получить достоверный результат, нам стоит хорошенько перемешать содержимое кастрюли, перед тем как пробовать его. Перемешивание в данном случае – аналог процедуры простого случайного отбора, поскольку оно предоставляет всем ингредиентам примерно равную вероятность попадания в ложку-выборку (или тарелку-выборку).

Рис.6. Борщ как модель, демонстрирующая репрезентативность выборки.

В реальности применить простой случайный отбор респондентов не всегда удается в полной мере. Например, мы можем абсолютно корректно отобрать в выборку нужное количество номеров домашних телефонов случайным образом, но при их прозвоне выяснится, что дозвониться и поговорить удается преимущественно с пенсионерами, а «поймать» дома молодежь и работающих людей получается плохо.

Возвращаясь к примеру с борщом, если у нас вместо кастрюли – огромный ресторанный котел, а в руках все та же обычная ложка, перемешивание будет неэффективным. Чтобы решить задачу, потребуются иные подходы. Например, мы можем теоретически разделить глубину котла на несколько слоев и постараться зачерпнуть содержимое из каждого слоя (из случайного места слоя: не только в центре, но и по краям). Таким образом, наша итоговая выборка будет состоять уже из нескольких выборок и при этом адекватно отражать содержимое всех слоев котла. Подобные альтернативные подходы называются типами выборки, которых придумано достаточно много для того, чтобы максимизировать репрезентативность выборки в сложных условиях реального мира.

Последствия нарушения репрезентативности выборки: некорректные выводы исследования, выброшенный на ветер бюджет исследования, финансовые потери вследствие применения неправильных выводов. Вы можете выбрать валидную исследовательскую методику, рассчитать объем выборки, обеспечивающий приемлемую точность измерений, но, если выборка исследования нерепрезентативна, получить достоверную информацию не удастся.

Самым известным примером нарушения репрезентативности выборки является история провала американского журнала «Литературный дайджест».

В 1936 году журнал в очередной раз провел почтовый опрос общественного мнения о вероятных результатах грядущих президентских выборов в США. До 1936 года опрос всегда правильно предсказывал победителя. Опрос 1936 года показал, что победителем с большим отрывом станет кандидат от республиканцев, но в итоге победителем оказался представитель демократов.

Таким образом, гигантская выборка (около 2,4 млн. человек) не обеспечила достоверных результатов. В чем же заключалась причина ошибки?

Называются две основные причины провала: смещение при формировании выборки и смещение вследствие отказа респондентов от участия в опросе.

Прежде всего, журнал включил своих подписчиков в список для рассылки анкет и, желая расширить выборку, использовал два других доступных тогда списка граждан: зарегистрированных автовладельцев и пользователей телефонов. Во времена Великой Депрессии представители этих групп отличались от остального населения более высоким доходом, как и подписчики самого журнала. Таким образом, полученная база для рассылки не являлась корректным отражением структуры населения США.

Вторая проблема с опросом заключалась в том, что из 10 миллионов человек, чьи имена были в первоначальном списке рассылки, только 2,4 миллиона ответили на опрос. Вероятно, высокий процент отказов был связан с тем, что опрос проводился по почте. Уже в те времена американцы относились к почтовым рассылкам как к спаму. Таким образом, размер выборки составил примерно одну четверть от того, что первоначально планировалось. Когда доля ответивших низка (как это было в данном случае), считается, что исследование страдает от необъективности ответов.

У этой истории две морали: Большая, но неправильно сформированная выборка гораздо хуже маленькой, но правильно сформированной выборки. При проведении опроса не упускайте из внимания смещение отбора и смещение в результате отказов.

Пример из военной практики. Во Вторую мировую войну американские военные столкнулись со следующей проблемой. Не все американские бомбардировщики после задания возвращались на базу. На вернувшихся самолетах оставалось множество пробоин от выстрелов противника, но распределены они были неравномерно: больше всего на фюзеляже и прочих частях, меньше в топливной системе и гораздо меньше — в двигателе. Командованию казалось логичным, что в наиболее поврежденных местах нужно установить больше брони.
Привлеченный к решению задачи математик возразил: данные как раз показывают, что самолет, получивший пробоины в этих местах, еще может вернуться на базу. А самолет, которому попали в бензобак или двигатель, выходит из строя и не возвращается. Поэтому укреплять следует те места, которые у вернувшихся самолетов повреждены меньше всего.

Рис .7. Пробоины на вернувшихся самолётах.
Получившие повреждения в других местах не смогли вернуться на базу

Эта задача служит примером нарушения репрезентативности выборки, когда в нее включены не те респонденты: в данном случае, вернувшиеся самолеты, в то время как не вернувшиеся проигнорированы.

Применительно к маркетинговым исследованиям, эта ситуация подобна следующей. При опросе клиентов бизнеса будет ошибкой опрашивать только текущих клиентов и не опрашивать потерянных клиентов (а какие «пробоины» получили они?).

При опросе посетителей ТРЦ важно правильно расставить интервьюеров. Например, если поставить интервьюеров только у главного входа, в выборку не попадут посетители, приехавшие в ТРЦ на автомобиле и попавшие в него через парковку. Как следствие, выводы, полученные на собранных данных, будут корректны только для той части посетителей, которые приходят в ТРЦ пешком, а значит, делают меньше покупок, не покупают габаритные товары, живут ближе к ТРЦ, чем приезжающие на автомобиле.

Другой пример. Бывает, что в разных районах города сбор анкет идет с разной скоростью: где-то (например, в центре города) большой пешеходный поток и у людей есть время на участие в опросе (отдыхающие, в отпуске, офисные сотрудники на обеде), а на окраинах либо мало людей на улицах, либо все спешат на работу и отказываются участвовать. В результате, если не ограничивать доли районов, в выборке будут преобладать люди из центрального района, которые могут значимо отличаться от остальных людей родом занятий, уровнем дохода и образования, уровнем осведомленности о магазинах и др. Таким образом, собранная выборка уже не будет репрезентативной по отношению к населению всего города.

Несмотря на многие положительные стороны онлайн-опросов, такие как экономичность, оперативность сбора информации, удобство ее обработки и т. д., некоторые их особенности напрямую угрожают репрезентативности исследования:

Во-первых, участники онлайн-опросов – это, как правило, активные пользователи интернета, хорошо в нем разбирающиеся и больше подверженные влиянию интернет-культуры, чем обычные люди.

Во-вторых, люди, у которых есть время и желание регулярно участвовать в онлайн-опросах за небольшое вознаграждение, скорее всего, значительно отличаются от остальных людей как по социально-демографическим, так и по психографическим характеристикам.

В-третьих, профессиональное участие в опросах приводит к так называемой профессиональной деформации, когда ответы респондентов на вопросы новых исследований обусловлены предыдущим опытом, но не жизненным, а опытом участия в других опросах.

Таким образом, в данном случае возникает та ситуация, когда опрашиваются не те люди, хотя по формальным характеристикам они подходят под описание целевой аудитории.

Итак, чтобы получить достаточно точные данные об интересующей нас группе людей, необязательно опрашивать их всех, благодаря свойству репрезентативности выборки.

«Чем больше, тем лучше» – неправильный подход к формированию выборки.

Небольшая репрезентативная выборка лучше большой, но нерепрезентативной выборки. Применительно к выборке не стоит пугаться слова «случайная». Это вовсе не значит, что в исследовании будут получены случайные результаты. Напротив, случайный подход к формированию выборки делает ее максимально похожей на генеральную совокупность, а значит, репрезентативной.

При проектировании выборки следует учитывать опасность смещения структуры выборки вследствие особенностей сбора информации и других условий.


ПРОГРАММНЫЕ ТРЕБОВАНИЯ К ВЫБОРКЕ

(Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности. М.: «Добросвет», 1999. С. 111-122)

В подавляющем большинстве случаев социолог использует тот или иной способ выделения из большой совокупности явлений и объектов изучения некоторую их часть в надежде, что на этой выборочной совокупности могут быть выявлены свойства объекта исследования в целом. (В отличие от идеализированного объекта исследования как определенной области социальной реальности, содержащей предмет изучения, здесь имеется в виду эмпирический объект: конкретные индивиды, группы, организации, регионы, локализованные во времени и пространстве).
Тип и способы выборки прямо зависят от целей исследования и его гипотез. Чем конкретнее цель и чем яснее сформулированы гипотезы, тем правильнее будет решен вопрос о выборке.
Наиболее строгие требования предъявляются к выборкам дескриптивных и аналитико-экспериментальных исследований, наименее строгие — к исследованиям по разведывательному плану. В последнем случае отбор «единиц наблюдения» на объекте подчиняется довольно простым правилам: следует выделять полярные группы по существенным для анализа критериям. Численность таких несистематических выборок строго не определяется. Все зависит от состояния получаемой информации. Наблюдение или опрос в таком исследовании продолжаются до тех пор, пока не обнаружится, что получена информация, достаточно разнообразная для формулировки гипотез. Следовательно, состав и объем выборки заранее не фиксируются, а устанавливаются опытным путем по мере развития исследования.
В исследовании дескриптивного плана выборка, напротив, должна быть строго репрезентативной.
Требования репрезентативности выборки означают, что по выделенным параметрам (критериям) состав обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности. Между тем строго репрезентативную выборку по всем важным для проблематики исследования параметрам обеспечить невозможно, и поэтому следует гарантировать репрезентацию по главному направлению анализа данных.
Прежде всего, надо уяснить, какие из имеющихся сведений о характеристиках генеральной совокупности существенны для целей исследования. Во многих случаях это половозрастной, социально-профессиональный, имущественный состав обследуемых, их пространственная локализация. Половозрастная структура «замыкает» на себя многие показатели семейного состояния, уже известные по другим данным. Возраст содержит указания на жизненный опыт и, как правило, на рабочий или профессиональный стаж. Социально-профессиональные, социально-статусные характеристики — это свидетельства о различиях в системе реального положения людей и их особых интересов, позиций. Пространственная локализация (по территории, подразделениям предприятий и учреждений, по другим административным и производственным «локалам») важна и с точки зрения особенностей условий этой деятельности (например, центр и периферия, основные и вспомогательные службы), и с точки зрения адресности итоговых выводов и рекомендаций, которые должны быть «привязаны» к административным или производственным ячейкам, имеющим четкие границы и часто самоуправляемым. В сочетании трех названных параметров — половозрастной структуры, социального состава, пространственной локализации — можно, как правило, быть уверенным, что выборка будет представительна для анализа многих социальных проблем. Понятно, что это правило имеет исключения в зависимости от конкретных условий и особых целей исследования (например, в этнически неоднородной среде существенно иметь в виду репрезентацию по критерию национальной принадлежности).
Мера подобия выборочной модели структуре генеральной совокупности оценивается ошибкой выборки, а пределы допустимой ошибки опять-таки зависят от цели исследования.
Иногда требуется повышенная надежность, как это имеет место в экономических и демографических обследованиях, например при переписях населения. Здесь существенные ошибки оборачиваются миллионными потерями материальных ресурсов и просчетами планирования. 
Примечание. Аккуратная репрезентативная территориальная выборка в современной России требует систематических коррекций. Это связано с тем, что территориальные административные границы (именно они являются основами официальной статистики населения) формировались для целей, не совпадающих с социально-исследовательскими и помимо того состав и структура населения в периоды реформации неустойчивы. Как показывает М. С. Косолапов [Косолапов М.С. Принципы построения многоступенчатой вероятностной выборки для субъектов РФ // Социологические исследования. – 1997. — №10.], достоверные расчеты общенациональной и региональных представительных выборок — сложная исследовательская задача. Экономная выборка предполагает также аккуратные расчеты маршрутов исследователей (интервьюеров и др.), что составляет особую проблему в данном регионе.

Гораздо чаще социологические обследования проводятся для уяснения общих тенденций, общей ориентировки в сфере социальной политики.
Весьма полезна следующая приблизительная оценка надежности результатов выборочного обследования [Экспертные оценки в социологических исследованиях / Ред. Крымский С.Б., Жилин Б.Б., Паниотто В.И. Киев: Наукова думка, 1990. С. 36]. Повышенная надежность допускает ошибку выборки до 3%, обыкновенная — до 3—10% (доверительный интервал распределений на уровне 0,03—0,1), приближенная — от 10 до 20%, ориентировочная — от 20 до 40%, а прикидочная — более 40%.
В аналитических и экспериментальных исследованиях проблема статистической репрезентативности выборки оказывается второстепенной в сравнении с необходимостью обеспечить качественное представительство изучаемых социальных объектов.
В.А. Ядов рассматривает следующий пример. В изучении образа жизни населения некоторого города мы, следуя правилам дескриптивного обследования, хотим обеспечить представительство всех групп населения соответственно их пропорциям в составе генеральной совокупности с отклонением ±5% от истинного распределения. Такая выборка, представительная в качественном отношении, будет также и статистически репрезентативной, но следует решить, нужно ли это.
Напомним, что репрезентативные выборки необходимы лишь в том случае, если целью исследования является получение суммарных данных в отношении изучаемого объекта в целом. В нашем примере — это все население данного города. Тогда в выводах социолог имеет право сообщить, что в среднем горожане так-то оценивают различные условия жизни и деятельности, в среднем такая-то доля населения проявляет высокую активность в таких-то видах деятельности, а такая-то — низкую и т. п. Но с практической точки зрения, не говоря уже о теоретических задачах изучения образа жизни, нам гораздо важнее выявить специфику условий и образа жизни различных групп населения и в том числе тех, которые, будучи малочисленными, нуждаются в специальном внимании.
Допустим, что в составе населения города имеется 370 ветеранов Отечественной войны. Чтобы получить более или менее достоверную информацию об условиях их жизни и их проблемах, надо обеспечить должное численное представительство этой категории граждан в выборочной совокупности. Но поскольку выборка статистически репрезентативна, то при численности на¬селения города, скажем, в 100 тыс. и численности выборочной совокупности в 2 тыс., т. е. при двухпроцентной выборке, доля ветеранов в выборочной совокупности составит 60 человек. Много это или мало? Возможно, этой численности достаточно для того, чтобы сделать статистически достоверные заключения о простейших частных показателях условий их жизни, например об уровне обеспеченности жилищем ветеранов войны, в сравнении со среднестатистическими показателями на всю выборку населения города. Но как только мы захотим углубить анализ, мы обнаружим, что численность подвыборки ветеранов явно мала. К примеру, важно установить, какова доля ветеранов войны, проживающих в отдельной квартире и без семьи, т. е. одиноких. В таком случае придется составить табличку размерностью 2X2 (две градации «проживают с семьей» и «одиночки» + две градации по критерию наличия своей комнаты или квартиры). В каждой клеточке этой таблицы может быть в пределе по 15 единиц наблюдения (60:4=15). Конечно, реальное распределение окажется иным. Так, ветеранов-одиночек, не имеющих собственной комнаты, не будет вовсе. Зато одиночек, проживающих в отдельной квартире, может оказаться, допустим, 5—10 человек. Вместе с тем именно эта категория ветеранов и составляет предмет особого внимания. Однако при численности подвыборки в 10 человек никакой дальнейший статистический анализ уже невозможен.
Следовательно, если мы хотим изучить в статистических показателях особенности условий и образа жизни каких-то определенных групп населения, репрезентативная выборка должна быть заменена целевой, в которой численность каждой интересующей нас группы будет достаточна для более основательного анализа. Такая выборка, будучи качественно представительной в отношении целей исследования, не является статистически репрезентативной в отношении генеральной совокупности.
Во многих случаях необходимы именно целевые выборки. (Иногда целевую выборку называют «социологической», в ней обеспечивается представительство по признакам, выявленным в предыдущих социологических исследованиях, а для реализации таких выборок могут использоваться таксономические процедуры [см. Жабский М.И. Обоснование Репрезентативности социологического исследования // Социологические исследования. – 1982. — №2.; Кочанов Л. Алгоритм построения представительной территориальной выборки при наличии ограничений на стоимость измерений. М.,1992. Т.1 №1.].
Особенно это важно в исследованиях экспери¬ментального плана. Скажем, проверяется эффективность введения новой формы организации труда. Ясно, что для этого следует отобрать подразделения, где введена новая организация, и для сравнения — аналогичные, где работа идет постарому. Следует гарантировать в выборке равную численность экспериментальных подразделений или организаций и «контрольных», работающих по прежней системе. При этом важно так подобрать эти подразделения, чтобы они были аналогичны по всем существенным характеристикам, кроме факта наличия или отсутствия новой формы организации труда. Формы собственности, профессиональный и квалифицированный состав работников, их половозрастная структура и, возможно, другие показатели должны быть сопоставимы. Решающее значение имеет здесь отнюдь не пропорциональность выборочной доли экспериментальных подразделений фирмы или предприятия в отношении к их доле в генеральной совокупности, но именно качественное представительство экспериментальных и контрольных объектов соответственно цели исследования.
Численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы. Но степень однородности социального объекта зависит, в сущности, от того, насколько детально мы намерены его исследовать. Практически любой, самый «элементарный» объект оказывается чрезвычайно сложным. Лишь в анализе мы представляем его как относительно простой, выделяя те или иные его свойства. Чем более основательным и детальным будет анализ, чем больше свойств данного объекта мы намерены принять во внимание в их сочетании, а не изолированно, тем больше должен быть объем выборки.
Для решения такого рода задач как раз и необходимы целевые аналитические выборки. В них учитывается не только структура изучаемой совокупности, но и огра¬ничения, накладываемые на объем выборки целями исследования, глубиной анализа проблем.
Используя статистический критерий Стьюдента, можно рассчитать объем выборок в зависимости от заданного уровня доверительного интервала ошибки вывода [Руковишников В.О., Паниотто В.И., Чурилов Н.Н. Опросы населения. М.: Финансы и статистика, 1984. С. 19—21], Чем меньше объем сравниваемых подвыборок (пусть это будут ветераны-одиночки и семейные), тем больше должно быть различие каждой пары сопоставляемых статистик (например, процентные различия оценок условий быта теми и другими). Если численность сравниваемых подвыборок неодинакова, за базу определения допустимой ошибки следует брать наименьшую подвыборку.
В зависимости от объема подвыборки существен¬ность процентных различий определяется таблицей:

Объем подвыборок по их численности   Значимая разность          Объем подвыборок по их численности     Значимая разность

в % при ошибке                                                                          в % при ошибке

не более 5 %                                                                               не более 5%

50                                           20                                               300                                               8

100                                          14                                                500                                              6,3

150                                          11,5                                             1000                                             4,5

200                                          10                                                5000                                              2

Допустим, что удовлетворительно оценивают условия быта 85% ветеранов-женщин и 79% мужчин, проживающих с семьями, и соответственно 32% женщин и 38% мужчин-одиночек. Разности в процентах составляют здесь: 85—79=6 и 42— 38,4=3,6%. При численности подвыборок до 150 человек и при 5-процентном уровне ошибки эти различия нельзя признать существенными, так как они должны перекрывать 11,5%. Но различия между соответствующими оценками одиночек и семейных будут существенны. Они составят для женщин 85—32= 53% и 79—38=41% для мужчин. Такие различия значимы уже при выборках около 50 человек. Достоверный вывод звучит так: решающей является ситуация проживания ветеранов с семьей или одиноко. В какой мере эти обстоятельства больше переживаются мужчинами или женщинами, сказать трудно; наших данных для этого недостаточно.
Авторы приведенных расчетов отмечают, что выборки на уровне 500 человек позволяют анализировать таблицы сопряженности с 4 признаками из трех градаций каждый, а выборки в 1000 единиц расширяют возможности уверенного анализа до таблиц с 6 признаками из пяти градаций. Все это при условии обеспечения доверительного интервала, не превышающего 5% статистически значимой ошибки.
Общее правило таково: объем выборки при заданном уровне доверительного интервала должен быть не менее чем пК единиц наблюдения, где п — объем подвыборки по столбцу, а К — число столбцов.
Объем выборки зависит также от уровня доверительного интервала допустимой ошибки, каковая, как уже говорилось, задается целесообразной точностью итоговых обобщений: от повышенной до ориентировочной. Однако здесь имеются в виду так называемые случай¬ные ошибки, связанные с природой любых статистичес¬ких погрешностей. Именно они и вычисляются как ошибки репрезентативности вероятностных выборок.
В. И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5-процентной ошибки [Паниотто В.И., Максименко В.С. Количественные методы в социологических исследованиях. Киев: Наукова думка, 1982. С. 81].

Объем генеральной совокупности    500  1000   2000   3000   4000   5000   10000   100000
Объем выборки                                       222   286      333     350      360     370       385          398

Для совокупности более 100000 выборка составляет 400 единиц. Если же иметь в виду генеральные совокупности численностью от 5 тыс. и больше, то, по расчетам того же автора, можно указать величины фактической ошибки выборки в зависимости от ее объема [Паниотто В.И. Качество социологической информации. Киев: Наукова думка, 1986. С. 82], что для нас весьма важно, памятуя, что величина допустимой ошибки зависит от цели исследования и необязательно должна приближаться к 5-процентному уровню.

Объем выборки, если генеральная совокупность > 5000 25    45    100    123    156    204   400    625…
Фактическая ошибка при
данном объеме выборки, % 20    15     10        9         8         7        5         4  

Наряду со случайными возможны ошибки систематического характера. Они зависят от организации выборочного обследования. Это разнообразные смещения выборки в сторону одного из полюсов выборочного параметра.
Объем выборки определяется аналитическими задачами исследования, а ее репрезентативность — целевой установкой программы. Именно программа задает образ необходимой генеральной совокупности для проведения выборки. Будет ли это все население или особые его структурные образования, все элементы изучаемого объекта или только выделяемые по заданным программой критериям.
Генеральную совокупность составляют все единицы определенного в программе объекта. Теперь следует обеспечить равную их вероятность попадания в выборочную совокупность.
При небольших по численности генеральных совокупностях применяют случайную бесповторную выборку, где обеспечивают равную вероятность попадания в исследование всех ее единиц по полному их списку из генеральной совокупности. Имея полный список работников предприятия (например, 2000 человек) и определив объем выборочной совокупности (например, в 2000 человек), устанавливаем шаг выборки делением первого на второе (2000:200) и получаем шаг отбора — каждый 10-й из списка. Здесь важно не допустить систематической ошибки из-за отсутствия в списке, скажем, какого-то подразделения, например работающих в филиале предприятия.
При больших генеральных совокупностях, как это имеет место в опросах населения, используют многоступенчатый отбор по районам, т. е. крупным структурным составляющим генеральной совокупности: регионы, типы поселений, кварталы города. На каждой ступени отбора следует обеспечить требования представительности населения, т. е. обоснованно отобрать регионы так, чтобы не было смещения по какому-то важному параметру (например, по этнонациональному). То же самое и на последующих ступенях отбора. В конечном счете отбор производится опять-таки систематически с установленным шагом отбора по списку граждан (из списков избирателей или иных), списку хозяйств на селе, путем посещения каждой, скажем, 20-й квартиры в списке квартир каждого 50-го дома выделенного квартала города.
Многие обстоятельства усложняют проблему расчета ошибки и нередко могут привести к тому, что формально-статистически репрезентативная выборка окажется качественно непредставительной.
Итак, качество выборки зависит от трех условий: (а) от меры однородности социальных объектов по наиболее существенным для исследования характеристикам; (б) от степени дробности группировок анализа, планируемых по задачам исследования; (в) от целесообразного уровня надежности выводов из предпринимаемого исследования.
Очень часто малоопытный социолог не улавливает разницы между проблемой ошибки репрезентативности выборки и ошибки вывода из данного конкретного распределения в рамках выборочной совокупности.
Пусть выборка, достаточно репрезентативна и ошибка по тому или иному параметру выборки незначительна. Оценка уровня достоверности вывода по каждому конкретному распределению остается при этом проблемой самостоятельного анализа. (Приемы расчета разнообразных ошибок вывода рассматривает К. В. Кемниц, который подчеркивает, что формально-статистические методы расчета ошибок вывода должны предваряться «инженерным» (т. е. содержательным.) изучением распределения [Кемниц Ю.В. Математическая обработка зависимых результатов измерений. М., 1970. С. 4].
Несколько заключительных замечаний. Из сказанного выше может показаться, что обеспечить представительство данных в выборочном обследовании если и удается, то ценой непомерных усилий, разумность затрат которых часто сомнительна. Рекомендуется, во-первых, не отчаиваться и, во-вторых, рассуждать здраво, имея в виду программные цели исследования.
Если перед нами стоит задача выполнить дескрип¬тивное обследование большой общественной значимости, в итоге которого должны быть сделаны заключения относительно генеральной совокупности в целом, следует, конечно, максимально реализовать все требования репрезентативной выборочной процедуры. Затраченные усилия будут не только оправданны, они просто необходимы, так как ошибки в выводах такого исследования недопустимы. Здесь ложная информация опаснее ее отсутствия (достаточно сослаться на ошибки прогнозов исхода выборов вследствие ошибок выборки опросов электората или ошибки в исследованиях рынка).
Если же задачи исследования более скромные, уровень надежности планируемых выводов с точки зрения их статистической точности можно смело понизить, но надо принять все меры к.качественному представительству выборочной совокупности. Преувеличенное внимание к формально-статистическим критериям достоверности выводов (и тем более их абсолютизация) за счет качества исходной информации и качества анализа — свидетельство профессиональной неопытности социолога. Подчеркивая статистическую надежность данных, он вводит в заблуждение и себя, и, хуже того, тех, кто привык верить в убедительность математических расчетов. Нельзя забывать о реальной природе того, что кроется за цифрами и математическими формулами. Ведь сами исходные характеристики, получаемые иссле¬дователем путем опросов или другими способами, лишь условно переводятся в количественные показатели. Час¬то эти количественные сведения весьма приблизительно отражают существо социальных процессов. Поэтому усилия, направленные на строгость статистического обо¬снования результатов, приобретают смысл только при условии серьезного качественного анализа проблемы, со¬держательного ее изучения. Бывает и так, что непредставительные в статистическом смысле данные, многократно повторяемые на разных подвыборках, как раз свидетельствуют об определенной социальной тенденции лучше, чем статистически достоверный вывод, сделанный на одной единственной выборке.
Следует постоянно помнить, что социолог призван сосредоточить внимание именно на существе социальных проблем, активно привлекать к постановке задач исследования других специалистов, практиков и теоретиков, внимательно следить за литературой по широкому кругу вопросов, относящихся к предмету исследования. Наконец, для решения собственно статистических задач, касающихся типа и объема выборки, он прежде всего обязан максимально четко сформулировать конкретные вопросы, подлежащие решению, и уже после этого обращаться к соответствующим расчетам разнообразных статистик.

Лекция № 16. ОСНОВНЫЕ ПРИЁМЫ СОЦИОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ

16.1. Формирование социологической выборки. Типы выборок
16.2. Принципы социологических измерений
16.3. Приемы сбора эмпирической информации
16.4. Методы обработки социологической информации

16.1. Формирование социологической выборки. Типы выборок

Организация социологического исследования — сложный и многоплановый процесс. Рассмотрим его основные составляющие.
Весь изучаемый социальный массив социологи называют генеральной совокупностью, конечно, для исследования берется какая-то часть, точно так же, как при анализе крови берется одна капля.
Выборка — это метод исследования, когда из общей изучаемой (генеральной) совокупности однородных единиц отбирается некоторая его часть (выборочная совокупность), и только эта часть подвергается обследованию.
Социолог выделяет некую часть генеральной совокупности в надежде, что сумеет выявить и доказать свойства всего объекта исследования в целом. Тип и способ выборки зависят от целей исследования и его гипотез: чем конкретней цель и яснее сформулированы гипотезы, тем правильней будет решен вопрос о выборке. Первое выборочное исследование в России было проведено в 1884 г. — обследование крестьянских хозяйств Воронежской губернии. После 1917 г. они стали ежегодными.
Генеральная и выборочная совокупности должны сопоставляться по некоторым важным признакам, которые легко проверяются статистическими методами. Если они совпадают, то выборка называется представительной, или репрезентативной. Понятно и то, что чем больше размер выборки, тем больше и достоверность. Прежде всего, надо уяснить, какие из имеющихся сведений о характеристике генеральной совокупности, объекте исследования существенны для целей исследования. Во многих случаях это половозрастной, социально-профессиональный, имущественный состав обследуемых, их пространственная локализация. Пол и возраст замыкают на себе многие показатели семейного состояния: возраст, к примеру, указывает на жизненный опыт, профессиональный стаж. Пространственная локализация (по территории, по месту работы) важна с точки зрения адресности выводов и рекомендаций, которые должны быть привязаны к административным или производственным показателям. При сочетании этих трех параметров: половозрастной структуры, социального состава и пространственной локализации — можно быть уверенным, что выборка будет представительной для изучения многих социальных проблем. Понятно, что это правило имеет исключения в зависимости от конкретных условий и особых целей исследования. Например, при изучении политических ориентаций населения уже не обойтись без учета имущественного положения, а студенческих проблем — без знания вуза и курса обучения студентов.
Иногда требуется повышенная надежность, например в экономических и демографических исследованиях, при переписях населения. Здесь даже несущественные отклонения в конечном счете могут давать большие ошибки. Отклонение выборки от известных показателей генеральной совокупности считается в процентах. Повышенная надежность (репрезентативность) выборки допускает ошибку до 3%, обыкновенная — от 3 до 10 процентов, приближенная — от 10 до 20%, ориентировочная — от 20 до 40% и прикидочная — более 40%.
При этом следует иметь в виду, что при изучении определенной группы населения, например ветеранов, репрезентативная выборка заменяется целевой. Она, будучи представительной в отношении цели исследования, может и не быть репрезентативной ко всей генеральной совокупности, например население города.
Существуют специальные формулы для определения размера выборки. В их основе: заданная точность исследования, разброс признака и допустимая ошибка репрезентативности. Но это для специального исследования. Начинающие социологи делают проще: берут вопрос, возможные варианты ответа, умножают на десять, прибавляют на ремонт выборки и получают минимальное число возможной выборки: больше — можно, меньше — нельзя. Простой обсчет, двухмерное распределение, трехмерное распределение. По каждому интересующему нас варианту ответа, группе людей должно быть не меньше 10 ответов. Если меньше, то говорить о точности не приходится.
Объем выборки определяется аналитическими задачами исследования, а ее репрезентативность — целевой установкой программы исследования. Именно программа задает образ необходимой генеральной совокупности для формирования выборки: будет ли это все население страны, региона, города или его отдельные группы.
Очень важно при формировании выборки обеспечить равномерный отбор из всей генеральной совокупности. При небольших по численности генеральных совокупностях применяют случайные выборки. Их можно использовать, когда известны основные параметры генеральной совокупности.
Случайная систематическая выборка — отбор идет через определенные интервалы, например, по спискам студентов, клиентов банка, избирателей и т.п. Имея список работников предприятия и определив объем необходимой выборки, можно установить шаг выборки, например каждый десятый или сотый из списка.
Серийная или гнездовая выборка реализуется в том случае, если есть внутренняя структура объекта. На предприятии выбираются не все подразделения, а наиболее типичные, например в области — отдельные города и районы, но опять же типичные; в городе это могут быть отдельные микрорайоны.
Целевой называется выборка, в которой идет выделение на основе каких-либо признаков, например по полу, национальности, имущественному положению, принадлежности к политическим партиям и т. п.
Целенаправленная квотная выборка предполагает пропорциональный отбор на основании статистики распределения среди генеральной совокупности заданных сочетаний паспортных данных респондентов — квот. В социологии также используется выборка как метод основного массива — опрос всех присутствующих (или 60-70% всей численности). Посредством этого метода, например, осуществляется «зондаж» общественного мнения.
Выборки бывают одно- и многоступенчатыми, комбинированными. На каждой ступени отбора следует обеспечить требование представительности. Например, при опросе населения города на первом этапе отбираются типичные микрорайоны, а затем опрашиваются жители каждой двадцатой или пятидесятой квартиры дома. При опросе населения области на первой ступени выбираются типичные районы и города. Примером стихийной выборки могут быть опросы по почте, интервью встречных, прохожих, пассажиров. Здесь может применяться квотный принцип, когда в конкретном здании необходимо опросить определенное количество человек по некоторым признакам, к примеру, по полу, возрасту.

16.2. Принципы социологических измерений

Социолог имеет дело с массовыми процессами, по необходимости он оперирует различными числовыми показателями, выражающими частоты, протяженность и напряженность связей между различными социальными характеристиками. Поэтому в основе работы социолога при изучении социальных процессов — первичное измерение качественных признаков, или их квантификация. Любое социологическое измерение начинается с поиска простейших качественных признаков, отношения между которыми можно выразить в числовом масштабе.
Измерение — это процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном. Получается числовое выражение в определенном масштабе или шкале. Социальные измерения иногда называют квазиметрическими, то есть условно количественными аналогами качественных социальных отношений. Такую тонкую материю, как отношение, например, к выполняемой работе, социолог выражает с помощью цифровых показателей. В принципе, можно измерить практически любые свойства социальных объектов, качественные и количественные. Количественные: возраст — число исполнившихся лет, заработок — денежные единицы, образование — число лет обучения и т. п. Качественные характеристики (социальная принадлежность, мнение людей, отношение к работе, оценка качества жизни и т. п.) не имеют установленных эталонов измерения. Социологу приходится их конструировать. Такие измерительные процедуры являются своего рода изобретениями.

* В первом приближении способы измерения в социологии делятся на две группы:
o Приемы, с помощью которых измеряются количественные признаки объектов с точки зрения их физического пребывания в пространстве и во времени (удаленность проживания от столицы, культурного центра, места работы). Частота событий, частота публикаций, величина временных интервалов в использовании свободного и рабочего времени также характеризуют социальные процессы с количественной стороны.
o Измерения, относящиеся к социальным объектам, для которых не существует общепринятых шкал. Но даже самые сложные социальные явления могут быть квантифицированы со стороны их протяженности, интенсивности, повторяемости. Многое зависит от умения социолога найти или изобрести надежную и убедительную измерительную процедуру.

Нахождение эталона измерения, как правило, осуществляется в три этапа, стадии:
1. Качественная классификация объекта исследования. Например, изучая ценностные ориентации личности, мы, прежде всего, должны классифицировать типы ориентации личности исходя из теоретической концепции и задач исследования. Можно положить в основу классификации иерархию потребностей или интересов, сфер деятельности, социальные функции, социальные ситуации, которые различались бы по степени свободы выбора целей и средств деятельности. Рассмотрим с этой точки зрения ценностную ориентацию на материальный достаток или культурные ценности.

* Их можно классифицировать как:
o сильная — средняя — слабая;
o устойчивая — малоустойчивая — неустойчивая;
o господствующая — рядоположенная — подавленная;
o центральная или периферийная.
Можно поискать и другие варианты.

2. Поиск эмпирических индикаторов или внешних признаков тех свойств объекта, которые поддаются расположению в континуум. Индикатор — внешне хорошо различимый показатель изменяемости признака. Например, высота ртутного столбика термометрa — индикатор температуры.
В социологии простейшим индикатором является расположение измеряемых показателей в предложенном списке (ранговое место). Допустим, измерению подлежат интересы к различным видам занятий в свободное время. Предлагаются три одинаковых списка возможных занятий, в каждом по 18 наименований (чтение художественной литературы, театр, прием гостей, встреча с друзьями, спорт, игра в карты и т. д.). В первой ситуации (широкий диапазон выбора) изучаемый имеет право без ограничения указать любые виды занятий, которые ему нравятся. Во второй ситуации (средний диапазон выбора) ему предложено оставить или выбрать шесть наиболее важных для него занятий, в третьем случае (узкий диапазон) — не более трех.
Индикатор сильной ориентации человека — выбор какого-то занятия имел место во всех трех ситуациях; средней ориентации — выбор в первой и второй ситуациях, слабый — выбор имел место только при широком диапазоне принятия решения.
Одно и то же социальное свойство, качество, признак могут фиксироваться с помощью нескольких индикаторов, которые затем сводятся в общий показатель-индекс.
3. Проверка работы индикатора применительно ко всей изучаемой выборке, совокупности. К примеру, если социологи изучают отношение людей к труду, то измерить его только через выполнение норм выработки или соблюдения трудовой дисциплины не представляется возможным. Труд людей творческой профессии вряд ли можно измерить такими показателями.
В результате всех указанных процедур устанавливается эталон или шкала измерения.
Следующая очень важная работа — проверка процедуры первичного измерения на надежность. Такие операции используются на стадии отработки инструмента измерения в пилотажных исследованиях. Для этого существуют довольно сложные специальные процедуры.

* Точность и правильность измерения зависят от:
o степени устойчивости измеряемого объекта или свойства;
o чувствительности эталона измерения (дробности шкалы);
o отсутствия систематических ошибок измерения;
o устойчивости измеряемого признака.

Дробность шкалы, ее чувствительность прямо связаны с «точностью измерения. Шкала в 10 делений точнее, чем шкала в три или пять делений. Известно, что в вузе используется четырехбалльная система оценки знаний. Все понимают, что преподаватель часто колеблется между пятеркой и четверкой, между двойкой и тройкой, есть даже такое выражение «туберкулезная троечка». Конечно, лучше бы пользоваться десятибалльной системой оценки знаний Но дробность пунктов шкалы нельзя увеличивать бесконечно. Надо установить оптиум, удовлетворяющий двум требованиям: минимум градаций шкалы при высокой устойчивости результатов измерения. Постепенно повышая дробность эталона измерения, можно найти границу, за которой точность измерения уже не меняется.
В общенациональном тестировании школьников применяется двадцатибалльная шкала. Из 1800 человек, которые проходили тестирование в Тюменском университете, 20 баллов набрал только один школьник.
При проверке шкалы может обнаружиться, что какие-то ее пункты не работают, например, ответы концентрируются или в позитивном, или в негативном полюсе шкалы. Конечно, это может быть и результатом единодушия ответов, но может быть и результатом неверно сформулированного вопроса. Допустим, задан вопрос о частоте употребления алкоголя и крайний вариант ответа гласит: «Я пью систематически и обычно до бесчувственного состояния». Сомнительно, чтобы даже заведомый алкоголик отметил такой пункт. Крайне отрицательный вариант шкалы здесь не работает.
В современной социологии отработано достаточно большое количество шкал, которые могут быть упорядочены по мере повышения их способности удовлетворять требованиям более многообразных операций с числами.
Номинальная шкала — основа всех шкальных процедур. Она устанавливает отношения равенства между явлениями, которые включены в один класс.

* Пример номинальной шкалы:
1. Рабочие ручного труда, не требующего специальной подготовки.
2. Рабочие ручного труда высокой квалификации.
3. Рабочие механизированного труда средней квалификации
4. Рабочие механизированного труда высокой квалификации.
5. Рабочие автоматизированного труда.
6. Рабочие, занятые наладкой автоматизированного оборудования.

В этой шкале каждому из пунктов дается детальная эмпирическая интерпретация. Рабочие перечислены по мере роста их квалификации.

* Операции с числами для номинальной шкалы следующие:
o Нахождение частот распределения по пунктам шкалы в единицах или процентах от общего количества.
o Поиск средней тенденции по модальной частоте. Модальной называют группу с наибольшей численностью в данном измерении. Упорядоченная номинальная шкала чаще всего используется при опросах общественного мнения. Пример такой шкалы:
+ «вполне согласен»,
+ «пожалуй, согласен»,
+ «затрудняюсь ответить»,
+ «пожалуй, не согласен»,
+ «не согласен»,
+ «совершенно не согласен».

Весьма часто употребляемые разновидности шкал этого типа — ранговые. Они предполагают полное упорядочение каких-либо объектов или свойств от наиболее к наименее важному, значимому, предпочитаемому. Можно ранжировать относительную важность тех или иных методов решения крупных экономических, политических или социальных проблем, предпочтительное использование свободного времени. Задание на ранжирование формулируется примерно так: «Из перечисленных ниже суждений выберите самое для вас предпочтительное, затем — наименее предпочтительное, а остальные расположите от первого до последнего». То есть респондент указывает ранги предложенных вариантов. Полезно не забывать, что численность объектов для ранжирования не должна быть большой — до 10. В противном случае результаты ранжирования будут неустойчивыми.
Применение количественных методов и использование статистики социальных явлений возводит социологию в ранг строгой науки. Создается впечатление математической точности выводов. Между тем квантификация сложных социальных реалий накладывает немало ограничений на собственно математические операции с их измерениями. Математик работает с простыми однозначными абстракциями, в основе которых суждение «есть — нет». Социолог обязан помнить, что в действительности скрывается за величинами, которыми он оперирует. Главное состоит в том, что количественный анализ не самоцель, а лишь средство качественного анализа.

16.3. Приемы сбора эмпирической информации

* Наблюдение как метод сбора социологической информации
* Документальные источники
* Анкетные опросы и интервью

Имеются три принципиальных класса методов сбора первичных эмпирических данных: прямое наблюдение, анализ документов и опросы. Техника их применения столь многообразна, что некоторые модификации приобретают статус самостоятельных методов, например интервью или анкетный опрос.
Наблюдение как метод сбора социологической информации

Непосредственное наблюдение за поведением людей в определенной ситуации и сразу фиксация результатов.
От обыденного научное наблюдение отличается тем, что оно подчинено ясной исследовательской задаче, планируется по заранее обдуманной процедуре, данные фиксируются в протоколах или дневниках по определенной системе, информация, полученная путем наблюдения, должна поддаваться контролю на обоснованность и устойчивость.
По степени формализованности выделяют неконтролируемое или нестандартное и контролируемое наблюдения. В первом варианте исследователь пользуется общим принципиальным планом, во втором события регистрируются по детально разработанной процедуре. В этом случае есть бланк для наблюдения, который заполняется наблюдателем, используются также кино- и фотодокументы. Например, наблюдение за участниками в ходе деловой игры, совещания, лекции, митинга и т. п.
Нужна серия наблюдений и разными наблюдателями. Тогда результаты получаются достаточно достоверными.
Наблюдение бывает включенным и невключенным. При этом важно, чтобы наблюдатель своим присутствием не вносил флуктуации в деятельность коллектива, не проявлял внешне повышенного интереса, больше слушал и запоминал, не принимал чьей-либо стороны, не записывал свои наблюдения на виду.
Преимущества включенных наблюдений очевидны: они дают наиболее яркие непосредственные наблюдения, помогают лучше понять поступки людей. Но с этим же связаны и основные недостатки такого способа. Исследователь может потерять способность объективно оценивать ситуацию, слишком вживаться в роль соучастника событий. Как правило, итогом включенного наблюдения является социологическое эссе, а не строгий научный отчет.
Имеется и нравственная проблема включенного наблюдения: насколько вообще этична маскировка под рядового участника?
Если наблюдение проводится вне научного учреждения, то оно называется полевым. Могут быть и лабораторные наблюдения, когда людей приглашают для беседы, деловой игры. Наблюдения могут быть одномоментными, систематическими.
Прежде чем начать наблюдение, необходимо определить объект, сформулировать проблемы, поставить исследовательские задачи, подготовить инструментарий, способы описания результатов. Наблюдение — незаменимый источник социологической информации на стадии общей разведки.
Как самостоятельный способ наблюдение — основа для исследования митингов, демонстраций. Более распространено его применение в качестве дополнения к другим источникам получения информации. Так, включенное наблюдение в сочетании с последующими массовыми обследованиями позволяет дополнить сухой, но репрезентативный материал более живыми сведениями, своего рода «картинками».

Документальные источники

Документальной в социологии называют любую информацию, фиксированную в печатном или рукописном тексте, на магнитной ленте, на фото-, кино-, видеопленке. В этом смысле значение термина отличается от общеупотребительного: обычно документом называются лишь официальные материалы.
Из истории социологии известны примеры, когда документальные источники были главным способом получения нужной для исследования информации. Ф. Энгельс написал свою книгу о положении рабочего класса в Англии, используя официальные документы парламентских комиссий, наблюдение условий жизни и быта рабочих. В.И. Ленин в работе «Развитие капитализма в России» использовал данные статистики.
В истории социологии широко известен факт, когда основой исследования послужили личные документы. В начале XX в. американский социолог У. Томас и польский социолог Ф. Званецкий предприняли кропотливое изучение с тем, чтобы описать положение польских эмигрантов в Европе и Америке. В числе использованных документов были переписка крестьян-эмигрантов с родными, оставшимися в Польше, архивы эмигрантских газет, материалы церковно-приходских общин, землячеств, благотворительных обществ, судебные материалы и, наконец, уникальная автобиография одного из крестьян объемом в 300 страниц, написанная по просьбе исследователей.
Документы бывают целевыми, подготовленными специально для данного исследования.
По степени персонификации документы делятся на личные и безличные.
К личным относятся карточки индивидуального учета (например, библиотечные формуляры, анкеты, бланки, личные дела, заявления в загсе, дневники, мемуары, материалы поименного голосования в представительных органах власти).
Безличные документы — это статистические или событийные архивы, пресса, протоколы и т. п.
В зависимости от статуса документального источника выделяются документы официальные и неофициальные. К первым относятся правительственные материалы, постановления, заявления, стенограммы официальных заседаний, данные государственной и ведомственной статистики, деловая корреспонденция, финансовая отчетность и т. п.
Особую группу документов образуют материалы средств массовой информации.
Наконец, по источнику информации документы разделяют на первичные и вторичные. Первичные составляются на базе прямого наблюдения или опроса. Вторичные представляют собой уже некоторое обобщение, обработку или описание, сделанное на основе первичных документов.
Здесь возникает проблема достоверности информации. Первое золотое правило в работе с документами — четко различать описание самого события и его оценку, а также личные интересы автора документа.
Основная трудность при работе с документом — умение читать его данные на языке гипотез исследования, т. к. документ был составлен вовсе не для того, чтобы проверить гипотезы социолога. Поэтому в документах приходится выделять индикаторы (признаки) ключевых понятий исследования. Качественный анализ — необходимое условие для всех последующих количественных операций. Квантификация текстового материала получила весьма широкое распространение в 40-е гг., для нее была разработана специальная процедура контент-анализа.
Контент-анализ — это перевод в количественные показатели массовой текстовой информации с последующей ее статистической обработкой. Автором широко использован метод контент-анализа в книге «Новый город». Частота цитирования того или иного ученого — показатель его научного авторитета. Частота упоминания общественного деятеля или общественно-политического движения свидетельствует об их авторитете.
Можно использовать конкурсы сочинений, биографий, объявляемые через СМИ. Итоги анализа таких документов публикуются в виде полусоциологических очерков и часто ставят серьезные общественные проблемы.

Анкетные опросы и интервью

Опросы — незаменимый прием получения информации, является почти универсальным методом.
Искусство использования этого метода состоит в том, чтобы знать, о чем именно спрашивать, как спрашивать, какие задавать вопросы и, наконец, убедиться в том, что можно верить полученным ответам. Существуют два приема опросных методов: интервью и анкетные опросы.
Интервью — проводимая по определенному плану беседа, предполагающая прямой контакт интервьюера с респондентом, причем запись ответов производится интервьюером или его ассистентом, возможно, на пленку.
Имеется множество разновидностей интервью. По технике проведения различаются свободные, фокусированные и формализованные интервью.

* Свободные интервью — это продолжительные беседы с респондентом без строгой детализации вопросов.
* Формализованное (стандартизированное) интервью предполагает детальную разработку всей процедуры, включая общий план беседы, определенную последовательность и конструкцию вопросов, варианты возможных ответов.
* Фокусированное (клиническое) интервью — выявление относительно узкого круга реакций опрашиваемого. С помощью такого интервью можно изучать реакцию людей на сообщения СМИ, рекламу. Причем информацию предварительно обрабатывают с помощью контент-анализа. В фокусированном интервью стремятся определить, какие смысловые единицы текста, сообщения оказались в центре внимания опрошенных, какие — на периферии и что совсем не осталось в памяти.

Следует выделить ненаправленные интервью, в которых инициатива может принадлежать респонденту — интервью как бы помогает ему излить душу.
При проведении интервью многое зависит от подготовки, опыта самого интервьюера. Мужчины предпочитают опрашивать мужчин. Отрицательно сказывается большая разница в возрасте между респондентом и интервьюером. Как заметили новосибирские социологи, интервьюирование на дому имеет свой минус: воспринимая социолога как гостя, хозяева из вежливости стараются говорить только приятное.
По способу организации можно отметить индивидуальные и групповые интервью. Это планируемая беседа, в процессе которой исследователь стремится вызвать дискуссию в группе, к примеру методика телевизионных встреч В. Познера.
Сравнительно недавно и главным образом в избирательных технологиях начали использовать технику фокус-группы. По сути, интервьюер здесь выступает инициатором и ведущим дискуссии по заданной проблеме (личные качества потенциальных кандидатов, программы политических партий и т.п.). Телефонные интервью применяют для оперативного зондажа общественного мнения. При этом круг опрашиваемых может использоваться многократно.
Анкетный опрос предполагает жестко фиксированный порядок, содержание и форму ответов, причем они регистрируются респондентом либо наедине с самим собой (заочный опрос), либо в присутствии интервьюера (прямой опрос).
Анкетные опросы классифицируются по содержанию и конструкции задаваемых вопросов.

* Различают:
o открытые опросы, когда респонденты высказываются в свободной форме;
o закрытые опросы, когда в опросном листе (анкете) все варианты ответов заранее предусмотрены;
o полузакрытые анкеты комбинируют обе процедуры.

Листы всенародных референдумов — это закрытый вариант анкеты.
Анкетные опросы по почте отличаются от анкетирования на месте: в первом варианте ожидается возвращение анкеты по заранее оплаченному почтовому отправлению, во втором социолог сам собирает заполненные анкеты. Почтовый опрос в 10-20 раз дешевле. Правда, возврат анкет небольшой, поэтому иногда предпринимают уведомление по почте или по телефону.
Особая разновидность оперативных опросов — радиотелевизионные с прямой телефонной линией, допускающей и немедленную компьютерную обработку данных. Очень хорошо можно использовать при выяснении рейтинга кандидатов в депутаты.
Групповое анкетирование отличается от индивидуального. Анкетируют сразу до 30-40 человек: анкетер собирает опрашиваемых, инструктирует и оставляет для заполнения анкеты. Организация раздаточного анкетирования, включая опросы по месту жительства, более трудоемка, чем, например опросы по почте или через газету. Но газетные опросы вряд ли могут считаться репрезентативными, они возможны на стадии пилотажного исследования, нащупывания социальных проблем.
При проведении опросов не надо забывать, что анкета выявляет субъективные оценки, которые подвержены колебаниям, например, предвыборные симпатии избирателей. Поэтому при любой разновидности социологического исследования нельзя растягивать опрос во времени, так как к концу опроса оценки опрашиваемых могут сильно измениться под влиянием внешних факторов, обстоятельств.
Таким образом, опрос можно проводить в устной форме — интервью и в письменной форме — анкетирование. Но смысл одинаков: получить ответы респондентов на определенные, заранее сформулированные вопросы. Причем каждый вопрос анкеты надо рассматривать как специфический измерительный инструмент для фиксации определенной информации.
Существуют вопросы о фактах; вопросы о знаниях; вопросы о мнениях; установках, мотивах; вопросы контактные: «Пожалуйста, расскажите нам о себе»; вопросы-фильтры, например, при опросе на семейно-бытовые темы можно ввести в виде фильтров вопрос о семейном положении, о количестве детей в семье и т. п.; вопросы-ловушки, например, среди вариантов ответа могут быть предложены для оценки несуществующая книга, писатель, фильм, общественный деятель или движение либо: «Удовлетворены ли Вы выбранной профессией?», и через какой-то промежуток: «Хотели бы Вы, чтобы Ваши дети выбрали Вашу профессию?». В студенческом варианте: «Довольны ли Вы избранной профессией?» и «Желаете ли Вы перейти на другой факультет?».
Выделяют также вопросы-шкалы, вопросы-меню, вопросы-диалоги, вопросы-иллюстрации, вопросы-тесты, вопросы-индексы, когда на основе ответов делают следующий вывод: например, об уровне информированности.
Особое место в социологической анкете занимает паспортичка. Ее составить тоже довольно трудно, поэтому лучше всего пользоваться уже отработанными вариантами паспортичек.
Основные требования к составлению анкет: вопросы должны быть понятны для опрашиваемых, учитывать их уровень; просты и ясны. Затем вопросы не должны нести значительных эмоциональных нагрузок, формулироваться нейтрально, не выдавать установок исследователя. Правильная формулировка вопроса предполагает нейтральную интонацию.
В закрытых вопросах все возможные варианты ответа должны быть перечислены. Можно разбить варианты ответа на смысловые блоки. Не следует утомлять опрашиваемых, затраты времени на заполнение анкеты должны составлять не более 30 мин.

* Обычная последовательность построения анкеты такова:
o Введение, в котором указано, какая организация проводит опрос и для чего. Как правило, подчеркивается анонимность ответов. Не стоит начинать анкету с паспортички, так как это настораживает людей. Всю демографическую информацию лучше относить в конец анкеты.
o Вступительные вопросы, которые должны заинтересовать респондента и максимально облегчить ему включение в работу. В начале анкеты не должны ставиться трудные или беспокоящие респондента вопросы.
o Для оживления текста можно использовать шутливые рисунки, стрелки, циферблат, знак «стоп», фотографии узнаваемых лиц и т. п.

Формы проведения опроса — групповая, индивидуальная. Раздаточные анкеты, почтовые, прессовые, анонимные и не анонимные. Не все допустимо и в анонимных опросах. Хороший пример бестактности социолога приведен в книге финского писателя Марти Ларни «Четвертый позвонок».
Комичный случай имел место во Франции, когда в ответе на вопрос: «Какова смертность в вашей деревне?» — один юморист ответил: «В нашей деревне рано или поздно умирает каждый».

17.4. Методы обработки социологической информации

Анализ собранной социологической информации — самый увлекательный этап исследования. Здесь проверяются выдвинутые гипотезы, выявляются новые проблемы, а иногда ждет и разочарование.
Для начала группировка и классификация — элементарные процедуры упорядочения собранной информации.
Простая группировка — это классификация или упорядочение данных по одному признаку. Так, в зависимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, образованию или по высказанному суждению. Число членов выделенной группы называют долей или относительной частотой. Здесь сразу можно применить такие статистические приемы обработки информации, как вычисление медианы, среднеарифметических показателей, исчисление частот по процентам.
Перекрестная группировка — это связывание данных, предварительно упорядоченных по двум признакам в таблицах. Например, возраст мужа и возраст жены в семейных парах или отношение к проводимым в стране экономическим реформам в зависимости от возраста, материального положения. Основная задача перекрестной группировки — поиск устойчивых связей изучаемых объектов, например типичных соотношений возраста семейных пар. Выясняется, что мужья в большинстве случаев старше своих жен. Но в новых городах Севера, где довольно специфичен демографический состав населения, достаточно много семейных пар, где жена старше своего мужа.
Такая группировка в некоторых случаях уже является достаточной для основательного отчета по результатам исследования.
Далее возможны эмпирическая типологизация, поиск устойчивых сочетаний свойств социальных объектов не по одному или двум, а в нескольких измерениях одновременно. К примеру, в семейных парах возраст супругов анализируется в зависимости от национальности, места жительства, характера труда и т.п. Задачи многомерной эмпирической типологизации решают с помощью математических процедур распознавания образов — таксономии. В эмпирическом материале для таксономического анализа выделяются группы — таксоны, например по семейному положению, и затем анализируется их миграционное поведение по характеру миграционных потоков, в зависимости от численности поселенческих образований (крупных, средних и малых городов, сел).
В многомерной эмпирической классификации используется прием кластерного анализа. Например, конфигурация депутатских групп в органах представительной власти, позволяющая прогнозировать их поведение.
В специальной литературе рассматриваются более сложные приемы анализа информации: критерий Юла, метод корреляционного графа, факторный анализ, всевозможные коэффициенты, например Пирсона.
Как правило, социологи используют стандартные компьютерные программы обработки социологической информации, пригодные для выдачи простых распределений, процентов, отклонений, ранговых и парных коэффициентов корреляции, энтропии, регрессионных показателей, различного рода индексов и т. п.
В зависимости от программных целей исследования анализ полученных данных может быть более или менее глубоким и основательным. В зависимости от целей исследования можно остановиться на определенном этапе анализа информации.
Разумеется, в нашей лекции даны лишь общие подходы, которые позволяют получить представление о методологии, методике и организации социологических исследований. Этих знаний может быть достаточно для проведения простых исследований. Всему остальному надо учиться, в том числе и используя рекомендованную в курсе специальную литературу.

Основные приёмы социологического исследования

ОСНОВНЫЕ
ПРИЁМЫ СОЦИОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ

1.
Формирование социологической выборки. Типы выборок

Организация социологического
исследования — сложный и многоплановый процесс. Рассмотрим основные его
составляющие.

Весь изучаемый социальный
массив социологи называют генеральной совокупностью, конечно, для исследования
берется какая-то часть, точно так же, как при анализе крови берется одна капля.

Выборка — это метод исследования,
когда из общей изучаемой (генеральной) совокупности однородных единиц
отбирается некоторая его часть (выборочная совокупность), и только эта часть
подвергается обследованию.

Социолог выделяет некую часть
генеральной совокупности в надежде, что сумеет выявить и доказать свойства
всего объекта исследования в целом. Тип и способ выборки зависят от целей
исследования и его гипотез: чем конкретней цель и яснее сформулированы
гипотезы, тем правильней будет решен вопрос о выборке. Первое выборочное исследование
в России было проведено в 1884 г. — обследование крестьянских хозяйств
Воронежской губернии. После 1917 г. они стали ежегодными.

Генеральная и выборочная
совокупности должны сопоставляться по некоторым важным признакам, которые легко
проверяются статистическими методами. Если они совпадают, то выборка называется
представительной, или репрезентативной. Понятно и то, что, чем больше размер
выборки, тем больше и достоверность. Прежде всего, надо уяснить, какие из
имеющихся сведений о характеристике генеральной совокупности, объекте
исследования существенны для целей исследования. Во многих случаях это
половозрастной, социально-профессиональный, имущественный состав обследуемых,
их пространственная локализация. Пол и возраст замыкают на себе многие показатели
семейного состояния: возраст, к примеру, указывает на жизненный опыт,
профессиональный стаж. Пространственная локализация (по территории, по месту
работы) важна с точки зрения адресности выводов и рекомендаций, которые должны
быть привязаны к административным или производственным показателям. При
сочетании этих трех параметров: половозрастной структуры, социального состава и
пространственной локализации — можно быть уверенным, что выборка будет
представительной для изучения многих социальных проблем. Понятно, что это
правило имеет исключения в зависимости от конкретных условий и особых целей
исследования. Например, при изучении политических ориентации населения уже не
обойтись без учета имущественного положения, а студенческих проблем — без
знания вуза и курса обучения студентов.

Иногда требуется повышенная
надежность, например, в экономических и демографических исследованиях, при
переписях населения. Здесь даже несущественные отклонения в конечном счете
могут давать большие ошибки. Отклонение выборки от известных показателей
генеральной совокупности считается в процентах. Повышенная надежность
(репрезентативность) выборки допускает ошибку до 3 процентов, обыкновенная — от
3 до 10 процентов, приближенная — от 10 до 20 процентов, ориентировочная — от
20 до 40 процентов и прикидочная — более 40 процентов.

При этом следует иметь в виду,
что при изучении определенной группы населения, например, ветеранов,
репрезентативная выборка заменяется целевой. Она, будучи представительной в
отношении цели исследования, может и не быть репрезентативной ко всей
генеральной совокупности, например, население города.

Существуют специальные формулы
для определения размера выборки. В их основе: заданная точность исследования,
разброс признака и допустимая ошибка репрезентативности. Но это для
специального исследования. Начинающие социологи делают проще: берут вопрос,
возможные варианты ответа, умножают на десять, прибавляют на ремонт выборки и
получают минимальное число возможной выборки: больше — можно, меньше — нельзя.
Простой обсчет, двухмерное распределение, трехмерное распределение. По каждому
интересующему нас варианту ответа, группе людей должно быть не меньше 10
ответов. Если меньше, то говорить о точности не приходится.

Объем выборки определяется
аналитическими задачами исследования, а ее репрезентативность — целевой
установкой программы исследования. Именно программа задает образ необходимой
генеральной совокупности для формирования выборки: будет ли это все население
страны, региона, города или его отдельные группы.

Очень важно при формировании
выборки обеспечить равномерный отбор из всей генеральной совокупности. При
небольших по численности генеральных совокупностях применяют случайные выборки.
Их можно использовать, когда известны основные параметры генеральной совокупности.

Случайная систематическая
выборка — отбор идет через определенные интервалы, например, по спискам
студентов, клиентов банка, избирателей и т. п. Имея список работников
предприятия и определив объем необходимой выборки, можно установить шаг
выборки, например, каждый десятый или сотый из списка.

Серийная или гнездовая выборка
реализуется в том случае, если есть внутренняя структура объекта. На
предприятии выбираются не все подразделения, а наиболее типичные, например, в
области — отдельные города и районы, но опять же типичные; в городе это могут
быть отдельные микрорайоны.

Целевой называется выборка, в
которой идет выделение на основе каких-либо признаков, например, по полу,
национальности, имущественному положению, принадлежности к политическим партиям
и т. п.

Целенаправленная квотная
выборка предполагает пропорциональный отбор на основании статистики
распределения среди генеральной совокупности заданных сочетаний паспортных
данных респондентов — квот. В социологии также используется выборка как метод
основного массива — опрос всех присутствующих (или 60-70 % всей численности).
Посредством этого метода, например, осуществляется «зондаж»
общественного мнения.

Выборки бывают
одноступенчатыми и многоступенчатыми, комбинированными. На каждой ступени
отбора следует обеспечить требование представительности. Например, при опросе
населения города на первом этапе отбираются типичные микрорайоны, а затем
опрашиваются жители каждой двадцатой или пятидесятой квартиры, дома. При опросе
населения области на первой ступени выбираются типичные районы и города.
Примером стихийной выборки могут быть опросы по почте, интервью встречных,
прохожих, пассажиров. Здесь может применяться квотный принцип, когда в
конкретном здании необходимо опросить определенное количество человек по
некоторым признакам, к примеру, по полу, возрасту.

2.
Принципы социологических измерений

Социолог имеет дело с
массовыми процессами, он по необходимости оперирует различными числовыми
показателями, выражающими частоты, протяженность и напряженность связей между
различными социальными характеристиками. Поэтому в основе работы социолога при
изучении социальных процессов — первичное измерение качественных признаков, или
их квантификация. Любое социологическое измерение начинается с поиска
простейших качественных признаков, отношения между которыми можно выразить в
числовом масштабе.

Измерение — это процедура, с
помощью которой измеряемый объект сравнивается с некоторым эталоном. Получается
числовое выражение в определенном масштабе или шкале. Социальные измерения
иногда называют квалиметрическими, то есть условно количественными аналогами
качественных социальных отношений. Такую тонкую материю, как отношение,
например, к выполняемой работе, социолог выражает с помощью цифровых
показателей. В принципе, можно измерить практически любые свойства соци альных
объектов, качественные и количественные. Количественные: возраст — число
исполнившихся лет, заработок — денежные единицы, образование — число лет
обучения и т. п. Качественные характеристики (социальная принадлежность, мнение
людей, отношение к работе, оценка качества жизни и т. п.) не имеют
установленных эталонов измерения. Социологу приходится их конструировать. Такие
измерительные процедуры — своего рода изобретения.

В первом
приближении способы измерения в социологии делятся на две группы:

Приемы, с
помощью которых измеряются количественные признаки объектов с точки зрения их
физического пребывания в пространстве и во времени (удаленность проживания от
столицы, культурного центра, от места работы). Частота событий, частота
публикаций, величина временных интервалов в использовании свободного и рабочего
времени также характеризуют социальные процессы с количественной стороны.

Измерения,
относящиеся к социальным объектам, для которых не существует общепринятых шкал.
Но даже самые сложные социальные явления могут быть квантифицированы со стороны
их протяженности, интенсивности, повторяемости. Многое зависит от умения
социолога найти или изобрести надежную и убедительную измерительную процедуру.

Нахождение эталона измерения,
как правило, осуществляется в три этапа, стадии:

1. Качественная классификация
объекта исследования. Например, изучая ценностные ориентации личности, мы,
прежде всего, должны классифицировать типы ориентации личности исходя из
теоретической концепции и задач исследования. Можно положить в основу
классификации иерархию потребностей или интересов, сфер деятельности,
социальные функции, социальные ситуации, которые бы различались по степени
свободы выбора целей и средств деятельности. Рассмотрим с этой точки зрения
ценностную ориентацию на материальный достаток или культурные ценности.

Их можно
классифицировать как:

сильная —
средняя — слабая;

устойчивая —
малоустойчивая — неустойчивая;

господствующая
— рядоположенная — подавленная;

центральная
или периферийная.

Можно
поискать и другие варианты.

2. Поиск эмпирических
индикаторов или внешних признаков тех свойств объекта, которые поддаются
расположению в континуум. Индикатор — внешне хорошо различимый показатель
изменяемости признака. Например, высота ртутного столбика термометрa —
индикатор температуры.

В социологии простейшим
индикатором является расположение измеряемых показателей в предложенном списке
(ранговое место). Допустим, измерению подлежат интересы к различным видам
занятий в свободное время. Предлагаются три одинаковых списка возможных
занятий, в каждом по 18 наименований (чтение художественной литературы, театр,
прием гостей, встреча с друзьями, спорт, игра в карты и т. д.). В первой
ситуации (широкий диапазон выбора) изучаемый имеет право без ограничения
указать любые виды занятий, которые ему нравятся. Во второй ситуации (средний
диапазон выбора) ему предложено оставить или выбрать шесть наиболее важных для
него занятий, в третьем случае (узкий диапазон) не более трех.

Индикатор сильной ориентации
человека — выбор какого-то занятия имел место во всех трех ситуациях; средней
ориентации — выбор в первой и второй ситуации, слабый — выбор имел место только
при широком диапазоне принятия решения.

Одно и то же социальное
свойство, качество, признак могут фиксироваться с помощью нескольких
индикаторов, которые затем сводятся в общий показатель-индекс.

3. Проверка работы индикатора
применительно ко всей изучаемой выборке, совокупности. К примеру, если
социологи изучают отношение людей к труду, то измерить его только через
выполнение норм выработки или соблюдения трудовой дисциплины не представляется
возможным. Труд людей творческой профессии вряд ли можно измерить такими
показателями.

В результате всех указанных
процедур устанавливается эталон или шкала измерения.

Следующая очень важная работа
— проверка процедуры первичного измерения на надежность. Такие операции
используются на стадии отработки инструмента измерения в пилотажных
исследованиях. Для этого существуют довольно сложные специальные процедуры.

Точность и
правильность измерения зависят от:

степени
устойчивости измеряемого объекта или свойства;

чувствительности
эталона измерения (дробности шкалы);

отсутствия
систематических ошибок измерения;

устойчивости
измеряемого признака.

Дробность шкалы, ее
чувствительность прямо связаны с «Точностью измерения. Шкала в 10 делений
точнее, чем шкала в три или пять делений. Известно, что в вузе используется
четырехбалльная система оценки знаний. Все понимают, что преподаватель часто
колеблется между пятеркой и четверкой, между двойкой и тройкой, есть даже такое
выражение «туберкулезная троечка». Конечно, лучше бы пользоваться
десятибалльной системой оценки знаний Но дробность пунктов шкалы нельзя
увеличивать бесконечно. Надо установить оптиум, удовлетворяющий двум
требованиям: минимум градаций шкалы при высокой устойчивости результатов
измерения. Постепенно повышая дробность эталона измерения, можно найти границу,
за которой точность измерения уже не меняется.

В общенациональном
тестировании школьников применяется двадцатибалльная шкала. Из 1800 человек,
которые проходили тестирование в Тюменском университете, 20 баллов набрал
только один школьник.

При проверке шкалы может
обнаружиться, что какие-то ее пункты не работают, например, ответы
концентрируются или в позитивном, или негативном полюсе шкалы. Конечно, это
может быть и результатом единодушия ответов, но может быть и результатом
неверно сформулированного вопроса. Допустим, задан вопрос о частоте
употребления алкоголя, и крайний вариант ответа гласит: «Я пью
систематически и обычно до бесчувственного состояния». Сомнительно, чтобы
даже заведомый алкоголик отметил такой пункт. Крайне отрицательный вариант
шкалы здесь просто не работает.

В современной социологии
отработано достаточно большое количество шкал, которые могут быть упорядочены
по мере повышения их способности удовлетворять требованиям более многообразных
операций с числами.

Номинальная шкала — основа
всех шкальных процедур. Она устанавливает отношения равенства между явлениями,
которые включены в один класс.

Пример
номинальной шкалы:

Рабочие
ручного труда, не требующего специальной подготовки.

Рабочие
ручного труда высокой квалификации.

Рабочие
механизированного труда средней квалификации

Рабочие
механизированного труда высокой квалификации.

Рабочие
автоматизированного труда.

Рабочие
заняты наладкой автоматизированного оборудования.

В этой шкале каждому из
пунктов дается детальная эмпирическая интерпретация. Рабочие перечислены по мере
роста их квалификации.

Операции с
числами для номинальной шкалы следующие:

Нахождение
частот распределения по пунктам шкалы в единицах или процентах от общего
количества.

Поиск
средней тенденции по модальной частоте. Модальной называют группу с наибольшей
численностью в данном измерении. Упорядоченная номинальная шкала чаще всего
используется при опросах общественного мнения. Пример такой шкалы:

«вполне
согласен»,

«пожалуй,
согласен»,

«затрудняюсь
ответить»,

«пожалуй,
не согласен»,

«не
согласен»,

«совершенно
не согласен».

Весьма часто употребляемые
разновидности шкал этого типа — ранговые. Они предполагают полное упорядочение
каких-либо объектов или свойств от наиболее к наименее важному, значимому,
предпочитаемому. Можно ранжировать относительную важность тех или иных методов
решения крупных экономических, политических или социальных проблем,
предпочтительное использование свободного времени. Задание на ранжирование
формулируется примерно так: «Из перечисленных ниже суждений выберите самое
для вас предпочтительное, затем — наименее предпочтительное, а остальные
расположите от первого до последнего». То есть респондент указывает ранги
предложенных вариантов. Полезно не забывать, что численность объектов для
ранжирования не должна быть большой — до десяти. В противном случае результаты
ранжирования будут неустойчивыми.

Применение количественных
методов и использование статистики социальных явлений возводит социологию в
ранг строгой науки. Создается впечатление математической точности выводов.
Между тем квантификация сложных социальных реалий накладывает немало
ограничений на собственно математические операции с их измерениями. Математик
работает с простыми однозначными абстракциями, в основе которых суждение
«есть нет». Социолог обязан помнить, что в действительности
скрывается за величинами, которыми он оперирует. Главное состоит в том, что
количественный анализ не самоцель, а лишь средство качественного анализа.

3.
Приемы сбора эмпирической информации

Наблюдение
как метод сбора социологической информации

Документальные
источники

Анкетные
опросы и интервью

Имеется три принципиальных
класса методов сбора первичных эмпирических данных: прямое наблюдение, анализ
документов и опросы. Техника их применения столь многообразна, что некоторые
модификации приобретают статус самостоятельных методов, например, интервью или
анкетный опрос.

Наблюдение как метод
сбора социологической информации

Непосредственное наблюдение за
поведением людей в определенной ситуации и сразу фиксация результатов.

От обыденного научное
наблюдение отличается тем, что оно подчинено ясной исследовательской задаче,
планируется по заранее обдуманной процедуре, данные фиксируются в протоколах
или дневниках по определенной системе, информация, полученная путем наблюдения,
должна поддаваться контролю на обоснованность и устойчивость.

По степени формализованности
выделяют неконтролируемое или нестандартное и контролируемое наблюдения. В
первом варианте исследователь пользуется общим принципиальным планом, во втором
события регистрируются по детально разработанной процедуре. В этом случае есть
бланк для наблюдения, который заполняется наблюдателем, используются также
кино-фотодокументы. Например, наблюдение за участниками в ходе деловой игры,
совещания, лекции, митинга и т. п.

Нужна серия наблюдений и
разными наблюдателями. Тогда результаты получаются достаточно достоверными.

Наблюдение бывает включенным и
невключенным. При этом важно, чтобы наблюдатель своим присутствием не вносил
флуктуации в деятельность коллектива, не проявлял внешне повышенного интереса,
больше слушал и запоминал, не принимал чьей-либо стороны, не записывал свои
наблюдения на виду.

Преимущества включенных
наблюдений очевидны: они дают наиболее яркие непосредственные наблюдения,
помогают лучше понять поступки людей. Но с этим же связаны и основные
недостатки такого способа. Исследователь может потерять способность объективно
оценивать ситуацию, слишком вживаться в роль соучастника событий. Как правило,
итогом включенного наблюдения является социологическое эссе, а не строгий
научный отчет.

Имеется и нравственная
проблема включенного наблюдения: насколько вообще этична маскировка под
рядового участника?

Если наблюдение проводится вне
научного учреждения, то оно называется полевым. Могут быть и лабораторные наблюдения,
когда людей приглашают для беседы, деловой игры. Наблюдения могут быть
одномоментными, систематическими.

Прежде чем начать наблюдение,
необходимо определить объект, сформулировать проблемы, поставить
исследовательские задачи, подготовить инструментарий, способы описания
результатов. Наблюдение — незаменимый источник социологической информации на
стадии общей разведки.

Как самостоятельный способ
наблюдение — основа для исследования митингов, демонстраций. Более
распространено его применение в качестве дополнения к другим источникам
получения информации. Так, включенное наблюдение в сочетании с последующими
массовыми обследованиями позволяет дополнить сухой, но репрезентативный
материал более живыми сведениями, своего рода «картинками».

Документальные
источники

Документальной в социологии
называют любую информацию, фиксированную в печатном или рукописном тексте, на
магнитной ленте, на фото-, кино-, видеопленке. В этом смысле значение термина
отличается от общеупотребительного: обычно документом называются лишь
официальные материалы.

Из истории социологии известны
примеры, когда документальные источники были главным способом получения нужной
для исследования информации. Ф. Энгельс написал свою книгу о положении рабочего
класса в Англии, используя официальные документы парламентских комиссий,
наблюдение условий жизни и быта рабочих. В. Ленин в своей работе «Развитие
капитализма в России» использовал данные статистики.

В истории социологии широко
известен факт, когда основой исследования послужили личные документы. В начале
XX в. американский социолог У. Томас и польский — Ф. Званецкий предприняли
кропотливое изучение с тем, чтобы описать положение польских эмигрантов в
Европе и Америке. В числе использованных документов были переписка
крестьян-эмигрантов с родными, оставшимися в Польше, архивы эмигрантских газет,
материалы церковноприходских общин, землячеств, благотворительных обществ,
судебные материалы и, наконец, уникальная автобиография одного из крестьян
объемом в 300 страниц, написанная по просьбе исследователей.

Документы бывают целевыми,
подготовленными специально для данного исследования.

По степени персонификации
документы делятся на личные и безличные.

К личным относятся карточки
индивидуального учета, (например, библиотечные формуляры, анкеты, бланки,
личные дела, заявления в загсе, дневники, мемуары, материалы поименного
голосования в представительных органах власти).

Безличные документы — это
статистические или событийные архивы, пресса, протоколы и т. п.

В зависимости от статуса
документального источника выделяются документы официальные и неофициальные. К
первым относятся правительственные материалы, постановления, заявления,
стенограммы официальных заседаний, данные государственной и ведомственной
статистики, деловая корреспонденция, финансовая отчетность и т. п.

Особую группу документов
образуют материалы средств массовой информации.

Наконец, по источнику
информации документы разделяют на первичные и вторичные. Первичные составляются
на базе прямого наблюдения или опроса. Вторичные представляют собой уже
некоторое обобщение, обработку или описание, сделанное на основе первичных
документов.

Здесь возникает проблема
достоверности информации. Первое золотое правило в работе с документами — четко
различать описание самого события и его оценку, а также личные интересы автора
документа.

Основная трудность при работе
с документом — умение читать его данные на языке гипотез исследования, т. к.
документ был составлен вовсе не для того, чтобы проверить гипотезы социолога.
Поэтому приходится в документах выделять индикаторы (признаки) ключевых понятий
исследования. Качественный анализ — необходимое условие для всех последующих
количественных операций. Квантификация текстового материала получила весьма
широкое распространение в 40-е гг., для нее была разработана специальная
процедура контент-анализа.

Контент-анализ — это перевод в
количественные показатели массовой текстовой информации с последующей ее
статистической обработкой. Автором широко использован метод контент-анализа в
книге «Новый город». Частота цитирования того или иного ученого —
показатель его научного авторитета. Частота упоминания общественного деятеля
или общественно-политического движения свидетельствует об их авторитете.

Можно использовать конкурсы
сочинений, биографий, объявляемые через СМИ. Итоги анализа таких документов
публикуются в виде полусоциологических очерков и часто ставят серьезные
общественные проблемы.

Анкетные
опросы и интервью

Опросы — незаменимый прием
получения информации, является почти универсальным методом.

Искусство использования этого
метода состоит в том, чтобы знать, о чем именно спрашивать, как спрашивать,
какие задавать вопросы, и, наконец, убедиться в том, что можно верить
полученным ответам. Существуют два приема опросных методов: интервью и анкетные
опросы.

Интервью — проводимая по
определенному плану беседа, предполагающая прямой контакт интервьюера с
респондентом, причем запись ответов производится интервьюером или его
ассистентом, возможно, на пленку.

Имеется множество
разновидностей интервью. По технике проведения различаются свободные,
фокусированные и формализованные интервью.

Свободные
интервью — это продолжительные беседы с респондентом без строгой детализации
вопросов.

Формализованное
(стандартизированное) интервью предполагает детальную разработку всей
процедуры, включая общий план беседы, определенную последовательность и
конструкцию вопросов, варианты возможных ответов.

Фокусированное
(клиническое) интервью — выявление относительно узкого круга реакций
опрашиваемого. С помощью такого интервью можно изучать реакцию людей на
сообщения СМИ, рекламу. Причем информацию предварительно обрабатывают с помощью
контент-анализа. В фокусированном интервью стремятся определить, какие
смысловые единицы текста, сообщения оказались в центре внимания опрошенных,
какие — на периферии и что совсем не осталось в памяти.

Следует выделить
ненаправленные интервью, в которых инициатива может принадлежать респонденту —
интервью как бы помогает ему излить душу.

При проведении интервью многое
зависит от подготовки, опыта самого интервьюера. Мужчины предпочитают
опрашивать мужчин. Отрицательно сказывается большая разница в возрасте между
респондентом и интервьюером. Как заметили новосибирские социологи,
интервьюирование на дому имеет свой минус: воспринимая социолога как гостя,
хозяева из вежливости стараются говорить только приятное.

По способу организации можно
отметить индивидуальные и групповые интервью. Это планируемая беседа, в
процессе которой исследователь стремится вызвать дискуссию в группе, к примеру,
методика телевизионных встреч В. Познера.

Сравнительно недавно и главным
образом в избирательных технологиях начали использовать технику фокус-группы.
По сути, интервьюер здесь выступает инициатором и ведущим дискуссии по заданной
проблеме (личные качества потенциальных кандидатов, программы политических
партий и т. п.) Телефонные интервью применяют для оперативного зондажа
общественного мнения. При этом круг опрашиваемых может использоваться
многократно.

Анкетный опрос предполагает
жестко фиксированный порядок, содержание и форму ответов, причем они
регистрируются респондентом либо наедине с самим собой (заочный опрос), либо в
присутствии интервьюера (прямой опрос).

Анкетные опросы
классифицируются по содержанию и конструкции задаваемых вопросов.

Различают:

открытые
опросы, когда респонденты высказываются в свободной форме;

закрытые
опросы, когда в опросном листе (анкете) все варианты ответов заранее
предусмотрены;

полузакрытые
анкеты комбинируют обе процедуры.

Листы всенародных референдумов
— это закрытый вариант анкеты.

Анкетные опросы по почте
отличаются от анкетирования на месте: в первом варианте ожидается возвращение
анкеты по заранее оплаченному почтовому отправлению, во втором социолог сам
«собирает заполненные анкеты. Почтовый опрос в 10-20 раз дешевле. Правда,
возврат анкет небольшой, поэтому иногда предпринимают уведомление по почте или
по телефону.

Особая разновидность
оперативных опросов — радиотелевизионные с прямой телефонной линией,
допускающей и немедленную компьютерную обработку данных. Очень хорошо можно
использовать при выяснении рейтинга кандидатов в депутаты.

Групповое анкетирование
отличается от индивидуального. Анкетируют сразу до 30-40 человек: анкетер
собирает опрашиваемых, инструктирует и оставляет для заполнения анкеты.
Организация раздаточного анкетирования, включая опросы по месту жительства,
более трудоемка, чем, например, опросы по почте или через газету. Но газетные
опросы вряд ли могут считаться репрезентативными, они возможны на стадии
пилотажного исследования, нащупывания социальных проблем.

При проведении опросов не надо
забывать, что анкета выявляет субъективные оценки, которые подвержены
колебаниям, например, предвыборные симпатии избирателей. Поэтому при любой
разновидности социологического исследования нельзя растягивать опрос во
времени, так как к концу опроса оценки опрашиваемых могут сильно измениться под
влиянием внешних факторов, обстоятельств.

Таким образом, опрос можно
проводить в устной форме — интервью и в письменной форме — анкетирование. Но
смысл одинаков: получить ответы респондентов на определенные, заранее
сформулированные: вопросы. Причем каждый вопрос анкеты надо рассматривать как
специфический измерительный инструмент для фиксации определенной информации.

Существуют: вопросы о фактах;
вопросы о знаниях; вопросы о мнениях; установках, мотивах; вопросы контактные:
«Пожалуйста, расскажите нам о себе»; вопросы-фильтры, например, при
опросе на семейно-бытовые темы можно ввести в виде фильтров вопрос о семейном
положении, о количестве детей в семье и т. п.; вопросы-ловушки, например, среди
вариантов ответа могут быть предложены для оценки несуществующая книга,
писатель, фильм, общественный деятель или движение. Либо: «Удовлетворены
ли вы выбранной профессией?», и через какой-то промежуток: «Хотели бы
вы, чтобы ваши дети выбрали вашу профессию?». В студенческом варианте:
«Довольны ли вы избранной профессией?» и «Желаете ли вы перейти
на другой факультет?».

Выделяют также вопросы-шкалы,
вопросы-меню, вопросы-диалоги, вопросы-иллюстрации, вопросы-тесты,
вопросы-индексы, когда на основе ответов делают следующий вывод: например, об
уровне информированности.

Особое место в социологической
анкете занимает паспортичка. Ее составить тоже довольно трудно, поэтому лучше
всего пользоваться уже отработанными вариантами паспортичек.

Основные требования к
составлению анкет: вопросы должны быть понятны для опрашиваемых, учитывать их
уровень; просты и ясны. Затем: не нести значительных эмоциональных нагрузок,
формулироваться нейтрально, не выдавать установок исследователя. Правильная формулировка
вопроса предполагает нейтральную интонацию.

В закрытых вопросах все
возможные варианты ответа должны быть перечислены. Можно разбить варианты
ответа на смысловые блоки. Не следует утомлять опрашиваемых, затраты времени на
заполнение анкеты должны составлять не более 30 минут.

Обычная
последовательность построения анкеты такова:

Введение, в
котором указано, какая организация проводит опрос и для чего. Как правило,
подчеркивается анонимность ответов. Не стоит начинать анкету с паспортички, так
как это настораживает людей. Всю демографическую информацию лучше относить в
конец анкеты.

Вступительные
вопросы, которые должны заинтересовать респондента и максимально облегчить ему
включение в работу. В начале анкеты не должны ставиться трудные или беспокоящие
респондента вопросы.

Для
оживления текста можно использовать шутливые рисунки, стрелки, циферблат, знак
«стоп», фотографии узнаваемых лиц и т. п.

Формы проведения опроса —
групповая, индивидуальная. Раздаточные анкеты, почтовые, прессовые, анонимные и
не анонимные. Не все допустимо и в анонимных опросах. Хороший пример
бестактности социолога приведен в книге финского писателя Марти Ларни
«Четвертый позвонок».

Комичный случай имел место во
Франции, когда в ответе на вопрос: «Какова смертность в вашей
деревне?», — один юморист ответил: «В нашей деревне рано или поздно
умирает каждый».

4.
Методы обработки социологической информации

Анализ собранной
социологической информации — самый увлекательный этап исследования. Здесь
проверяются выдвинутые гипотезы, выявляются новые проблемы, а иногда ждет и
разочарование.

Для начала группировка и
классификация — элементарные процедуры упорядочения собранной информации.

Простая группировка — это
классификация или упорядочение данных по одному признаку. Так, в зависимости от
гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду
занятий, образованию или по высказанному суждению. Число членов выделенной
группы называют долей или относительной частотой. Здесь сразу можно применить
такие статистические приемы обработки информации, как вычисление медианы,
среднеарифметических показателей, исчисление частот по процентам.

Перекрестная группировка — это
связывание данных, предварительно упорядоченных по двум признакам в таблицах.
Например, возраст мужа и возраст жены в семейных парах или отношение к
проводимым в стране экономическим реформам в зависимости от возраста,
материального положения. Основная задача перекрестной группировки — поиск
устойчивых связей изучаемых объектов, например, типичных соотношений возраста
семейных пар. Выясняется, что мужья в большинстве случаев старше своих жен. Но
в новых городах Севера, где довольно специфичен демографический состав
населения, достаточно много семейных пар, где жена старше своего мужа.

Такая группировка в некоторых
случаях уже является достаточной для основательного отчета по результатам
исследования.

Далее возможны эмпирическая
типологизация, поиск устойчивых сочетаний свойств социальных объектов не по
одному или двум, а в нескольких измерениях одновременно. К примеру, в семейных
парах возраст супругов анализируется в зависимости от национальности, места
жительства, характера труда и т. п. Задачи многомерной эмпирической
типологизации решают с помощью математических процедур распознавания образов —
таксономии. В эмпирическом материале для таксономического анализа выделяются
группы — таксоны, например, по семейному положению, и затем анализируется их
миграционное поведение, по характеру миг рационных потоков в зависимости от
численности поселенческих образований (крупных, средних и малых городов, сел).

В многомерной эмпирической
классификации используется прием кластерного анализа. Например, конфигурация
депутатских групп в органах представительной власти, позволяющая прогнозировать
их поведение.

В специальной литературе
рассматриваются более сложные приемы анализа информации: критерий Юла, метод
корреляционного графа, факторный анализ, всевозможные коэффициенты, например
Пирсона.

Как правило, социологи
используют стандартные компьютерные программы обработки социологической
информации, пригодные для выдачи простых распределений, процентов, отклонений,
ранговых и парных коэффициентов корреляции, энтропии, регрессионных
показателей, различного рода индексов и т. п.

В зависимости от программных
целей исследования анализ полученных данных может быть более или менее глубоким
и основательным. В зависимости от целей исследования можно остановиться на
определенном этапе анализа информации.

Разумеется, в нашей лекции
даны лишь общие подходы, которые позволяют получить представление о
методологии, методике и организации социологических исследований. Этих знаний
может быть достаточно для проведения простых исследований. Всему остальному
надо учиться, в том числе и используя рекомендованную в курсе специальную
литературу.

Список
литературы

Воронов Ю.
П. Районирование выборки в социологии. Новосибирск, 1990.

Давыдов А.
А. Репрезентативность выборки//СоцИС. 1990 N° 1.

Давыдов А.
А. Объем выборки // СоцИС. 1990. № 6.

Давыдов А.
А., Крыштановский А. О. Ремонт выборки // СоцИС. 1989. № 5

Конкрен Ч.
Методы выборочного исследования. — М., 1976.

Моин В. Б.
Альтернативная интерпретация данных: атрибутивный подход // СоцИС. 1990. № 11.

Осипов Г.
В., Андреев Э. П. Методы измерения в социологии. — М., 1977.

Основы
прикладной социологии /Под ред Ф Э Шереги М. К. Горшкова. — М., 1996.

Паниотто В.
И. Качество социологической информации. Киев 1986.

Рабочая
книга социолога. — М., 1983.

Степанов А
С. Метод контент-анализа и принципы в исследовании актуальных проблем
современного общества. — М., 1995.

Табарова Г.
Г. Методология анализа данных в социологии. — М., 1998.

Толстова Ю.
Н. Модели и методы анализа социологического исследования: Учебное пособие. —
М., 1996.

Ядов В. А.
Социологическое исследование: методология, программы, методы. Самара, 1995.

Якубович В.
Б. Качественные методы или качество результатов// Социология: методология,
методы, математические модели. — М., 1995. № 5-6.

Для подготовки
данной работы были использованы материалы с сайта http://websites.pfu.edu.ru/IDO/ffec/

Дата добавления: 22.02.2003

ТЕМА 17. Основные приёмы социологического исследования

  • 17.1. Формирование социологической выборки. Типы выборок
  • 17.2. Принципы социологических измерений
  • 17.3. Приемы сбора эмпирической информации
  • 17.4. Методы обработки социологической информации
  • Контрольные вопросы
  • Список рекомендуемой литературы
  • Темы рефератов
  • ВЕРНУТЬСЯ К ОГЛАВЛЕНИЮ

17.1. Формирование социологической выборки. Типы выборок

Организация социологического исследования — сложный и многоплановый процесс. Рассмотрим основные его составляющие.
Весь изучаемый социальный массив социологи называют генеральной совокупностью, конечно, для исследования берется какая-то часть, точно так же, как при анализе крови берется одна капля.
Выборка — это метод исследования, когда из общей изучаемой (генеральной) совокупности однородных единиц отбирается некоторая его часть (выборочная совокупность), и только эта часть подвергается обследованию.
Социолог выделяет некую часть генеральной совокупности в надежде, что сумеет выявить и доказать свойства всего объекта исследования в целом. Тип и способ выборки зависят от целей исследования и его гипотез: чем конкретней цель и яснее сформулированы гипотезы, тем правильней будет решен вопрос о выборке. Первое выборочное исследование в России было проведено в 1884 г. — обследование крестьянских хозяйств Воронежской губернии. После 1917 г. они стали ежегодными.
Генеральная и выборочная совокупности должны сопоставляться по некоторым важным признакам, которые легко проверяются статистическими методами. Если они совпадают, то выборка называется представительной, или репрезентативной. Понятно и то, что, чем больше размер выборки, тем больше и достоверность. Прежде всего, надо уяснить, какие из имеющихся сведений о характеристике генеральной совокупности, объекте исследования существенны для целей исследования. Во многих случаях это половозрастной, социально-профессиональный, имущественный состав обследуемых, их пространственная локализация. Пол и возраст замыкают на себе многие показатели семейного состояния: возраст, к примеру, указывает на жизненный опыт, профессиональный стаж. Пространственная локализация (по территории, по месту работы) важна с точки зрения адресности выводов и рекомендаций, которые должны быть привязаны к административным или производственным показателям. При сочетании этих трех параметров: половозрастной структуры, социального состава и пространственной локализации — можно быть уверенным, что выборка будет представительной для изучения многих социальных проблем. Понятно, что это правило имеет исключения в зависимости от конкретных условий и особых целей исследования. Например, при изучении политических ориентации населения уже не обойтись без учета имущественного положения, а студенческих проблем — без знания вуза и курса обучения студентов.
Иногда требуется повышенная надежность, например, в экономических и демографических исследованиях, при переписях населения. Здесь даже несущественные отклонения в конечном счете могут давать большие ошибки. Отклонение выборки от известных показателей генеральной совокупности считается в процентах. Повышенная надежность (репрезентативность) выборки допускает ошибку до 3 процентов, обыкновенная — от 3 до 10 процентов, приближенная — от 10 до 20 процентов, ориентировочная — от 20 до 40 процентов и прикидочная — более 40 процентов.
При этом следует иметь в виду, что при изучении определенной группы населения, например, ветеранов, репрезентативная выборка заменяется целевой. Она, будучи представительной в отношении цели исследования, может и не быть репрезентативной ко всей генеральной совокупности, например, население города.
Существуют специальные формулы для определения размера выборки. В их основе: заданная точность исследования, разброс признака и допустимая ошибка репрезентативности. Но это для специального исследования. Начинающие социологи делают проще: берут вопрос, возможные варианты ответа, умножают на десять, прибавляют на ремонт выборки и получают минимальное число возможной выборки: больше — можно, меньше — нельзя. Простой обсчет, двухмерное распределение, трехмерное распределение. По каждому интересующему нас варианту ответа, группе людей должно быть не меньше 10 ответов. Если меньше, то говорить о точности не приходится.
Объем выборки определяется аналитическими задачами исследования, а ее репрезентативность — целевой установкой программы исследования. Именно программа задает образ необходимой генеральной совокупности для формирования выборки: будет ли это все население страны, региона, города или его отдельные группы.
Очень важно при формировании выборки обеспечить равномерный отбор из всей генеральной совокупности. При небольших по численности генеральных совокупностях применяют случайные выборки. Их можно использовать, когда известны основные параметры генеральной совокупности.
Случайная систематическая выборка — отбор идет через определенные интервалы, например, по спискам студентов, клиентов банка, избирателей и т. п. Имея список работников предприятия и определив объем необходимой выборки, можно установить шаг выборки, например, каждый десятый или сотый из списка.
Серийная или гнездовая выборка реализуется в том случае, если есть внутренняя структура объекта. На предприятии выбираются не все подразделения, а наиболее типичные, например, в области — отдельные города и районы, но опять же типичные; в городе это могут быть отдельные микрорайоны.
Целевой называется выборка, в которой идет выделение на основе каких-либо признаков, например, по полу, национальности, имущественному положению, принадлежности к политическим партиям и т. п.
Целенаправленная квотная выборка предполагает пропорциональный отбор на основании статистики распределения среди генеральной совокупности заданных сочетаний паспортных данных респондентов — квот. В социологии также используется выборка как метод основного массива — опрос всех присутствующих (или 60-70 % всей численности). Посредством этого метода, например, осуществляется «зондаж» общественного мнения.
Выборки бывают одноступенчатыми и многоступенчатыми, комбинированными. На каждой ступени отбора следует обеспечить требование представительности. Например, при опросе населения города на первом этапе отбираются типичные микрорайоны, а затем опрашиваются жители каждой двадцатой или пятидесятой квартиры, дома. При опросе населения области на первой ступени выбираются типичные районы и города. Примером стихийной выборки могут быть опросы по почте, интервью встречных, прохожих, пассажиров. Здесь может применяться квотный принцип, когда в конкретном здании необходимо опросить определенное количество человек по некоторым признакам, к примеру, по полу, возрасту.

К НАЧАЛУ ТЕМЫ

17.2. Принципы социологических измерений

Социолог имеет дело с массовыми процессами, он по необходимости оперирует различными числовыми показателями, выражающими частоты, протяженность и напряженность связей между различными социальными характеристиками. Поэтому в основе работы социолога при изучении социальных процессов — первичное измерение качественных признаков, или их квантификация. Любое социологическое измерение начинается с поиска простейших качественных признаков, отношения между которыми можно выразить в числовом масштабе.
Измерение — это процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном. Получается числовое выражение в определенном масштабе или шкале. Социальные измерения иногда называют квалиметрическими, то есть условно количественными аналогами качественных социальных отношений. Такую тонкую материю, как отношение, например, к выполняемой работе, социолог выражает с помощью цифровых показателей. В принципе, можно измерить практически любые свойства соци альных объектов, качественные и количественные. Количественные: возраст — число исполнившихся лет, заработок — денежные единицы, образование — число лет обучения и т. п. Качественные характеристики (социальная принадлежность, мнение людей, отношение к работе, оценка качества жизни и т. п.) не имеют установленных эталонов измерения. Социологу приходится их конструировать. Такие измерительные процедуры — своего рода изобретения.

  • В первом приближении способы измерения в социологии делятся на две группы:
    • Приемы, с помощью которых измеряются количественные признаки объектов с точки зрения их физического пребывания в пространстве и во времени (удаленность проживания от столицы, культурного центра, от места работы). Частота событий, частота публикаций, величина временных интервалов в использовании свободного и рабочего времени также характеризуют социальные процессы с количественной стороны.
    • Измерения, относящиеся к социальным объектам, для которых не существует общепринятых шкал. Но даже самые сложные социальные явления могут быть квантифицированы со стороны их протяженности, интенсивности, повторяемости. Многое зависит от умения социолога найти или изобрести надежную и убедительную измерительную процедуру.

Нахождение эталона измерения, как правило, осуществляется в три этапа, стадии:
1. Качественная классификация объекта исследования. Например, изучая ценностные ориентации личности, мы, прежде всего, должны классифицировать типы ориентации личности исходя из теоретической концепции и задач исследования. Можно положить в основу классификации иерархию потребностей или интересов, сфер деятельности, социальные функции, социальные ситуации, которые бы различались по степени свободы выбора целей и средств деятельности. Рассмотрим с этой точки зрения ценностную ориентацию на материальный достаток или культурные ценности.

  • Их можно классифицировать как:
    • сильная — средняя — слабая;
    • устойчивая — малоустойчивая — неустойчивая;
    • господствующая — рядоположенная — подавленная;
    • центральная или периферийная.
      Можно поискать и другие варианты.

2. Поиск эмпирических индикаторов или внешних признаков тех свойств объекта, которые поддаются расположению в континуум. Индикатор — внешне хорошо различимый показатель изменяемости признака. Например, высота ртутного столбика термометрa — индикатор температуры.
В социологии простейшим индикатором является расположение измеряемых показателей в предложенном списке (ранговое место). Допустим, измерению подлежат интересы к различным видам занятий в свободное время. Предлагаются три одинаковых списка возможных занятий, в каждом по 18 наименований (чтение художественной литературы, театр, прием гостей, встреча с друзьями, спорт, игра в карты и т. д.). В первой ситуации (широкий диапазон выбора) изучаемый имеет право без ограничения указать любые виды занятий, которые ему нравятся. Во второй ситуации (средний диапазон выбора) ему предложено оставить или выбрать шесть наиболее важных для него занятий, в третьем случае (узкий диапазон) не более трех.
Индикатор сильной ориентации человека — выбор какого-то занятия имел место во всех трех ситуациях; средней ориентации — выбор в первой и второй ситуации, слабый — выбор имел место только при широком диапазоне принятия решения.
Одно и то же социальное свойство, качество, признак могут фиксироваться с помощью нескольких индикаторов, которые затем сводятся в общий показатель-индекс.
3. Проверка работы индикатора применительно ко всей изучаемой выборке, совокупности. К примеру, если социологи изучают отношение людей к труду, то измерить его только через выполнение норм выработки или соблюдения трудовой дисциплины не представляется возможным. Труд людей творческой профессии вряд ли можно измерить такими показателями.
В результате всех указанных процедур устанавливается эталон или шкала измерения.
Следующая очень важная работа — проверка процедуры первичного измерения на надежность. Такие операции используются на стадии отработки инструмента измерения в пилотажных исследованиях. Для этого существуют довольно сложные специальные процедуры.

  • Точность и правильность измерения зависят от:
    • степени устойчивости измеряемого объекта или свойства;
    • чувствительности эталона измерения (дробности шкалы);
    • отсутствия систематических ошибок измерения;
    • устойчивости измеряемого признака.

Дробность шкалы, ее чувствительность прямо связаны с «Точностью измерения. Шкала в 10 делений точнее, чем шкала в три или пять делений. Известно, что в вузе используется четырехбалльная система оценки знаний. Все понимают, что преподаватель часто колеблется между пятеркой и четверкой, между двойкой и тройкой, есть даже такое выражение «туберкулезная троечка». Конечно, лучше бы пользоваться десятибалльной системой оценки знаний Но дробность пунктов шкалы нельзя увеличивать бесконечно. Надо установить оптиум, удовлетворяющий двум требованиям: минимум градаций шкалы при высокой устойчивости результатов измерения. Постепенно повышая дробность эталона измерения, можно найти границу, за которой точность измерения уже не меняется.
В общенациональном тестировании школьников применяется двадцатибалльная шкала. Из 1800 человек, которые проходили тестирование в Тюменском университете, 20 баллов набрал только один школьник.
При проверке шкалы может обнаружиться, что какие-то ее пункты не работают, например, ответы концентрируются или в позитивном, или негативном полюсе шкалы. Конечно, это может быть и результатом единодушия ответов, но может быть и результатом неверно сформулированного вопроса. Допустим, задан вопрос о частоте употребления алкоголя, и крайний вариант ответа гласит: «Я пью систематически и обычно до бесчувственного состояния». Сомнительно, чтобы даже заведомый алкоголик отметил такой пункт. Крайне отрицательный вариант шкалы здесь просто не работает.
В современной социологии отработано достаточно большое количество шкал, которые могут быть упорядочены по мере повышения их способности удовлетворять требованиям более многообразных операций с числами.
Номинальная шкала — основа всех шкальных процедур. Она устанавливает отношения равенства между явлениями, которые включены в один класс.

  • Пример номинальной шкалы:
    1. Рабочие ручного труда, не требующего специальной подготовки.
    2. Рабочие ручного труда высокой квалификации.
    3. Рабочие механизированного труда средней квалификации
    4. Рабочие механизированного труда высокой квалификации.
    5. Рабочие автоматизированного труда.
    6. Рабочие заняты наладкой автоматизированного оборудования.

Рекомендуемые материалы

В этой шкале каждому из пунктов дается детальная эмпирическая интерпретация. Рабочие перечислены по мере роста их квалификации.

  • Операции с числами для номинальной шкалы следующие:
    • Нахождение частот распределения по пунктам шкалы в единицах или процентах от общего количества.
    • Поиск средней тенденции по модальной частоте. Модальной называют группу с наибольшей численностью в данном измерении. Упорядоченная номинальная шкала чаще всего используется при опросах общественного мнения. Пример такой шкалы:
      • «вполне согласен»,
      • «пожалуй, согласен»,
      • «затрудняюсь ответить»,
      • «пожалуй, не согласен»,
      • «не согласен»,
      • «совершенно не согласен».

Весьма часто употребляемые разновидности шкал этого типа — ранговые. Они предполагают полное упорядочение каких-либо объектов или свойств от наиболее к наименее важному, значимому, предпочитаемому. Можно ранжировать относительную важность тех или иных методов решения крупных экономических, политических или социальных проблем, предпочтительное использование свободного времени. Задание на ранжирование формулируется примерно так: «Из перечисленных ниже суждений выберите самое для вас предпочтительное, затем — наименее предпочтительное, а остальные расположите от первого до последнего». То есть респондент указывает ранги предложенных вариантов. Полезно не забывать, что численность объектов для ранжирования не должна быть большой — до десяти. В противном случае результаты ранжирования будут неустойчивыми.
Применение количественных методов и использование статистики социальных явлений возводит социологию в ранг строгой науки. Создается впечатление математической точности выводов. Между тем квантификация сложных социальных реалий накладывает немало ограничений на собственно математические операции с их измерениями. Математик работает с простыми однозначными абстракциями, в основе которых суждение «есть нет». Социолог обязан помнить, что в действительности скрывается за величинами, которыми он оперирует. Главное состоит в том, что количественный анализ не самоцель, а лишь средство качественного анализа.

К НАЧАЛУ ТЕМЫ

17.3. Приемы сбора эмпирической информации

  • Наблюдение как метод сбора социологической информации
  • Документальные источники
  • Анкетные опросы и интервью

Имеется три принципиальных класса методов сбора первичных эмпирических данных: прямое наблюдение, анализ документов и опросы. Техника их применения столь многообразна, что некоторые модификации приобретают статус самостоятельных методов, например, интервью или анкетный опрос.

Наблюдение как метод сбора социологической информации

Непосредственное наблюдение за поведением людей в определенной ситуации и сразу фиксация результатов.
От обыденного научное наблюдение отличается тем, что оно подчинено ясной исследовательской задаче, планируется по заранее обдуманной процедуре, данные фиксируются в протоколах или дневниках по определенной системе, информация, полученная путем наблюдения, должна поддаваться контролю на обоснованность и устойчивость.
По степени формализованности выделяют неконтролируемое или нестандартное и контролируемое наблюдения. В первом варианте исследователь пользуется общим принципиальным планом, во втором события регистрируются по детально разработанной процедуре. В этом случае есть бланк для наблюдения, который заполняется наблюдателем, используются также кино-фотодокументы. Например, наблюдение за участниками в ходе деловой игры, совещания, лекции, митинга и т. п.
Нужна серия наблюдений и разными наблюдателями. Тогда результаты получаются достаточно достоверными.
Наблюдение бывает включенным и невключенным. При этом важно, чтобы наблюдатель своим присутствием не вносил флуктуации в деятельность коллектива, не проявлял внешне повышенного интереса, больше слушал и запоминал, не принимал чьей-либо стороны, не записывал свои наблюдения на виду.
Преимущества включенных наблюдений очевидны: они дают наиболее яркие непосредственные наблюдения, помогают лучше понять поступки людей. Но с этим же связаны и основные недостатки такого способа. Исследователь может потерять способность объективно оценивать ситуацию, слишком вживаться в роль соучастника событий. Как правило, итогом включенного наблюдения является социологическое эссе, а не строгий научный отчет.
Имеется и нравственная проблема включенного наблюдения: насколько вообще этична маскировка под рядового участника?
Если наблюдение проводится вне научного учреждения, то оно называется полевым. Могут быть и лабораторные наблюдения, когда людей приглашают для беседы, деловой игры. Наблюдения могут быть одномоментными, систематическими.
Прежде чем начать наблюдение, необходимо определить объект, сформулировать проблемы, поставить исследовательские задачи, подготовить инструментарий, способы описания результатов. Наблюдение — незаменимый источник социологической информации на стадии общей разведки.
Как самостоятельный способ наблюдение — основа для исследования митингов, демонстраций. Более распространено его применение в качестве дополнения к другим источникам получения информации. Так, включенное наблюдение в сочетании с последующими массовыми обследованиями позволяет дополнить сухой, но репрезентативный материал более живыми сведениями, своего рода «картинками».

К НАЧАЛУ ПУНКТА

Документальные источники

Документальной в социологии называют любую информацию, фиксированную в печатном или рукописном тексте, на магнитной ленте, на фото-, кино-, видеопленке. В этом смысле значение термина отличается от общеупотребительного: обычно документом называются лишь официальные материалы.
Из истории социологии известны примеры, когда документальные источники были главным способом получения нужной для исследования информации. Ф. Энгельс написал свою книгу о положении рабочего класса в Англии, используя официальные документы парламентских комиссий, наблюдение условий жизни и быта рабочих. В. Ленин в своей работе «Развитие капитализма в России» использовал данные статистики.
В истории социологии широко известен факт, когда основой исследования послужили личные документы. В начале XX в. американский социолог У. Томас и польский — Ф. Званецкий предприняли кропотливое изучение с тем, чтобы описать положение польских эмигрантов в Европе и Америке. В числе использованных документов были переписка крестьян-эмигрантов с родными, оставшимися в Польше, архивы эмигрантских газет, материалы церковноприходских общин, землячеств, благотворительных обществ, судебные материалы и, наконец, уникальная автобиография одного из крестьян объемом в 300 страниц, написанная по просьбе исследователей.
Документы бывают целевыми, подготовленными специально для данного исследования.
По степени персонификации документы делятся на личные и безличные.
К личным относятся карточки индивидуального учета, (например, библиотечные формуляры, анкеты, бланки, личные дела, заявления в загсе, дневники, мемуары, материалы поименного голосования в представительных органах власти).
Безличные документы — это статистические или событийные архивы, пресса, протоколы и т. п.
В зависимости от статуса документального источника выделяются документы официальные и неофициальные. К первым относятся правительственные материалы, постановления, заявления, стенограммы официальных заседаний, данные государственной и ведомственной статистики, деловая корреспонденция, финансовая отчетность и т. п.
Особую группу документов образуют материалы средств массовой информации.
Наконец, по источнику информации документы разделяют на первичные и вторичные. Первичные составляются на базе прямого наблюдения или опроса. Вторичные представляют собой уже некоторое обобщение, обработку или описание, сделанное на основе первичных документов.
Здесь возникает проблема достоверности информации. Первое золотое правило в работе с документами — четко различать описание самого события и его оценку, а также личные интересы автора документа.
Основная трудность при работе с документом — умение читать его данные на языке гипотез исследования, т. к. документ был составлен вовсе не для того, чтобы проверить гипотезы социолога. Поэтому приходится в документах выделять индикаторы (признаки) ключевых понятий исследования. Качественный анализ — необходимое условие для всех последующих количественных операций. Квантификация текстового материала получила весьма широкое распространение в 40-е гг., для нее была разработана специальная процедура контент-анализа.
Контент-анализ — это перевод в количественные показатели массовой текстовой информации с последующей ее статистической обработкой. Автором широко использован метод контент-анализа в книге «Новый город». Частота цитирования того или иного ученого — показатель его научного авторитета. Частота упоминания общественного деятеля или общественно-политического движения свидетельствует об их авторитете.
Можно использовать конкурсы сочинений, биографий, объявляемые через СМИ. Итоги анализа таких документов публикуются в виде полусоциологических очерков и часто ставят серьезные общественные проблемы.

К НАЧАЛУ ПУНКТА

Анкетные опросы и интервью

Опросы — незаменимый прием получения информации, является почти универсальным методом.
Искусство использования этого метода состоит в том, чтобы знать, о чем именно спрашивать, как спрашивать, какие задавать вопросы, и, наконец, убедиться в том, что можно верить полученным ответам. Существуют два приема опросных методов: интервью и анкетные опросы.
Интервью — проводимая по определенному плану беседа, предполагающая прямой контакт интервьюера с респондентом, причем запись ответов производится интервьюером или его ассистентом, возможно, на пленку.
Имеется множество разновидностей интервью. По технике проведения различаются свободные, фокусированные и формализованные интервью.

  • Свободные интервью — это продолжительные беседы с респондентом без строгой детализации вопросов.
  • Формализованное (стандартизированное) интервью предполагает детальную разработку всей процедуры, включая общий план беседы, определенную последовательность и конструкцию вопросов, варианты возможных ответов.
  • Фокусированное (клиническое) интервью — выявление относительно узкого круга реакций опрашиваемого. С помощью такого интервью можно изучать реакцию людей на сообщения СМИ, рекламу. Причем информацию предварительно обрабатывают с помощью контент-анализа. В фокусированном интервью стремятся определить, какие смысловые единицы текста, сообщения оказались в центре внимания опрошенных, какие — на периферии и что совсем не осталось в памяти.

Следует выделить ненаправленные интервью, в которых инициатива может принадлежать респонденту — интервью как бы помогает ему излить душу.
При проведении интервью многое зависит от подготовки, опыта самого интервьюера. Мужчины предпочитают опрашивать мужчин. Отрицательно сказывается большая разница в возрасте между респондентом и интервьюером. Как заметили новосибирские социологи, интервьюирование на дому имеет свой минус: воспринимая социолога как гостя, хозяева из вежливости стараются говорить только приятное.
По способу организации можно отметить индивидуальные и групповые интервью. Это планируемая беседа, в процессе которой исследователь стремится вызвать дискуссию в группе, к примеру, методика телевизионных встреч В. Познера.
Сравнительно недавно и главным образом в избирательных технологиях начали использовать технику фокус-группы. По сути, интервьюер здесь выступает инициатором и ведущим дискуссии по заданной проблеме (личные качества потенциальных кандидатов, программы политических партий и т. п.) Телефонные интервью применяют для оперативного зондажа общественного мнения. При этом круг опрашиваемых может использоваться многократно.
Анкетный опрос предполагает жестко фиксированный порядок, содержание и форму ответов, причем они регистрируются респондентом либо наедине с самим собой (заочный опрос), либо в присутствии интервьюера (прямой опрос).
Анкетные опросы классифицируются по содержанию и конструкции задаваемых вопросов.

  • Различают:
    • открытые опросы, когда респонденты высказываются в свободной форме;
    • закрытые опросы, когда в опросном листе (анкете) все варианты ответов заранее предусмотрены;
    • полузакрытые анкеты комбинируют обе процедуры.

Листы всенародных референдумов — это закрытый вариант анкеты.
Анкетные опросы по почте отличаются от анкетирования на месте: в первом варианте ожидается возвращение анкеты по заранее оплаченному почтовому отправлению, во втором социолог сам «собирает заполненные анкеты. Почтовый опрос в 10-20 раз дешевле. Правда, возврат анкет небольшой, поэтому иногда предпринимают уведомление по почте или по телефону.
Особая разновидность оперативных опросов — радиотелевизионные с прямой телефонной линией, допускающей и немедленную компьютерную обработку данных. Очень хорошо можно использовать при выяснении рейтинга кандидатов в депутаты.
Групповое анкетирование отличается от индивидуального. Анкетируют сразу до 30-40 человек: анкетер собирает опрашиваемых, инструктирует и оставляет для заполнения анкеты. Организация раздаточного анкетирования, включая опросы по месту жительства, более трудоемка, чем, например, опросы по почте или через газету. Но газетные опросы вряд ли могут считаться репрезентативными, они возможны на стадии пилотажного исследования, нащупывания социальных проблем.
При проведении опросов не надо забывать, что анкета выявляет субъективные оценки, которые подвержены колебаниям, например, предвыборные симпатии избирателей. Поэтому при любой разновидности социологического исследования нельзя растягивать опрос во времени, так как к концу опроса оценки опрашиваемых могут сильно измениться под влиянием внешних факторов, обстоятельств.
Таким образом, опрос можно проводить в устной форме — интервью и в письменной форме — анкетирование. Но смысл одинаков: получить ответы респондентов на определенные, заранее сформулированные: вопросы. Причем каждый вопрос анкеты надо рассматривать как специфический измерительный инструмент для фиксации определенной информации.
Существуют: вопросы о фактах; вопросы о знаниях; вопросы о мнениях; установках, мотивах; вопросы контактные: «Пожалуйста, расскажите нам о себе»; вопросы-фильтры, например, при опросе на семейно-бытовые темы можно ввести в виде фильтров вопрос о семейном положении, о количестве детей в семье и т. п.; вопросы-ловушки, например, среди вариантов ответа могут быть предложены для оценки несуществующая книга, писатель, фильм, общественный деятель или движение. Либо: «Удовлетворены ли вы выбранной профессией?», и через какой-то промежуток: «Хотели бы вы, чтобы ваши дети выбрали вашу профессию?». В студенческом варианте: «Довольны ли вы избранной профессией?» и «Желаете ли вы перейти на другой факультет?».
Выделяют также вопросы-шкалы, вопросы-меню, вопросы-диалоги, вопросы-иллюстрации, вопросы-тесты, вопросы-индексы, когда на основе ответов делают следующий вывод: например, об уровне информированности.
Особое место в социологической анкете занимает паспортичка. Ее составить тоже довольно трудно, поэтому лучше всего пользоваться уже отработанными вариантами паспортичек.
Основные требования к составлению анкет: вопросы должны быть понятны для опрашиваемых, учитывать их уровень; просты и ясны. Затем: не нести значительных эмоциональных нагрузок, формулироваться нейтрально, не выдавать установок исследователя. Правильная формулировка вопроса предполагает нейтральную интонацию.
В закрытых вопросах все возможные варианты ответа должны быть перечислены. Можно разбить варианты ответа на смысловые блоки. Не следует утомлять опрашиваемых, затраты времени на заполнение анкеты должны составлять не более 30 минут.

  • Обычная последовательность построения анкеты такова:
    • Введение, в котором указано, какая организация проводит опрос и для чего. Как правило, подчеркивается анонимность ответов. Не стоит начинать анкету с паспортички, так как это настораживает людей. Всю демографическую информацию лучше относить в конец анкеты.
    • Вступительные вопросы, которые должны заинтересовать респондента и максимально облегчить ему включение в работу. В начале анкеты не должны ставиться трудные или беспокоящие респондента вопросы.
    • Для оживления текста можно использовать шутливые рисунки, стрелки, циферблат, знак «стоп», фотографии узнаваемых лиц и т. п.

3 Доброкачественная миоклоническая эпилепсия младенчества — лекция, которая пользуется популярностью у тех, кто читал эту лекцию.

Формы проведения опроса — групповая, индивидуальная. Раздаточные анкеты, почтовые, прессовые, анонимные и не анонимные. Не все допустимо и в анонимных опросах. Хороший пример бестактности социолога приведен в книге финского писателя Марти Ларни «Четвертый позвонок».
Комичный случай имел место во Франции, когда в ответе на вопрос: «Какова смертность в вашей деревне?», — один юморист ответил: «В нашей деревне рано или поздно умирает каждый».

К НАЧАЛУ ТЕМЫ

17.4. Методы обработки социологической информации

Анализ собранной социологической информации — самый увлекательный этап исследования. Здесь проверяются выдвинутые гипотезы, выявляются новые проблемы, а иногда ждет и разочарование.
Для начала группировка и классификация — элементарные процедуры упорядочения собранной информации.
Простая группировка — это классификация или упорядочение данных по одному признаку. Так, в зависимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, образованию или по высказанному суждению. Число членов выделенной группы называют долей или относительной частотой. Здесь сразу можно применить такие статистические приемы обработки информации, как вычисление медианы, среднеарифметических показателей, исчисление частот по процентам.
Перекрестная группировка — это связывание данных, предварительно упорядоченных по двум признакам в таблицах. Например, возраст мужа и возраст жены в семейных парах или отношение к проводимым в стране экономическим реформам в зависимости от возраста, материального положения. Основная задача перекрестной группировки — поиск устойчивых связей изучаемых объектов, например, типичных соотношений возраста семейных пар. Выясняется, что мужья в большинстве случаев старше своих жен. Но в новых городах Севера, где довольно специфичен демографический состав населения, достаточно много семейных пар, где жена старше своего мужа.
Такая группировка в некоторых случаях уже является достаточной для основательного отчета по результатам исследования.
Далее возможны эмпирическая типологизация, поиск устойчивых сочетаний свойств социальных объектов не по одному или двум, а в нескольких измерениях одновременно. К примеру, в семейных парах возраст супругов анализируется в зависимости от национальности, места жительства, характера труда и т. п. Задачи многомерной эмпирической типологизации решают с помощью математических процедур распознавания образов — таксономии. В эмпирическом материале для таксономического анализа выделяются группы — таксоны, например, по семейному положению, и затем анализируется их миграционное поведение, по характеру миг рационных потоков в зависимости от численности поселенческих образований (крупных, средних и малых городов, сел).
В многомерной эмпирической классификации используется прием кластерного анализа. Например, конфигурация депутатских групп в органах представительной власти, позволяющая прогнозировать их поведение.
В специальной литературе рассматриваются более сложные приемы анализа информации: критерий Юла, метод корреляционного графа, факторный анализ, всевозможные коэффициенты, например Пирсона.
Как правило, социологи используют стандартные компьютерные программы обработки социологической информации, пригодные для выдачи простых распределений, процентов, отклонений, ранговых и парных коэффициентов корреляции, энтропии, регрессионных показателей, различного рода индексов и т. п.
В зависимости от программных целей исследования анализ полученных данных может быть более или менее глубоким и основательным. В зависимости от целей исследования можно остановиться на определенном этапе анализа информации.
Разумеется, в нашей лекции даны лишь общие подходы, которые позволяют получить представление о методологии, методике и организации социологических исследований. Этих знаний может быть достаточно для проведения простых исследований. Всему остальному надо учиться, в том числе и используя рекомендованную в курсе специальную литературу.

К НАЧАЛУ ТЕМЫ

Контрольные вопросы

  1. Что такое генеральная и выборочная совокупность?
  2. Каковы основные требования к формированию социологической выборки?
  3. Назовите и охарактеризуйте основные виды выборки.
  4. Каковы основные принципы социологических измерений?
  5. Что такое шкала измерения? Составьте такую шкалу по выбранной самостоятельно теме.
  6. Как можно классифицировать шкалы?
  7. Каковы критерии принадлежности шкал?
  8. Каковы основные приемы сбора эмпирической информации?
  9. В чем специфика наблюдения в социологическом исследовании?
  10. Что такое контент-анализ? Определите место анализа документов в социологическом исследовании.
  11. В чем специфика опроса как метода сбора эмпирической информации?
  12. Охарактеризуйте интервью и его виды.
  13. В чем специфика анкетного опроса?
  14. В чем различие индивидуального и группового анкетирования?
  15. Каковы основные требования и последовательность построения анкет?
  16. Каковы основные методы обработки социологической информации?
  17. Определите последовательность и охарактеризуйте стадии социологического анализа.

Понравилась статья? Поделить с друзьями:

Интересное по теме:

  • Повторная регистрация первичного документа ошибка 3 ндфл
  • Повышение значений почти всегда свидетельствует об аппаратной ошибке
  • Повторная регистрация первичного документа код ошибки 0400200000
  • Повышать мастерство лексическая ошибка
  • Повторная регистрация первичного документа код ошибки 0400200005

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии