Генеральная и
выборочная совокупности.
Множество социальных объектов, которые
являются предметом изучения в пределах,
очерченных программой социологического
исследования и территориально-временными
границами, образует генеральную
совокупность.
Любую генеральную
совокупность характеризует некоторый
явно задаваемый признак (или набор
признаков), по значению которого всегда
можно однозначно определить, относится
данный объект к генеральной совокупности
или нет. Так, в качестве генеральной
совокупности мы можем рассматривать
жителей данного города,
промышленно-производственный персонал
предприятия, студентов всей страны и
т. п. Часть
объектов генеральной совокупности,
выступающих в качестве объектов
наблюдения, называется выборочной
совокупностью.
Иными словами, если генеральная
совокупность включает все без исключения
единицы, составляющие объект исследования,
то выборочная совокупность представляет
собой специальным образом отобранную
часть генеральной совокупности. При
этом статистическое наблюдение
осуществляется именно за элементами
выборочной совокупности.
Внимательный
читатель может заметить,, что метод
основного массива и метод монографического
исследования также предполагают
статистическое наблюдение некоторой
части исследуемой совокупности. В чем
же характерный признак выборки? Выборочная
совокупность обычно конструируется
таким образом, чтобы при минимуме
исследуемых объектов удавалось с
необходимой степенью гарантии
представить всю генеральную совокупность.
Единица отбора
и единица наблюдения.
Единицей
отбора называют элементы генеральной
совокупности, которые выступают
единицами счета в различных процедурах
отбора, формирующих выборку.
Единицами
наблюдения называют элементы сформированной
выборочной совокупности, которые
непосредственно подвергаются
статистическому наблюдению.
Единица отбора и единица наблюдения
представляют собой социальные объекты,
обладающие характеристиками,
существенными для предмета конкретного
социологического исследования. Они
могут совпадать (в простых схемах отбора)
и различаться (при сложных комбинированных
схемах отбора).
Систематические
и случайные ошибки статистического
наблюдения.
При получении социальной информации
выборочным методом могут возникать
ошибки различного рода. Причинами могут
быть неточность данных, сообщенных
социологу респондентом, неправильная
фиксация получаемых сведений или
неправильное измерение переменных,
характеризующих единицы наблюдения, и
т. д. Эти ошибки, называемые иногда
ошибками регистрации, могут быть
разделены на два типа: случайные
и систематические.
Систематической
ошибкой регистрации называется ошибка,
выражающая некоторые существенные
связи, возникающие в процессе регистрации
между объектом, субъектом и условиями
проведения наблюдения.
Систематическая ошибка может быть
значительной по своей, величине из-за
одностороннего искажения (в сторону
увеличения или уменьшения) исследуемой
характеристики. Происходящее
вследствие этого накопление ошибки по
исследуемой совокупности в целом
может зачеркнуть результаты всего
исследования.
Систематическая
ошибка регистрации может возникнуть
при любом типе статистического
наблюдения, в том числе и при проведении
выборочного или сплошного обследования.
Характерным
примером систематической ошибки являются
данные о женатых мужчинах и замужних
женщинах во Всесоюзной переписи 1970 г.
По результатам переписи в целом по Союзу
.оказалось 53,0 млн. женатых мужчин и
54,2 млн. замужних женщин. Систематическая
ошибка, зафиксированная в этой, переписи,
образовалась из-за погрешностей в
ответах, возникающих от различной оценки
своего семейного положения мужчинами
я женщинами.
Случайные ошибки
регистрации отражают менее существенные
связи между объектом, субъектом и
условиями регистрации и складываются
из различные статистических погрешностей
в процессе наблюдения.
Погрешности, имея различную направленность
в отдельных единицах наблюдения,
проявляют тенденцию к взаимному
погашению при обобщении результатов
.регистрации по всей исследуемой
совокупности.
Таким образом, в
отличие от систематической случайная
ошибка вызывается при наблюдении
причинами, носящими вероятностный
характер.
Типичные ошибки
выборочного социологического исследования.
Ошибки
регистрации встречаются при любом типе
статистического наблюдения и,
следовательно, свойственны и выборочному
методу исследования.
Кроме того, в
выборочном исследовании могут появиться
ошибки, возникающие при различных
отклонениях от планируемой выборки.
Можно выделить два наиболее типичных
вида отклонения от плана выборки.
1. Замена намеченных
при планировании выборки единиц
наблюдения другими, более доступными,
которые, однако, оказываются
неполноценными с точки зрения выработанного
плана выборки.
Такого рода ошибки
могут возникать при использовании-
недостаточно квалифицированных
интервьюеров. Например, опрос планируется
провести в каждой десятой квартире
жилого массива. Никого не застав в
выбранных квартирах, интервьюер иногда
обращается в соседние квартиры и
берет интервью. В итоге в выборке
оказывается значительная доля
пенсионеров, больших по размеру семей
и слабо представлены одинокие лица и
малочисленные семьи. Ошибок этого
типа (ошибок подстановки) можно избежать,
контролируя деятельность анкетеров и
интервьюеров и качество собранной ими
информации. В противном случае они могут
привести к серьезным систематическим
ошибкам.
2. Неполный охват
выборочной совокупности, т. е. неполучение
информации от части единиц наблюдения,
включенных в выборку (например,
недополучение почтовых анкет, не
полностью заполненные анкеты).
Эти ошибки
устанавливаются путем сравнения реально
сформированной выборки с ее планом.
Ошибки подобного рода снимаются так
называемой процедурой корректировки
выборки, т. е. путем специального
пересчета значений изучаемого признака
с учетом того, какая именно часть
выборочной совокупности выпала из
обследования.
Распространенными
ошибками в выборочном социологическом
исследовании являются ошибки, возникающие
при неправильной разработке плана
выборки. Только правильно намеченный
и, конечно, реализованный план
формирования выборочной совокупности
может дать определенные гарантии, для
распространения выводов, полученных
по выборке, на всю генеральную совокупность.
Во многих книгах
в качестве примера смещения, возникающего
из-за неправильного планирования
выборки, приводится известный опрос,
проведенный Литэрари Дайджест
(Литературное обозрение) относительно
исхода президентских выборов 1936 г. в
США.
Кандидатами на
этих выборах были Ф. Д. Рузвельт и А. М.
Лан-дон. Редакция журнала организовала
план выборки следующим образом. В
выборку попали более двух миллионов
американцев, выбранных при помощи
случайного отбора из списков, имеющихся
в телефонных книгах. По всей стране
попавшим в выборку лицам были разосланы
открытки с просьбой назвать фамилию
будущего президента. Затратив огромную
сумму на рассылку, сбор и обработку
полученных открыток, журнал информировал
общественность, что на предстоящих
выборах президентом США с большим
перевесом будет избран А. М. Ландон.
Результаты выборов опровергли этот
прогноз.
В то же время
социологи Д. Гэллап и Э. Роупер правильно
предсказали победу Ф. Д. Рузвельта,
основываясь только на четырех тысячах
анкет.
Ошибочный прогноз
относительно возможного президента
объясняется неправильным планом
выборки, который не обеспечил полного
отражения в ней всей генеральной
совокупности: в телефонных книгах,
которые использовались для организации
выборки, были представлены лишь наиболее
обеспеченные слои американского
населения, в частности домовладельцы.
Поскольку обеспеченные слои американцев
составляют меньшую часть генеральной
совокупности, то распространение мнения
этой части населения на всю страну в
целом оказалось ошибочным.
Ошибки часто
возникают и в тех случаях, когда в
выборочную совокупность преимущественно
попадают представители одинаковых
социальных групп. Так, почтовые анкеты
чаще заполняют лица с более высоким
уровнем образования, причем мужчины
чаще, чем женщины, пенсионеры чаще, чем
работающие и т. д.
Социолог самое
пристальное внимание должен уделять
анализу возможностей возникновения
ошибок смещения в выборочных
социологических исследованиях.
Репрезентативность
выборки.
Выборка в определенном смысле должна
быть моделью генеральной совокупности,
что и позволяет на ее основе оценивать
характеристики этой совокупности.
Однако нет необходимости моделировать
в выборке все аспекты генеральной
совокупности, достаточно лишь значимых
с точки зрения задач исследования.
Свойство выборки отражать, моделировать
эти характеристики будем называть
репрезентативностью.
Основной принцип
построения выборки (точнее, вероятностного
отбора) состоит в том, чтобы обеспечить
всем элементам генеральной совокупности
равные шансы попасть в выборку.
Однако даже самое аккуратное соблюдение
этого принципа не гарантирует выборку
от искажений. Эти искажения — случайные
ошибки — внутренне присущи выборочному
методу. Они появляются в результате
.того, что обследуются не все единицы
совокупности, а только выборка, и,
следовательно, результат будет неточен,
так как единицы совокупности не
тождественны между собой. Значение
случайной ошибки можно сравнительно
легко вычислить, используя аппарат,
разработанный в статистической
теории выборочного метода. Таким
образом, репрезентативность выборки
будет определяться двумя компонентами:
ошибками регистрации и случайными
ошибками.
В идеальной ситуации
в сплошном исследовании отсутствуют
ошибки репрезентативности, благодаря
чему при правильной организации
наблюдения ошибка выборочного исследования
больше ошибки наблюдения при сплошном
обследовании. Однако в социологии
применение сплошного обследования
требует значительного числа анкетеров
и интервьюеров, а это ведет к тому, что
иногда привлекаются недостаточно
квалифицированные кадры, участие
которых в исследовании увеличивает
ошибку регистрации. И наоборот, применение
выборочного исследования при решении,
тех же вопросов позволяет использовать
более подготовленные кадры специалистов,
обеспечить лучший их инструктаж, контроль
за его выполнением. Это ведет к
уменьшению ошибки регистрации. И если
случайная ошибка не велика, то ошибка
выборочного наблюдения в целом может
оказаться меньше ошибки сплошного
исследования. Таким образом, при
определенных условиях выборочный метод
оказывается более точным, чем сплошной,
что еще раз подчеркивает его преимущество
при организации и проведении эмпирических
социологических исследований.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
1.Инструментарий статистического наблюдения содержит:
а) инструкцию;
б) формуляр;
в) инструкцию и формуляр;
г) макет разработочных таблиц;
д) нет точного ответа.
2.Ошибки статистического наблюдения бывают:
а) только случайные;
б) случайные и систематические;
в) только ошибки репрезентативности.
3.Срок статистического наблюдения — это время, в течение которого:
а) заполняются статистические формуляры;
б) обучается кадровый состав для проведения наблюдения;
в) обрабатывается полученный в ходе наблюдения материал.
4. Ошибки регистрации возникают:
а) только при сплошном наблюдении;
б) только при несплошном наблюдении;
в) как при сплошном, так и при несплошном наблюдении;
5. По времени регистрации фактов статистическое наблюдение бывает:
а) специально организованное;
б) единовременное;
в) выборочное;
г) непосредственное.
6. Статистическая отчетность — это:
а) вид статистического наблюдения;
б) организационная форма наблюдения
в) форма статистического наблюдения.
7. По охвату единиц совокупности статистическое наблюдение бывает:
а) периодическое;
б) в виде отчетности;
в) документальное;
г) монографическое
8. Перепись населения России — это:
а) единовременное, специально организованное, сплошное наблюдение;
б) периодическое, специально организованное, сплошное наблюдение;
в) периодическое, регистровое, сплошное наблюдение;
г) периодическое, специально организованное, несплошное наблюдение.
9. Расхождение между расчетными и действительными значениями изучаемых величин называется:
а) ошибкой наблюдения;
б) ошибкой регистрации;
в) ошибкой репрезентативности.
10. Программно-методологические вопросы плана наблюдения определяют:
а) место, время, вид и способ наблюдения;
б) цель, объект, единицу и программу наблюдения;
в) систему контроля данных наблюдения.
Ответы: 1) а; 2) б; 3) в; 4) а, б, в.
11. Объектом статистического наблюдения являются:
а) явления, подлежащие обследованию;
б) совокупность элементов, подлежащих обследованию;
в) первичный элемент, от которого получают информацию;
г) первичный элемент, признаки которого регистрируются.
12. Единицей статистического наблюдения является:
а) первичный элемент, признаки которого регистрируются;
б) первичная единица совокупности, от которой получают информацию;
в) социально-экономическое явление (или процесс), которое изучается;
г) статистический формуляр (отчет, анкета, учетная карта).
13.Во время переписи земельного фонда всех регионов страны объектом наблюдения является:
а) земельная площадь каждого региона; б) земельная площадь страны.
Единицей совокупности является:
в) земельная площадь каждого региона; г) единица земельной площади.
Ответы: 1) б, в; 2) а, г; 3) б, г; 4) — .
14. Во время инвентаризации кредиторской задолженности клиентов коммерческих банков объектом наблюдения являются:
а) объемы кредиторской задолженности; б) коммерческие банки.
Единицей совокупности являются:
в) кредиты; г) клиенты-должники.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
15. При опросе жителей города по поводу их отношения к приватизации жилья единицами наблюдения являются:
а) все жители города; б) жители неприватизированного жилья.
Единицей совокупности является:
в) жильё, подлежащее приватизации; г) жилищный фонд города.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
16. При выборочной проверке средних школ города по поводу качества питания учащихся в школьных
столовых единицей наблюдения является:
а) учащийся школы; б) школа.
Единицей совокупности является:
в) учащийся школы; г) школьная столовая.
Ответы: 1) а, г; 2) б, в; 3) б, г; 4) а, в.
17. Цензом в статистике называют:
а) орган, осуществляющий наблюдение;
б) лицо, осуществляющее наблюдение;
в) набор количественных и качественных ограничительных признаков.
Ответы: 1) а; 2) б; 3) в; 4) а, б.
18. Программой наблюдения является:
а) перечень работ, которые следует провести;
б) перечень вопросов, на которые следует получить ответы;
в) перечень ответов, полученных в результате наблюдения.
Ответы: 1) а; 2) б; 3) в; 4) б, в.
19. Количественными признаками являются:
а) стаж работы; б) профессия.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
20. Непрерывными признаками являются:
а) оценка знаний студентов; б) средний балл оценок.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
21. Непрерывными признаками являются:
а) размер налогов; б) количество налогоплательщиков.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
22. Дискретными признаками являются:
а) число стран-экспортеров; б) объем экспорта товаров и услуг.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
23. Дискретными признаками являются:
а) количество предприятий бытового обслуживания; б) объем реализации бытовых услуг населению.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
24. Проводится запись актов гражданского состояния.
По степени охвата единиц это наблюдение:
а) основного массива; б) сплошное.
По времени регистрации данных:
в) текущее; г) периодическое.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
25. Проводится учет военнообязанных лиц.
По степени охвата единиц это наблюдение:
а) сплошное; б) монографическое.
По времени регистрации данных:
в) периодическое; г) текущее.
Ответы: 1) а, г; 2) а, в; 3) б, в; 4) б, г.
26. Проводится опрос постоянных слушателей радио-передач «Music-радио».
По степени охвата единиц это явление:
а) выборочное; б) сплошное.
По времени регистрации данных:
в) единовременное; г) текущее.
Ответы: 1) а, г; 2) а, в; 3) б, в; 4) б, г.
27. Организационной формой переписи многолетних плодово-ягодных насаждений является:
а) отчетность; б) специально организованное наблюдение.
Организационной формой составления списков налогоплательщиков является:
в) регистр; г) специально организованное наблюдение.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
28.Организационной формой учета посещений учреждений культуры является:
а) отчетность; б) специально организованное наблюдение.
Организационной формой регистрации итогов биржевых торгов является:
в) отчетность; г) специально организованное наблюдение.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
29. Ошибки регистрации присущи наблюдению:
а) сплошному; б) выборочному.
Ошибки репрезентативности присущи наблюдению:
в) сплошному; г) выборочному.
Ответы: 1) а, в; 2) а, г; 3) б, г; 4) а, б, г.
30. Ошибки регистрации могут быть:
а) случайными, систематическими;
б) логическими и арифметическими.
Ответы: 1) а; 2) б; 3) а, б; 4) — .
31. При анкетном опросе респондент определил свой социальный статус как « учащийся общеобразовательной школы», а в пункте « семейное положение» указал «вдовец». Допущена ошибка:
а) случайная; б) систематическая; в) преднамеренная; г) непреднамеренная.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
32 При опросе респондентка указала, что ей 45 лет. В действительности ей исполнилось 46 лет. Допущена ошибка:
а) случайная; б) систематическая; в) преднамеренная; г) непреднамеренная.
Ответы: 1) а, в; 2) а, г; 3) б, в; — 4) б, г.
33. Сводка статистических данных – это:
а) разбивка совокупности на группы и подгруппы по наиболее характерному признаку;
б) это упорядочивание, классификация и систематизация данных.
Ответы: 1) а; 2) б; 3) а, б; 4) — .
34. Многоступенчатое разбиение совокупности по атрибутивному признаку с четко определенными требованиями и условиями отнесения элементов к той или иной группе называют:
а) классификацией; б) группировкой.
Ответы: 1) а; 2) б; 3) а, б; 4) — .
35. Группировка статистических данных – это:
а)разбивка совокупности на группы и подгруппы по наиболее характерному признаку;
б) это упорядочивание, классификация и систематизация данных.
Ответы: 1) а; 2) б; 3) а, б; 4) — .
36. Вариационным рядом распределения является:
а) распределение городов по количеству жителей;
б) распределение фермерских хозяйств по размеру посевных площадей.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
37. В ряду распределения семей по количеству детей вариантом является:
а) количество семей; б) количество детей.
В ряду распределения городов по количеству жителей частотой является:
в) количество городов; г) количество жителей.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
38. В ряду распределения фирм по количеству занятых вариантом является:
а) количество занятых; б) количество фирм.
В ряду распределения рабочих-наладчиков по количеству обслуживаемых ими станков частотой является:
в) количество наладчиков; г) количество станков.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
39. В форме дискретного ряда целесообразно представить распределение рабочих предприятия:
а) по стажу работы; б) по уровню квалификации (тарифные разряды).
Ответы: 1) а; 2) б; 3) а, б; 4) -.
40. Статистической является таблица, в которой приводится:
а) платежный баланс страны по кварталам года;
б) соотношение мужчин и женщин по регионам.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
41. Статистической является таблица, в которой приводится:
а) итоги торгов на фондовой бирже;
б) расписание движения пригородных электропоездов.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
42. «Подлежащим» статистической таблицы является:
а) перечень характеристик совокупности; б) перечень объектов, подлежащих исследованию.
43. «Сказуемым» статистической таблицы является:
1) перечень характеристик совокупности; 2) перечень объектов, подлежащих исследованию.
44. Статистическая таблица представляет собой:
а) форму наиболее рационального изложения результатов статистического наблюдения;
б) сведения о каком-либо явлении, расположенном по строкам и графам.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
45. Как называется таблица, в которой подлежащее сгруппировано по нескольким признакам: а)простые; б) групповые; в) комбинационные.
Ответы: 1) а, б; 2) б, в; 3) а, в; 4) а, б, в; 5) -.
46.Сводка статистических материалов включает следующие этапы:
а) контроль первичных данных; б) группировка; в) подсчет итогов; г) изложение результатов сводки в виде таблиц.
Ответ: 1) а, б, в; 2) б, в, г; 3) а, в, г; 4) а, б, г.
47. Статистической группировкой называется: а) расчленение совокупности на группы и подгруппы по определенным существенным признакам; б) собирание статистических данных по определенным объектам, группам и т.д.
Ответ: 1) а; 2) б; 3) а, б; 4) -.
48. Признаки, выражающиеся числами, между которыми не может быть никаких промежуточных значений, являются: а) дискретными; б) непрерывными.
Признаки, выражающиеся целыми и дробными числами и регистрирующиеся с определенной степенью точности, являются: в) дискретными; г) непрерывными.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
49. Из перечисленных ниже признаков дискретными являются: а) выработка продукции на одного рабочего в год по заводу (тыс. руб.); б) выработка деталей каждым рабочим за один день (шт.).
Ответ: 1) а; 2) б; 3) а, б; 4) -.
50. Если группировочный признак изменяется более или менее равномерно в небольших пределах, то применяются интервалы:
а) равные; б) неравные;
Если группировочный признак изменяется неравномерно или в больших пределах, то применяются интервалы: в) равные; г) неравные.
Ответы: 1) а, в; 2) б, в; 3) б, г; 4) а, г.
51. По форме выражения группировочные признаки бывают: а) атрибутивные; б) количественные.
Ответ: 1) а; 2) б; 3) а, б; 4) -.
52. К количественным признакам относятся: а) вид выпускаемой продукции; б) выпуск продукции в натуральном выражении.
Ответ: 1) а; 2) б; 3) а, б; 4) -.
53. Признаки, выражающиеся целыми и дробными числами и регистрирующиеся с определенной степенью точности являются: а) дискретными; б) непрерывными. Вопрос об определении интервалов возникает при группировке по признакам: в) атрибутивным; г) количественным.
Ответы: 1) а, в; 2) б, в; 3) а, г; 4) б, г.
54. Из перечисленных ниже признаков дискретными являются: а) объём выпускаемой продукции (млн. шт.); б) выработка деталей каждым рабочим за один день (шт.).
Ответ: 1) а; 2) б; 3) а, б; 4) -.
55. Интервалы, имеющие две границы (верхнюю и нижнюю), являются интервалами: а) открытыми; б)закрытыми. Если группировочный признак изменяется более или менее равномерно в небольших пределах, то применяются интервалы: в) равные; г) неравные.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
56. Группировка — это:
а) упорядочение единиц совокупности по признаку;
б) разбивка единиц совокупности на группы по признаку;
в) обобщение единичных фактов.
57. Группировочным признаком при построении аналитической группировки выступает:
а) факторный;
б) результативный;
в) факторный и результативный.
58. Основанием группировки может быть:
а) качественный признак;
б) количественный признак;
в) как качественный, так и количественный признаки
59.Ряд распределения, построенный по качественному признаку, называется:
а) атрибутивным;
б) дискретным;
в) вариационным.
60. Вариационный ряд распределения — это ряд, построенный:
а) по качественному признаку;
б) по количественному признаку;
в) как по качественному, так и по количественному признаку.
61. Для изображения дискретных рядов распределения используется:
а) полигон;
б) гистограмма;
в) кумулята.
62.Статистическая таблица – это: а) определенная последовательность пересекающихся горизонтальных и вертикальных линий; б) наглядное изложение (представление) в специальной (табличной) форме статистического материала; в) определенный носитель статистических данных. Ответы: 1) а; 2) б; 3) в; 4) –
63. Подлежащее в таблице – это: а) информация, размещенная в таблице в определенной логической последовательности; б) название (заголовок) таблицы; в) признак, который анализируется (описывается) в таблице. Ответы: 1) а; 2) б; 3) в; 4)-
64. Сказуемое в таблице – это: а) источники статистической информации; б) цифровой материал таблицы; в) признаки, которыми характеризуется подлежащее, и цифровой материал таблицы; г) название граф (столбцов, колонок). Ответы: 1) а; 2) б; 3) в; 4) г
65. По сложности построения подлежащего таблицы делятся на: а) простые, групповые, комбинированные; б) первичные, вторичные, многоступенчатые; в) типологические, структурные, аналитические. Ответы: 1) а; 2) б; 3) в; 4) –
66. Показатели, характеризующие объемы, размеры социально-экономических явлений, — величины:
а) абсолютные; б) относительные.
Они выражаются единицами измерения:
в) натуральными, трудовыми, стоимостными; г) коэффициентами, процентами.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
67. Укажите относительные величины интенсивности:
а) на 1000 женщин приходится 895 мужчин;
б) количество новорожденных на 1000 жителей составляет 13,5.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
68. Укажите относительные величины интенсивности:
а) на 10 000 жителей старше 14 лет зарегистрировано 510 преступлений;
б) среди осужденных каждый третий в возрасте до 30 лет.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
69. На начало года капитал коммерческих банков составлял, млн. ден. ед.: банка А – 760, банка В – 420; прибыль соответственно 266 и 147. Прибыльность капитала (прибыль/капитал):
1)больше в банке А; 2) больше в банке В; 3) в обоих банках одинакова; 4) вывод сделать невозможно.
70. Укажите относительные величины структуры:
а) бюджетные расходы на охрану здоровья составляют 10%;
б) в экспорте продукции акционерного общества 48% приходится на Китай, 29% — на Россию.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
71.Абсолютные величины могут выражаться в единицах измерения:
а) натуральных и условно-натуральных;
б) трудовых и денежных;
в) отвлеченных.
72. Абсолютные величины выражаются в единицах измерения:
а) килограммах, штуках, метрах, тоннах, километрах и т.д.;
б) коэффициентах, процентах, промилле, продецимилле.
73 .Виды абсолютных величин:
а) индивидуальные, общие;
б) выполнение плана, планового задания, динамики, структуры, координации, сравнения, интенсивности.
74. Относительные величины выполнения плана исчисляются как:
а) отношение планового задания на предстоящий период к фактически достигнутому уровню, являющемуся базисным для плана;
б) отношение фактически достигнутого уровня к плановому заданию за тот же период времени.
75. Относительные величины динамики получаются в результате сопоставления показателей каждого последующего периода:
а) с предыдущим;
б) с первоначальным;
в) со средним.
76.Относительные величины структуры:
а) характеризуют состав явления и показывают, какой удельный вес в общем итоге составляет каждая его часть;
б) показывают соотношение отдельных составных частей целого явления.
77.Относительные величины интенсивности представляют собой:
а) отношение двух разноименных показателей, находящихся в определенной взаимосвязи;
б) отношение двух одноименных показателей, относящихся к разным объектам или территориям за один и тот же период или момент времени.
78. Укажите относительную величину уровня экономического развития:
а) в одном из регионов на душу населения было произведено 760 м3 газа;
б) производство хлопчатобумажных тканей на душу населения в одном из регионов в 2,3 раза больше, чем в другом.
79. Величины, адекватно характеризующие социально-экономические явления в конкретных условиях времени и места: а) обобщающие показатели; б) индивидуальные показатели; в) статистические
показатели.
Ответы: 1) а; 2) б; 3) в; 4) все; 5) -.
80. Показатели, характеризующие размеры (объёмы) изучаемых явлений: а) относительные величины; б) абсолютные величины; в) обобщающие показатели.
Ответы: 1) а; 2) б; 3) в; 4) все; 5) -.
81. Абсолютные величины – это: а) показатели, характеризующие размер изучаемых явлений; б) показатели, получаемые путем сравнения, сопоставления величин в пространстве, во времени или сравнение показателей разных свойств изучаемого объекта.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
82. Относительная величина структуры характеризует: а) соотношение между частями статистической совокупности; б) степень сравнения одноименных показателей в различных совокупностях; в) развитие явления во времени; г) удельный вес части изучаемого явления.
Ответы: 1) а; 2) б; 3) в; 4) г.
83. Средняя является величиной, типичной для качественно однородной совокупности: а) да; б) нет.
Для любой совокупности: в) да; г) нет.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
84. Для определения среднего значения признака, индивидуальные значения которого выражены
обратными показателями, следует применить формулу средней: а) гармонической; б)арифметической; в) геометрической; г) квадратической.
Ответы: а, б, в, г.
85. Имеются ежегодные коэффициенты роста, характеризующие изменение явления по отношению к предыдущему году за период 1990 – 1996 гг. Для определения среднего темпа роста следует применить формулу среднюю: а) арифметическую; б) гармоническую; в) геометрическую; г)квадратическую.
Ответы: а, б, в. г.
86. Если все индивидуальные значения признака увеличить в 5 раз, то средняя: а) увеличится в 5 раз; б) не изменится; в) увеличится на пять; г) изменение средней предсказать нельзя.
Ответы: а, б, в, г.
87. Если частоты всех значений признака увеличить в 7 раз, то средняя: а) не изменится; б) увеличится; в) уменьшится; г) изменение средней предсказать нельзя.
Ответы: а, б, в, г.
88. Конкурс на вступительных экзаменах в ВУЗ изменялся относительно предыдущего года, %: в 1991 г.– 79; 1992 г. – 82; 1993 г. – 87; 1994 г. – 96. Среднегодовой процент изменения конкурса можно вычислить по формуле средней: а) арифметической; б) гармонической; в) геометрической; г)хронологической.
89. Мода в ряду распределения – это:
а) наиболее распространенное значение признака; б) наибольшая частота.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
90. Медиана в ряду распределения – это:
а) наиболее распространенное значение признака; б) значение признака, делящее ряд пополам.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
91. Вариация – это:
а) разнообразие значений определенного признака в статистической совокупности; б) отличия значений разных признаков у отдельного элемента совокупности. Можно ли измерять вариацию по данным ряда распределения?
в) да; г) нет.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г._
92. Если все частоты умножить на 25, то средняя: а) не изменится; б) увеличится на 25; в) уменьшится на 25 раз.
Ответы: 1) а; 2) б; 3) в; 4) -.
93. Какое (какие) из указанных ниже действий необходимо произвести для расчета средней арифметической из интервального ряда. Добавьте, что считаете необходимым: а) закрыть интервалы; б) заменить интервалы их среднем значением; в) рассчитать среднюю арифметическую взвешенную.
Ответы: 1) а, б; 2) а, в; 3) б, в; 4) а, б, в.
94. Варианта – это: а) число единиц совокупности, обладающих данным признаком; б) анализируемый признак.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
100. Отношение частоты признака к объёму совокупности – это: а) частота; б)частость; в) накопленная частота;
Ответы: 1) а; 2) б; 3) в; 4) -.
95. Медианный интервал представляет собой: а) интервал, содержащий наибольшую частоту; б) интервал, для которого выполняется соотношение: первая накопленная частота равна или больше половины суммы всех частот.
Ответы: 1) а; 2) б; 3) а, б; 4) -.
96. Модой в ряду распределения является: а) наибольшая частота; б) наибольшая варианта; в) варианта, которая чаще других встречается; г) варианта, делящая ряд на две равные части.
Ответы: 1) а; 2) б; 3) в; 4) г; 5) -.
97. Отклонение выборочных характеристик от соответствующих характеристик генеральной совокупности, возникающее вследствие несплошного характера наблюдения, называется:
а) систематической ошибкой репрезентативности;
б) случайной ошибкой репрезентативности.
98. Остатки оборотных средств на конец каждого квартала – это ряд динамики:
а) интервальный; б) моментный.
Средний уровень этого ряда рассчитывается по формуле средней:
в) арифметической; г) хронологической.
Ответы: 1) а,в; 2) а,г; 3) б,в; 4) б,г.
99. Базисный абсолютный прирост равен:
а) сумме цепных абсолютных приростов; б) произведению цепных абсолютных приростов. Базисный коэффициент роста равен: в) сумме абсолютных темпов роста; г) произведению цепных коэффициентов роста.
Ответы: 1) а,в; 2) а,г; 3) б,в; 4) б,г.
100. Темпы роста прибыльности банка (в % к 1997 г.) составляли: 1997 г. – 100; 1998 г. – 105; 1999 г. –110. В 1999 г. темп роста прибыльности по сравнению с 1997 г.:
а) увеличился; б) уменьшился; в) остался неизменным.
- 1
- 2
- 3
- 4
- 5
Категория: Статистика | Просмотров: 1 | Рейтинг: 3.8/4
48 : Основные понятия теории выборки. Типы выборочных процедур.
Понятие генеральной и выборочной совокупности. Задача построения выборки возникает всякий раз, когда необходимо собрать информацию о некоторой группе или большой совокупности людей. Выборка — это подмножество заданной совокупности (популяции), позволяющее делать более или менее точные выводы относительно совокупности в целом. выборка экономит силы и средства исследователей. представляет собой удобную и экономичную форму индуктивного вывода, используется принцип случайного отбора
Применимость выборочного метода для изучения случайно распределенных признаков, например дохода или размера семьи, была впервые обоснована в работах норвежца А. Киэра, англичан А. Боули и К. Пирсона, а также русского статистика А. И. Чупрова.
Следующим принципиально важным шагом в развитии выборочного метода стала осуществленная Р. Фишером разработка техники рандомизации в эксперименте и выборочном наблюдении. равенство шансов попадания в выборку для каждого наблюдения, т. е. отбор «наугад», гарантирует от намеренных или ненамеренных искажений. Поэтому наилучшей моделью отбора считается вероятностная, или случайная, выборка, в которой строго соблюдается принцип равенства шансов попадания в выборку и для всех единиц изучаемой совокупности, и для любых последовательностей таких единиц.
Все члены интересующей исследователя группы (популяции) составляют генеральную совокупность. Выборочная процедура обеспечивает обоснованность и «законность» выводов о генеральной совокупности, сделанных на основании небольшой выборки. Первым шагом в построении любой модели отбора, включая вероятностную, является определение генеральной совокупности. — множество интересующих социолога объектов исследования, может быть задана и описана лишь на основе каких-то содержательных представлений. Если, например, нас интересуют политические пристрастия избирателей, естественно включить в генеральную совокупность лишь тех, кто уже достиг 18-летнего возраста.
идеальная генеральная совокупность, задаваемая теоретическим описанием предмета исследования, почти никогда не будет полностью совпадать с реальной совокупностью. Репрезентативность выборки. Основной принцип построения выборки (точнее, вероятностного отбора) состоит в том, чтобы обеспечить всем элементам генеральной совокупности равные шансы попасть в выборку. Однако даже самое аккуратное соблюдение этого принципа не гарантирует выборку от искажений. Эти искажения — случайные ошибки — внутренне присущи выборочному методу. репрезентативность выборки будет определяться двумя компонентами: ошибками регистрации и случайными ошибками.
можно говорить о наличии существенной выборочной ошибки. Более строго выборочную ошибку определяют как расхождение между оценкой некоторого показателя, получаемой на основании исследования выборки, и истинным значением этого показателя в генеральной совокупности.
Существует несколько типов вероятностной выборки, различающихся характером выборочной процедуры: простая случайная, систематическая, стратифицированная, кластернаяю и многоступенчатая.
Простая случайная выборка — это не только наглядное воплощение идеи случайного отбора, но и своего рода эталон, с которым сравниваются другие вероятностные процедуры. Процедура построения простой случайной выборки включает в себя следующие шаги. нужно получить полный список членов генеральной совокупности и пронумеровать этот список. следует определить предполагаемый объем выборки, т. е. ожидаемое число опрошенных. нужно извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел.Нужно выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам
Систематическая выборка по качеству часто приближается к простой случайной. Систематическая выборка, как и простая случайная, требует полного списка или заданного упорядочения совокупности. Техника осуществления систематического отбора элементарна: сначала случайным образом отбирается первая единица, затем отбору подлежит каждый k-й. элемент. Число k в данном случае называют шагом отбора. Можно, например, отбирать каждый 25-й или каждый 200-й элемент. Чтобы определить шаг отбора, нужно поделить известный объем генеральной совокупности (N) на предполагаемый объем выборки (п).
Стратифицированный отбор и соответственно стратифицированная выборка используются в тех случаях, когда важно обеспечить представительность вероятностной выборки по каким-то конкретным важным для исследовательских целей критериям.
Стратификацией, называют процедуру, при которой отбор осуществляют как бы из нескольких «параллельных» подсовокупностей, заданных на одной и той же генеральной совокупности.
многофазная (многоступенчатая) выборка. Он заключаемся в том, что из сформированной выборки большего объема производится новая выборка (подвыборка) меньшего объема и т. д.Особенность: независимо от числа фаз в последующих подвыборках используется неизменно одна и та же единица отбора, что и в основной выборке. К многофазовому отбору, прибегают тогда, когда в рамках исследования, которое проводится на большой выборке, возникает необходимость тщательного изучения более узкого круга вопросов. Для этих целей формируется вторая фаза — та же выборка в миниатюре и т. д. при многофазовом отборе каждая фаза является источником случайных ошибок.
Метод «снежного кома»—это еще один (наряду с выборкой доступных случаев) интересный подход к отбору из «редких» совокупностей. Первоначально идентифицированная небольшая группа членов интересующей социолога совокупности служит источником сведений о других членах этой совокупности, так что выборка постепенно разрастается вширь подобно снежному кому, катящемуся с горы. Этот метод использовал, например, П. Лазарсфельд с коллегами в исследовании «влиятельных людей» и неформальных связей.
К выборкам, не основанным на случайном отборе, относится и квотная выборка, Идея квотной выборки проста: изучаемая совокупность разбивается на такие социально-демографические группы, которые исследователь почему-либо считает важными. Обычно критериями разбивки становятся пол, возраст, национальная принадлежность, место жительства и т. п. Далее, основываясь на уже известных (обычно из официальной статистики) пропорциях этих групп в генеральной совокупности, социолог составляет полевые задания для интервьюеров, указывая, сколько женщин, мужчин, лиц с высшим образованием и т. п. нужно опросить. носит неслучайный характер и осуществляется лично интервьюером.
Единица отбора и единица наблюдения. Единицей отбора называют элементы генеральной совокупности, которые выступают единицами, счета в различных процедурах отбора, формирующих выборку.
Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются статистическому наблюдению. Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора).
Систематические и случайные ошибки статистического наблюдения. При получении социальной информации выборочным методом могут возникать ошибки различного рода. Систематической ошибкой регистрации называется ошибка, выражающая некоторые существенные связи, возникающие в процессе регистрации между объектом, субъектом и условиями проведения наблюдения. Систематическая ошибка может быть значительной по своей величине из-за одностороннего искажения (в сторону увеличения или уменьшения) исследуемой характеристики. Происходящее вследствие этого накопление ошибки по исследуемой совокупности в целом может зачеркнуть результаты всего исследования.Систематическая ошибка регистрации может возникнуть при любом типе статистического наблюдения, в той числе и при проведении выборочного или сплошного обследования.
Случайные ошибки регистрации отражают менее существенные связи между объектом, субъектом и условиями регистрации и складываются из различных статистических погрешностей в процессе наблюдения. в отличие от систематической случайная ошибка вызывается при наблюдении причинами, носящими вероятностный характер.
Типичные ошибки выборочного социологического исследования. Ошибки регистрации встречаются при любом типе статистического наблюдения и, следовательно, свойственны и выборочному методу исследования.
В любом случае, при необходимости, социолог проводит ремонт выборки – уравнивание генеральной и выборочной долей, который осуществляется, как правило, компьютерным образом путем присвоения поправочных коэффициентов. Поправочный коэффициент – доля, которая существует в генеральной совокупности, делится на долю, которая существует в выборке (доля женщин в выборке составляет 40%, а на самом деле она должна быть 55%). Самая главная опасность – социолог может не только допустить, что в выборке могут появиться систематические смещения, но может их не заметить.
Верны ли определения?
А) Многофакторной называется связь между одним факторным и одним результативным признаком.
В) Однофакторной называется связь между несколькими факторными и одним результативным признаком.
Подберите правильный ответ.
(*ответ*) А – нет, В – нет.
А – да, В – нет.
А – да, В – да.
А – нет, В – да.
Верны ли определения?
А) Монографическое статистическое наблюдение является видом не сплошного наблюдения.
В) Анкетное статистическое наблюдения является видом периодического наблюдения.
Подберите правильный ответ.
(*ответ*) А – да, В – нет
А – да, В – да.
А – нет, В – нет.
А – нет, В – да.
Верны ли определения?
А) Не сплошное статистическое наблюдение бывает монографическим.
В) Сплошное статистическое наблюдение бывает выборочным.
Подберите правильный ответ.
(*ответ*) А – да, В – нет
А – да, В – да.
А – нет, В – нет.
А – нет, В – да.
Верны ли определения?
А) Номинальная шкала — шкала наименований, устанавливающая отношение подобия элементов, при котором порядок расположения признаков не имеет значения.
В) Порядковая (ранговая) шкала — шкала, устанавливающая последовательность интенсивности проявления признака.
Подберите правильный ответ.
(*ответ*) А – да, В – да.
А – да, В – нет
А – нет, В – нет.
А – нет, В – да.
Верны ли определения?
А) Номинальная шкала — шкала, устанавливающая последовательность интенсивности проявления признака.
В) Метрическая шкала — количественная шкала, в основу которой положены результаты непосредственного измерения.
Подберите правильный ответ.
(*ответ*) А – нет, В – да.
А – да, В – нет
А – да, В – да.
А – нет, В – нет.
Верны ли определения?
А) Общие статистические совокупности явлений состоят из частных совокупностей.
В) Частные статистические совокупности явлений состоят из общих совокупностей.
Подберите правильный ответ.
(*ответ*) А – да, В – нет
А – да, В – да.
А – нет, В – нет.
А – нет, В – да.
Верны ли определения?
А) Официальная отчетность охватывает данные в соответствии со специально утвержденными государственными органами формами.
В) Специально организованные наблюдения охватывают сферы жизни, которые не улавливаются официальной отчетностью.
Подберите правильный ответ.
(*ответ*) А – да, В – да.
А – да, В – нет
А – нет, В – нет.
А – нет, В – да.
Верны ли определения?
А) Ошибки регистрации свойственны только выборочному наблюдению, возникают вследствие не сплошного характера регистрации или нарушения принципов случайности отбора.
В) Ошибки репрезентативности возникают при любом статистическом наблюдении вследствие неправильного установления фактов.
Подберите правильный ответ.
(*ответ*) А – нет, В – нет.
А – да, В – нет
А – да, В – да.
А – нет, В – да.
Тип поведения объекта можно отождествить и с тем, что для этого объекта у принимает определенное значение. Подчеркнем, что в любом случав упомянутая выше гипотеза о детерминации не может означать предположения о «жестком» определении значения по сочетанию значений х.
В соответствии с выдвинутой гипотезой исследователь ставит перед собой задачу выяснить, какие именно сочетания значений независимых признаков являются в интересующем его смысле детерминирующими (определяющими тип поведения объектов). Иногда к этому добавляется и задача выделения из числа независимых переменных подсовокупности признаков, наиболее информативных в том смысле, что по сочетанию именно их значений с наибольшей степенью уверенности можно судить о типе поведения объектов. В едином комплексе с этими задачами может решаться и задача выявления самих типов поведения, свойственных объектам изучаемой совокупности. Именно сочетание названных трех задач (может быть, без второй или третьей) и называется задачей поиска детерминирующих комбинаций значений переменных.
В соответствии с тем, как понимается тип поведения объектов, должен формироваться критерий, является ли тот или иной набор сочетаний значений х детерминирующим это поведение. Многообразие методов поиска детерминирующих характеристик и объясняется в основном различием таких критериев.
Например, первому описанному выше пониманию типа поведения отвечает поиск такого разбиения исходной совокупности объектов (соответствующего определенному набору сочетаний значений х), что каждой выделенной подсовокупности будет соответствовать свое распределение значении у (степень различия распределений определяется в соответствии с известными статистическими критериями). Искомые детерминирующие комбинации — это те наборы сочетаний значений с, которые соответствуют выделенным подсовокупностям[101].
Второму пониманию типа поведения отвечает поиск такого разбиения исходной совокупности объектов, при котором каждая подсовокупность будет иметь свое среднее арифметическое значение у (т. с. разница между соответствующими средними значениями будет статистически значима)[102]. Отметим тесную связь такого подхода с методами дисперсионного анализа. С помощью которого можно изучать влияние совокупности качественных признаков па некоторый количественный признак[103]. Однако дисперсионный анализ предназначен для изучения интегральных связей. Он исходит из априори заданных групп объектов — каждая группа соответствует одному возможному сочетанию значений независимых переменных и позволяет проверить гипотезу о совпадении типов поведения этих групп (тип поведения в дисперсионном анализе понимается именно рассматриваемым образом). Описываемые же нами методы решают более широкую задачу — они позволяют проанализировать с той же точки зрения все возможные группы объектов, соответствующие тому или иному набору сочетаний значений независимых переменных.
Подчеркнем, что при использовании описанных подходов ищутся не только сочетания значений независимых переменных, определяющих некоторые типы поведений, но и сами эти типы.
Для иллюстрации одного из возможных подходов к поиску детерминирующих комбинаций значений переменных при третьем упомянутом выше понимании типа поведения дадим некоторые определения, введенные С. В. Чесноковым[104], и приведем пример из его же работы. Привлекательность методики поиска детерминирующих характеристик, предложенной этим автором, в том, что она по существу является формализацией рассуждений, наиболее часто использующихся социологом при практическом решении задач о статистической зависимости.
Рассмотрим случай, когда данные представлены таблицей 2×2, изучаемые объект —респонденты, признак х принимает значения а и b, а признак у — значения с и d. Назовем типом поведения респондента соответствующее ему значение у и ниже будем говорить о детерминации значением а типа поведения с. Очевидно, считать, что такая детерминация действительно имеет место, можно только в том случае, если достаточно велика степень уверенности в реализации поведения с для объекта, со значением а независимой переменной. Уточним смысл такой уверенности.
Назовем интенсивностью детерминации а®с величину I(а®с), равную доле респондентов, для которых у = с в группе респондентов, удовлетворяющих условию: х = а. Интенсивность детерминации означает точность высказывания «если а, то с». Назовем емкостью детерминации а®с величину c(а®с), равную доле респондентов, для которых х = а, в группе респондентов, удовлетворяющих условию у = с. Емкость детерминации измеряет долю случаев реализации поведения с, которая объясняется высказыванием из в следует. Емкость c(а®с) отражает, насколько всеобъемлюще объяснение, построенное на детерминации (а®с), т. е. полноту этой детерминации.
Для обоснованности выводов о том, что «а влечет с», недостаточно знать I, необходимо оценить и С.
Пример. Пусть х — пол (а — мужчина, b — женщина), а у — величина зарплаты (с—высокая, d — низкая). Предположим, что частотная таблица имеет вид
y | x | |
мужчины (a) | женщины (b) | |
Высокая зарплата (c) Низкая зарплата (d) |
Тогда очевидно, что
На основании того, что 70% мужчин имеют высокую зарплату, мы не можем говорить, что пол детерминирует величину зарплаты. Для этого вывода необходимо еще оценить, какова доля мужчин среди лиц с высокой зарплатой. Например, если этот процент равен I, то сформулированный вывод вряд ли можно считать справедливым. Полученные же в рассматриваемом примере 40% могут способствовать обоснованию этого вывода; если исследователь сочтёт этот процент достаточно высоким.
Показатели, аналогичные введенным величинам I и С, легко можно определить и для того случая, когда количество независимых признаков более одного.
Очевидно, в отличие от тех ситуаций, когда тип понимается одним из двух описанных выше способов, в данном случае мы не выявляем типы поведения в процессе нахождения детерминирующих сочетаний. Такая задача решается отдельно для каждого значения зависимой переменной: фиксируя это значение (т. е. тип поведения), мы ищем такие сочетания значений независимых переменных, которые определяют его с достаточно высокими значениями I и С (смысл выражения достаточно высокие определяется исследователем).
Наряду с методами поиска детерминирующих комбинаций значений переменных разработаны подходы к выявлению связей между номинальными признаками, аналогичные методам регрессионного анализа. В последнее десятилетие был предложен ряд подходов к решению этого вопроса[105]. Опишем один из них.
Прежде всего заметим, что если все рассматриваемые переменные дихотомические, то, применяя к исходным данным технику обычного регрессионного анализа, будем получать содержательно интерпретируемые результаты[106]. Это связано с тем, что дихотомическую шкалу можно считать частным случаем интервальной. Приведем пример вычисления регрессионной зависимости между номинальными переменными, в котором реализуется метод, основанный на сделанном замечании.
Сначала каждая переменная, принимающая I значений, заменяется на I фиктивных дихотомических переменных: каждому исходному значению соответствует своя дихотомическая переменная.
Пусть и
— исходные независимые номинальные переменные, принимающие каждая три значения — 1, 2, 3. Через
,
,
,
,
,
обозначим вводимые фиктивные переменные (
,
,
соответствуют переменной
,а
,
,
—
). Значения, принимаемые фиктивными переменными, можно понять из следующей таблицы, где приведены значения
и
для некоторых трех объектов.
№ объекта | Значение исходных переменных | Значение фиктивных переменных | |
0 1 0 1 0 0 1 0 0 0 0 1 0 0 1 0 1 0 |
|||
К полученным фиктивным переменным применяется обычная техника регрессионного анализа. Причем, поскольку зависимая переменная также заменена на k фиктивных переменных (если она принимает k значений), вместо одного уравнения рассчитывается k уравнений: для каждой упомянутой фиктивной переменной строится свое уравнение регрессии. Для оценивания влияния независимых переменных на зависимую в целом (а не на отдельные соответствующие ей фиктивные переменные) служит комплекс различных коэффициентов.
Аналогичный подход можно использовать и в случае, если зависимая переменная получена по интервальной шкале[107].
Как уже отмечалось, помимо задачи анализа связей между переменными, довольно актуальными для социологии являются также задачи нахождения латентных переменных и классификации объектов. Правда, эти задачи очень часто можно рассматривать как частный случай задачи изучения связей: латентные факторы обычно находятся именно на основе анализа связей между наблюдаемыми признаками, а для осуществления классификации, как правило, анализируются связи между объектами. Но тем не менее названные задачи -имеют и свою специфику, обусловленную их ролью в изучении интересующих социолога вопросов. Это обусловливает и определенную специфику соответствующих математических методов. Поэтому имеет смысл сказать несколько слов о путях решения обеих задач, когда изучаемые объекты характеризуются значениями номинальных или порядковых признаков[108].
Поиск латентных переменных может осуществляться с помощью методов латентно-структурного анализа. Кроме того, возможны различные подходы к использованию традиционных методов факторного анализа для анализа данных, полученных по порядковой и номинальной шкалам[109].
Основная проблема, встающая перед исследователем, желающим применить математические методы классификации к объектам, заданным значениями номинальных и порядковых признаков, — это проблема выбора меры близости между этими объектами. Большинство традиционных мер рассчитано на признаки, измеренные по интервальной шкале. Однако известны и такие меры, которые могут быть применены в интересующем нас случае. Выбор подходящей меры близости обеспечивает возможность использования многих методов классификации[110].
Далее рассмотрим несколько разработанных советскими авторами общих подходов к задаче анализа качественных данных.
Первый подход предложен Г. С. Лбовым[111]. Автор предполагает, что исходные признаки могут быть измерены по любой шкале, и следующим образом вводит понятие логического, высказывания, являющегося основным во всех предложенных им алгоритмах.
Если признак , измерен по номинальной шкале и
— его значения, то назовем элементарным высказыванием выражение вида
. Если признак
, измерен по шкале, тип которой не ниже порядковой шкалы, b и с — произвольные его возможные значения и b<с, то назовем элементарным высказыванием выражение вида b<
<c. Логическим высказыванием назовем выражение вида
, где
— произвольное элементарное высказывание, а
— знак конъюнкции (логический символ: высказывание, являющееся конъюнкцией двух предложений, истинно в том случае, если истинны оба входящие в него предложения).
Приведем пример логической закономерности. Пусть — пол, принимающий два значения: 0 (мужчина) и 1 (женщина);
— удовлетворенность респондента своей работой, измеренная по порядковой шкале с градациями 1, …, 5;
— зарплата респондента, измеренная по шкале отношений (в руб.). Примером логического высказывания может служить выражение
. Ясно, что каждое логическое высказывание задает определенную область рассматриваемого признакового пространства.
Разработанный Г. С. Лбовым подход к анализу исходных данных, полученных по разным шкалам, с успехом позволяет решать задачи, подобные описанным выше задачам поиска детерминирующих комбинаций значений признаков. А именно автор предлагает алгоритм, согласно которому при любом разбиении исходной совокупности объектов на классы (это разбиение может быть осуществлено, в частности, в соответствии со значениями некоторого зависимого, признака) для каждого такого класса может быть осуществлен поиск логических высказываний, выполняющихся (т.е. истинных) на принадлежащих ему объектах. (Выполнение понимается в некотором статистическом смысле. Грубо говоря, выполнение, высказывания для объектов какого-либо класса означает, что это высказывание истинно для большинства объектов этого класса.)
Но тот же подход позволяет решать и гораздо более широкий круг встающих перед социологом задач: задачу автоматической классификации исходных объектов (грубо говоря, в разные классы попадают объекты, для которых выполняются разные логические высказывания); задачу построения логических решающих правил, т. е. границ между классами, если задано, в какой класс каждый объект входит (такие правила также определяются в терминах логических высказываний); задачу динамического прогнозирования (алгоритм использует логические решающие правила.) и т. д.
Второй подход разработан группой исследователей под руководством Б. Г. Миркина[112]. Авторы этого подхода предлагают рассматривать каждый признак как некоторое отношение на множестве изучаемых объектов и задаватьего в виде булевой матрицы, т. е. матрицы, элементы которой могут принимать только два значения, например 0 и 1. Приведем пример.
Пусть для некоторых четырех респондентов заданы значения признаков: пол (0 — мужчина, 1 — женщина) и профессия {принимающая значения 1, 2, 3, 4) и пусть соответствующая матрица объект — признак имеет вид
№ респондента | Признак | |
пол | профессия | |
Тогда рассматриваемым признакам будут соответствовать следующие булевы матрицы:
№ респондента | 1 2 3 4 | № респондента | 1 2 3 4 | |
1 1 0 1 1 1 0 1 0 0 1 0 1 1 0 1 |
1 0 0 0 0 1 0 0 0 0 1 1 0 0 1 0 |
На пересечении i-го столбца и j-й строки стоит единица, если значения рассматриваемых признаков для i-го и j-го объектов совпадают, и 0 — в противоположном случае.
Авторы рассматриваемого подхода предлагают основанные на использовании описанного способа представления исходных данных методы решения широкого круга задач, в том числе и социологических: классификация объектов, изучение связей между признаками, выявление латентных переменных и т. д. Например, в качестве латентного фактора, объясняющего связи между несколькими исходными признаками, заданными матрицами, подобны ми описанным выше, будет выступать признак, заданный матрицей, в определенном смысле близкой ко всем исходным матрицам одновременно (первым шагом решения соответствующей задачи будет поиск таких групп исходных матриц, для каждой из которых подобную среднюю матрицу можно найти).
Интересный подход к анализу структуры связей между рассматриваемыми переменными в тех случаях, когда эти переменные измерены по произвольным шкалам, предложен Ю. Н. Гаврильцом[113]. Этот подход позволяет учитывать, что связь может быть прямой и опосредованной, тесной и слабой и т. д., что изменение значений части признаков может менять характер распределения у другой части признаков, в то время как распределение третьей части признаков остается прежним. Основные принципы представления исходной информации, лежащие в основе этого подхода, являются слишком сложными для того, чтобы их можно было сформулировать в настоящем параграфе.
Последний подход к анализу информации, полученной по поминальной или порядковой шкале, о котором нам хотелось бы упомянуть,— это так называемая метризация используемых шкал (оцифровка значений признаков). Это — приписывание исходным шкальным значениям таких меток, чисел, что отношения между получающимися интервалами начинают иметь содержательный смысл. К настоящему времени разработано довольно много способов такого превращения номинальной либо порядковой шкалы в интервальную[114]. Однако использовать их надо с большой осторожностью, поскольку каждый из этих способов предполагает довольно сильные и часто трудно проверяемые свойства исходных шкальных значений (эти предположения могут быть как содержательными, таки формальными).
В заключение настоящего раздела отметим, что большинство описанных в этой главе методов реализовано в имеющихся в различных научных центрах нашей страны комплексах программ для ЕС ЭВМ. Методы дискриптивной статистики, вычисления, всевозможных мер связи, методы регрессионного анализа и другие методы многомерного статистического анализа, в том числе методы поиска детерминирующих характеристик значений независимых Примаков, реализованы в системе Социолог, применяемой в ИСИ АН СССР. Алгоритм поиска детерминационных характеристик, основанный на методе С. В. Чеснокова, представлен в системе, разработанной во ВНИИ системных исследований ГКНТ и АН СССР. Упомянутые выше алгоритмы, предложенные Г. С. Лбовым, реализованы- в пакете программ ОТЕКС Института математики СО АН СССР.
Литература для дополнительного чтения
1. Вайнберг Дж., Шумекер Дж. Статистика. М.: Статистика, 197?. 389 с.
2. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии М.: Прогресс, 1976. 495 с.
3. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.
4. Лбов Г. С. Методы обработки разнотипных экспериментальных данных Новосибирск: Наука, 1981. 160 с.
5. Математические методы в социологическом исследовании/Отв. ред. Т. В. Рябушкин и др. М.: Наука, 1981. 332 с.
6. Миркин В. Г. Анализ качественных признаков и структур. М.: Статистика, 1980. 166 с.
7. Елисеева Ц. И., Рукавишников В. О. Группировка, корреляция, распознавание образов. М.: Статистика, 1977. 144 с.
8. Рунион Р. Справочник по непараметрической статистике, М.: Финансы и статистика, 1982. 198 с.
9. Рябушкин Т. В. Теория и методы экономической статистики. М.: Наука, 1977. 511 с.
10. Статистические методы анализа информации в социологических исследованиях/Отв. ред. Г. В. Осипов и др. М.: Наука, 1979. 319 с.
11. Типология и классификация в социологических исследованиях/Отв. ред. В. Г. Андреенков, Ю. Н. Толстова, М.: Наука, 1982. 296 с.
12. Тюрин Ю. Н. Непараметрические методы статистики. М.: Знание, 1978. 62 с.
ГЛАВА ШЕСТАЯ
ВЫБОРОЧНЫЙ МЕТОД В СОЦИОЛОГИЧЕСКОМ ИССЛЕДОВАНИИ
В марксистской социологии имеются давние традиции по применению методов статистического наблюдения. В настоящее время без них практически немыслимо проведение эмпирических социологических исследований.
В целом эти методы могут быть разделены на сплошные и не-сплошные. Сплошное статистическое наблюдение требует полного охвата объекта исследования, всех его элементов без исключения.
Сплошное исследование некоторых социальных объектов по многим причинам может оказаться или очень трудоемким, или требующим больших денежных затрат, или просто невозможным. В этих случаях используются методы несплошного наблюдения, которые очень хорошо себя зарекомендовали в различных областях науки и техники.
Строгому научно обоснованному выбору части социальных объектов как методу исследования всей совокупности большое значение .придавал В. И. Ленин. Он предлагал провести выборку для изучения небольшого числа типичных предприятий (фабрик, совхозов) и учреждений (a) наилучших, образцовых; (b) средних и ( ) наихудших[115].
Наиболее часто в социологии используются три метода несплошного наблюдения: 1. Монографический, 2. Метод основного массива, 3. Выборочный.
Монографический метод, строго говоря, выходит за рамки чисто статистического наблюдения, ибо наряду с фиксацией статистических данных предполагает детальное качественное описание массовых явлений. Выбираемая для монографического исследования часть объекта очень часто является типичной, в определенном смысле, для всего объекта или для важнейших его элементов.
Именно эта особенность, дающая возможность глубокого проникновения в сущность изучаемых массовых явлений, представляет важнейшее достоинство монографического метода, который, как правило, применяется в социологии в комбинации со сплошным или различными видами несплошного исследования.
Известно, например, какую роль В. И. Ленин отводил монографическому методу наблюдения за состоянием сельского хозяйства в нашей стране в целях его скорейшего подъема. В. И. Ленин выделял три группы крестьянских хозяйств по уровню их развития: «…поставленные заведомо хорошо, сносно и неудовлетворительно. Одно типичное хозяйство каждой из этих последних трех групп должно быть не менее двух раз в год описываемо подробно с точным указанием всех данных об описываемом хозяйстве»[116].
Значение монографического метода не ограничивается применением лишь к типичным объектам социологического исследования. Он оказывается весьма полезным при изучении объектов в социальном эксперименте, когда зарождается передовой опыт, намечаются ростки прогрессивных явлений.
Методом основного массива, как правило, изучается большая часть объекта социологического исследования или его важнейшие элементы. Этот метод находит применение, например, в некоторых социологических исследованиях, проводимых с помощью контент-аналиэа.
Разновидностью метода основного массива являются экспертные опросы, так как при организации таких опросов стараются привлечь большую часть наиболее компетентных экспертов.
Наиболее широкое распространение в социологических исследованиях получил выборочный метод. В этой главе подробно рассматривается суть этого метода и основные процедуры его применения в социологии.
1. Основные понятия выборочного метода
Генеральная и выборочная совокупности. Множество социальных объектов, которые являются предметом изучения в пределах, очерченных программой социологического исследования и территориально-временными границами, образует генеральную совокупность.
Любую генеральную совокупность характеризует некоторый явно задаваемый признак (или набор признаков), по значению которого всегда можно однозначно определить, относится данный объект к генеральной совокупности или нет. Так, в качестве генеральной совокупности мы можем рассматривать жителей данного города, промышленно-производственный персонал предприятия, студентов всей страны и т. п. Часть объектов генеральной совокупности, выступающих в качестве объектов наблюдения, называется выборочной совокупностью. Иными словами, если генеральная совокупность включает все без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральной совокупности. При этом статистическое наблюдение осуществляется именно за элементами выборочной совокупности.
Внимательный читатель может заметить,, что метод основного массива и метод монографического исследования также предполагают статистическое наблюдение некоторой части исследуемой совокупности. В чем же характерный признак выборки? Выборочная совокупность обычно конструируется таким образом, чтобы при минимуме исследуемых объектов удавалось с необходимой степенью гарантии представить всю генеральную совокупность.
Единица отбора и единица наблюдения. Единицей отбора называют элементы генеральной совокупности, которые выступают единицами счета в различных процедурах отбора, формирующих выборку.
Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются статистическому наблюдению. Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора).
Систематические и случайные ошибки статистического наблюдения. При получении социальной информации выборочным методом могут возникать ошибки различного рода. Причинами могут быть неточность данных, сообщенных социологу респондентом, неправильная фиксация получаемых сведений или неправильное измерение переменных, характеризующих единицы наблюдения, и т. д. Эти ошибки, называемые иногда ошибками регистрации, могут быть разделены на два типа: случайные и систематические.
Систематической ошибкой регистрации называется ошибка, выражающая некоторые существенные связи, возникающие в процессе регистрации между объектом, субъектом и условиями проведения наблюдения. Систематическая ошибка может быть значительной по своей, величине из-за одностороннего искажения (в сторону увеличения или уменьшения) исследуемой характеристики. Происходящее вследствие этого накопление ошибки по исследуемой совокупности в целом может зачеркнуть результаты всего исследования.
Систематическая ошибка регистрации может возникнуть при любом типе статистического наблюдения, в том числе и при проведении выборочного или сплошного обследования.
Характерным примером систематической ошибки являются данные о женатых мужчинах и замужних женщинах во Всесоюзной переписи 1970 г. По результатам переписи в целом по Союзу .оказалось 53,0 млн. женатых мужчин и 54,2 млн. замужних женщин. Систематическая ошибка, зафиксированная в этой, переписи, образовалась из-за погрешностей в ответах, возникающих от различной оценки своего семейного положения мужчинами я женщинами.
Случайные ошибки регистрации отражают менее существенные связи между объектом, субъектом и условиями регистрации и складываются из различные статистических погрешностей в процессе наблюдения. Погрешности, имея различную направленность в отдельных единицах наблюдения, проявляют тенденцию к взаимному погашению при обобщении результатов .регистрации по всей исследуемой совокупности.
Таким образом, в отличие от систематической случайная ошибка вызывается при наблюдении причинами, носящими вероятностный характер.
Типичные ошибки выборочного социологического исследования. Ошибки регистрации встречаются при любом типе статистического наблюдения и, следовательно, свойственны и выборочному методу исследования.
Кроме того, в выборочном исследовании могут появиться ошибки, возникающие при различных отклонениях от планируемой выборки. Можно выделить два наиболее типичных вида отклонения от плана выборки.
1. Замена намеченных при планировании выборки единиц наблюдения другими, более доступными, которые, однако, оказываются неполноценными с точки зрения выработанного плана выборки.
©2015- 2023 pdnr.ru Все права принадлежат авторам размещенных материалов.