Формирование выборочной совокупности
Для метода опроса данная проблема чрезвычайно актуальна. Как правило, аналитика, работающего с политическими проблемами, интересует мнение не какого-то очень узкого круга лиц, который можно было бы охватить сплошным исследованием, а людей как представителей широких социальных групп. Нередко требуется выявить отношение к определенным политическим проблемам в масштабах региона или даже всей страны. По понятным причинам такое исследование неизбежно будет выборочным.
Выборочная совокупность (выборка) — это часть генеральной совокупности (всех изучаемых объектов), отражающая те ее свойства, которые важны с точки зрения цели и задач исследования. Формируя выборочную совокупность, мы должны быть уверены, что полученное знание о ее свойствах может быть корректно экстраполировано на генеральную совокупность, т. е. выборка репрезентативна по отношению к генеральной совокупности. Разумеется, полной идентичности выборочной и генеральной совокупности добиться невозможно, если они сильно различаются по объему (а так, как правило, и бывает). Для каждой выборочной совокупности специальным образом вычисляется ошибка, показывающая допустимое отклонение результатов, полученных при изучении выборки, от истинных значений признака для генеральной совокупности. Как правило, политические исследования требуют повышенной надежности выборки, при которой ошибка не должна превышать 3%.
Существует достаточно много способов формирования выборочной совокупности, они подробно изложены в учебниках по прикладной социологии. Мы коснемся этой темы кратко, обозначив лишь принципиальные подходы к формированию выборки. Конкретные техники приводятся в иллюстративном режиме.
Так, существуют методы построения выборки, основанные на принципе случайного отбора. Принцип случайности предполагает обеспечение для всех элементов генеральной совокупности равных шансов попасть в выборку. Этот принцип реализован, например, в ло-тотроне: каждый из шаров в крутящемся барабане имеет теоретически равные шансы оказаться в руке у человека, который их оттуда достает. Для этого все шары должны иметь одинаковые размер, вес, цвет (либо человек должен достать их с завязанными глазами), температуру, — а это уже техника реализации случайного принципа.
Примерами случайных методик, принятых в науке, являются метод пошаговой выборки и метод случайных чисел. Метод пошаговой выборки предполагает следующие действия:
1)составление перечня всех элементов генеральной совокупности (например, списка студентов философского факультета МГУ; тогда в совокупности будет около 1500 элементов). Каждый элемент нумеруется;
2) определение объема выборочной совокупности. Если нас удовлетворяет 5%-ная ошибка, мы можем остановиться на выборке из 300 студентов;
3) определение шага выборки, который является результатом деления объема генеральной совокупности на объем выборочной (в нашем случае 1500:300 = 5);
4) формирование из генеральной совокупности выборочной совокупности в соответствии с шагом выборки. Например, отбирается каждый пятый студент из общего списка: 1-й, 6-й, 11-й и т. д.
При построении пошаговой выборки важно следить за тем, чтобы шаг выборки не совпал с той или иной структурной закономерностью генеральной совокупности. Например, если перечень элементов генеральной совокупности составлен с учетом разбиения студентов на группы, при этом в каждой группе по 5 человек и первым в списке группы идет ее староста, мы можем получить в выборочной совокупности одних старост групп. Такая выборка с высокой вероятностью не будет репрезентативной: старосты групп обычно старше по возрасту, социально активнее, обладают лучшей успеваемостью по сравнению с другими студентами, среди них больше лиц мужского пола и т. д.
Метод случайных чисел также начинается с формирования перечня элементов генеральной совокупности и определения объема выборки. Однако отбор производится не пошаговым методом, а методом случайных чисел: с помощью компьютера или специальных таблиц выбирается определенное количество случайных чисел, равное объему выборки, в интервале, заданном объемом генеральной совокупности. В нашем примере генерируется 300 случайных чисел в интервале от 1 до 1500.
Разумеется, для студенческих групп, как правило существенно различающихся по численности, это маловероятно. Однако в совокупностях, где принято более строгое групповое деление (например, в армейских подразделениях), такая ошибка вполне возможна.
Еще одним вариантом реализации метода случайного отбора является гнездовая (серийная) выборка. Ее специфика состоит в том, что случайным образом отбираются не элементы генеральной совокупности, а группы элементов, из которых совокупность состоит. Так, в нашем примере будут отбираться не студенты, а студенческие группы (соответственно, требуется список групп, а не список студентов). А уже внутри каждой из отобранных групп производится сплошное исследование — опрашиваются все студенты, обучающиеся в данных группах. Собственно, эти группы и получили название «гнезда».
Гнездовая выборка удобна для проведения исследования тех совокупностей, где существует четко наблюдаемая структура: в учебных заведениях, в трудовых коллективах и т. д. По сравнению с простым случайным методом формирование гнездовой выборки может существенно технически облегчить процесс исследования. Значительно проще найти и опросить студентов шести групп, которые собираются в определенном месте и в определенное время (студенческие группы — в соответствии с расписанием занятий), чем искать и опрашивать каждого из 300 студентов по отдельности.
Случайный метод (во всех технических воплощениях) имеет ряд существенных ограничений. Во-первых, принцип случайности эффективно работает тогда, когда совокупность относительно однородна с точки зрения тех свойств, которые важны для исследователя. Это в значительной мере относится к студентам одного факультета, но никак не к избирателям большого города или района или членам политической партии. Во-вторых, техническая реализация принципа случайности предполагает наличие полного перечня элементов генеральной совокупности или хотя бы списка компактных групп, на которые эта совокупность разбита. Политические исследования, как правило, имеют дело с очень большими совокупностями, явным образом не структурированными по группам и не внесенными в единые списки. Конечно, существуют списки всех избирателей России, но как практически работать с многомиллионным перечнем, даже если таковой удастся получить?
Поэтому случайный способ не стал основным в выборочных политических исследованиях, уступив пальму первенства квотной (стратифицированной) выборке. В ее основе лежит принцип квотирования выборочной совокупности по определенному набору признаков, значимых с точки зрения цели исследования, в соответствии с распределением этих признаков в генеральной совокупности. В качестве квотирующих выделяются те признаки, которые являются наиболее существенными с точки зрения целей и задач исследования (влияют на политическое поведение).
Рассмотрим простой пример. Предположим, цель нашего исследования — выявить уровень поддержки действующего губернатора избирателями города N (генеральная совокупность). Мы ограничиваемся двумя квотирующими признаками — пол и возраст членов генеральной совокупности. Прежде всего выясняется распределение каждого из признаков в генеральной совокупности — это делается на основе имеющихся статистических данных, например:
Пол | |
Мужчины | 43,4% |
Женщины | 56,6% |
Вся совокупность | 100,0% |
Возраст | |
18—24 года | 11,7% |
25—39 лет | 26,4% |
40—54 года | 29,6% |
Старше 55 лет | 32,3% |
Вся совокупность | 100,0% |
М 18—2-4 |
Для удобства работы на основании этих данных строятся единые половозрастные квоты: для мужчин в возрасте от 18 до 24 лет, женщин — от 18 до 24 лет, мужчин — от 29 до 39 лет и т. д. Всего получится 8 половозрастных квот (произведение числа групп в каждом из квотирующих признаков):
Указанные выше квоты должны быть воспроизведены в выборочной совокупности. Так, если доля мужчин в возрасте от 18 до 24 лет составляет 5% от общего числа совершеннолетних жителей города IV, то и в выборке их доля должна составлять 5%.
При определении числа квотирующих признаков руководствуются спецификой исследования и принципом разумной достаточности. Нередко возникает искушение существенно увеличить число квотирующих признаков, чтобы добиться более полного соответствия выборочной и генеральной совокупности. Однако следует помнить: чем больше квотирующих признаков, тем сложнее технически будет провести опрос. Предположим, что к половозрастному квотированию добавляется еще один признак с тремя категориями: образование (неполное среднее, среднее, высшее). Несложно подсчитать, что общее число квот возрастет с 8 до 24: мужчины от 18 до 24 лет с неполным средним образованием; мужчины от 18 до 24 лет со средним образованием... и так далее по всем позициям. Работать с таким дробным квотированием неудобно с технической точки зрения.
Если входящие в генеральную совокупность люди проживают на большой территории, квотный принцип формирования выборки дополняется принципом многоступенчатого районированного отбора. Например, при проведении общероссийского опроса на первом этапе (ступени) производится отбор субъектов Федерации; на втором — городов и районов в рамках выбранных субъектов Федерации; на третьем — населенных пунктов и т. д. На каждой ступени отбора важно следить за тем, чтобы не произошло смещения выборки по какому-то важному признаку, например представленности городского/сельского населения или национальных групп.