Статистические методы в политическом анализе

Статистические методы давно и прочно заняли одну из центральных позиций в методическом арсенале политического анализа. Как будет показано, статистика позволяет решать множество разнообразных задач, обеспечивая исследователя точными количественными характеристиками различных свойств совокупностей объектов. Причем многие из этих количественных характеристик отражают скрытые, неявные свойства и связи, которые невозможно обнаружить «невооруженным глазом».

Статистические методы помогают обрабатывать очень большие массивы данных. В современном мире, перенасыщенном информацией, это чрезвычайно полезное свойство. Именно статистические подходы лежат в основе большинства методов Оа1а Мтт§ (англ.) — «раскопки данных», поиска практически полезных и нетривиальных сведений в большом объеме сырой информации.

Ниже приводятся перечень и краткая характеристика «типовых задач», которые способна решать статистика в политическом анализе и прогнозировании.

1. Получение усредненных данных. Как правило, в процессе исследования бывает важно не только получить характеристики отдельных объектов, но взглянуть на их совокупность в целом через призму какого-то конкретного свойства. Вместо большого числа отдельных показателей нам требуется одно значение, которое было бы типичным для всей совокупности объектов. Каково отношение «среднего» россиянина к перспективам вступления России в ВТО? Принадлежность к какой социальной или возрастной группе наиболее типична для членов определенной партии? Сколько раз в среднем в месяц студенты смотрят общественно-политические телепрограммы? Ответы на эти вопросы дает анализ одномерных распределений, в частности подсчет средних величин для разных уровней измерения. Анализ одномерных распределений позволяет заодно установить, насколько типичное значение в действительности типично, репрезентативно по отношению к совокупности данных.

2. Оценка связей между переменными. Утверждение о наличии статистической связи между переменными правомочно в том случае, если изменение значений одной переменной приводит к изменению распределения другой. Для порядковых и интервальных переменных понятие связи более определенно: связанные переменные обладают общностью вариаций. Возрастание значений одной переменной будет соответствовать возрастанию (и тогда связь будет положительной, или прямой) или уменьшению (связь будет отрицательной, или обратной) значений другой переменной. Наличие связи позволяет делать предположения относительно зависимой переменной на основании информации о независимой.

В статистическом анализе такие предсказания никогда не будут стопроцентно точными, случаи однозначного соответствия значений переменных практически не встречаются. Речь идет скорее об увеличении шансов получить правильный ответ относительно значений зависимой переменной на основании значений независимой переменной. Например, мы можем объяснить определенную часть всех случаев (долю вариации) голосования за либеральные политические партии с помощью независимой переменной «принадлежность к городскому населению».

Статистические методы позволяют ответить на вопрос об интенсивности (плотности, тесноте) связи между переменными. Численная оценка интенсивности будет называться коэффициентом связи; для разного типа переменных вычисляются разные коэффициенты, их общее количество в статистике достаточно велико.

3. Классификация. Ряд статистических техник дает возможность соотнести исследуемые объекты с несколькими заранее определенными классами. Например, можно выделить класс граждан, участвующих в выборах, и класс не участвующих в них (абсентеистов). Далее, опираясь на ряд характеристик (возраст, уровень образования, проживание в городе/на селе и т. д.), исследователь может предсказать с определенной долей вероятности принадлежность респондентов к одному или другому классу. В принципе, задачу классификации можно считать частным случаем задачи обнаружения связи: в нашем примере мы устанавливаем связь переменных «возраст» (интервальная), «уровень образования» (порядковая), «проживание в городе или на селе» (номинальная) с номинальной переменной «участие в выборах».

4. Кластеризация. Под кластеризацией понимается разбиение объектов на группы по критерию их близости в определенном пространстве признаков. Например, нас интересуют три признака, характеризующие идеологию политических партий: степень поддержки действующего политического руководства страны, видение социальной роли государства, восприятие западных демократий в качестве оптимальной модели политического устройства России.
С помощью определенных статистических процедур мы можем выяснить, какие партии будут близки друг к другу в пространстве всех этих признаков одновременно. Кластеризация отличается от классификации тем, что в первом случае заранее определенные классы отсутствуют.

5. Редукция данных. Слово «редукция» означает сокращение, сжатие. Решение этой задачи важно в ситуации, когда объекты измерены большим числом переменных и исследователь ищет способ сгруппировать их по какому-то смысловому признаку. К примеру, при изучении образов политических лидеров используется большое число при-
знаков описания (так называемых дескрипторов): интеллектуальные качества, энергичность, опыт, волевые качества, честность, личное обаяние и т. д. Чтобы сделать описание более компактным, мы можем объединить отдельные признаки в группы, основываясь на выявлении скрытых связей между ними. Способность статистических техник решать задачи редукции данных обусловливает их высокую полезность в качестве методов.

Существуют статистические методы, которые приспособлены к решению какой-то одной из указанных задач, а также многофункциональные, «многозадачные» техники. Ниже мы рассмотрим примеры тех и других. Следует оговориться, что наше изложение статистических методов не преследует цель заменить отдельный курс статистики (который совершенно необходим для современного политолога). Нашей задачей будет, во-первых, продемонстрировать палитру тех возможностей, которые открывает перед политическим аналитиком статистика; во-вторых, дать ясное представление о практическом использовании ряда наиболее полезных и распространенных техник.