Процесс кодирования данных

Наиболее просто (по существу, автоматически) кодируется временная составляющая события — дата. Если событие произошло 2 июля 2003 г., оно получит код 030702. Также весьма несложно кодируются объекты и субъекты событий. В их качестве могут выступать государства, политические партии, транснациональные компании, несистемные игроки (например, партизанские движения) — вообще все явно идентифицируемые участники политического процесса. Большинство уже созданных баз данных ориентировано на государства как центральных акторов международного политического процесса, что вполне объяснимо. Государствам присваиваются стандартные трехбуквенные аббревиатуры. Так, Россия обозначается как К. Ц18, Ирак — Кувейт — КЦ1ЛУ и т. д.

Наиболее «тонкая» часть кодирования событий — кодирование действий, которое придает особую специфику ивент-анализу. Каждое политическое действие входит в определенный класс (подкласс) действий, каждый класс действий имеет свое фиксированное место в некой шкале, отражающей состояние отношений между акторами. Наиболее распространенный признак построения такой шкалы — уровень конфликтности (или, наоборот, «мирной» составляющей) в том или ином действии или классе действий.

Поясним все это на примере самой первой систематически разработанной Ч. Маклеландом кодировочной системы ивент-анализа — ЛУЕ18 (ЛУогЫ Еуеп! 1п1егасИоп 8игуеу). ЛУЕ18 относит всю совокупность действий к 63 подклассам, агрегируемым в 22 класса. Кодиро-вочный номер класса соответствует уровню «конфликтного поведения», содержащегося в том или ином действии. Например, классы с наиболее высоким числовым значением включают демонстрацию и применение военной силы, с наиболее низким числовым значением — заключение межгосударственных альянсов. Таким образом, кодирование действий в ивент-анализе выводит на порядковый уровень измерения. Например, известно, что в классе действий «Отказ»

То же правило порядкового измерения распространяется и на подклассы. Так, уже названный класс «Угроза» в ЛУЕ18 содержит четыре подкласса:

171 угроза, не предполагающая применения санкций;

172 угроза, предполагающая применение невоенных санкций;

173 угроза, предполагающая применение военных санкций;

174 ультиматум — угроза, предполагающая применение военных санкций в ограниченное время.

Нетрудно заметить, что уровень конфликтности поведения в классе идет по возрастающей от подкласса к подклассу, что отражается в возрастании цифрового кода. Это классическая порядковая шкала: известно, что в действии 173 («угроза, предполагающая применение военных санкций») больше выражен признак «конфликтность», чем в действии 171 («угроза, не предполагающая применения санкций»), и меньше, чем в действии 174 («ультиматум») — 171 < 173 < 174. В то же время неизвестно, насколько признак выражен больше, так как у нас нет четкой единицы измерения признака «конфликтность». Соответственно, шкала не интервальная.

Широко используются шкалы, трансформирующие значения кодов в интервальные величины. Например, известная шкала Гольд-штейна позволяет работать с кодировками ЛУЕ18 на интервальном уровне. Некоторые примеры приведены в таблице :

Класс в ЛШ8

Код ЛШ8

Значение по шкале Гольдштейна

«Похвала» (политическому курсу, лидеру и т. д.)

41

3,4

Обещание политической поддержки

51 4,5

Ультиматум

174 6,9

Военное вмешательство

223 10,0

Разумеется, шкала Гольдштейна небесспорна, как небесспорна была бы любая другая шкала, — объективного интервала для признака «конфликтность в международных отношениях», видимо, не существует в принципе. Однако необходимость перевода кодов ивент-анали-за в интервальные величины очевидна, так как именно это позволяет использовать в работе с событийными данными сложные статистические методы. К тому же данная шкала является хорошим инструментом визуализации событийной информации. Ниже приводится график, отражающий действия Ирака в отношении Ирана с 1979 по 1997 г. (отрицательные величины характеризуют более высокий уровень конфликтности). В частности, четко видны стадия ирано-иракской войны и период иракского вторжения в Кувейт.

Кроме «односторонней» картины действий одного актора в отношении другого можно получить и визуальное представление о взаимодействии субъектов политики. Ниже приводится схема, демонстрирующая развитие палестино-израильского конфликта с 1982 по 1992 г. Опять же четко видны «провалы», связанные с интифадой.

Однако чисто визуальной верификации данных практически всегда бывает недостаточно. Любые СМИ — в том числе информагентства — дают погрешность, связанную с той или иной политической ангажированностью (если не прямое искажение фактов, то умолчание одних событий и «выпячивание» других). Соответственно, необходимо тестирование созданных баз данных с использованием независимых (по возможности объективных и непременно взятых из иных источников) индикаторов.