Методика и техника контент-анализа

Подготовка к контент-анализу строится в соответствии с общими принципами составления программы научно-исследовательской работы: постановка проблемы, формулирование целей и задач, определение информационного обеспечения и т. д. Некоторые стадии подготовительного процесса заслуживают особого внимания.

В частности, важное значение применительно к контент-анализу имеет идентификация корпуса источников — совокупности документов, которые станут подвергаться количественной обработке. Когда цель исследования является достаточно узкой и конкретной, возможно сплошное исследование (например, если мы хотим выяснить, каким проблемам было уделено наибольшее внимание в посланиях Президента РФ Федеральному собранию). Однако в большинстве случаев текстовой массив потенциально столь велик, что требует проведения выборочного исследования. Предположим, целью исследования является отношение различных российских СМИ к проблеме политического экстремизма. При формировании выборки документов мы должны будем ответить на целый комплекс весьма непростых вопросов. Каковы должны быть временные рамки исследования? Ограничимся ли мы только федеральными СМИ или будем вовлекать в анализ региональную и местную прессу? В последнем случае — каково должно быть соотношение в нашей выборочной совокупности источников федерального, регионального и местного уровня? Каково будет соотношение печатных СМИ, телевидения и радио? Какие конкретно печатные издания, теле - и радиопередачи мы будем рассматривать? В рамках отобранных наименований, например изданий прессы, будет ли производиться сплошное исследование или сформирована случайная выборка (например, 120 номеров ежедневной газеты из 1200)? При решении этих вопросов исследователь будет исходить не только из представлений о наиболее качественном и добросовестном решении задачи исследования, но и из неизбежных ограничений в людских, временных, информационных и других ресурсах.

Поскольку методически контент-анализ ориентирован на извлечение из всего многообразия информации в текстовом массиве специально интересующих исследователя компонентов формы или содержания, которые затем подсчитываются и подвергаются статистической обработке, ключевым вопросом, возникающим в процессе составления программы контент-аналитического исследования, является определение единиц анализа (или смысловых единиц). Другими словами, необходимо понять, какие конкретно элементы текста будут подсчитываться.

Определение единиц анализа зависит от целого ряда факторов, среди которых важнейшее значение имеют, естественно, цель и задачи исследования. Кроме того, существенную роль играет характер информационного массива, который является объектом изучения. Учет специфики массива важен потому, что единицы анализа должны сравнительно легко (в идеале — автоматически, что принципиально для различных компьютерных программ контент-анализа) извлекаться из данной совокупности документов.

В соответствии с наиболее распространенным подходом выделяются следующие типичные единицы анализа:

• понятия, выраженные в словах и сочетаниях слов. Применительно к проблеме политического экстремизма единицами анализа могут выступать такие понятия, как «радикальный», «экстремистский», «внесистемная оппозиция» и т. д. Отдельной, нередко трудоемкой практической задачей является составление полного словаря понятий, выражающих единицу анализа. Например, В. В. Жириновский может фигурировать в различных сообщениях как «Владимир Вольфович», «сын юриста», «лидер ЛДПР», «главный либеральный демократ», «либералиссимус» и т. п.;

• темы, выраженные в предложениях, фрагментах текста (например, абзацах) или даже целостных текстах. Так, в интервью министра экономического развития политический экстремизм может быть вскользь упомянут как возможный фактор дестабилизации экономической ситуации (тема, выраженная в предложении). В статье, посвященной проблемам политического развития России, тема политической радикализации может быть развита в нескольких абзацах. Наконец, этой теме может быть целиком посвящен отдельный материал (статья, теле - или радиопередача);

• политическая ситуация или событие, рассматриваемые в целом. Например, нас может интересовать реакция отдельных СМИ на экстремистские действия членов Национал-большевистской партии.

Впрочем, среди методологов контент-анализа нет единства в отношении выделения основных типов единиц анализа. Существуют значительно более сложные и дифференцированные схемы по сравнению с представленной выше.

Кроме единиц анализа — извлекаемых из текста элементов — важным понятием для контент-анализа является единица счета. Вопрос об определении единицы счета — это вопрос о том, как конкретно подсчитать (измерить) представленность единиц анализа в тексте.

Единицы счета могут совпадать с единицами анализа, а могут не совпадать. Предположим, проводится сравнительный анализ степени внимания, уделяемого двумя федеральными изданиями (к примеру, «Комсомольской правдой» и «Московским комсомольцем») проблеме политического экстремизма за последний год. В качестве единицы анализа избрана тема политического экстремизма. В одном случае мы можем подсчитать, сколько раз в течение последнего года данная тема (выраженная в предложении, абзаце или статье) появлялась на страницах этих газет. Иными словами, определяются частоты упоминания единицы анализа в одном и другом издании, и при таком подходе единица анализа совпадает с единицей счета. В другом случае мы измеряем объем (протяженность или площадь) текста, заполненный единицами анализа. При таком подходе мы подсчитываем число строк, абзацев, печатных знаков, долей полосы или квадратных сантиметров площади текста, в котором говорится о политическом экстремизме. Единицей анализа остается тема экстремизма, а единицей счета будет строка, абзац, печатный знак, доля полосы или квадратный сантиметр.

Следует отметить, что в последнем случае возникает необходимость стандартизации вычислений. Корректно сравнивать не абсолютный объем текста, посвященного теме экстремизма в «МК» и «КП», а долю темы экстремизма от общего объема текста каждого издания.

Проблема выбора единицы счета возникает и в ситуации контент-анализа видеоматериалов. Предположим, мы сравниваем степень внимания, уделяемого лидеру ЛДПР Жириновскому в информационных программах Первого канала и канала «Россия». При одном подходе подсчитывается число появлений Жириновского на экране, при другом — количество эфирного времени (например, в минутах), когда Жириновский находился на экране.

Однако в арсенале контент-анализа имеется и существенно иной способ решения той же самой задачи. Понятие «внимание, уделяемое теме в СМИ» может быть операционализировано не только через встречаемость (упоминаемость) данной темы в тексте, будь то частота упоминаний или объем («физическая протяженность») упоминаний. В качестве «меры внимания» могут быть избраны определенные структурные признаки, связанные с положением сообщений по теме относительно других сообщений, формой представления сообщений и т. д. Так, анализируя внимание СМИ к Жириновскому, корректно поставить следующие вопросы:

• На какой полосе расположено сообщение о Жириновском? Размещение материала на первых двух полосах будет свидетельствовать о большем внимании, на последних — о меньшем.

• Присутствует ли акцентированный анонс материала о Жириновском (например, позиционируются ли он в качестве «темы номера»)?

• Сопровождается ли текстовой материал о лидере ЛДПР фотографией?

• Каков размер заголовка материала? Насколько он бросается в глаза?

При анализе телевизионных передач уместно выяснить, какой по счету сюжет от начала передачи был посвящен Жириновскому? Был ли сделан анонс данного материала в начале передачи или во время предыдущего ее выпуска? Ограничились ли авторы программы устным сообщением о деятельности Жириновского или присутствовал соответствующий видеосюжет?

Отдельной методической проблемой в контент-анализе является оценка отношения продуцента сообщения к тому или иному политическому субъекту, событию или проблеме. Измерение отношения предполагает:

• конструирование системы категорий (классов). В простейшем случае шкала может включать всего три класса: позитивное отношение, негативное и нейтральное. Часто шкала бывает более дифференцированной: на порядковом уровне (включать большее число классов, отражающих степень позитивности/негативности восприятия) или на номинальном уровне (классы будут отражать качественно разные типы отношения);

•формирование системы кодировки, позволяющей однозначно отнести текстовую характеристику к тому или иному классу. Например, классу «позитивное отношение к политику» будут соответствовать такие характеристики, как «выдающийся деятель», «бесспорный авторитет», «заслуженно одержал победу», «с удовольствием передаем слово» и т. д.

При формировании кодировочных систем нередко прибегают к специальным методикам, позволяющим снизить элемент произвольности при отнесении суждений к определенному классу. В частности, используется метод парного сравнения. Группе респондентов (которые в данном случае называются арбитрами) предлагается набор характеристик. Арбитры попарно сравнивают все предложенные им характеристики, в каждом случае решая, какая характеристика из пары более позитивна (или негативна) по отношению к политику. Оказавшаяся более «сильной» в парном сравнении характеристика получает плюс один балл (если всего характеристик 10, максимально возможное число баллов — 9). Итоговый ранг характеристики вычисляется очень просто: складываются баллы, поставленные каждым из арбитров, полученная сумма делится на количество арбитров.

О кодировочных системах мы более подробно поговорим в связи с рассмотрением ивент-анализа, который можно охарактеризовать как метод «дочерний» по отношению к контент-анализу.