Задачи, решаемые ИНС
Решаемые нейронными сетями задачи весьма разнообразны. Неудивительно, что этот метод нашел применение в таких сферах, как медицина, финансовый менеджмент и политическая наука. В целом можно свести основную часть решаемых с помощью ИНС проблем к нескольким категориям задач.
• Классификация. Задачей нейронной сети является распределение объектов по нескольким заранее установленным непересекающимся классам. Рассмотренный нами пример с распознаванием рукописных цифр относится именно к этой категории задач: ИНС устанавливает соответствие объекта одному из десяти классов (цифры от 0 до 9). Известны компьютерные программы ИНС, выполняющие функции распознавания текста, речи, отнесения предприятия к классу «перспективных» или «убыточных», классификации клеток крови и сигналов электрокардиограммы, установления подлинности подписи и многие другие.
В политической науке нейросетевой метод используется для решения задач классификации, в частности в ивент-анализе. Заранее определяется класс конфликтных событийных последовательностей, ведущих к мирному урегулированию, и класс конфликтных событийных последовательностей, ведущих к военному противостоянию. Сеть обучается на базе реальных исторических примеров конфликтного взаимодействия государств, приведшего к одному или другому исходу. Получив на «входе» определенную последовательность событий, соответствующим образом закодированных, обученная сеть должна определить принадлежность данной событийной цепочки к «мирному» или «военному» классу. В том случае, если анализируется еще не завершенная цепочка событий, мы имеем характерный пример использования нейронных сетей для решения задач прогнозирования.
Другой пример использования нейронной сети для классификации объектов можно почерпнуть из сферы оценки политических рисков — угроз для инвесторов и бизнесменов, проистекающих из действий политических акторов. В данном случае сеть распределяет страны и регионы по нескольким категориям политического риска (например: высокий, низкий, средний).
Из тех статистических методов, которые мы изучали ранее, задачи классификации наиболее близки к дискриминантному анализу, который также определяет принадлежность объекта к одной из заранее заданных групп. В то же время ИНС и дискриминантный анализ ведут к достижению этой цели разными путями: дискриминантный анализ строит линейную дискриминантную функцию, тогда как нейронные сети нелинейны по своей природе. Соответственно, они могут «схватывать» связи между переменными, не поддающиеся описанию с помощью линейных функций.
Нейросетевой подход особенно эффективен при решении задач классификации по той причине, что он сочетает в себе способность компьютера к обработке чисел и способность мозга к обобщению и распознаванию. Вычислительные способности искусственных нейро-сетей позволяют обрабатывать огромное количество факторов, а ней-росетевые свойства распознавания — улавливать чрезвычайно сложные связи между ними.
• Кластеризация. Как мы уже знаем, кластеризация представляет собой распределение объектов по группам сходства/различия. Основное отличие этой категории задач от классификации состоит в том, что кластеры не задаются заранее. Может возникнуть закономерный вопрос: но ведь в алгоритме кластеризации методом К-средних мы определяем число кластеров еще до всех вычислений? Действительно, число кластеров задается заранее, но никогда заранее не определяются содержательные их характеристики. В методе К-средних мы даем программе задание разбить политические партии, например, на три группы. Но мы не знаем заранее, какие это будут группы: «левые», «правые», «центр»; или «оппозиция», «лояльные», «нейтральные»; или какие-то еще. Содержательные различия между кластерами выявляются уже после и на основе того, как разбиты объекты, при классификации же мы изначально ставим задачу разбить событийные цепи не на два каких-то класса, а на вполне определенные классы «военных» и «мирных» исходов.
Различия между категориями задач классификации и кластеризации иллюстративны с точки зрения выбора метода обучения сети. Так, если целью исследования является классификация объектов, абсолютно логичным является обучение «с учителем». Чтобы сеть «поняла» правила отнесения объектов к заранее определенным классам, необходимо во всех случаях четко показывать принадлежность объекта из обучающей выборки к определенному классу. Нет иного способа научить сеть различать «мирные» и «военные» исходы последовательностей событий, кроме как на стадии обучения ввести в нее базу событийных последовательностей, однозначно классифицированных как «мирные» либо «военные».
Задача кластеризации, напротив, предполагает обучение «без учителя». Алгоритм ее основан на подобии образов и размещает близкие образы в один кластер. Кластеризация позволяет представить неоднородные данные в более наглядном виде и использовать далее для исследования каждого кластера различные методы. Например, в экономике кластеризация с помощью ИНС используется для выявления фальсифицированных страховых случаев или недобросовестных предприятий.
В политической науке кластеризация с помощью ИНС направлена на решение тех же задач, что и обычный кластер-анализ: это «разведочные» методы, нацеленные на поиск признаков сходства в больших массивах неоднородных данных. Однако возможности ИНС, как правило, превышают возможности обычного кластер-анализа.
• Предсказание конкретных числовых значений. В такого рода задачах требуется предсказать значение переменной, принимающей непрерывные числовые значения: исход выборов для определенной партии, курс акций, значение рейтинга политика и т. д.