Решение
задач сегментации рынка и диагностики
потребителя с использованием нейросетевыхтехнологий
и многомерного статистического анализа
Э.Б. Песиков, Н.С. Юрьева
Северо-Западный
Институт Печати Санкт-Петербургского
Государственного Университета Печати
Abstract - The problem in view
is developing of the computer system of support in marketing decision making
when undertaking market segmentation and customer diagnostics, based on multi
measuring statistical analysis methods, neural networks technologies and
up to date programme measures. The target setting,
mathematical models and algorithms of market research task solution are cited.
The results of the PC calculation experiments are discussed.
В настоящее время известные подходы к решению маркетинговых задач строятся в основном на эвристических методах, основанных на прошлом опыте, интуиции и здравом смысле руководителя. В ряде случаев такие подходы оказываются неэффективными и могут привести к существенным коммерческим потерям. Наиболее перспективным направлением является разработка систем интеллектуальной поддержки принятия решений, основанных на применении математических моделей и методов и специального программного обеспечения.
Среди множества задач стратегического планирования маркетинга предприятия наиболее важными являются задачи сегментации рынка и диагностики потребителя [1]. Для решения этих задач наряду с эвристическими методами применяются методы многомерного статистического анализа (методы кластерного и дискриминантного анализа) [2].
В последнее время стали интенсивно применяться методы, основанные на нейросетевых технологиях и позволяющие получать эффективные решения таких маркетинговых задач как: прогнозирование спроса, сегментация рынка, диагностика потребителей и многие другие [3,4].
Основными этапами сегментации рынка являются: выбор принципов сегментации рынка; определение параметров (характеристик) сегментов; анализ и отбор сегментов. позиционирование товара в сегменте; создание плана маркетинга для отобранных сегментов. Наличие информации о сегментах потребительского рынка позволит предприятию - производителю провести в дальнейшем выбор наиболее привлекательных (целевых) сегментов. В результате представляется возможным для предприятия решить проблему наиболее рационального использования ограниченных производственных ресурсов за счет построения для каждой целевой группы потребителей индивидуальной стратегии по всем компонентам Marketing Mix (4P) - товар, цена, сбыт и коммуникации. Наиболее распространенными методами сегментирования рынка являются метод группировок по одному или нескольким признакам и методы кластерного и анализа.
Сформулируем задачу сегментации в терминах кластерного анализа. Пусть задано множество из N объектов (потребителей товара) некоторого рынка. Каждый объект характеризуется определенными значениями одного и того же набора классификационных признаков (количественных и качественных показателей). Задан способ определения близости между объектами. Требуется разбить множество объектов на непересекающиеся подмножества (классы, кластеры, группы), так чтобы в один класс объединялись объекты, сходные между собой по ряду признаков.
Для решения задачи сегментации
могут быть применены наиболее известные методы кластерного анализа -
иерархические агломеративные и иерархические дивизимные [2]. В иерархических агломеративных
(объединительных) методах на начальном этапе все N объектов независимы, т.е.
создаются элементарные кластеры, каждый из которых состоит ровно из одного
объекта. На первом шаге в группу объединяются два наиболее схожих кластера
(объекта). На каждом последующем шаге происходит объединение двух наиболее
близких кластеров в один. На последнем шаге все объекты объединяются в одну
большую группу. Для полной кластеризации необходимо сделать N-1 шагов. Момент
остановки этого процесса может задаваться маркетологом - аналитиком (например,
указанием требуемого числа кластеров или максимального расстояния, при котором
допустимо объединение).
Иерархические агломеративные
методы различаются по правилам построения кластеров, т.е. критериям, которые
используются при решении вопроса о "схожести" объектов при их
объединении в группу. Примером реализации иерархических
агломеративных методов является программа “Statistica”, разработанная компанией “StatSoft Inc. STATISTICA”. Иерархические дивизимные
методы являются логической противоположностью агломеративным
методам. В начале процедуры все объекты принадлежат одному кластеру, а затем
этот кластер с использованием определенных процедур разрезается на
"ломтики". Примером реализации иерархических
дивизимных методов является программа “Statgraphics Plus”, разработанная
компанией “STSC Inc” [5].
Задачу диагностики потребителя сформулируем в терминах дискриминантного анализа. Пусть имеется совокупность из N объектов (предприятий– потребителей некоторого товара на рынке) и каждому объекту (наблюдению) ставится в соответствие некоторый набор значений признаков. В результате ранее проведенной кластеризации представляется возможным определить, к какому кластеру относится каждый наблюдаемый объект. Пусть на рынке появляется новый (N+1)-й объект с известными значениями признаков. Требуется определить, к какому из полученных кластеров этот объект относится.
Для решения задачи диагностики могут
применяться как методы дискриминантного анализа, так и нейросетевые
технологии.
Методы
дискриминантного анализа позволяют строить функции измеряемых признаков,
значения которых объясняют разбиение множества объектов на кластеры. Наиболее
распространенным является линейный дискриминантный анализ, в котором
классифицирующие признаки выбираются как линейные функции от первичных
признаков [2].
На основе "обучающей"
выборки методом дискриминантного анализа, не решая заново задачу кластеризации,
можно отнести "новых" потребителей товара к уже известным сегментам
рынка. Зная к какому сегменту принадлежит
"новый" потребитель, представляется возможным спрогнозировать его
требования к товару и заранее спланировать оптимальную стратегию взаимодействия
предприятия с этим потребителем.
Приведем краткую характеристику нейросетевой технологии. Программное моделирование нейронных сетей обеспечивает достаточно дешевую и гибкую среду для формирования и анализа эффективности и степени риска маркетинговых стратегий, а для рассматриваемых практических задач такое моделирование оказывается вполне адекватным и достаточным. Хотя решение на основе нейронной сети может выглядеть как обычное программное обеспечение, они различны в принципе, поскольку большинство реализаций на основе нейронных сетей "обучается", а не программируется: сеть учится выполнять задачу, а не программируется непосредственно.
Искусственные нейронные сети представляют собой устройство параллельных вычислений, состоящие из множества взаимодействующих простых процессоров - нейронов. Математическая модель нейрона представлена на рис. 1.

Рис.1 . Математическая
модель нейрона
При работе сети во входные элементы подаются значения входных переменных x1…xn, затем последовательно отрабатывают нейроны промежуточных и выходного слоев. Каждый из них вычисляет свое значение активации, беря взвешенную сумму выходов элементов предыдущего слоя и вычитая из нее пороговое значение. Затем значение активации преобразуются с помощью функции активации, и в результате получается выход нейрона. После того, как вся сеть отработает, выходные значения элементов выходного слоя принимаются за выход всей сети в целом.
К наиболее широко используемым типам переходных функций относятся:
1. Пороговая функция:
![]()
![]()
2. Линейная функция:
![]()
3. Сигмоидальная функция:
.
Процесс функционирования нейронной сети зависит от величин синапсических связей. Задавшись определенной структурой сети, соответствующей какой-либо задаче, находятся оптимальное значение всех переменных весов коэффициентов – процесс обучение нейронной сети. Для этого используются алгоритмы обучения. С использованием собранных данных веса пороговые значения автоматически корректируются с целью минимизировать ошибку. По сути этот процесс представляет собой подгонку модели, которая реализуется сетью, к имеющимся обучающим данным. В качестве функции ошибок чаще всего берется сумма квадратов ошибок. Согласно методу наименьших квадратов, минимизируемой целевой функцией ошибки нейронной сети является величина:
.
После обучения нейронный сети проводится ее запуск на исполнение и выведение результатов, характеризующих ее работу [3]. В настоящее время к числу наиболее популярных программных продуктов, реализующих нейросетевые технологии, относятся “Brain Maker Professional”, “NeuroShell Day Trader”, “Neuro Builder 2001” и “Statistica Neural Network”.
Вычислительные эксперименты. Исследования проводились на основе контрольного примера, в рамках которого было рассмотрено 22 предприятия-потребителя (20 «старых» и 2 «новых» потребителя). По каждому потребителю были получены сведения о пяти параметрах (классификационных признаках) предприятия - потребителя. Необходимо было разделить множество из 20 «старых» потребителей на 3 непересекающиеся группы (сегменты), а затем спрогнозировать принадлежность двух «новых» потребителей к уже известным сегментам рынка.
Для решения задачи разбиения множества потребителей на сегменты использовался реализованный в пакете “Statgraphics Plus” метод “Nearest Neighbor (Single Linkage)” – иерархический агломеративный метод (метод «одиночной связи») [5].
Задача диагностики решалась двумя методами – методом дискриминантного анализа [6] и с использованием нейронной сети. При решении задачи диагностики потребителя на основе нейросетевых технологий выбор топологии нейронной сети, ее построение и обучение проводились c помощью системы “Statistica Neural Network”, разработанной компанией “StatSoft”.[3]. На начальном этапе исследований для решения поставленной задачи использовался один из возможных типов нейронной сети - многослойный персептрон с сигмоидальной передаточной функцией активации. При обучении сети использовался метод наименьших квадратов.
В результате вычислительных экспериментов по решению задачи диагностики потребителя методом нейронных сетей были получены результаты, аналогичные результатам при использовании метода дискриминантного анализа.
Анализ результатов, полученных при решении исследуемых задач, подтвердил корректность и эффективность разработанного метода планирования маркетинга с использованием нейросетевых технологий и многомерного статистического анализа.
Предлагаемый в работе аналитический инструментарий маркетинга позволяет руководству предприятия проводить глубокий анализ формируемых маркетинговых стратегий, повысить качество и эффективность принимаемых маркетинговых решений. Предполагается промышленное внедрение предлагаемых методов сегментирования и диагностики потребителей для ряда издательско-полиграфических предприятий Санкт-Петербурга.
Дальнейшее развитие аналитического инструментария маркетинга целесообразно проводить в направлении исследований эффективности применения теории и методов нечеткой математики (нечетких нейронных сетей) для моделирования и оценки риска маркетинговых стратегий.
Литература
1.
Котлер Ф., Армстронг Г., Сондерс Дж., Вонг
В. Основы маркетинга: Пер. с англ. – 2-е европ. изд. – М.; СПб.; К.;
Издательский дом «Вильямс», 2001. – 994 с.
2.
Ким Дж. – О., Мьюллер, Ч.У. Клекка У.К. и др.
Факторный, дискриминантный и кластерный анализ /Пер. с
англ. Под ред. И.С. Енюкова. – М.: Финансы и
статистика, 1989.
3.
Шапот М., Рощупкина В. Интеллектуальный анализ данных и
управление процессами. // Открытые системы. – 1998. - № 4.
4.
Нейронные сети.
STATISTICA Neural Networks. /Пер. с англ. – М.: Горячая линия – Телеком, 2001. – 182 с.
5.
Григорьев Ф. Г., Левандовский В. В., Перфилов А.
М., Юнкеров В.И. Statgraphics на персональном
компьютере. Практическое пособие по обработке результатов медико-биологических
исследований. - СПб.,1992.
6.
Песиков Э.Б.
Решение задачи диагностики потребителя методом дискриминантного анализа. // Print&Publishing, N2. - 1998, с. 37 - 40.