Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Анализ покупательской корзины.
Ассоциация, или метод корзины покупателя (market basket analysis) является одним из вариантов кластеризации, используемым для поиска групп характеристик, наблюдаемых, большей частью, одновременно. Анализ ассоциации имеет смысл в том случае, если несколько событий связаны друг с другом. Строимые модели характеризуют близость различных одновременно наблюдаемых категориальных характеристик и могут быть выражены в виде простых правил. Такими характеристиками могут быть одновременно покупаемые потребителем товары и услуги или диагнозы наблюдаемых у пациентов болезней. Метод был впервые предложен для анализа структуры покупок и широко используется в этой сфере бизнес-приложений. С таким использованием метода связано и его образное название- большое количество покупок совершается в супермаркетах, где покупатели для удобства складывают закупаемый товар в корзины или тележки. Использование этого метода целесообразно как один из первых шагов исследования, когда известна (или существенна) только некоторая группа однородных характеристик, например, при исследовании характера жалоб больных, обратившихся в клинику в первый раз. Такие пациенты как бы обезличены - они не имеют истории болезни, результатов специализированных анализов, а характеризуются только " букетом" диагнозов, выявленных при первичном осмотре. Анализируя результаты осмотра, можно установить, какие болезни характеризуют каждого пациента. На основе этой информации легко построить таблицу совпадений диагнозов - таблицу, в ячейках которой указано число пациентов, страдающих одновременно от двух болезней, маркирующих строки и столбцы таблицы. Таблица 1. Диагнозы различных болезней условно помечены латинскими буквами В ячейках главной диагонали этой таблицы указано число пациентов, которым вынесен диагноз одной из болезней. Анализируя приведенную таблицу, легко определить, что заболевания A и D одновременно встречаются наиболее часто, что больные E, напротив, редко одновременно страдают болезнями B или C, а диагноз С редко сопровождается диагнозом D или E. Таким образом, таблица совпадений позволяет устанавливать на основании наблюдений правила типа
если A то D если E то не B.
Частота появления каждого отдельного диагноза, или группы диагнозов, определяется очень просто - считается количество появления этого диагноза(ов) и делится на общее количество пациентов. Эта величина измеряется в процентах и называется поддержкой (support). Низкий уровень поддержки (менее одной тысячной процента) говорит о том, что такая ассоциация не существенна.
О важности установленного правила можно судить, анализируя число событий, определяющих это правило. Степень достоверности равна отношению числа событий, удовлетворяющих правилу, к числу событий, удовлетворяющих только условию если этого правила. Например, достоверность первого из приведенных правил равна отношению числа пациентов, страдающих болезнями A и D одновременно, к числу пациентов, которым поставлен диагноз A. Заметьте, что поскольку числа пациентов, страдающих болезнями A и D, как правило, различается, достоверность правил если A то D и если D то A также различается. В приведенном примере достоверность первого утверждения выше. Ещё одной важной характеристикой ассоциации является усиление (improvement) ассоциации. Чем больше усиление, тем сильнее влияние, которое появление A оказывает на появление B. Усиление рассчитывается по формуле: (доверительность A к B ) / (распространенность B ). Рассмотренный анализ таблицы совпадений двух событий (диагнозов) легко обобщается на случай нескольких событий. Основное отличие - невозможность одновременного восприятия многомерной таблицы человеком; в этом случае рутинный перебор различных возможностей необходимо перепоручить компьютеру даже в случае небольшого числа анализируемых параметров. И, конечно, правила, которые могут быть выведены в многомерной таблице совпадений, становятся более разнообразными. В случае одновременно случающихся трех параметров к уже рассмотренным правилам могут добавиться правила типа
если ( A и B ) то C если ( A и не B ) то C.
Эти правила принято называть правилами ассоциации и диссоциации соответственно. Основным достоинством метода корзины потребителя является простота генерируемых правил. Действительно, генерируемые правила имеют форму
если условие то результат
и легко воспринимаются человеком. Такие правила легко формулируются обычным языком и, соответственно, их можно непосредственно использовать. С другой стороны, генерируемое правило представляет собой оператор многих языков программирования, в частности языка SQL, и, следовательно, этот метод легко сопрягается с базами данных. Другими его достоинствами являются способность работать с записями различной длины и принципиальная (для понимания человеком) вычислительная простота. Наконец, его удобно использовать " для затравки" исследований, когда у Вас нет почти никаких начальных представлений о данных и Вы не знаете с какой стороны подступиться к задаче. Основными недостатками метода являются: резкий (экспоненциальный) рост объема вычислений с увеличением числа параметров, фактически полное неприятие в расчет редко встречаемых параметров и ограниченные возможности метода по учету дополнительных знаний о свойствах параметров. С точки зрения метода все анализируемые параметры (потребительские товары, диагнозы болезней) абсолютно идентичны во всех смыслах, кроме одного - названия параметра. Естественно, далеко не все задачи укладываются в эту жесткую схему. Возможность введения дополнительных, так называемых виртуальных, параметров (искусственное, мыслимое приведение других характеристик задачи к исследуемому типу) не снимает всей остроты проблемы. Метод корзины покупателя дает наилучшие результаты, когда различные параметры наблюдаются в примерно одинаковом числе случаях. В противном случае, поскольку установленные методом правила будут связывать только наиболее часто встречаемые параметры, мы не узнаем ничего нового о редко встречаемых параметрах, а только потратим впустую время на ненужный перебор малозначимых случаев. В рассмотренном примере бессмысленно включать в анализ редкие диагнозы, лучше попытаться их обобщить, сгруппировать близкие в медицинском смысле редкие диагнозы в один обобщенный и включить его в анализ. При этом при группировке редко встречаемых параметров желательно руководствоваться систематикой свойств, их таксономическими свойствами. В соответствии с ними следует выбрать такой уровень обобщения, который обеспечивает примерно равную встречаемость включенных в анализ параметров. Использование метода покупательской корзины также целесообразно при исследовании временных рядов, когда необходимо выявить группы нескольких событий, имеющих тенденцию происходить в строго фиксированной последовательности. При таком исследовании любая последовательность фиксированного числа событий может быть обозначена своим идентификатором, эквивалентным диагнозу болезни или названию покупаемого продукта.
Рекомендуемая литература: Основная: 1. Котлер Ф., Армстронг Г., Вонг В., Сондерс Д. Основы маркетинга. Пер. с англ. – М.: ООО «И.Д. Вильямс», 2012. – 752с. 2. Панкрухин А.П. Маркетинг: Учебник. – М.: Издательство «Омега-Л», 2011. – 655с. 3. Соловьев Б.А., Мешков А.А., Мусатов Б.В. Маркетинг: Учебник. – М.: ИНФРА-М, 2012. – 336с. Дополнительная: 1. Беляев В.И. Маркетинг: основы теории и практики. Электронный учебник. – М.: ПРИОР, 2001.- 208с. 2. Еремин В.Н. Маркетинг: основы и маркетинг информации: учебник. – М.: КНОРУС, 2008. – 656с. 3. Калюжнова Н.Я. Якобсон А.Я. – под ред. Маркетинг: общий курс: учеб. пособие для студентов вузов, обуч. по направлению «Экономика». – М.: Омега-Л, 2009. – 476с. 4. Калюжнова Н.Я. Якобсон А.Я. – под ред. Маркетинг: общий курс: учеб. пособие для студентов вузов. – М.: Омега-Л, 2010. – 476с. 5. Фатхутдинов Р.А. Управление конкурентоспособностью организации: Учебник. – М.: Маркет ДС, 2008. – 432с.
ПЛАНЫ СЕМИНАРСКИХ ЗАНЯТИЙ
Цель семинарских занятий - активизация работы студентов по изучению учебной дисциплины. Свое участие в семинарских занятиях студент реализует посредством выступления по темам семинарских занятий. Планы семинаров предусматриваютуглубленное и всестороннее изучение узловых проблем мировой финансовой среды. В ходе семинарских занятий развивается экономическое мышление и формируются навыки анализа возникающих проблем на основе полученных знаний. Необходимый объем знаний достигается в результате тщательной подготовки к семинарским занятиям и активного участия в их проведении. При подготовке к семинару необходимо изучить рекомендованную литературу и дополнить конспект, выучить основные дефиниции, их сущность и основные показатели, характеризующие мировую финансовую среду, составить тезисы ответов по каждому из вопросов, выносимых для обсуждения на семинаре. В целях углубленного изучения отдельных проблем темы целесообразны выступления с научными сообщениями на семинаре, тематику которых необходимо согласовать с преподавателем. На каждом семинаре студент должен быть готов отвечать на все контрольные вопросы. Каждую тему занятий важно увязывать с предыдущими темами, смежными дисциплинами и спецификой будущей профессиональной деятельности специалиста по международным отношениям.
Популярное:
|
Последнее изменение этой страницы: 2016-06-04; Просмотров: 869; Нарушение авторского права страницы