Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Системный подход к информатизации производства



Системный подход к информатизации производства

Процесс перехода от индустриального общества к информационному путем насыщения политической, экономической и социальной деятельности современными информационными технологиями получил название информатизация. Информатизация в системе управления предприятием предполагает:

· создание правовых, экономических, технологических, социальных условий для того, чтобы необходимая для решения управленческих проблем информация была доступна в кратчайшие сроки, в любой точке, любому потенциальному пользователю;

· создание аппаратных и программных средств, телекоммуникационных систем, обеспечивающих формирование информационных ресурсов и доступ к ним, включая хранение, переработку, преобразование и передачу информации и знаний;

· обеспечение первоочередного развития структур, обеспечивающих производство и воспроизводство информации и знаний;

· разработку и реализацию организационно-методологических основ и программ последовательного, целенаправленного и эффективного внедрения информационных технологий в систему управления организацией.

Информационная стратегия как ключевой фактор успеха

В известной книге Ксавьера Гилберта " Менеджмент" дается точная оценка роли информационных технологий в современном бизнесе. Многие компании предлагают рынку новые виды продукции, но оказываются не в силах обеспечить устойчивое конкурентное преимущество. У них есть только продукция. Другие составляющие конкурентного успеха отсутствуют. Системы сбыта не соответствует продаваемым товарам или нужному уровню услуг. Рынок недостаточно сегментирован, и маркетинг оказывается ненаправленным. Системы автоматизации производства были созданы для предыдущего поколения продукции, а условия конкуренции и сбыта изменились.

Когда конкуренция принудит компанию к снижению расходов или к повышению прибыли, эти отсутствующие элементы, может быть, наконец, появятся, и тогда функциональные службы начнут действовать согласованно. Изменения идут шаг за шагом: сначала бухгалтерия, затем инженерное обеспечение, в конце — планирование и маркетинг. Такая " лоскутная" стратегия едва ли пригодна в ситуации общеотраслевых сдвигов. Она не может направлять динамику изменений, не в силах создать новую модель конкуренции и обратить разовое изобретение или приобретение технологии в источник длительного конкурентного преимущества.

Действительно, эффективная инновация не сводится только к новой продукции. Нужен набор конкурентных качеств — дизайн продукта, организация производства, направленность маркетинга, каналы сбыта и предоставление услуг. В результате потребителям будет предъявлено новое качество — более привлекательное соотношение между воспринимаемой ценностью и действительной ценой. Чтобы получить растущее конкурентное преимущество, изменения следует осуществлять достаточно быстро.

Стратегии, направленные на повышение ценности производимой продукции и на ее удешевление, обычно исключают друг друга. Быстрота изменений позволяет добиться оптимизации главных составляющих формулы конкуренции — роста воспринимаемой ценности без повышения цены или сокращения цены без снижения ценности. Скорость важна для обеих составляющих формулы конкуренции, для прибыли и цены. Чем быстрее реакция на требования рынка, тем выше прибыль. При этом нужна более гибкая и более дешевая организация процесса.

Новые победители внедряют свои новаторские подходы очень быстро. Они постоянно следят за рынком и быстро реагируют на новую информацию. Разработка и внедрение новой продукции ведется быстро. Информационные технологии и организация управления, производства и сбыта взаимно дополняют друг друга и настраиваются так, чтобы с наибольшей скоростью давать заказчикам ожидаемый продукт или услугу с требуемым качеством.

Примеров того, как работает такой подход, достаточно. Широко известно исследование, проведенное известным агентством McKinsey, которое показало, что если товар попадает на рынок с шестимесячным отставанием от графика, компания теряет 36 % прибыли, потенциально возможной за период жизни этого товара. Если, с другой стороны, он попал на рынок вовремя, но при этом расходы на разработку и внедрение оказались на 50 % выше заложенных в смету, совокупная прибыльность уменьшается всего на 3, 5 %. Компании Toyota, Nissan и Honda тратят на создание новой модели в среднем 24 месяца. У компаний Ford, Chrysler и General Motors на это уходит от 36 до 48 месяцев. При этом японские компании тратят на разработку модели от 1 до 1, 5 млрд. долларов, а американские — от 3, 2 до 4 млрд. долларов.

Большинство компании, которые рискнули провести реинжиниринг основных бизнес-процессов с применением новейших информационных технологий, убедились, что новые технологии не дают обещанных преимуществ, если нет новых, согласованных с планированием и производством стратегий. Возможности информационных технологий часто преувеличиваются, но сами они не виноваты! Технология не в силах спасти традиционные стратегии адаптации к изменениям, предполагающие длинную череду усовершенствований. Успешные стратегии ведут к быстрым изменениям. Быстрые стратегии делают информационные технологии эффективными, а технологии, в свою очередь, делают реальными быстрое следование этим изменениям.

Само по себе информационное обеспечение не является длительно действующим фактором успеха. Если исходить из возможностей современных информационных технологий и слепо искать, где бы в компании их применить, почти наверняка получите негодную корпоративную стратегию. Информационное обеспечение всего лишь помогает реализовать возможности, создаваемые формулой конкуренции. Технологии широко доступны, а творческие формулы конкуренции, ориентированные на быстроту реакции и обновление производства, достаточно редки.

Новое оружие конкуренции — это обновление и скорость реакции на происходящие изменения. Чтобы действовать быстро, нужна инициатива и ответственность руководителя, нужны рабочие группы, включающие специалистов разных профессий, располагающих общей информационной базой и умеющих работать с ней. Информационные системы управления производством очень полезны, но не являются их заменой. Для информационных систем управления конкуренцией главное — не информационная технология, а формула конкуренции, ключевые для нее факторы успеха и приданные ей информационные возможности. Если среди принимающих решения не найдется ни одного человека, способного задавать действительно важные вопросы, и если будут использоваться традиционные критерии, то при принятии этих решений могут возникнуть проблемы.

Типы данных в организации

Многие компании не испытывают недостатка в данных. Данные находятся везде — в рабочих файлах персональных компьютеров, базах данных, видео и графических презентациях, бумажных и электронных документах. Вся информация, которую использует менеджер в повседневной деятельности и в процессе принятия решений, может быть условно разделена на три категории: формализованная, частично формализованная и неформализованная. В зависимости от степени формализации определяются и типы решений — структурированные, частично структурированные и неструктурированные.

Компьютер обрабатывает данные, представленные в формализованном виде — в виде чисел. С такими же данными имеют дело и формальные математизированные средства статистики. Таким образом, формализация данных является важнейшей составляющей работы информационных систем. Примером формализованных данных является представление результатов деятельности компании в виде наборов числовых таблиц: финансовые отчеты, баланс, денежные транзакции, платежи, оперативные сводки о выполнении суточных заданий, заказы, накладные и т. д. Действия с формализованными данными легче автоматизируются, и они могут проходить практически без участия человека.

Часть информации изначально является неформализованной, но поддается частичной формализации матричными методами. Например, для того чтобы оценить влияние факторов внешнего окружения или ответные действия самого предприятия, часто применяются матицы BCG (Boston Consulting Group). Для оценки степени успешности бизнеса по характеристикам получения и расходования денежных средств на поддержку деятельности или для оценки перспектив бизнеса на конкретном рынке в конкретной ценовой обстановке используется матрица GEMPM (General Electric Multifactor Portfolio Model) из Portfolio-анализа.

Матрица строится по некоторому алгоритму, который заполняет клетки матрицы формальными параметрами, имеющими реальный неформальный смысл. Ячейки матрицы BCG (2 x 2) — " вопросительные знаки", " звезды", " дойные коровы", " собаки". Матрица GEMPM строится в системе координат " сила бизнеса — привлекательность рынка", оценки производятся по девяти параметрам (матрица 3 x 3). В этих случаях принятие решений осуществляется тандемом " человек-компьютер": оптимальное решение выбирает человек, пользуясь набором сценариев, предоставленных компьютером. Сценарии строятся по принципу " что, если…? " с помощью систем поддержки принятия решения (Decision Support System — DSS).

Значительная часть данных, особенно на верхнем уровне управления, бывает неформализованной — политические новости, сведения о партнерах и конкурентах, информация с фондовых и валютных бирж, сводные неформальные отчеты по периодам, деловая переписка, протоколы встреч, семинаров, научные публикации и обзоры, гипертексты в Интернет. Такие данные наиболее трудно формализуемы, но их анализ является обязательной составляющей деятельности высшего руководителя. В этом случае основная тяжесть в принятии решения и ответственность за его результаты лежит на руководителе — здесь огромную роль играют его знания, деловой опыт, компетенция и, конечно, интуиция. Компьютерные, информационные экспертные системы (Expert System — ES) только дополняют эти качества.

Если данные являются недостаточно структурированными и фрагментированными среди разнообразных платформ, операционных систем, различных СУБД и приложений, то особенно важным является концентрация по некоторым согласованным правилам этих данных в массивы, называемые метаданными (Metadata). Решения для управления метаданными предоставляют расширенные возможности доступа к массивам структурированных данных вместе с отображением их взаимоотношений с другими массивами информации. Использование специальных хранилищ — репозиториев (Repository) — также может рационализовать или придать смысл этим данным за счет идентификации и сравнения.

Работа с неформализованными данными вызывает значительные трудности. Эти структуры данных, разбитые на категории, довольно сложно поддерживать с помощью репозитория. Особенно это касается систем управления смыслом и содержанием (Content Management Systems — CMS), а также документацией. Специализированные репозитории и поисковые машины предоставляют только отдельные решения, и ни одно из них не покрывает весь спектр данных. Тем не менее, для решений на базе репозиториев существует возможность объединения как формализованных, так и неформализованных метаданных, что может быть достигнуто путем разработки соответствующих интерфейсов к этим новым технологиям. Подобный репозиторий станет центральным каналом доступа ко всем корпоративным массивам данных, идентифицируя взаимоотношения между данными, а также то, насколько сотрудники, заказчики и партнеры их используют.

OLAP-технологии

В 1993 году основоположник реляционного подхода к построению баз данных Э. Кодд с партнерами опубликовали статью, инициированную компанией " Arbor Software" (сегодня это известнейшая компания " Hyperion Solutions" ), озаглавленную " Обеспечение OLAP (оперативной аналитической обработки) для пользователей-аналитиков". В статье сформулированы 12 особенностей технологии OLAP, которые впоследствии были дополнены еще шестью.

Эти положения стали основным содержанием новой и очень перспективной технологии.

Основные особенности технологии OLAP (Basic):

· многомерное концептуальное представление данных

· интуитивное манипулирование данными

· доступность и детализация данных

· пакетное извлечение данных против интерпретации

· модели анализа OLAP

· архитектура " клиент-сервер" (OLAP доступен с рабочего стола)

· прозрачность (прозрачный доступ к внешним данным).

· многопользовательская поддержка

Специальные особенности (Special):

· обработка неформализованных данных

· сохранение результатов OLAP: хранение их отдельно от исходных данных

· исключение отсутствующих значений

· обработка отсутствующих значений

Особенности представления отчетов (Report)

· гибкость формирования отчетов

· стандартная производительность отчетов

· автоматическая настройка физического уровня извлечения данных

Управление измерениями (Dimension):

· универсальность измерений

· неограниченное число измерений и уровней агрегации

· неограниченные операции между размерностями.

Исторически сложилось так, что сегодня термин OLAP подразумевает не только многомерный взгляд на данные со стороны конечного пользователя, но и многомерное представление данных в целевой БД. Именно с этим, связано появление в качестве самостоятельных терминов " Реляционный OLAP" (ROLAP) и " Многомерный OLAP" (MOLAP).

Рис. 2.14. Элементарный OLAP-куб

Программные средства OLAP — это инструмент оперативного анализа данных, содержащихся в хранилище. Главной особенностью является то, что эти средства ориентированы на использование не специалистом в области информационных технологий, не экспертом-статистиком, а профессионалом в прикладной области управления — менеджером отдела, департамента, управления, и, наконец, директором. Средства предназначены для общения аналитика с проблемой, а не с компьютером. На рисунке 2.14 показан элементарный OLAP-куб, позволяющий производить оценки данных по трём измерениям.

OLAP-сервис представляет собой инструмент для анализа больших объемов данных в режиме реального времени. Многомерный OLAP-куб и система соответствующих математических алгоритмов статистической обработки позволяет анализировать данные любой сложности на любых временных интервалах. Вся работа с OLAP-системой происходит в терминах предметной области и позволяет строить статистически обоснованные модели деловой ситуации. Взаимодействуя с OLAP-системой, менеджер может осуществлять быстрый просмотр интересующей его информации, получать произвольные срезы данных и выполнять аналитические операции: детализации, свертки, сквозного распределения, сравнения во времени одновременно по многим параметрам.

Рис. 2.15. Аналитическая ИС извлечения, обработки данных и представления информации

Имея в своем распоряжении гибкие механизмы манипулирования данными и визуального отображения (рис. 2.15, 2.16), менеджер сначала рассматривает с разных сторон данные, которые могут быть (а могут и не быть) связаны с решаемой проблемой.

Рис. 2.16. Механизмы манипулирования данными и визуального отображения результатов

Далее он сопоставляет различные показатели бизнеса между собой, стараясь выявить скрытые взаимосвязи. Может рассмотреть данные более пристально, детализировав их, например, разложив на составляющие по времени, по регионам или по клиентам, или наоборот еще более обобщить представление информации, чтобы убрать отвлекающие подробности. После этого с помощью модуля статистического оценивания и имитационного моделирования строится несколько вариантов развития событий, и из них выбирается наиболее приемлемый вариант.

У управляющего компанией, например, может зародиться гипотеза о том, что разброс роста активов в различных филиалах компании, зависит от соотношения в них специалистов с техническим и экономическим образованием. Для проверки этой гипотезы менеджер может запросить из хранилища и отобразить на графике интересующее его соотношение для тех филиалов, у которых за текущий квартал рост активов снизился по сравнению с прошлым годом более чем на 10 %, и для тех, у которых повысился более чем на 25 %.

Для этого он должен иметь возможность использовать простой выбор из предлагаемого меню. Если полученные результаты ощутимо распадутся на две соответствующие группы, то это должно стать стимулом для дальнейшей проверки выдвинутой гипотезы.

В настоящее время быстрое развитие получило направление, называемое динамическим моделированием (Dynamic Simulation), в полной мере реализующее указанный выше принцип FASMI. Используя динамическое моделирование, аналитик строит модель деловой ситуации, развивающуюся во времени, по некоторому сценарию. При этом результатом такого моделирования могут быть несколько новых бизнес-ситуаций, порождающих дерево возможных решений с оценкой вероятности и перспективности каждого. В таблице 2.3 приведены сравнительные характеристики статического и динамического анализа.

 

 

Практически всегда задача построения аналитической системы для многомерного анализа данных — это задача построения единой, согласованно функционирующей информационной системы, на основе неоднородных программных средств и решений. И уже сам выбор средств для реализации ИС становится чрезвычайно сложной задачей. Здесь должно учитываться множество факторов, включая, взаимную совместимость различных программных компонент, легкость их освоения, использования и интеграции, эффективность функционирования, стабильность и даже формы, уровень и потенциальную перспективность взаимоотношений различных фирм производителей.

OLAP применим везде, где есть задача анализа многофакторных данных. Вообще, при наличии некоторой таблицы с данными, в которой есть хотя бы одна описательная колонка и одна колонка с цифрами, OLAP-инструмент будет эффективным средством анализа и генерации отчетов. В качестве примера применения OLAP-технологии рассмотрим исследование результатов процесса продаж.

Ключевые вопросы: " Сколько продано? ", " На какую сумму продано? " расширяются по мере усложнения бизнеса и накопления исторических данных до некоторого множества факторов, или разрезов: " …в Санкт-Петербурге, в Москве, на Урале, в Сибири…", "..в прошлом квартале, по сравнению с нынешним", "..от поставщика А по сравнению с поставщиком Б…" и т. д.

Ответы на подобные вопросы необходимы для принятия управленческих решений: об изменении ассортимента, цен, закрытии и открытии магазинов, филиалов, расторжении и подписании договоров с дилерами, проведения или прекращения рекламных кампаний и т. д.

Если попытаться выделить основные цифры (факты) и разрезы (аргументы измерений), которыми манипулирует аналитик, стараясь расширить или оптимизировать бизнес компании, то получится таблица, подходящая для анализа продаж как некий шаблон, требующий соответствующей корректировки для каждого конкретного предприятия.

Поля таблицы:

Время, Категория товара, Товар, Регион, Продавец, Покупатель, Сумма, Количество.

Время. Как правило, это несколько периодов: Год, Квартал, Месяц, Декада, Неделя, День. Многие OLAP-инструменты автоматически вычисляют старшие периоды из даты и вычисляют итоги по ним.

Категория товара. Категорий может быть несколько, они отличаются для каждого вида бизнеса: Сорт, Модель, Вид упаковки и пр. Если продается только один товар или ассортимент очень невелик, то категория не нужна.

Товар. Иногда применятся название товара (или услуги), его код или артикул. В тех случаях, когда ассортимент очень велик (а некоторые предприятия имеют десятки тысяч позиций в своем прайс-листе), первоначальный анализ по всем видам товаров может не проводиться, а обобщаться до некоторых согласованных категорий.

Регион. В зависимости от глобальности бизнеса можно иметь в виду Континент, Группа стран, Страна, Территория, Город, Район, Улица, Часть улицы. Конечно, если есть только одна торговая точка, это измерение отсутствует.

Продавец. Это измерение тоже зависит от структуры и масштабов бизнеса. Здесь может быть: Филиал, Магазин, Дилер, Менеджер по продажам. В некоторых случаях измерение отсутствует, например, когда продавец не влияет на объемы сбыта, магазин только один и так далее.

Покупатель. В некоторых случаях, например в розничной торговле, покупатель обезличен и измерение отсутствует, в других случаях информация о покупателе есть, и она важна для продаж. Это измерение содержать название фирмы-покупателя или множество группировок и характеристик клиентов: Отрасль, Группа предприятий, Владелец и так далее.

Важный вопрос — наличие данных. Если они есть в каком-либо виде (Excel или Access-таблица, данные из базы учетной системы, в виде структурированных отчетов филиалов) ИТ-специалист сможет передать их OLAP-системе напрямую или с промежуточным преобразованием. Для этого OLAP-системы имеют специальные инструменты конвертации данных.

После настройки OLAP-системы на данные, пользователь получит возможность быстро получать ответы на ключевые вопросы путем простых манипуляций мышью над OLAP-таблицей и соответствующими меню. При этом будут доступны некоторые стандартные методы анализа, следующие из природы OLAP-технологии.

Факторный (структурный) анализ. Анализ структуры продаж для выявления важнейших составляющих в интересующем разрезе. Для этого удобно использовать, например, диаграмму типа " Пирог" в сложных случаях, когда исследуется сразу 3 измерения — " Столбцы". Например, в магазине " Компьютерная техника" за квартал продажи компьютеров составили $100000, фототехники —$10000, расходных материалов — $4500. Вывод: оборот магазина зависит в большой степени от продажи компьютеров (на самом деле, быть может, расходные материалы необходимы для продажи компьютеров, но это уже анализ внутренних зависимостей).

Анализ динамики (регрессионный анализ — выявление трендов). Выявление тенденций, сезонных колебаний. Наглядно динамику отображает график типа " Линия". Например, объемы продаж продуктов компании A в течение года падали, а объемы продаж B росли. Возможно, улучшилось благосостояние среднего покупателя, или изменился имидж магазина, а с ним и состав покупателей. Требуется провести корректировку ассортимента. Другой пример, в течение 3 лет зимой снижается объем продаж видеокамер.

Анализ зависимостей (корреляционный анализ). Сравнение объемов продаж разных товаров во времени для выявления необходимого ассортимента — " корзины". Для этого также удобно использовать график типа " Линия". Например, при удалении из ассортимента принтеров в течение первых двух месяцев обнаружилось падение продаж картриджей с порошком.

Сопоставление (сравнительный анализ). Сравнение результатов продаж во времени, или за заданный период, или для заданной группы товаров. В зависимости от количества анализируемых факторов (от 1 до 3-х) используется диаграмма типа " Пирог" или " Столбцы". Пример, сравнение результатов продаж однотипных магазинов для оценки качества работы менеджеров.

Дисперсионный анализ. Исследование распределения вероятностей и доверительных интервалов рассматриваемых показателей. Применяется для прогнозирования и оценки рисков.

Этими видами анализа возможности OLAP не исчерпываются. Например, применяя в качестве алгоритма вычисления промежуточных и окончательных итогов функции статистического анализа — дисперсию, среднее отклонение, моды более высоких порядков, можно получить самые изощренные виды аналитических отчетов.

OLAP-системы являются частью более общего понятия " интеллектуальные ресурсы предприятия" или " средства интеллектуального бизнес-анализа" (Business Intelligence — BI), которое включает в себя помимо традиционного OLAP-сервиса средства организации совместного использования данных и информации, возникающих в процессе работы пользователей хранилища. Технология Business Intelligence обеспечивает электронный обмен отчетными документами, разграничение прав пользователей, доступ к аналитической информации из Internet и Intranet.

Технологии Data Mining

В настоящее время элементы искусственного интеллекта активно внедряются в практическую деятельность менеджера. В отличие от традиционных систем искусственного интеллекта, технология интеллектуального поиска и анализа данных или " добыча данных" (Data Mining — DM), не пытается моделировать естественный интеллект, а усиливает его возможности мощностью современных вычислительных серверов, поисковых систем и хранилищ данных. Нередко рядом со словами Data Mining встречаются слова " обнаружение знаний в базах данных" (Knowledge Discovery in Databases).

В основу современной технологии Data Mining (Discovery-driven Data Mining) положена концепция шаблонов (Pattern), отражающих фрагменты многоаспектных взаимоотношений в данных. Эти шаблоны представляют собой закономерности, свойственные выборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборке и виде распределений значений анализируемых показателей. На рисунке 2.17 показана схема преобразования данных с использованием технологии Data Mining.


Рис. 2.17. Схема преобразования данных с использованием технологии DM

Важное положение Data Mining — нетривиальность разыскиваемых шаблонов. Это означает, что найденные шаблоны должны отражать неочевидные, неожиданные (Unexpected) регулярности в данных, составляющие, так называемые, скрытые знания (Hidden Knowledge). К деловым людям пришло понимание, что " сырые" данные (Raw Data) содержат глубинный пласт знаний, при грамотной раскопке которого могут быть обнаружены настоящие самородки, которые можно использовать в конкуренции.

Data Mining — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Data Mining представляют большую ценность для руководителей и аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью методов Data Mining они могут получить ощутимые преимущества в конкурентной борьбе.

В первую очередь методы Data Mining заинтересовали коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных (Data Warehousing). Опыт многих таких предприятий показывает, что отдача от использования Data Mining может достигать 1000 %. Известны сообщения об экономическом эффекте, в 10—70 раз превысившем первоначальные затраты от 350 до 750 тыс. долларов. Есть сведения о проекте в 20 млн. долларов, который окупился всего за 4 месяца. Другой пример — годовая экономия 700 тыс. долларов за счет внедрения Data Mining в одной из сетей универсамов в Великобритании.

Компания Microsoft официально объявила об усилении своей активности в области Data Mining. Специальная исследовательская группа Microsoft, возглавляемая Усамой Файядом, и пять приглашенных партнеров (компании Angoss, Datasage, Epiphany, SAS, Silicon Graphics, SPSS) готовят совместный проект по разработке стандарта обмена данными и средств для интеграции инструментов Data Mining с базами и хранилищами данных.

Сфера применения Data Mining ничем не ограничена — технологию можно применять всюду, где имеются огромные количества какие-либо " сырых" данные!

Data Mining является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. (рис. 2.18). Отсюда обилие методов и алгоритмов, реализованных в различных действующих системах Data Mining. [В. А. Дюк, www.inftech.webservis.ru/it/data mining/ar2.html]. Многие из таких систем интегрируют в себе сразу несколько подходов. Тем не менее, как правило, в каждой системе имеется какая-то ключевая компонента, на которую делается главная ставка.

Рис. 2.18. Области применения технологии Data Mining

Можно назвать пять стандартных типов закономерностей, выявляемых с помощью методов Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование.

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в компьютерном супермаркете, может показать, что 55 % купивших компьютер берут также и принтер или сканер, а при наличии скидки за такой комплект принтер приобретают в 80 % случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45 % случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60 % новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить найти шаблоны, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем. На рисунке 2.19 показан полный цикл применения технологии Data Mining.

Рис. 2.19. Полный цикл применения технологии Data Mining

Статистические пакеты

Последние версии почти всех известных статистических пакетов включают наряду с традиционными статистическими методами также элементы Data Mining. Но основное внимание в них уделяется все же классическим методикам — корреляционному, регрессионному, факторному анализу и другим.

Недостатком систем этого класса считают требование к специальной подготовке пользователя. Также отмечают, что мощные современные статистические пакеты являются слишком " тяжеловесными" для массового применения в финансах и бизнесе. К тому же часто эти системы весьма дороги — от $1000 до $15000.

Есть еще более серьезный принципиальный недостаток статистических пакетов, ограничивающий их применение в Data Mining. Большинство методов, входящих в состав пакетов опираются на статистическую парадигму, в которой главными фигурантами служат усредненные характеристики выборки. А эти характеристики при исследовании реальных сложных жизненных феноменов часто являются фиктивными величинами. Это чрезвычайно важное обстоятельство следует обязательно учитывать при анализе многомерных данных.

В качестве примеров наиболее мощных и распространенных статистических пакетов можно назвать SAS (компания SAS Institute), SPSS (SPSS), STATGRAPHICS (Manugistics), STATISTICA для WINDOWS, STADIA и другие. Эти пакеты с успехом могут применять небольшие и средние предприятия, большие многопрофильные компании могут интегрировать их в общую корпоративную сеть.

Варианты интеграционных решений

Многообразие применяемых технологий и систем, разнообразие форматов данных, циркулирующих в информационных потоках, обилие аналитических и отчётных форм сделали чрезвычайно актуальной задачу интеграции указанных выше технологических и информационных объектов и сущностей, а также физические и виртуальные пространства их взаимодействия в единую информационно-управленческую среду (рис. 3.3) [Н.И. Куцевич., ].

Интеграция — это не просто механическое объединение модулей информационной системы. При разработке плана интеграции исходят прежде всего из стратегических целей развития предприятия, возможного изменения бизнес-логики, в соответствии с которой выстраиваются бизнес-процессы и осуществляется их информационное сопровождение. Интеграция может производиться на уровне форматов и баз данных, программно-аппаратных и сетевых устройств, пользовательских интерфейсов, форм и шаблонов документооборота, программных приложений и т.д. Выгоды от такой интеграции очевидны.

Рис. 3.3. Общая схема аппаратно-комммуникационной реализации интегрированной системы управления предприятием

Подход к разработке и внедрению КИС, основанный на интеграции приложений, позволяет:

· сохранить ранее сделанные инвестиции;

· сократить временные и финансовые затраты на поддержку и развитие информационного пространства компании;

· использовать для решения конкретных задач наиболее эффективные системы отдельных производителей;

· легко расширять и развивать отдельные возможности существующих информационных систем с уже накопленными в них данными.

Интеграция на уровне данных

Одной из главных проблем интеграции данных является обилие форматов и типов (неструктурированные, частично-структурированные, жёстко-структурированные) данных, а также лавинообразное нарастание их объёмов. Циркулирование разнородных массивов данных и информации в сетях различных служб предприятия создает множество проблем с их сбором, структурированием, обработкой, анализом, хранением, архивированием и передачей пользователю для принятия делового решения. На рисунке 3.4 показана традиционная схема интеграции данных.

Рис. 3.4. Традиционная схема интеграции данных

Для их интеграции в настоящее время обычно используют стандартные интерфейсы и протоколы, например, SQL и JDBC/ODBC, применяют различные инструменты реляционных баз данных (Relational Database — RD), сквозных репозиториев — баз данных с " надстройкой", содержащей информацию об артефактах и объектах проектирования, надмножество словарей метаданных (Transparent Repository — TR) и современных хранилищ и фабрик данных (Data Warehouse, Data Factory — DW, DF).

Последний вид технологий интеграции применяется, как правило, в крупных компаниях и производственных объединениях. Такие технологии создают удобную для пользователя единую среду для хранения и использования данных. Ниже будет подробнее рассказано о системах коллективного использования информации.

Рис. 4.3.

Опыт создания и использования " заказных" ИС позволяет условно выделить следующие основные этапы их жизненного цикла:

· определение требований к системе и их анализ — определение того, что должна делать система;

· проектирование — определение того, как система будет делать то, что она должна делать; проектирование это, прежде всего, спецификация подсистем, функциональных компонентов и способов их взаимодействия в системе;

· разработка — создание функциональных компонентов и отдельных подсистем, соединение подсистем в единое целое;

· тестирование — проверка функционального соответствия системы показателям, определенным на этапе анализа;

· внедрение — установка и ввод системы в действие;

· функционирование — штатный процесс эксплуатации в соответствии с основными целями и задачами ИС;


Поделиться:



Последнее изменение этой страницы: 2017-05-11; Просмотров: 1370; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.077 с.)
Главная | Случайная страница | Обратная связь