РОЗДІЛ 2. Технологічні засоби обробки економічної інформації в сучасних інформаційних системах

Стр 1 из 11Следующая ⇒

РОЗДІЛ 2. Технологічні засоби обробки економічної інформації в сучасних інформаційних системах

Зіставлення основних компонентів технологій

Компоненти технологій для виробництва продуктів

Матеріальних

Інформаційних

Підготовка сировини матеріалів

Збір даних або початкової інформації

Виробництво матеріального продукту

Оброблення даних та одержання результуючої інформації

Збут продукції

Передача результатів користувачу для приняття на її основі рішень

Інформаційна технологія є найбільш важливою складовою процесу використання ІР суспільства.

Вона пройшла кілька еволюційних етапів, зміна яких, в оснвнму визначалась:

· розвитком науково-технічного прогресу,

· появою нових технічних засобів переробки інформації.

В сучасному суспільстві основним технічним засобом технології переробки інформації є ПК, який суттєво вплинув як на концепцію побудови і використання технологічних процесів, так і на якість результатной (вихідної) інформації. Впровадження ПК в інформаційну сферу і застосування телекомунікаційних засобів зв’язку визначили новий етап розвитку ІТ і, як наслідок, зміну її назви за рахунок приєднання одного з синонімів: “нова”, “комп’ютерна” або “сучасна”.

Прикметник “нова” підкреслює новаторський, а не еволюційний характер цієї технології. Її впровадження є новаторським актом в тому розумінні, що ця технологія суттєво змінює зміст різних видів діяльності в організаціях. В поняття “нова інформаційна технологія” включені також комунікаційні технології, які забезпечують передачу інформації різними засобами. Основні характерні ознаки нової ІТ наведені в табл. 2.2.

Таблиця 2.2

Процедури обробки даних

Потоки інформації, що виникають під час здійснення функцій економіко-організаційної діяльності об'єкта управління, завжди беруть початок з конкретних джерел, а закінчуються у конкретних користувачів.

Між джерелом інформації та користувачем лежить шлях обробки даних – ІТ.

Основна функція системи обробки даних – реалізація типових операцій обробки даних, а саме:

· збір, реєстрація і перенесення інформації на машинні носії;

· передача інформації в місця її зберігання та обробки;

· введення інформації в ЕОМ, контроль за введенням та її компонування в пам'яті комп'ютера;

· створення і ведення внутрішньомашинної інформаційної бази;

· обробка інформації в ЕОМ (накопичення, сортування, коригування, арифметична і логічна обробка) для вирішування функціональних задач системи (підсистеми) управління об'єктом;

· виведення інформації у вигляді машинограм, відеограм, інформації для зв'язку з іншими системами;

· організація, управління (адміністрування) обчислювальним процесом (планування, облік, контроль, аналіз реалізації ходу обчислень) у локальних і глобальних мережах.

Система обробки даних (СОД) призначена для інформаційного обслуговування спеціалістів різних органів управління підприємства, що приймають управлінські рішення.

Виділення типових операцій (процедур) обробки даних дало змогу розробити спеціалізовані програмно-апаратні комплекси, що їх реалізують (периферійні пристрої, оргтехніку, пакети прикладних програм , стандартні набори програм для реалізації функціональних задач тощо). Конфігурація апаратних комплексів утворює топологію обчислювальної системи.

Інформаційна технологія вирішування економічних задач складається з ряду процедур: отримання даних; збір і реєстрація даних; пересилання їх до місця обробки; машинне кодування даних; зберігання; обробка; використання інформації в управлінні. При цьому послідовність виконання процедур не може бути суворо фіксованою і, крім того, можливе виконання додаткових процедур (кодування, тиражування). Інколи не обов'язково в процесі обробки даних виконувати всі процедури: наприклад, дані, що надходять каналами зв'язку, не завжди реєструють і зберігають на машинних носіях, а відразу обробляють на ЕОМ.

Варто зупинитися на загальній характеристиці основних процедур, пов'язаних з обробкою економічних даних.

Отримання даних – здійснюється під час виконання господарських операцій шляхом виміру, зважування, підрахунку тощо. Для отримання даних застосовують різні пристрої: вага; вимірна тара; електричні, газові і водяні лічильники; контрольно-реєструвальні машини. Деякі з цих пристроїв за даними підрахунків одразу формують первинний документ і машинний носій. Тобто отримання даних нерозривно пов'язане з їх збором і реєстрацією.

Збір і реєстрація – це формування і запис на носій первинних даних, джерелом яких є підрозділи об'єкта управління або інші підприємства та організації (зовнішнє середовище), що виконують функції, пов'язані з підготовкою чи здійсненням виробництва й економіко-організаційною діяльністю. Первинні документи містять нормативно-довідкову (довідники і цінники, угоди і плани, організаційно-розпорядчі документи) та оперативну інформацію ПрО (прибуткові/видаткові первинні документи, платіжні доручення тощо), що утворює позамашинну інформаційну базу.

Документи підписують особи, які підтверджують адекватність записаних у них даних реальній дійсності. Процедури збору і реєстрації даних, як правило, здійснюються на робочих місцях, а їх обробка – у комп'ютерному відділі. Така технологія вимагає організації пересилання даних, що залежить від форм носіїв даних, відстані та їх змісту. За цими ознаками ведеться класифікація операцій передачі.

Передача даних обумовлена багатьма причинами: необхідністю розповсюдження даних за адресами різних отримувачів; інформаційні процедури здійснюються в різних місцях, а обробка ведеться в іншому місці. Передача даних виконується кількома способами: за допомогою кур'єра, пересилання поштою, доставка транспортними засобами, передача каналами зв'язку (дистанційна).

Дистанційна передача відрізняється від усіх наведених способів передачі даних тим, що пересилаються не носії, а сигнали, у яких відображена інформація.

Машинне кодування - перенесення даних з первинних документів на машинний носій (магнітний диск, магнітну стрічку). На цьому ж етапі дані також можуть автоматично перезаписуватися з одних носіїв на інші безпосередньо або з пересиланням їх каналами зв'язку.

Зберігання економічної інформації. Необхідність зберігання ЕКІ диктується багатьма обставинами – мережі різних видів, продаж проїзних квитків через комп'ютерну систему тощо.

Економічна інформація використовується в кількох напрямах, найважливіший – прийняття управлінських рішень, що базується головним чином на результатній інформації. Для прийняття оперативних рішень використовується також і первинна інформація. Розвиток ринкових відносин приводить до появи нових споживачів інформації. Звітність подається державній податковій адміністрації, власникам майна підприємства чи організації, постачальникам і покупцям, банкам тощо.

Сховища даних

Інформація є ключовим корпоративним ресурсом. Технологія сховищ даних дає змогу одержати точну інформацію, постійний доступ до якої є перевагою цієї технології.

Якщо мережа є нервовою системою корпорації, то БД − її пам'ять. БД − водночас інструментальні засоби й інформація, з якою ці засоби працюють.

Якщо клієнти, сервери, мережі, великі універсальні ЕОМ купуються корпорацією як компоненти, то БД − як технологія. БД, процеси та додатки проектуються в корпорації для здобуття повної системи “клієнт-сервер”.

В корпоративних системах обробки даних інформація поділяється між різними БД (операційними й аналітичним) залежно від часу.

Фундаментальна відмінність у філософії природи реального часу транзакційних систем і природи часу СППР привела до поділу БД на операційні й аналітичні, порівняльні характеристики яких наведено в табл. 2.3.

Таблиця 2.3

GRID -т ехнологія

Технологія Грід (Grid) використовується для створення географічно розподіленої обчислювальної інфраструктури, об'єднуючої ресурси різних типів з колективним доступом до цих ресурсів в рамках віртуальних організацій, що складаються з підприємств і фахівців, які спільно використовують ці загальні ресурси.

Термін Grid (сітка, грати) почав використовуватися з середини 90-х років і був вибраний за аналогією з мережами передачі та розподілу електроенергії (Power Grids).

Розвиток і впровадження технології Грід мають стратегічний характер. У найближчій перспективі ця технологія дозволить створити принципово новий обчислювальний інструмент для розвитку високих технологій в різних сферах людської діяльності.

Ідейною основою технології Грід є об'єднання ресурсів шляхом створення комп'ютерної інфраструктури нового типу, що забезпечує глобальну інтеграцію інформаційних і обчислювальних ресурсів на основі мережевих технологій і спеціального програмного забезпечення проміжного рівня (між базовим і прикладним ПЗ), а також набору стандартизованих служб для забезпечення надійного спільного доступу до географічно розподілених інформаційних і обчислювальних ресурсів: окремим комп'ютерам, кластерам, сховищам інформації й мережам.

Поява технології Грід обумовлена наступними передумовами:

· наявністю в багатьох організаціях обчислювальних ресурсів: суперкомп'ютерів або, що найчастіше зустрічається, організованих у вигляді кластерів ПК;

· необхідністю рішення складних наукових, виробничих, інженерних і завдань бізнесу;

· стрімким розвитком мережевого транспортного середовища і технологій високошвидкісної передачі даних.

Застосування технології Грід може забезпечити новий якісний рівень, а іноді і реалізувати принципово новий підхід в обробці величезних обсягів експериментальних даних, забезпечити моделювання складних процесів, візуалізацію великих наборів даних, складні додатки бізнесу з великими обсягами обчислень.

До теперішнього часу вже реалізовані і далі реалізуються безліч проектів по створенню Грід-систем. Велика частина цих проектів має експериментальний характер. Виходячи з результатів аналізу проектів можна зробити висновок про три напрямки розвитку технології Грід: обчислювальний Грід, Грід для інтенсивної обробки даних і семантичний Грід для операцій даними з різних БД.

Метою першого напрямку є досягнення максимальної швидкості обчислень за рахунок глобального розподілу цих обчислень між комп'ютерами. Проект DEISA (www.desia.org) може служити прикладом цього напрямку, в якому робиться спроба об'єднання суперкомп'ютерних центрів.

Метою другого напрямку є обробка величезних обсягів даних відносно нескладними програмами за принципом “одне завдання – один процесор”. Доставка даних для обробки і пересилання результатів в цьому випадку є достатньо складним завданням. Для цього напряму інфраструктура Грід є об'єднанням кластерів. Один з проектів, метою якого і є створення виробничої Грід-системи для обробки наукових даних, є проект EGEE (Enabling Grids for E-sciencE), виконуваний під егідою Європейського Союзу (www.eu-egee.org). Учасниками цього проекту є більше 90 наукових і освітніх установ зі всього світу.

Побудова інфраструктури Грід в рамках проекту EGEE орієнтована, в першу чергу, на застосування в різних галузях наукової діяльності, у тому числі і для обробки даних у фізиці високих енергій учасниками експериментів, що проводяться на базі створюваного в Європейському центрі ядерних досліджень (CERN, www.cern.ch) прискорювача LHС. Проект EGEE тісно пов'язаний на даній фазі розвитку з проектом LCG (LHC Computing Grid), який, по суті, і є його технологічною базою. Ведеться активна робота по розширенню інфраструктури Грід (RDIG, www.egee-rdig.ru).

Не зважаючи на достатньо тісну взаємодію багатьох проектів, конкретні реалізації Грід-систем відрізняються одна від одної, хоча до теперішнього часу з достатньою визначеністю почала спостерігатися тенденція стандартизації більшості компонентів, що означає найважливіший етап формування технології Грід (архітектура, протоколи, сервіси й ін.). З найзагальніших позицій ця технологія характеризується простим набором критеріїв:

· координація використання ресурсів за відсутності централізованого управління цими ресурсами;

· використання стандартних, відкритих, універсальних протоколів і інтерфейсів;

· забезпечення високоякісного обслуговування користувачів.

Концепція Грід. Грід є технологією забезпечення гнучкого, безпечного і скоординованого загального доступу до ресурсів. При цьому термін “ресурс” розуміється в дуже широкому сенсі, тобто ресурсом може бути апаратура (жорсткі диски, процесори), а також системне і прикладне ПЗ (бібліотеки, додатки).

У термінології Грід сукупність людей і організацій, вирішуючих спільно те або інше загальне завдання і що надають один одному свої ресурси, має назву віртуальна організація (ВО). Наприклад, віртуальною організацією може бути сукупність всіх, що беруть участь в якій-небудь науковій колаборації [фр. collaboration –співробітництво]. Віртуальні організації можуть розрізнятися за складом, масштабом, часом існування, родом діяльності, цілями, відносинам між учасниками (довірчі, не довірчі) і т.д. Склад віртуальних організацій може динамічно мінятися.

Є два основних критерії, що виділяють Грід-системи серед інших систем, які забезпечують доступ до ресурсів, що розділяються:

1. Грід-система координує розрізнені ресурси. Ресурси не мають загального центру управління, а Грід-система займається координацією їх використання, наприклад балансуванням навантаження. Тому проста система управління ресурсами кластера не є системою Грід, оскільки здійснює централізоване керування всіма вузлами даного кластера, маючи до них повний доступ. Грід-системи мають лише обмежений доступ до ресурсів, залежних від політики того адміністративного домену (організації-власника), в якому цей ресурс знаходиться.

2. Грід-система будується на базі стандартних і відкритих протоколів, сервісів та інтерфейсів. Не маючи стандартних протоколів, неможливо легко і швидко підключати нові ресурси до Грід-системи, розробляти новий вигляд сервісів і т.д.

Додамо ще декілька властивостей, якими звичайно володіють Грід-системи:

· гарантії якості обслуговування;

· гнучка і могутня підсистема безпеки: стійкість до атак зловмисників, забезпечення конфіденційності;

· гнучкість, тобто можливість забезпечення доступу, що розділяється, потенційно до будь-яких видів ресурсів;

· масштабованість: працездатність Грід-системи при значному збільшенні або зменшенні її складу;

· можливість контролю над ресурсами: застосування локальних і глобальних політик і квот;

· можливість одночасної, скоординованої роботи з декількома ресурсами.

Хоча сама технологія Грід не прив'язана до певних ресурсів, найчастіше реалізація Грід-систем забезпечують роботу з наступними типами ресурсів:

· обчислювальні ресурси – окремі комп'ютери, кластери;

· ресурси зберігання даних – диски і дискові масиви, стрічки, системи масового зберігання даних;

· мережеві ресурси;

· програмне забезпечення – яке-небудь спеціалізоване ПЗ.

Відзначимо різницю між технологією Грід і реалізаціями Грід-систем. Технологія Грід включає лише найбільш загальні та універсальні аспекти, однакові для будь-якої системи (архітектура, протоколи, інтерфейси, сервіси). Використовуючи цю технологію і наповнюючи її конкретним змістом, можна реалізувати ту або іншу Грід-систему, призначену для вирішення того або іншого класу прикладних задач.

Не варто змішувати технологію Грід з технологією паралельних обчислень. В рамках конкретної Грід-системи, звичайно, можливо організувати паралельні обчислення з використанням існуючих технологій (PVM, MPI), оскільки Грід-систему можна розглядати як якийсь мета-комп'ютер, що має безліч обчислювальних вузлів. Проте технологія Грід не є технологією паралельних обчислень, в її завдання входить лише координація використання ресурсів.

Архітектура Грід. Архітектура Грід визначає системні компоненти, цілі і функції цих компонентів і відображає способи їх взаємодії. Архітектура Грід є архітектурою взаємодіючих протоколів, сервісів і інтерфейсів, що визначають базові механізми, за допомогою яких користувачі встановлюють з'єднання з Грід-системою, спільно використовують обчислювальні ресурси для вирішення різного роду завдань. Архітектура протоколів Грід розділена на рівні (рис. 2.25), компоненти кожного з яких можуть використовувати можливості компонентів будь-якого з розташованих нижче рівнів. В цілому ця архітектура задає вимоги для основних компонентів технології (протоколів, сервісів, прикладних інтерфейсів і засобів розробки ПЗ), не надаючи строгий набір специфікацій, залишаючи можливість їх розвитку в рамках прийнятої концепції.

Рис. 2.25. Рівні архітектури протоколів Грід та їх відповідність рівням архітектури протоколів Інтернет

Базовий рівень (Fabric Layer) описує служби, безпосередньо працюючи з ресурсами. Ресурс є одним з основних понять архітектури Грід. Ресурси можуть бути вельми різноманітними, проте, як вже відмічалося, можна виділити декілька основних типів (рис. 2.26):

· обчислювальні ресурси;

· ресурси зберігання даних;

· інформаційні ресурси, каталоги;

· мережеві ресурси.

Обчислювальні ресурси надають користувачу Грід-системи процесорні потужності. Обчислювальними ресурсами можуть бути як кластери, так і окремі робочі станції. При всій різноманітності архітектури будь-яка обчислювальна система може розглядатися як потенційний обчислювальний ресурс Грід-системи. Необхідною умовою для цього є наявність спеціального ПЗ, так званого “проміжного рівня” (middleware), що реалізує стандартний зовнішній інтерфейс з ресурсом і що дозволяє зробити ресурс доступним для Грід-системи. Основною характеристикою обчислювального ресурсу є продуктивність.

Ресурси пам'яті є простором для зберігання даних. Для доступу до ресурсів пам'яті також використовується ПЗ проміжного рівня, що реалізує уніфікований інтерфейс управління і передачі даних. Як і у обчислювальних ресурсів, фізична архітектура ресурсу пам'яті не принципова для Грід-системи, будь то жорсткий диск на робочій станції або система масового зберігання даних на сотні терабайт. Основною характеристикою ресурсу пам'яті є його обсяг.

Інформаційні ресурси і каталоги є особливим видом ресурсів пам'яті. Вони служать для зберігання і надання метаданих й інформації про інші ресурси Грід-системи. Інформаційні ресурси дозволяють структуровано зберігати величезний обсяг інформації про поточний стан Грід-системи і ефективно виконувати завдання пошуку.

Мережевий ресурс є сполучною ланкою між розподіленими ресурсами Грід-системи. Основною характеристикою мережевого ресурсу є швидкість передачі даних. Географічно розподілені системи на основі даної технології здатні об'єднувати тисячі ресурсів різного типа, незалежно від їх географічного положення.

Рівень зв'язку. Рівень зв'язку (Connectivity Layer) визначає комунікаційні протоколи і протоколи аутентифікації.

Комунікаційні протоколи забезпечують обмін даними між компонентами базового рівня.

Протоколи аутентифікації, грунтуючись на комунікаційних протоколах, надають криптографічні механізми для ідентифікації й перевірки достовірності користувачів і ресурсів.

Протоколи рівня зв'язку повинні забезпечувати надійне транспортування і маршрутизацію повідомлень, а також привласнення імен об'єктам мережі. Не зважаючи на існуючі альтернативи, зараз протоколи рівня зв'язку в Грід-системах припускають використання тільки стека протоколів TCP/IP, зокрема: на мережевому рівні – IP і ICMP, транспортному рівні – TCP, UDP; прикладному рівні – HTTP, FTP, DNS, RSVP. Враховуючи бурхливий розвиток мережевих технологій, в майбутньому рівень зв'язку, можливо, залежатиме і від інших протоколів.

Для забезпечення надійного транспортування повідомлень в Грід-системі повинні використовуватися рішення, що передбачають гнучкий підхід до безпеки комунікацій (можливість контролю над рівнем захисту, обмеження делегування прав, підтримка надійних транспортних протоколів). В теперішній час ці рішення грунтуються як на існуючих стандартах безпеки, спочатку розроблених Інтернет (SSL, TLS), так і на нових розробках.

Ресурсний рівень. Ресурсний рівень (Resource Layer) побудований над протоколами комунікації й аутентифікації рівня зв'язку архітектури Грід. Ресурсний рівень реалізує протоколи, що забезпечують виконання наступних функцій:

· узгодження політик безпеки використання ресурсу;

· процедура ініціації ресурсу;

· моніторинг стану ресурсу;

· контроль над ресурсом;

· облік використання ресурсу.

Протоколи цього рівня спираються на функції базового рівня для доступу і контролю над локальними ресурсами. На ресурсному рівні протоколи взаємодіють з ресурсами, використовуючи уніфікований інтерфейс і не розрізняючи архітектурні особливості конкретного ресурсу.

Розрізняють два основних класи протоколів ресурсного рівня:

1. інформаційні протоколи, які одержують інформацію про структуру і стан ресурсу, наприклад про його конфігурацію, поточне завантаження, політику використання;

2. протоколи управління, використовувані для узгодження доступу до ресурсів, що розділяються, визначаючи вимоги і допустимі дії відносно до ресурсу (наприклад, підтримка резервування, можливість створення процесів, доступ до даних). Протоколи управління повинні перевіряти відповідність запрошуваних дій політиці розділення ресурсу, включаючи облік і можливу оплату. Вони можуть підтримувати функції моніторингу статусу і управління операціями.

Список вимог до функціональності протоколів ресурсного рівня близький до списку для базового рівня архітектури Грід. Додалася лише вимога єдиної семантики для різних операцій з підтримкою системи сповіщення про помилки.

Колективний рівень. Колективний рівень (Collective Layer) відповідає за глобальну інтеграцію різних наборів ресурсів, на відміну від ресурсного рівня, сфокусованого на роботі з окремо взятими ресурсами. У колективному рівні розрізняють загальні і специфічні (для додатків) протоколи. До загальних протоколів відносяться, в першу чергу, протоколи виявлення і виділення ресурсів, системи моніторингу і авторизації співтовариств. Специфічні протоколи створюються для різних додатків Грід (наприклад, протокол архівації розподілених даних або протоколи управління завданнями збереження стану і т.п.).

Компоненти колективного рівня пропонують величезну різноманітність методів спільного використання ресурсів. Нижче приведені функції й сервіси, реалізовані в протоколах даного рівня:

· сервіси каталогів дозволяють віртуальним організаціям виявляти вільні ресурси, виконувати запити по іменах і атрибутах ресурсів, таким як тип і завантаження;

· сервіси спільного виділення, планування і розподілу ресурсів забезпечують виділення одного або більш ресурсів для певної мети, а також планування виконуваних на ресурсах завдань;

· сервіси моніторингу і діагностики відстежують аварії, атаки і перевантаження;

· сервіси дублювання (реплікації) даних координують використання ресурсів пам'яті в рамках віртуальних організацій, забезпечуючи підвищення швидкості доступу до даних відповідно до вибраних метрик, такими як час відповіді, надійність, вартість і т.п.;

· сервіси управління робочим завантаженням застосовуються для опису і управління багатокроковими, асинхронними, багатокомпонентними завданнями;

· служби авторизації співтовариств сприяють поліпшенню правил доступу до ресурсів, що розділяються, а також визначають можливості використання ресурсів співтовариства. Подібні служби дозволяють формувати політики доступу на основі інформації про ресурси, протоколи управління ресурсами і протоколи безпеки зв'язуючого рівня;

· служби обліку і оплати забезпечують збір інформації про використання ресурсів для контролю звернень користувачів;

· сервіси координації підтримують обмін інформацією в потенційно великому співтоваристві користувачів.

Прикладний рівень. Прикладний рівень (Application Layer) описує призначені для користувача додатки, що працюють в середовищі віртуальної організації. Додатки функціонують, використовуючи сервіси, визначені на рівнях що пролягають нижче. На кожному з рівнів є певні протоколи, що забезпечують доступ до необхідних служб, а також прикладні програмні інтерфейси (Application Programming Interface – API), відповідні даним протоколам.

Для полегшення роботи з прикладними програмними інтерфейсами користувачам надаються набори інструментальних засобів для розробки ПЗ (Software Development Kit – SDK). Набори інструментальних засобів високого рівня можуть забезпечувати функціональність з одночасним використанням декількох протоколів, а також комбінувати операції протоколів з додатковими викликами прикладних програмних інтерфейсів нижнього рівня.

Варто звернути увагу, що додатки на практиці можуть викликатися через достатньо складні оболонки і бібліотеки. Ці оболонки самі можуть визначати протоколи, сервіси і прикладні програмні інтерфейси, проте подібні надбудови не відносяться до фундаментальних протоколів і сервісів, необхідним для побудови Грід-систем.

Розподіл ресурсів в Грід. Ефективний розподіл ресурсів і їх координація є основними завданнями системи Грід, і для їх вирішення використовується планувальник (брокер ресурсів). Користуючись інформацією про стан Грід-системи, планувальника визначає найбільш відповідні ресурси для кожного конкретного завдання і резервує їх для її виконання. Під час виконання завдання може запросити у планувальника додаткові ресурси або звільнити надмірні. Після завершення завдання всі відведені для неї обчислювальні ресурси звільняються, а ресурси пам'яті можуть бути використані для зберігання результатів роботи.

Важливою властивістю систем Грід є те, що користувачу не потрібно знати про фізичне розташування ресурсів, відведених його завданню. Вся робота по управлінню, перерозподілу і оптимізації використання ресурсів лягає на планувальник і виконується непомітно для користувача. Для користувача створюється ілюзія роботи в єдиному інформаційному просторі, що володіє величезними обчислювальними потужностями і обсягом пам'яті.

Грід є найбільш складним інформаційним середовищем, коли-небудь створюваним людиною. Для системи такої складності дуже важлива проблема забезпечення надійного функціонування і відновлення при збоях. Людина не здатна встежити за станом тисяч різних ресурсів, що входять в Грід-систему, і з цієї причини завдання контролю над помилками покладається на систему моніторингу, яка стежить за станом окремих ресурсів. Дані про стан заносяться в інформаційні ресурси, звідки вони можуть бути прочитані планувальником та іншими сервісами, що дозволяє мати достовірну інформацію про стан ресурсів, що постійно оновлюються.

У Грід-системах використовується складна система виявлення і класифікації помилок. Якщо помилка відбулася з вини завдання, то завдання буде зупинене, а відповідна діагностика направлена її власнику (користувачу). Якщо причиною збою послужив ресурс, то планувальник проведе перерозподіл ресурсів для даного завдання і перезапустить її.

Збої ресурсів є не єдиною причиною відмов в Грід-системах. Через величезну кількість завдань і постійно змінну складну конфігурацію системи важливо своєчасно визначати переобтяжені і вільні ресурси, проводячи перерозподіл навантаження між ними. Переобтяжений мережевий ресурс може стати причиною відмови значної кількості інших ресурсів. Планувальник, використовуючи систему моніторингу, постійно стежить за станом ресурсів і автоматично вживає необхідні заходи для запобігання перевантаженням і простою ресурсів.

У розподіленому середовищі, якою є Грід-система, життєво важливою властивістю є відсутність так званої “єдиної точки збою”. Це означає, що відмова будь-якого ресурсу не повинна приводи до збою в роботі всієї системи. Саме тому планувальник, система моніторингу й інші сервіси Грід-системи розподілені й продубльовані. Не зважаючи на всю складність, архітектура Грід розроблялася з метою забезпечення максимальної якості сервісу для користувачів. У Грід-системах використовуються сучасні технології передачі даних, забезпечення безпеки і відмовостійкості.

Інструментальні засоби Грід ( Globus Toolkit). У цьому розділі буде розглянутий набір інструментальних засобів, використовуваних при реалізації проектів Грід і розроблених в рамках проекту Глобус (Globus Project). Ці інструментальні засоби утворюють набір програмних засобів Globus Toolkit і дозволяють побудувати повнофункціональну Грід-систему. Засоби Globus Toolkit є сукупністю програмних компонентів, що реалізують необхідні частини архітектури.

Globus Toolkit складається з наступних основних компонентів:

· GRAM (Globus Resource Allocation Manager) відповідальний за створення процесів. Цей компонент Globus Toolkit встановлюється на обчислювальному вузлі Грід-системи (вузлом може бути як робоча станція, так і обчислювальний кластер). Призначені для користувача додатки формують запити до GRAM спеціальною мовою RSL (Resource Specification Language);

· MDS (Monitoring and Discovery Service) забезпечує способи представлення інформації про Грід-систему. Ця інформація може бути найрізноманітнішою і містити, наприклад, дані про конфігурацію або стан як всієї системи, так і окремих її ресурсів (тип ресурсу, доступний дисковий простір, кількість процесорів, обсяг пам'яті, продуктивність q ін.). Вся інформація логічно організована у вигляді “дерева”, і доступ до неї здійснюється за стандартним протоколом LDAP (Lightweight Directory Access Protocol);

· GSI (Globus Security Infrastructure) забезпечує захист, що включає шифрування даних, а також аутентифікацію (перевірка достовірності, при якій встановлюється, що користувач або ресурс дійсно є тим, за кого себе видає) і авторизацію (процедура перевірки, при якій встановлюється, що аутентифікований користувач або ресурс дійсно має право доступу, що зажадалися) з використанням цифрових сертифікатів Х.509;

· GASS (Global Access to Secondary Storage) надає можливість зберігання масивів даних в розподіленому оточенні і доступу до цих даних. Визначає різні стратегії розміщення даних;

· Бібліотеки globus _ io і Nexus використовуються як прикладними програмами, так і компонентами Globus Toolkit для мережевої взаємодії вузлів в гетерогенному середовищі.

Далі детальніше розглянуті деякі з цих компонентів. Варто зазначити, що Globus Toolkit не містить брокера ресурсів, залишаючи завдання його реалізації розробникам, що створюють системи Грід на його основі.

Управління ресурсами. Архітектура засобів управління ресурсами (Globus Resource Management Architecture – GRMA) має багаторівневу структуру (рис. 2.27).

Запити призначених для користувача додатків виражаються на RSL і передаються брокеру ресурсів, який відповідає за високорівневу координацію користування ресурсами (балансування завантаження) в певному домені. На основі переданого призначеним для користувача додаткам запиту і політики (права доступу, обмеження використання ресурсів) відповідального адміністративного домена брокер ресурсів ухвалює рішення про те, на яких обчислювальних вузлах виконуватиметься завдання, який відсоток обчислювальної потужності вузла вона може використовувати й ін.

При виборі обчислювального вузла брокер ресурсів повинен визначити, які вузли доступні у теперішній момент, їх завантаження, продуктивність та інші параметри, вказані в RSL-запиті; вибрати найбільш оптимальний варіант (це може опинитися один обчислювальний вузол або декілька); згенерувати новий RSL-запит (ground RSL) і передати його високорівневому менеджеру ресурсів (co-allocator). Цей запит міститиме вже конкретніші дані, такі, як імена конкретних вузлів, необхідна кількість пам'яті й ін. Основні функції високорівневого менеджера ресурсів: колективне виділення ресурсів; додавання/видалення ресурсів до раніше виділених; отримання інформації про стан завдань; передача початкових параметрів завданням.

Рис. 2.27. Архітектура засобів управління ресурсами

Високорівневий менеджер ресурсів проводить декомпозицію запитів ground RSL на безліч простіших RSL-запитів і передає ці запити GRAM. Далі, за відсутності повідомлень про помилки від GRAM, завдання користувача запускається на виконання. У разі, якщо один з GRAM повертає помилку, завдання або знімається з виконання, або спроба запуску проводиться повторно.

Менеджер GRAM надає верхнім рівням універсальний API для управління ресурсами вузла Грід. Сам GRAM взаємодіє з локальними засобами управління ресурсами вузла. Вузлом може бути, наприклад, робоча станція або обчислювальний кластер.

Організація доступу до ресурсів. GRAM – достатньо низькорівневий компонент Globus Toolkit, що є інтерфейсом між високорівневим менеджером ресурсів і локальною системою управління ресурсами вузла. В даний час цей інтерфейс може взаємодіяти з наступними локальними системами управління ресурсами:

· PBS (Portable Batch System) – система управління ресурсами і завантаженням кластерів. Може працювати на великому числі різних платформ: Linux, FreeBSD, NetBSD, Digital Unix Tru64, HP-UX, AIX, IRIX, Solaris. В теперішній час існує вільна і наділена ширшими можливостями реалізація PBS, звана Torque;

· LSF (Load Sharing Facility) – система, аналогічна PBS. Розроблена компанією Platform Computing. Також здатна працювати на безлічі платформ;

· NQE (Network Queuing Environment) – продукт компанії Cray Research, використовуваний найчастіше як менеджер ресурсів на суперкомп'ютерах, кластерах і системах Cray, хоча може працювати і на інших платформах;

· LoadLeveler – продукт компанії IBM, керівник балансом завантаження крупних кластерів. Використовується в основному на кластерах IBM;

· Condor – вільно доступний менеджер ресурсів, розроблений в основному студентами різних університетів Європи і США. Аналогічний вищепереліченим. Працює на різних платформах UNIX і Windows NT;

· Easy-LL – сумісна розробка IBM і Cornell Theory Center, призначена для управління крупним кластером IBM в цьому центрі. По суті є об'єднанням LoadLeveler і продукту EASY лабораторії Argonne National Lab;

· fork – простий стандартний засіб запуску процесів в UNIX.

Структура GRAM представлена на рис. 2.28.

Рис. 2.28. Структура GRAM

Щоб на даному обчислювальному вузлі можна було віддалено запускати на виконання програми, на ньому повинен виконуватися спеціальний процес, названий Gatekeeper. Gatekeeper працює в привілейованому режимі й виконує наступні функції:

· проводить взаємну аутентифікацію з клієнтом;

· аналізує RSL-запит;

· відображає клієнтський запит на обліковий запис деякого локального користувача;

· запускає від імені локального користувача спеціальний процес, званий Job Manager, і передає йому список потрібних ресурсів.

Після того як Gatekeeper виконає свою роботу, Job Manager запускає завдання (процес або декілька процесів) і проводить його подальший моніторинг, повідомляючи клієнта про помилки й інші події. Gatekeeper запускає тільки один Job Manager для кожного користувача, який управляє всіма завданнями даного користувача. Коли завдань більше не залишається, Job Manager завершує роботу.

Інформаційний сервіс. Всі перелічені компоненти, включаючи призначені для користувача додатки, можуть використовувати інформаційний сервіс (Information Service) для отримання всієї необхідної інформації про стан Грід-системи. У Globus Toolkit роль інформаційного сервісу грає MDS. Цей компонент відповідає за збір і надання конфігураційної інформації, інформації про стан Грід-системи та її підсистем, а також забезпечує універсальний інтерфейс отримання необхідної інформації. MDS має децентралізовану, легкомасштабовану структуру і працює як із статичними, так і з динамічно змінними даними, необхідними призначеним для користувача додаткам і різним сервісам Грід-системи.

MDS складається з трьох основних компонентів:

1) IP (Information Provider) – є джерелом інформації про конкретний ресурс або частину ресурсу;

2) GRIS (Grid Resource Information Service) – надає інформацію про вузол Грід-системи, який може бути як обчислювальним вузлом, так і яким-небудь іншим ресурсом. GRIS опитує індивідуальні IP і об'єднує одержану від них інформацію в рамках єдиної інформаційної схеми;

3) GIIS (Grid Index Information Service) – об'єднує інформацію з різних GRIS або інших GIIS. Для зменшення часу реакції на запит і зниження мережевого трафіку GIIS кеширує дані. GIIS верхнього рівня містить всю інформація про стан даної системи Грід.

Безпека. Інфраструктура безпеки Грід (Grid Security Infrastructure – GSI) забезпечує безпечну роботу в незахищених мережах загального доступу (Інтернет), надаючи такі сервіси, як аутентифікація, конфіденційність передачі інформації і єдиний вхід в Грід-систему. Під єдиним входом мається на увазі, що користувачу потрібно лише один раз пройти процедуру аутентифікації, а далі система сама потурбується про те, щоб аутентифікувати його на всіх ресурсах, якими він збирається скористатися. GSI заснована на надійній і широко використовуваній інфраструктурі криптографії з відкритим ключем (Public Key Infrastructure – PKI).

Як ідентифікатори користувачів і ресурсів в GSI використовуються цифрові сертифікати X.509. В роботі з сертифікатами X.509 і в процедурі видачі/отримання сертифікатів задіяні три сторони:

1) центр Сертифікації (Certificate Authority – CA) – спеціальна організація, що володіє повноваженнями видавати (підписувати) цифрові сертифікати. Різні CA звичайно взаємонезалежні. Відносини між CA і його клієнтами регулюються спеціальним документом;

2) передплатник – людина або ресурс, який користується сертифікаційними послугами CA. CA включає в сертифікат дані, надані передплатником (ім'я, організація й ін.) і ставить на ньому свій цифровий підпис;

3) користувач – людина або ресурс, що покладається на інформацію з сертифіката при отриманні його від передплатника. Користувачі можуть приймати або відкидати сертифікати, підписані якої-небудь CA.

У Globus Toolkit використовуються два типу сертифікатів X.509:

1) Сертифікат користувача (User Certificate) – цей сертифікат повинен мати кожен користувач, що працює з Грід-системою. Сертифікат користувача містить інформацію про ім'я користувача; організацію, до якої він належить; і центр сертифікації, що видав даний сертифікат;

2) Сертифікат вузла (Host Certificate) – цей сертифікат повинен мати кожен вузол (ресурс) Грід-системи. Сертифікат вузла аналогічний сертифікату користувача, але в ньому замість імені користувача указується доменне ім'я конкретного обчислювального вузла.

Подальший розвиток інструментальних засобів. Globus Toolkit набув широкого поширення, оскільки був першим повноцінним набором інструментальних засобів для розробок у сфері технології Грід і став стандартом де-факто. Проте навіть найбільш поширена друга версія Globus Toolkit не була позбавлена недоліків, основним з яких була відсутність уніфікованих засобів розробки додатків, здатних взаємодіяти між собою і надавати один одному різні послуги (сервіси).

Для вирішення цієї проблеми на Global Grid Forum (GGF) була запропонована відкрита архітектура сервісів Грід (Open Grid Services Architecture – OGSA). Стандарт OGSA визначає основний набір послуг, які надають Грід-системи, і описує їх архітектуру. У термінології OGSA ці послуги називають “можливостями”. Прикладами таких можливостей є запуск додатків, доступ до даних й ін. У OGSA Грід-система розглядається як набір незалежних одна від одної послуг, які можуть використовуватися незалежно або спільно для побудови необхідної інфраструктури.

Стандарт OGSA пропонує конструювати Грід-системи за принципом сервіс-орієнтованої архітектури. Рівні архітектури OGSA представлені на рис. 2.29:

Рис. 2.29. Трьохрівневе представлення Грід в OGSA

· нижній рівень представлений ресурсами, які можуть входити в Грід-систему;

· середній рівень є послугами. На цьому рівні здійснюється узагальнення (віртуалізація) ресурсів. Користувачу надаються високорівневі послуги з певними інтерфейсами. Строга специфікація цього рівня і є основним завданням OGSA;

· верхній рівень представляє додатки, що використовують послуги для виконання тих або інших завдань. Цей рівень в OGSA не специфікований.

OGSA спирається на сімейство технологій веб-сервісів (Web-services), які з'явилися відносно недавно і зараз дуже бурхливо розвиваються. Архітектура OGSA зосереджується на визначенні послуг у вигляді набору взаємодіючих сервісів.

Програмне забезпечення LCG. Для побудови повністю функціональної Грід-системи необхідне ПЗ проміжного рівня, побудоване на базі існуючих інструментальних засобів і надаюче високорівневі сервіси завданням і користувачам.

Прикладом такого ПЗ може стати ПЗ LCG (LHC Computing Grid), розроблене в Європейському центрі ядерних досліджень (CERN). Спочатку метою проекту LCG була розробка повністю функціонуючої Грід-системи на базі Globus Toolkit для обробки даних у фізиці високих енергій. З часом сфера застосування LCG розширилася, і в даний час це – один з найпоширеніших пакетів, що швидко розвиваються.

Пакет LCG складається з декількох частин, званих “елементами”. Кожен елемент є самостійним набором програм (одні й ті ж програми можуть входити в декілька елементів), що реалізують деякий сервіс, і призначений для установки на комп'ютер під управлінням ОС Scientific Linux.

Основні елементи LCG та їх призначення:

· CE (Computing Element) – набір програм, призначений для установки на вузол обчислювального кластера, що управляє. Даний елемент надає універсальний інтерфейс до системи управління ресурсами кластера і дозволяє запускати на кластері обчислювальні завдання;

· SE (Storage Element) – набір програм, призначений для установки на вузол зберігання даних. Даний елемент надає універсальний інтерфейс до системи зберігання даних і дозволяє управляти даними (файлами) в Грід-системі;

· WN (Worker Node) – набір програм, призначений для установки на кожен обчислювальний вузол кластера. Даний елемент надає стандартні функції й бібліотеки LCG завданням, що виконуються на даному обчислювальному вузлі;

· UI (User Interface) – набір програм, що реалізують призначений для користувача інтерфейс Грід-системи (інтерфейс командного рядка). У цей елемент входять стандартні команди управління завданнями і даними;

· RB (Resource Broker) – набір програм, що реалізують систему управління завантаженням (брокер ресурсів). Це найбільш складний (і об'ємний) елемент LCG, що надає всі необхідні функції для скоординованого автоматичного управління завданнями в Грід-системі;

· PX (Proxy) – набір програм, що реалізують сервіс автоматичного оновлення сертифікатів (myproxy);

· LFC (Local File Catalog) – набір програм, що реалізують файловий каталог Грід-системи. Файловий каталог необхідний для зберігання даних про копії (репліках) файлів, а також для пошуку ресурсів, що містять необхідні дані;

· BDII (Infornation Index) – набір програм, що реалізують інформаційний індекс Грід-системи. Інформаційний індекс містить всю інформацію про поточний стан ресурсів, що одержується з інформаційних сервісів, і необхідний для пошуку ресурсів;

· MON (Monitor) – набір програм для моніторингу обчислювального кластера. Даний елемент збирає і зберігає в БД інформацію про стан і використання ресурсів кластера;

· VOMS (VO Management Service) – набір програм, що реалізують каталог віртуальних організацій. Даний каталог необхідний для управління доступом користувачів до ресурсів Грід-системи на основі членства у віртуальних організаціях.

На один комп'ютер можлива установка відразу декількох елементів LCG, якщо це дозволяють його потужності (обсяг пам'яті й продуктивність). Мінімальна кількість вузлів, необхідних для розгортання повного набору ПЗ LCG, дорівнює трьом. Варто помітити, що установка всіх сервісів на один вузол хоч і можлива технічно, але не рекомендується. Брокер ресурсів, з міркувань безпеки, необхідно розташовувати на окремому вузлі. Обчислювальні вузли також варто виділити окремо, оскільки навантаження, що створюється на них працюючими завданнями, приведе до дефіциту ресурсів для решти сервісів. Вся решта елементів може бути встановлена спільно.

В основу LCG покладено розробки, виконані в рамках Європейського проекту EDG (European DataGrid) кілька років тому. Зараз проект LCG активно розвивається і стоїть на порозі переходу до нової, більш функціональної інфраструктури ПЗ, що носить назву gLite. Даний перехід має на увазі поступову заміну застарілих програм новими із збереженням сумісності.

Важливо відзначити, що все ПЗ, що розробляється в рамках проекту LCG, може вільно використовуватися. На основі цього ПЗ можливо створення національних і регіональних Грід-систем для ефективного розподілу локальних ресурсів. LCG є технологічною базою для інфраструктури, реалізованої в рамках проекту EGEE.

Користувач в Грід. Система входу користувача в Грід-систему достатньо складна. Це визначено багатьма чинниками, але головною проблемою є рішення питань безпеки (загрози вторгнень і атак зловмисників). Аутентифікація і авторизація користувачів є шляхами для вирішення цієї проблеми. Аутентифікаційні рішення для середовищ віртуальних організацій повинні володіти наступними властивостями:

· єдиний вхід. Користувач повинен реєструватися і аутентифікуватися тільки один раз на початку сеансу роботи, дістаючи доступ до всіх дозволених ресурсів базового рівня архітектури Грід;

· делегування прав. Користувач повинен мати можливість запуску програм від свого імені. Таким чином, програми дістають доступ до всіх ресурсів, на яких авторизований користувач. Призначені для користувача програми можуть, у разі потреби, делегувати частину своїх прав іншим програмам;

· довірче відношення до користувача. Якщо користувач виконує одночасно роботу з ресурсами декількох постачальників, то при конфігурації захищеного середовища користувача система безпеки не повинна вимагати взаємодії постачальників ресурсів один з одним.

Для входу в Грід-систему користувач повинен:

1) бути легальним користувачем обчислювальних ресурсів в своїй організації;

2) мати персональний цифровий сертифікат, підписаний центром сертифікації;

3) бути зареєстрованим хоч би в одній віртуальній організації.

Отримання цифрового сертифіката є важливим і необхідним кроком для отримання доступу до Грід-системи. Цифровий сертифікат аналогічний паспорту і однозначно ідентифікує користувача. Для отримання цифрового сертифіката користувачу необхідно звернутися в Центр сертифікації.

Докладну інструкцію по отриманню цифрового сертифіката можна одержати безпосередньо в Центрі сертифікації, а тут вкажемо лише основні кроки при виконанні цієї інструкції:

· створення на комп'ютері користувача (на призначеному для користувача інтерфейсі) двох файлів – закритого ключа і запиту на сертифікат;

· відсилання запиту на сертифікат в Центр сертифікації;

· отримання з Центру сертифікації підписаного відкритого ключа (потрібна перевірка особи користувача).

Закритий ключ не варто посилати в Центр сертифікації, а необхідно зберігати в захищеному місці. Не зважаючи на те, що закритий ключ додатково захищений паролем, про всі випадки втрати або можливого несанкціонованого доступу до закритого ключа необхідно негайно повідомляти в Центр сертифікації.

Після отримання цифрового сертифіката користувачу необхідно зареєструватися у віртуальній організації. Залежно від сфери діяльності користувача це може бути міжнародна, національна або локальна віртуальна організація. Правила реєстрації у віртуальній організації необхідно дізнатися у відповідному Центрі реєстрації (не плутати з Центром сертифікації). Можливо реєстрація одного і того ж користувача (сертифіката) в декількох віртуальних організаціях.

Доступ до Грід-системи може бути проведений з будь-якої точки (обчислювальної системи, термінала), в якій встановлений призначений для користувача інтерфейс системи Грід.

Веб-інтерфейси Грід. Прикладом веб-інтерфейсу до Грід-системи може служити GENIUS, розроблений в Італійському інституті INFN (grid-demo.ct.infn.it). Основними цілями при створенні веб-інтерфейсу GENIUS:

· ознайомлення користувача з технологією Грід;

· надання доступу до сервісів Грід-системи через Інтернет;

· простий і зручний графічний інтерфейс;

· ефективний моніторинг поточного стану Грід-системи.

Веб-інтерфейс GENIUS дозволяє виконувати всі основні операції по управлінню завданнями і даними в Грід-системі, причому всі ці дії користувач може проводити прямо з браузера.

В теперішній час GENIUS активно використовується в рамках проекту GILDA (Grid Infn Laboratory for Dissemination Activities), що є віртуальною лабораторією для демонстрації можливостей технології Грід. Проект GILDA складається з декількох частин:

· GILDA Testbed – набір сайтів зі встановленим ПЗ LCG;

· Grid Demonatrator – веб-інтерфейс GENIUS, що дозволяє працювати з певним набором додатків;

· GILDA CA – центр сертифікації, що видає 14-денні сертифікати для роботи з GILDA;

· GILDA VO – віртуальна організація, об'єднуюча всіх користувачів GILDA;

· Grid Tutor – веб-інтерфейс GENIUS, використовуваний для демонстрації можливостей технології Грід;

· Monitoring System – система моніторингу для GILDA Testbed.

Призначені для користувача веб-інтерфейси до Грід-систем є вельми перспективним напрямом, оскільки можуть бути легко адаптовані під конкретне завдання або наочну сферу і не вимагають навиків роботи з командним рядком unix. Авторизація користувачів на таких інтерфейсах проводиться також за допомогою завантажених в браузер цифрових сертифікатів.

Критерій застосовності ЕС

Застосовні	Непридатні
Не можуть бути побудовані строгі алгоритми або процедури, але існують евристичні методи рішення	Є ефективні алгоритмічні методи
Є експерти, здатні вирішити завдання	Відсутні експерти або їх число недостатньо
По своєму характеру завдання відносяться до сфери діагностики, інтерпретації або прогнозування	Завдання носять обчислювальний характер
Доступні дані “зашумлені”	Відомі точні факти і строгі процедури
Завдання вирішуються методом формальних міркувань	Завдання вирішуються процедурними методами, за допомогою аналогії або інтуїтивно
Знання статичні (незмінні).	Знання динамічні (міняються з часом)

В цілому ЕС не рекомендується застосовувати для вирішення наступних типів завдань:

· математичних, вирішуваних звичайним шляхом формальних перетворень і процедурного аналізу;

· завдань розпізнавання, оскільки в загальному випадку вони вирішуються чисельними методами;

· завдань, знання про методи рішення яких відсутні (неможливо побудувати БЗ).

Сфери застосування експертних систем. Сфери застосування систем, заснованих на знаннях, можуть бути згруповані в декілька основних класів: медична діагностика, контроль і управління, діагностика несправностей в механічних і електричних пристроях, навчання.

а) Медична діагностика

Діагностичні системи застосовуються для встановлення зв'язку між порушеннями функціонування організму й їх можливими причинами. Найбільш відома діагностична система MYCIN, призначена для діагностики і спостереження за станом хворого при менінгіті й бактерійних інфекціях. Її перша версія була розроблена в Стенфордськом університеті усередині 70-х років минулого століття. В теперішній час ця система ставить діагноз на рівні лікаря-фахівця. Вона має розширену БЗ, дякуючи чому може застосовуватися і в інших галузях медицини.

б) Прогнозування

Прогнозуючі системи передбачають можливі результати або події на основі даних про поточний стан об'єкта. Програмна система “Завоювання Уолл-стріта” може проаналізувати кон'юнктуру ринку і з допомогою статистичних методів алгоритмів розробити план капіталовкладень на перспективу. Вона не належить до систем, заснованих на знаннях, оскільки використовує процедури і алгоритми традиційного програмування. Хоча поки що відсутні ЕС, здатні за рахунок своєї інформації про кон'юнктуру ринку допомогти збільшити капітал, що прогнозують системи вже сьогодні можуть передбачати погоду, врожайність і потік пасажирів. Навіть на ПК, встановивши просту систему, засновану на знаннях, можна одержати місцевий прогноз погоди.

в) Планування та організація виробництва

Планують системи, призначені для досягнення конкретної мети при рішенні задач з великим числом змінних. Так, Дамаська фірма Informat вперше в торговій практиці надає у розпорядження покупців 13 робочих станцій, встановлених в холі свого офісу, на яких проводяться безкоштовні 15-хвилинні консультації з метою допомогти покупцям вибрати комп'ютер, що найбільшою мірою відповідає їх потребам і бюджету. Крім того, компанія Boeing застосовує ЕС для проектування космічних станцій, а також для виявлення причин відмов літакових двигунів і ремонту вертольотів. Експертна система XCON, створена фірмою DEC, служить для визначення або зміни конфігурації комп'ютерних систем типу VAX і відповідно до вимог покупця. Фірма DEC розробляє могутнішу систему XSEL, що включає БЗ системи XCON, з метою надання допомоги покупцям при виборі обчислювальних систем з потрібною конфігурацією. На відміну від XCON, система XSEL є інтерактивною.

Система підтримки прийняття рішень “Super Finance 2“ (“SF 2“) являє собою програмну оболонку загального користування, призначену для проведення консультацій користувача в спроектованій БЗ (рис. 2.31). СППР “SF2“ базується на правилах та побудована у вигляді продукційної системи, модель якої генерує граф пошуку. Оболонка системи запрограмована мовою Visual Prolog та дозволяє реалізувати цільовий пошук згідно з метою.

Рис. 2.31. Вигляд інтерфейсу користувача системи “SF2”

Фахівець з питань знань (експерт) спочатку забезпечує систему інформацією в вигляді БЗ залежно від сфери використання системи. Запис діалогу під час створення БЗ відтворюється у “вікнах” та записується у файл для подальшого користування та консультацій. Створена фахова консультація підключається через “меню“ консультацій (рис. 2.32).

Рис. 2.32. Меню вибору консультаційної бази системи

Розроблена система перевірялась для аналізування та загального оцінення деяких показників фінансового стану модельованого підприємства, виявлення причин погіршення можливостей використання ресурсів, прискорення обігу засобів і зміцнення фінансового стану.

Основним джерелом даних для БЗ системи є звітний бухгалтерський баланс та додатки, звіт про фінансові результати, рух статутного капіталу інші звітні форми, які деталізують зміст балансу та дозволяють досліджувати чинники впливу на фінансові показники.

Функціональна структура ЕС “SF 2” приведена на рис. 2.33.

Рис. 2.33. Функціональна структура експертної системи “SF 2”

Діалог – це форма консультації з ЕС “SF 2”. На деякі питання користувач відповідає з допомогою вибору з “меню”; в інших випадках користувачу необхідно надрукувати відповіді. Консультація завершується висновком, виданим системою, та поясненням послідовності висновку, що привела до цього твердження. Система розпізнає непорозуміння, виникле або через помилку, або на принциповій основі, та реагує відповідним чином на цю ситуацію. Наприклад, при введенні перевіряється тип змінних. Система інтерфейсу використовує мовний інтерпретатор системи, діалоговий процесор та механізм висновку. Механізм висновку повертає знання, виведені з БЗ, та через інтерфейс передає їх назад користувачу в зручній формі. Інтерфейс з користувачем та оболонка системи можуть розглядатися як “додаток” до БЗ.

Діалоговий процесор створює в системі питання для користувача та забезпечує обґрунтовані висновки системи, відповіді та необхідні конкретні пояснення результатів консультацій (рис. 2.34).

Рис. 2.34. Приклад поради діалогового процесора системи “SF 2”

Ядром ЕС є БЗ, яка містить знання з аналізування та загального оцінення деяких показників фінансового стану підприємства. База знань – центральна частина ЕС, що складається з фактичних знань. Вона містить модель знань – правила, що описують відносини або явища, методи і знання для вирішення задач з ПрО системи.

Механізм висновку містить принципи і правила роботи та визначає, як використовувати БЗ так, щоб можна було одержувати висновки, що адекватно узгоджуються. На протязі консультації, механізм висновку будує граф вирішення задачі та визначає, які правила потрібно викликати, і організує доступ до БЗ. Результат пошуку та прийняте рішення передається користувачу.

База знань містить факти, або твердження та правила. Факти є короткостроковою інформацією в тому сенсі, що вони можуть змінюватися, наприклад, після консультації. Правилами є більш довготривала інформація про те, як породжувати нові факти або гіпотези враховуючи відомі факти.

Метод представлення знань, використовуваний в системі, об'єднує декларативне та процедурне представлення знань. Декларативне представлення знань описує власний логічний висновок. У зв'язку з цим декларативна частина знань володіє достатньою гнучкістю, дозволяє описувати логічну частину знань сфери практичного використання системи. Процедурна частина знань дозволяє задати набір дій, які необхідно зробити в тій або іншій ситуації. При цьому висновки про відповідність деякої ситуації робляться за допомогою декларативної частини знань. Процедурна частина знань дозволяє повністю і зручно описати набір дій, які може надати експерт.

База знань консультацій є змінною частиною системи та може поповнюватися і модифікуватися. Спосіб представлення знань – у вигляді конкретних фактів і правил, з яких можуть бути виведені нові, використовуючи “меню” системи. В більш простіших випадках факт виражається значенням параметра атрибута, або простим твердженням, яке може бути істинним або помилковим, наприклад:

parameter koef 'коефіцієнт власного капіталу'

type text

explanation

'завдяки цим пказникам можна передбачити банкрутство наперед'

rules

'на початку року' if vlast < 60,

'на кінець періода' if vlast >=60 and vlast < 100,

question ' Ну як згодні з отриманим результатом ?' ,

'invisible'.

В БД pictures.dba зберігаються рисунки типів: метафайли Windows, залежні точкові малюнки (DDB) і незалежні точкові рисунки (DIB). Система використовує ім'я рисунка як посилання. База даних рисунків підтримує загальні функції БД: додавання, редагування, видалення (рис. 2.35).

Рис. 2.35. “Меню” редагування бази рисунків

Правила в БЗ призначені для представлення евристичних знань, тобто неформальних правил міркування, що виробляються експертом на основі досвіду його діяльності. Дії, що входять до складу правил, можуть містити нові факти. При використанні таких правил ці факти стають відомі системі і стають робочою множиною (рис. 2.36).

Рис. 2.36. Меню редагування параметрів графа бази знань

Якщо система не може вивести деякий факт, істинність або помилковість якого необхідно встановити, система питає про нього користувача. Факти в БЗ записуються у вершині графу у вигляді параметрів за допомогою “меню” (рис. 2.37), а висновки в вигляді правил:

Рис. 2.37. Меню редагування правил графа бази знань

section manevr : ' розрахунок робочого капіталу'

assign m1:=z1/p1

assign m2:=z2/p2

if m1>m2 advice ' На кінець звітного періоду запаси у '& m2& ' разів менше робочого капіталу'

if m1< m2 advice ' На кінець звітного періоду запаси у '& m2& ' разів більше робочого капіталу '

else …

Інтерпретатор системи “SF 2” – це модуль з багаторівневим лінгвістичним процесором, складеним з лексичного аналізатора, блоку визначення слів, чисел та констант, блоку трансляції у внутрішню формальну мову, використовує системні бібліотеки Visual Prolog та призначений для моделювання діалогу користувача і системи.

Модель БЗ в “SF2” має структуру в вигляді “дерева-графа”. Система автоматично рисує граф БЗ та дозволяє підключати, за потреби, модулі зовнішніх баз різних форматів у внутрішній формат програми, що робить систему гнучкою та незалежною від формата зовнішніх даних. Структура БЗ задається у вигляді направленого графу (рис. 2.38), вузли якого – модулі обробки даних, а ребра задають напрям і послідовність пошуку відповіді.

Рис. 2.38. Приклад структурного “дерева” бази знань

Процедури пошуку рішень залежать від особливостей предметної області та вимог, які пред'являють користувачі до цих рішень. Фахова предметна експертна область характеризується розміром, мінливістю її в часі та просторі, повнотою моделі, визначеністю даних про поставлену задачу, кількістю необхідних рішень (одне застосовне, або всі допустимі), обмеженнями на результат та параметри, засобом його отримання.

Метод пошуку рішення в просторі станів визначаємо трійкою , де – безліч початкових станів системи (запит); – безліч операторів, що відображають одні стани в інші; – безліч кінцевих цільових станів системи.

Процес консультації в системі – це визначення такої послідовності операторів , які дозволять перетворити початковий стан системи в кінцевий. Процес консультації представляється у вигляді графу , де розуміють пару , де – безліч вершин графу, кожна з яких пов'язана з певними станами. — безліч пар належить множині . В системі використано орієнтований граф, тобто для кожної пари є порядок, а пара – є дуга. У цьому разі пошук рішення задачі є шляхом на орієнтованому графі, де пари належать , який приводить з початкового стану до цільового. В системі дугам графу можна надати евристичні вагові характеристики, які відображають їх пріоритетність в процесі обробки запиту. В цьому разі вибір шляху зводиться до мінімізації (максимізації) суми вагових характеристик дуг, котрі створюють цей шлях: .

Таким чином, граф задає простір можливих станів ПрО. Побудова простору консультацій здійснюється з допомогою “розкриттям вершин”: береться деяка вершина з безлічі початкових станів і до неї застосовуються всі можливі оператори, що породжують дочірні вершини. Цей процес продовжується до тих пір, поки не буде знайдена вершина, відповідна одному із цільових станів.

Пошук може здійснюватися або в глибину, або в горизонталі залежно від моделі знань. Процес розбиття задач на підзадачі представляється у вигляді орієнтованого графа – “і/або” – граф. Кожна вершина “і/або” – графа є задачею (підзадачею) і може бути кон'юнктивною (“і” – вершиною) або диз'юнктивною (“або” – вершиною). Кон'юнктивні вершини разом з своїми дочірніми вершинами зводять рішення задачі до рішення всіх її підзадач, відповідних дочірнім вершинам.

В наступних версіях системи з метою скорочення часу пошуку рішень, передбачається використовувати евристичні методи пошуку та введення в БЗ системних правил. Системні правила можуть включати ступінь надійності, що забезпечує можливість евристичного пошуку рішення. Для цього в кожній вершині передбачається використання евристичної інформації, яка перед розкриттям вершини дозволяє визначити ступінь її перспективності для реалізації певного запиту. Оцінка перспективності визначається на основі обраної функції оцінювання, в якій задаються різного роду семантичні обмеження.

Редактор БЗ, необхідний для підтримки БЗ її доповнення, аналізування помилок програми, перевірки коректності синтаксису правил на несуперечність при змінах, автоматизує процеси редагування та придбання знань, що здійснюються користувачем-експертом, та записує базу в файл.

Редактор відображає граф моделі бази на екрані монітора, параметри вершин графу, надає користувачу можливість редагувати програми, пов'язані з вершинами, та їх трансляцію. Трансляція початкової програми здійснюється в проміжний код, оскільки це дозволяє істотно прискорити логічний висновок в цілому.

При створенні вершини графу редактор перевіряє синтаксис змінних, діагностує помилки, зберігає і трасує граф знань. Знання при цьому розділяються на декларативні і процедурні. Для запису декларативних та процедурних знань створення графу застосована спеціалізована внутрішня мова інтерпретатора системи “SF 2”. Семантичні мовні інструкції та функції інтерпретатора “SF 2” приведені в табл. 2.6.

Таблиця 2.6

Теми рефератів

1. WAP-технології.

2. PR-технології.

3. ІР-технології.

4. Характеристика технології оперативного аналітичного оброблення даних OLAP.

5. Тенденції розвитку сховищ даних.

6. Багатовимірна модель даних.

Тести

1. Які з компонент в широкому розумінні включає технологія:

a) Інформаційну;

b) Матеріальну;

c) Соціальну;

d) Психологічну.

2. До еволюційних етапів інформаційних технологій належать :

a) Розвиток науково-технічного прогресу;

b) Поява нових технологічних засобів переробки інформації;

c) Врахування закономірностей соціального середовища.

3. Основні методи класифікації інформації:

a) Ієрархічний і фасетний;

b) Фасетний і паралельний;

c) Ієрархічний і послідовний;

d) Послідовний і паралельний.

4. В ка жіть наступні принципи комп’ютерної технології :

a) Інтерактивний (діалоговий) режим роботи з комп’ютером;

b) Інтегрованість (взаємозв’язок) з іншими інструментарієм і продуктом;

c) Гнучкість процесу як зміни даних, так і постановок задач;

d) Еволюційність процесу зберігання даних.

5. Інформаційні системи управління являють собою:

a) Організаційно-технічні системи;

b) Системи моніторингу;

c) Організацій системи;

d) Організаційно-оперативні системи.

6. Файл – це:

a) Набір взаємопов’язаних даних однієї форми;

b) Пойменована сукупність записів для об’єктів одного типу;

c) Сукупність полів, об’єднаних за змістовим принципом, яка є об’єктом і результатом одного кроку оброблення даних;

d) Сукупність полів, об’єднаних за змістовим принципом, яка призначена для одночасного використання багатьма споживачами.

7. Основні методи кодування – це :

a) Порядковий, серійно-порядковий, послідовний, паралельний;

b) Порядковий, порядково-серійний, фасетний;

c) Паралельний, послідовний, ієрархічний;

d) Порядковий, серійно-порядковий, фасетний.

Література

1. Чубукова О.Ю. Алгоритмізація та програмування процедур обробки економічної інформації : навч. посіб. [для студ. вищ. навч. закл.]/ Чубукова О.Ю., Іванченко Н.О., Кучер С.Л. – К. : КНУТД, 2009. – 138 с.

2. Системи оброблення інформації. Керування процесами оброблення інформації. Терміни та визначення : ДСТУ 2940–94. – [Чинний від 1995 р. ] – К. : Держстандарт України, 1995. – 28 с.

3. Системи оброблення інформації. Основні поняття. Терміни та визначення : ДСТУ 2938–94. – [Чинний від 1995 р.] – К. : Держстандарт України, 1995. – 32 с.

4. Системи оброблення інформації. Розроблення систем. Терміни та визначення : ДСТУ 2941–94. – [Чинний від 1995 р.] – К. : Держстандарт України, 1995. – 20 с.

5. Плескач В.Л. Інформаційні технології та системи / Плескач В.Л., Рогушина Ю.В., Кустова Н.П. – К. : Книга, 2004. – 520 с.

6. Свідоцтво на знак товарів і послуг. Система “Super Finance”. N 14154 від 29.12.1999, № 14154.; Бюл. N8, 2912.99, Держпатент, Україна.

7. Ситник Н.В. Проектування баз і сховищ даних : [навч. посіб.] / Ситник Н.В. – К. : КНЕУ, 2004. – 348 с.

8. Гордієнко І.В. Інформаційні системи в менеджменті : [навч. посіб.] / Гордієнко І.В. – К. : КНЕУ, 2008. – 544 с.

9. Татарчук М.І. Корпоративні інформаційні системи : [навч. посіб.] / Татарчук М.І. – К. : КНЕУ, 2005. – 291 с.

10. Гужва В.М. Інформаційні системи і технології на підприємствах : [навч. посіб.] / Гужва В.М. – К. : КНЕУ, 2001. – 400 с.

11. Ситник В.Ф. Основи інформаційних систем : [навч. посіб.]; 2-ге вид., перероб. і доп. / В.Ф. Ситник, Т.А. Писаревська, Н.В. Єрьоміна, О.С. Краєва ; [за ред. В.Ф. Ситника]. – К. : КНЕУ, 2001. – 420 с.

12. Інформаційні системи і технології в економіці / [Пономаренко В.С., Бутова Р.К., Журавльова І.В. та ін.] ; за ред. В.С. Пономаренка. – К. : Вид. центр “Академія”, 2002. – 544 с.

13. Іванченко Г.Ф. Інформаційна система підтримки прийняття рішень “SUPER FINANCE 2” / Іванченко Г.Ф. // Наук. зб. “Моделювання та інформаційні системи в економіці”, 2007. – №75. – С. 60–69.

14. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. – [2-е изд.]. – СПб. : БХВ-Петербург, 2007. – 384 с.

15. Ситник В.Ф. Інтелектуальний аналіз даних (дейтамайнінг) : [навч. посіб.] / Ситник В.Ф., Краснюк М.Т. – К. : КНЕУ, 2007. – 376 с.

16. Чубукова И.А. Data Mining : [учеб. пособ.] / Чубукова И.А. – М. : Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2005. – 382 с.

РОЗДІЛ 2. Технологічні засоби обробки економічної інформації в сучасних інформаційних системах

12 3 4 5 6 7 8 9 10 Следующая ⇒