Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


МАТЕМАТИЧЕСКИЕ МЕТОДЫ И МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ НАУЧНЫХ ДАННЫХ



Можно выделить следующие общие группы этих задач (см. табл. 6.1).

1. Описание данных - компактное описание имеющихся данных с помощью различных агрегированных (обобщенных) показателей и графиков. К этому классу можно отнести также задачу определения необходимого объема выборки[1] (мини­мального числа исследуемых объектов), необходимого для того, чтобы сделать обоснованные выводы.

В практике научных исследований обычно имеется сово­купность наблюдений (десятки, сотни, а иногда - тысячи результатов измерений индивидуальных характеристик), поэтому возникает задача компактного описания имеющихся данных. Для этого используют методы описательной стати­стики - описания результатов с помощью различных агреги­рованных показателей и графиков. Перечислим некоторые из них.

Для результатов измерений в шкале отношений показатели описательной стати­стики можно разбить на несколько групп:

- показатели положения описывают положение экспери­ментальных данных на числовой оси. Примеры таких данных

- максимальный и минимальный элементы выборки, среднее значение, медиана, мода и др.;

- показатели разброса описывают степень разброса дан­ных относительно своего центра (среднего значения). К ним относятся: выборочная дисперсия, разность между мини­мальным и максимальным элементами (размах, интервал выборки) и др.

 

Таблица 6.1 – Задачи анализа экспериментальных данных

 

ЗАДАЧА Описание данных Изучение сходства/различий Исследование зависимостей Снижение размерности Классификация
МЕТОДЫ - описательная статистика; - определение необходимого объема выборки Статистические критерии: Крамера-Уэлча, Вилкоксона-Манна-Уитни, c2, Фишера - корреляционный анализ; - дисперсионный анализ; - регрессионный анализ - факторный анализ; - метод главных компонент   - дискриминантный анализ; - кластерный анализ; - группировка

 

- показатели асимметрии: положение медианы относи­тельно среднего (величина разности их значений) и др.

- гистограмма и др.

Данные показатели используются для наглядного пред­ставления и первичного («визуального») анализа результатов измерений характеристик экспериментальной и контрольной группы.

2. Изучение сходства/различий (сравнение двух выбо­рок). Например, требуется установить, достоверно ли разли­чие конечных состояний экспериментальной и контрольной группы в эксперименте. Или, например, задача заключается в установлении совпадений или различий харак­теристик двух выборок (например, требуется установить, что средние значения доходов населения в двух регионах (или средние значения производительности труда в двух отраслях народного хозяйства и т.д.) совпадают или различаются). Для этого формулируются статистические гипотезы:

- гипотеза об отсутствии различий (так называемая нуле­вая гипотеза);

- гипотеза о значимости (достоверности) различий (так называемая альтернативная гипотеза).

Для принятия решения о том, какую из гипотез (нулевую или альтернативную) следует принять, используют решаю­щие правила - статистические критерии[2]. То есть, на осно­вании информации о результатах наблюдений (характеристи­ках членов экспериментальной и контрольной группы) по известным формулам вычисляется число, называемое эмпирическим значением критерия. Это число сравнивается с известным (например, заданным таб­лично в соответствующих книгах по математической стати­стике эталонным числом, называемым критиче­ским значением критерия.

Критические значения приводятся, как правило, для не­скольких уровней значимости. Уровнем значимости называ­ется вероятность ошибки, заключающейся в непринятии нулевой гипотезы, когда она верна, то есть вероятность того, что различия сочтены существенными, а они на самом деле случайны.

Обычно используют уровни значимости (обозначаемые а), равные вероятности 0, 05, или 0, 01, или 0, 001. Или, пере­водя в проценты, выборки не различаются с вероятностями 5 %, 1 %, 0, 1 %. Соответственно, вероятности того, что вы­борки различаются составят 0, 95, 0, 99, 0, 999, или в процентах -95 %, 99 % и 99, 9 %. В экономических, педагогических, психологических, медико-биологических экспериментальных исследованиях обычно ограничиваются значением 0, 05, то есть допускается не более чем 5 %-ая возможность ошибки (95 % уровень достоверности различий). В естественных, технических науках чаще требуются уровни достоверности различий 99 % или 99, 9 %.

Если полученное исследователем эмпирическое значение критерия оказывается меньше или равно критическому, то принимается нулевая гипотеза - считается, что на заданном уровне значимости (то есть при том значении а, для которого рассчитано критическое значение критерия) характеристики экспериментальной и контрольной групп совпадают. В про­тивном случае, если эмпирическое значение критерия оказы­вается строго больше критического, то нулевая гипотеза отвергается и принимается альтернативная гипотеза - харак­теристики экспериментальной и контрольной группы счита­ются различными с достоверностью различий 1 - а. Напри­мер, если а = 0, 05 и принята альтернативная гипотеза, то достоверность различий равна 0, 95 или 95%.

Другими словами, чем меньше эмпирическое значение критерия (чем левее оно находится от критического значе­ния), тем больше степень совпадения характеристик сравни­ваемых объектов. И наоборот, чем больше эмпирическое значение критерия (чем правее оно находится от критическо­го значения), тем сильнее различаются характеристики срав­ниваемых объектов.

Итак, если мы ограничимся уровнем значимости a = 0, 05, то, если эмпирическое значение критерия оказывается мень­ше или равно критическому, то можно сделать вывод, что «характеристики экспериментальной и контрольной групп совпадают на уровне значимости 0, 05». Если эмпирическое значение критерия оказывается строго больше критического, то можно сделать вывод, что «достоверность различий харак­теристик экспериментальной и контрольной групп равна 95 %».

Приведем алгоритм выбора статистического критерия (см. табл. 6.2). Во-первых, необходимо определить, какая

 

Таблица 6.2 – Алгоритм выбора статистического критерия

Шкала Статистический критерий
измерений  
Отношений Крамера-Уэлча, Вилкоксона-Манна-Уитни
Порядковая Вилкоксона-Манна-Уитни, c2
Номинальная c2
Дихотомическая Фишера

 

шкала измерений используется - отношений, порядковая или номи­нальная.

Для шкалы отношений целесообразно использовать кри­терий Крамера-Уэлча. Если число различающихся между собой значений[3] в сравниваемых выборках велико (более десяти)[4], то возможно использование критерия Вилкоксона- Манна-Уитни.

Для порядковой шкалы целесообразно использовать кри­терий Вилкоксона-Манна-Уитни, возможно также использо­вание критерия c2.

Для номинальной шкалы следует использовать критерий c2.

Для дихотомической шкалы (номинальной шкалы с дву­мя возможными значениями) следует использовать критерий Фишера.

3. Исследование зависимостей. Следующим шагом по­сле изучения сходства/различий является установление факта наличия/отсутствия зависимости между показателями и ко­личественное описание этих зависимостей. Для этих целей используются, соответственно, корреляционный и дисперси­онный анализ, а также регрессионный анализ.

Корреляционный анализ. Корреляция (correlation) - связь между двумя или более переменными (в последнем случае корреляция называется множественной). Цель корреляцион­ного анализа - установление наличия или отсутствия этой связи, то есть установление факта зависимости каких-либо явлений, процессов друг от друга или их независимости.

В случае, когда имеются две переменные, значения кото­рых измерены в шкале отношений[5], используется коэффици­ент линейной корреляции Пирсона r, который принимает значения от -1 до +1 (нулевое его значение свидетельствует об отсутствии корреляции[6]) - см. Рис. 6.1, на котором каждая точка соответствует отдельному объекту, описываемому двумя переменным - х и у. Термин «линейный» свидетельст­вует о том, что исследуется наличие линейной связи между переменными - если r(х, у) = 1, то одна переменная линейно зависит от другой (и, естественно, наоборот), то есть сущест­вуют константы а и b, причем, а > 0, такие что у = а х + b.

На рис. 6.1, а и в изображены ситуации, когда все экспе­риментальные точки лежат на прямой (абсолютное значение коэффициента линейной корреляции равно единице). В си­туации, изображенной на рис. 6.1, б, однозначно провести прямую через экспериментальные точки невозмож­но (коэффициент линейной корреляции равен нулю).

Если экспериментальные точки сгруппированы около не­которой прямой - см. рис. 6.1, г и д, то коэффициент линей­ной корреляции принимает значения, отличные от нуля, при­чем чем «ближе» точки к прямой, тем выше абсолютное значение коэффициента линейной корреляции. То есть, чем выше абсолютное значение коэффициента Пирсона, тем сильнее исследуемые переменные линейно связаны между собой.

 

 

Рисунок 6.1 – Величины коэффициента линейной корреляции в различных ситуациях

 

Для данных, измеренных в порядковой шкале, следует использовать коэффициент ранговой корреляции Спирмена (он может применяться и для данных, измеренных в интер­вальной шкале, так как является непараметрическим и улав­ливает тенденцию - изменения переменных в одном направ­лении), который обозначается s и определяется сравнением рангов - номеров значений сравниваемых переменных в их упорядочении.

Коэффициент корреляции Спирмена является менее чувствительным, чем коэффициент корреляции Пирсона (так как первый в случае измерений в шкале отношений учитывает лишь упорядочение элементов выборки). В то же время, он позволяет выявлять корреляцию между монотонно нелинейно связанными переменными (для которых коэффициент Пирсона может показывать незначитель­ную корреляцию.

Отметим, что большое (близкое к плюс единице или к минус единице) значение коэффициента корреляции говорит о связи переменных, но ничего не говорит о причинно- следственных отношениях между ними. Так, например, из высокой корреляции температуры воздуха за окном и време­ни суток нельзя делать вывод о том, что движение солнца обусловлено изменениями температуры воздуха. Поэтому для установления причин связей между какими-либо явлениями, процессами необходимы дополнительные исследования по содержательной интерпретации этих связей.

Дисперсионный анализ. Изучение наличия или отсутствия зависимости между переменными можно также проводить и с помощью дисперсионного анализа. Его суть заключается в следующем. Дисперсия характеризует «разброс» значений переменной. Переменные связаны, если для объектов, отли­чающихся значениями одной переменной, отличаются и значения другой переменной. Значит, нужно для всех объек­тов, имеющих одно и то же значение одной переменной (на­зываемой независимой переменной), посмотреть, насколько различаются (насколько велика дисперсия) значения другой (или других) переменной, называемой зависимой переменной. Дисперсионный анализ как раз и дает возможность сравнить отношение дисперсии зависимой переменной (межгрупповой дисперсии) с дисперсией внутри групп объектов, характери­зуемых одними и теми же значениями независимой перемен­ной (внутригрупповой дисперсией).

Другими словами, дисперсионный анализ «работает» следующим образом. Выдвигается гипотеза о наличии зави­симости между переменными: например, между возрастом и уровнем образования сотрудников некоторой организации. Выделяются группы элементов выборки (сотрудников) с одинаковыми значениями независимой переменной - возрас­та, то есть сотрудников одного возраста (или принадлежащих выделенному возрастному диапазону). Если гипотеза о зави­симости уровня образования от возраста верна, то значения зависимой переменной (уровня образования) внутри каждой такой группы должны различаться не очень сильно (внутри- групповая дисперсия уровня образования должна быть мала). Напротив, значения зависимой переменной для различаю­щихся по возрасту групп сотрудников должны различаться сильно (межгрупповая дисперсия уровня образования должна быть велика). То есть, переменные зависимы, если отношение межгрупповой дисперсии к внутригрупповой велико. Если же гипотеза о наличии зависимости между переменными не верна, то это отношение должно быть мало.

Регрессионный анализ. Если корреляционный и диспер­сионный анализ дают ответ на вопрос, существует ли взаимо­связь между переменными, то регрессионный анализ предна­значен для того, чтобы найти «явный вид» функциональной зависимости между переменными. Для этого предполагается, что зависимая переменная (иногда называемая откликом) определяется известной функцией (иногда говорят - моде­лью), зависящей от зависимой переменной или переменных (иногда называемых факторами) и некоторого параметра. Требуется найти такие значения этого параметра, чтобы по­лученная зависимость (модель) наилучшим образом описы­вала имеющиеся экспериментальные данные. Например, в простой [7] линейной регрессии предполагается, что зависимая переменная у является линейной функцией у = а х + b от независимой переменной х. Требуется найти значения пара­метров а и b, при которых прямая а х + Ъ будет наилучшим образом описывать (аппроксимировать) экспериментальные точки (х1, у1), (х2, у2), ..., (хn, уn).

Можно использовать полиномиальную регрессию, в кото­рой предполагается, что зависимая переменная является полиномом (многочленом) некоторой степени от независи­мой переменной (напомним, что линейная зависимость явля­ется полиномом первой степени). Например, полиномом второй степени (знакомая всем из школьного курса алгебры парабола) будет зависимость вида у = а х2 + b х + с и задачей регрессии будет нахождение коэффициентов а, b и с.

Выше мы рассмотрели простую регрессию (по одной не­зависимой переменной) - линейную и нелинейную. Возмож­но также использование множественной регрессии - опреде­ления зависимости одной переменной от нескольких факторов (независимых переменных).

Регрессионный анализ, помимо того, что он позволяет количественно описывать зависимость между переменными, дает возможность прогнозировать значения зависимых пере­менных - подставляя в найденную формулу значения незави­симых переменных, можно получать прогноз значений зави­симых. При этом следует помнить, что построенная модель «локальна», то есть, получена для некоторых вполне кон­кретных значений переменных. Экстраполяция результатов модели на более широкие области значений переменных может привести к ошибочным выводам.

4. Снижение размерности. Часто в результате экспери­ментальных исследований возникают большие массивы ин­формации. Например, если каждый из исследуемых объектов описывается по нескольким критериям (измеряются значения нескольких переменных - признаков), то результатом изме­рений будет таблица с числом ячеек, равным произведению числа объектов на число признаков (показателей, характери­стик). Возникает вопрос, а все ли переменные являются ин формативными. Конечно, исследователю желательно было бы выявить существенные переменные (это важно с содержа­тельной точки зрения) и сконцентрировать внимание на них. Кроме того, всегда желательно сокращать объемы обрабаты­ваемой информации (не теряя при этом сути). Чем тут могут помочь статистические методы?

Существует целый класс задач снижения размерности, цель которых как раз и заключается в уменьшении числа анализируемых переменных либо посредством выделения существенных переменных, либо/и построения новых показа­телей (на основании полученных в результате эксперимента).

Для снижения размерности используется факторный анализ, а основными методами являются кратко рассматри­ваемый ниже метод главных компонент и многомерное шка­лирование.

Метод главных компонент заключается в получении не­скольких новых показателей - главных компонент, являю­щихся линейными комбинациями исходных показателей (напомним, что линейной комбинацией называется взвешен­ная сумма), полученных в результате эксперимента. Главные компоненты упорядочиваются в порядке убывания той дис­персии, которую они «объясняют». Первая главная компо­нента объясняет большую часть дисперсии, чем вторая, вто­рая - большую, чем третья и т.д. Понятно, что чем больше главных компонент будет учитываться, тем большую часть изменений можно будет объяснить.

Преимущество метода главных компонент заключается в том, что зачастую первые несколько главных компонент (одна-две-три) объясняют большую часть (например, 80-­90 %) изменений большого числа (десятков, а иногда и сотен) показателей. Кроме того, может оказаться, что в первые не­сколько главных компонент входят не все исходные парамет­ры. Тогда можно сделать вывод о том, какие параметры яв­ляются существенными, и на них следует обратить внимание в первую очередь.

Решив задачи описания данных, установления сходст­ва/отличий, проанализировав качественно и количественно зависимости между переменными и выявив существенные переменные, можно анализировать соотношение групп пере­менных и пытаться прогнозировать значения одних перемен­ных в зависимости от значений других переменных или вре­мени развития того или иного процесса.

5. Классификация. Обширную группу задач анализа данных, основывающихся на применении статистических методов, составляют так называемые задачи классификации. В близких смыслах (в зависимости от предметной области) используются также термины: «группировка», «систематиза­ция», «таксономия», «диагностика», «прогноз», «принятие решений», «распознавание образов». Обсудим некоторые различия между этими терминами. Предложено выде­лить три подобласти теории классификации: дискриминация (дискриминантный анализ), кластеризация (кластерный ана­лиз) и группировка. Здесь мы кратко остановимся на сути этих методов.

В дискриминантном анализе классы предполагаются за­данными (например, обучающими выборками, для элементов которых известно, каким классам они принадлежат: напри­мер, больной-здоровый, правильно-неправильно, легкая сте­пень заболевания - средняя - тяжелая и т.д.). Задача заключа­ется в том, чтобы каждый вновь появляющийся объект отнести к одному из этих классов. У термина «дискримина­ция» имеется множество синонимов: диагностика (например, в медицине требуется поставить диагноз из конечного списка возможных диагнозов, если известны определенные характе­ристики пациента и известно, какие диагнозы ставились пациентам, вошедшим в обучающую выборку), распознава­ние образов с учителем, автоматическая (или статистическая) классификация с учителем и т.д.

Если в дискриминантном анализе классы заданы, то кла­стеризация и группировка предназначены для выявления и выделения классов. Синонимами являются: построение клас­сификации, таксономия, распознавание образов без учителя, автоматическая классификация без учителя и т. д.

Задача кластерного анализа заключается в выделении по эмпирическим данным резко различающихся групп (класте­ров) объектов, которые схожи между собой внутри каждой из групп.

При группировке, когда резких границ между кластерами не существует, исследователю приходится самому вводить границы между группами объектов.

Использование компьютера при анализе результатов эксперимента, несомненно, целесообразно. С одной сторо­ны, ряд статистических методов реализован в такой популяр­ной программе, как Microsoft Excel для Windows, входящей в стандартный комплект Microsoft Office, и установленной на любом современном компьютере. С другой стороны, на сегодняшний день существует множество специ­альных профессиональных программ, позволяющих осущест­влять статистический анализ данных. Среди последних мож­но выделить и рекомендовать к использованию такие наиболее распространенные пакеты статистического анализа как: Statistice, StatGraphics и SPSS. Однако, упомянутые про­граммы достаточно сложны и требуют значительных времен­ных затрат для их освоения. Поэтому можно рекомендовать следующее: если для решения задач исследования хватает возможностей Ехсе1, то можно ограничиться использованием этой программы (недостатком ее, правда, является практиче­ски полное отсутствие вразумительных объяснений, которые помогли бы неподготовленному пользователю понять, что получилось в результате расчетов). Если возможностей Ехсеl недостаточно, то нужно обращаться к профессиональным статистическим программам. Каждая из них обладает своими достоинствами и недостатками (в одной более полно реализо­ваны одни методы, в другой другие и т.д.). С методической точки зрения можно рекомендовать использовать программу StatGraphics (версии 5.0 и выше). Ее достоинством с позиций непрофессионального статистика является наличие «советчи­ка», который разъясняет, что означает та или иная вычислен­ная величина, и что исследователю следует делать дальше.

Завершив описание статистических методов, отметим, что часто при организации исследования сложных явлений и процессов и обработке его результатов возникает необходи­мость использования агрегированных (комплексных) и/или векторных оценок. Рассмотрим кратко их специфику.

Агрегированные оценки. Во многих экспериментах имеется значительное число (десятки, сотни, а иногда и тыся­чи) объектов (субъектов). В результате измерения их показа­телей получается набор их частных оценок. Понятно, что сравнивать между собой и анализировать одновременно все частные оценки не всегда возможно и целесообразно, так как всегда существует их разброс, обусловленный неконтроли­руемым различием объектов эксперимента.

Поэтому для того, чтобы, во-первых, получить обозримое число характеристик и, во-вторых, для того, чтобы сгладить индивидуальные колебания, используют так называемые агрегированные (коллективные, групповые, производные) оценки. Например, если имелись частные (индивидуальные) оценки отдельных индивидуумов, то агрегированной оценкой будет «среднее» значение для их группы. Использование кавычек не случайно, так как получение агрегированных оценок на основании частных является их преобразованием, и преобразование это следует выполнять корректно.

Приведем некоторые корректные процедуры агрегирова­ния для наиболее распространенных в экспериментальных исследованиях показателей.

Для величин, измеренных в шкале отношений, наиболее типичным является вычисление среднего арифметического по группе. Эта процедура вполне корректна, и обычно ее реали­зация не вызывает затруднений.

Наибольшее число ошибок возникает при агрегировании показателей, измеренных в порядковых шкалах. Отметим, что не следует складывать, вычитать, умножать или делить баллы друг на друга, да и на чтобы то ни было - все это абсолютно бессмысленные операции. В порядковой шкале для «усреднения» обычно используют медиану.

Если имеется набор индивидуальных баллов, то агреги­рованной характеристикой группы будет число ее членов, получивших тот или иной балл[8]. Аналогичным образом агрегируется и информация о выделении уровней - если введены три уровня (например, уровни знаний: низкий, сред­ний и высокий) и имеется информация о распределении всех членов нескольких групп (контрольных или эксперименталь­ных) по этим уровням, то агрегированной информацией об объединенной группе будет число ее членов, обладающих тем или иным уровнем (вычисляемое как сумма по всем груп­пам числа их членов, обладающих данным уровнем).

Если агрегирование частных оценок по группе экспери­ментальных объектов (субъектов) производится с целью получения характеристик группы в целом, то для описания различных аспектов, свойств и т.п. одного и того же объекта используются так называемые векторные оценки.

Векторные оценки. Нередко встречаются случаи, когда какое-либо изучаемое явление, процесс характеризуется несколькими показателями - вектором показателей. Напри­мер, при оценке труда какого-нибудь рабочего используются показатели качества труда (точности обработки деталей) и производительности труда (время выполнения операций). При этом часто возникает вопрос о возможности однозначной оценки этого явления, процесса или изучаемых их свойств одной величиной - комплексной оценкой. Например, во мно­гих спортивных состязаниях победитель выявляется по ком­плексной оценке - сумме очков, баллов, набранных на от­дельных этапах состязания или в отдельных играх, в многоборье - в отдельных видах спорта.

На практике комплексные оценки встречаются довольно часто и, очевидно, без них не обойтись, хотя способы их определения нередко и вызывают множество недоуменных вопросов. Но в любом случае такие комплексные оценки, применяемые в повседневной жизни, являются либо резуль­татом определенных общественных соглашений, которые признаются всеми участниками, либо установлены каким- либо нормативным актом определенного директивного орга­на - министерства, ведомства и т.д. и в силу этого также признаются всеми заинтересованными лицами.

Другое дело - применение комплексных оценок в науч­ном исследовании. Здесь сразу на первое место встает вопрос о научной, в том числе математической, строгости применяе­мой оценки. В частности, например, не вызывает сомнений возможность использования в организации труда такой ком­плексной оценки, как суммарные затраты времени на выпол­нение тех или иных технологических операций. Здесь сумми­руются однородные величины, измеренные в шкале отношений.

Между тем, при использовании шкалы рангов (порядко­вой шкалы) суммирование баллов довольно часто встречается в исследованиях по педагогике, психологии, медицине, био­логии и другим наукам. Так, в одной «методологической» публикации для оценки эффективности деловой игры была использована следующая «формула»: Р = 50 - К - (В - 40), где Р - «комплексная» оценка в баллах, 50 - максимально возможное количество баллов, К - количество замечаний, сделанных ведущим, В - время в минутах. Как видим, здесь уж, что называется, «смешались в кучу кони, люди...». Под знак суммы (разности) поставлены совершенно разнородные величины: баллы, количество замечаний, время, безразмер­ные числа.

Достаточно простым и интуитивно понятным (но, в то же время, корректным) методом агрегирования балльных оценок является использование так называемых матриц свертки, элементы которых содержат значения агрегированного показателя, а агрегируемые баллы задают номер строки и столбца.

В некоторое оправдание используемым на практике не­корректным построениям комплексных оценок следует отме­тить, что проблема агрегирования векторных оценок на сего­дняшний день исследована не полностью, а существующие результаты, даже для их применения на практике, зачастую требуют хорошего знания высшей математики. Качественно же проблема векторных оценок (или как ее иногда называют - проблема принятия решений при многих критериях) может быть проиллюстрирована на следующем простом примере из области экономики: имеются два инвестиционных проекта с одним и тем же размером первоначальных вложений (допус­тим, 100 единиц), причем первый характеризуется более высоким доходом (300 единиц), но и более высоким риском (предположим, что вероятность неуспеха равна 0, 2), чем второй (доход - 250 единиц, вероятность неуспеха (риск) - 0, 05). В какой из проектов следует осуществлять инвестиции?

Ответ неоднозначен. Если бы первый проект был более при­быльным и менее рискованным, то следовало бы выбирать его. Но имеются два критерия (доход и риск) и первая аль­тернатива (первый проект) «лучше» по одному критерию, но «хуже» по второму. В подобных ситуациях обычно поступа­ют следующим образом. На первом шаге выделяют множе­ство эффективных альтернатив (так называемых, недоми­нируемых по Парето, то есть таких альтернатив, что не существует других допустимых альтернатив, которые были бы «не хуже» по всем критериям, а по одному из критериев - «строго лучше»). В рассматриваемом примере оба проекта эффективны по Парето.

Дальше - на втором шаге - возможно несколько вариан­тов (и привести априори рациональное обоснование того, какой из них следует использовать в том или ином конкрет­ном случае, невозможно):

- ввести комплексный критерий, оценка по которому бу­дет вычисляться агрегированием оценок по исходным крите­риям. В рассматриваемом примере таким критерием может быть ожидаемый доход (произведение дохода на вероятность его получения). Значение такого комплексного критерия для первого проекта равно 240 = 300 (1 - 0, 2), для второго - 237, 5 = =250 (1 - 0, 05). С точки зрения максимизации ожидае­мого дохода следует выбрать первый проект. В качестве комплексного критерия можно использовать ожидаемые потери (для первого проекта они равны 60 единиц, для второ­го - 12, 5), тогда с точки зрения минимизации ожидаемых потерь следует выбрать второй проект;

- упорядочить критерии по важности. Если считать доход более важным критерием, чем риск, то следует выбрать пер­вый проект (так как он приносит в случае успеха больший доход: 300 > 250). Но, если считать риск более важным кри­терием, чем доход, то следует выбрать второй проект (так как он характеризуется меньшим риском: 0, 05 < 0, 2);

- возможны и другие варианты принятия решений, часть из которых будет «рекомендовать» выбрать первый проект, а другая часть - второй.

Даже из приведенного элементарного примера многокри­териальной задачи принятия решений видно, что универсаль­ных «рецептов» в этой области не существует. Но в любом случае при построении ком­плексных оценок нужно быть предельно внимательным и осторожным. Кстати, нередко можно обойтись и без них. Если получены количественные результаты по отдельным показателям, то можно ограничиться их качественной интер­претацией, не «загоняя под общий знаменатель», проанализи­ровать и сравнить исследуемые объекты отдельно по каждо­му из показателей. И пусть по каким-то показателям результаты экспериментальных групп будут лучше контроль­ных, а по каким-то хуже – от этого исследование только обо­гатится, станет достовернее.

 

Контрольные вопросы

 

1. Перечислите задачи анализа экспериментальных данных.

2. Методы описательной статистики.

3. Приведите алгоритм выбора статистического критерия.

4. Корреляционный анализ.

5. Дисперсионный анализ.

6. Регрессионный анализ.

7. Использование компьютера при анализе результатов эксперимента.

 

Рекомендуемая литература

 

1. Новиков А. М. Методология научного исследования / А. М. Новиков, Д. А. Новиков. – М.: Либроком, 2010. – 280 с.

2. Лукашевич В. К. Основы методологии научных исследований: Учеб. пособие для студентов вузов / В. К. Лукашевич. – Мн.: ООО «Элайда», 2001. – 104 с.

3. Сабитов Р. А. Основы научных исследований: Учеб. пособие для вузов / Р. А. Сабитов. – Челябинск: Челябинский государственный университет, 2002. – 138 с.

4. Макогон Ю. В. Методика научных исследований внешнеэкономических связей / Ю. В. Макогон, В.В. Пилипенко. – Донецк: ДНУ, 2002. – 170 с.

5. Баскаков А. Я. Методология научного исследования: Учеб. пособие для вузов / А. Я. Баскаков, Н. В. Туленков. – К.: МАУП, 2004. – 216 с.

6. Новиков А. М. Методология / А. М. Новиков, Д. А. Новиков. – М.: СИНТЕГ, 2007. – 668 с.

7. Бургин М. С. Введение в современную точную методологию науки: структуры систем знания: Пособие для студентов вузов / М. С. Бургин, В. И. Кузнецов. – М.: АО «Аспект Пресс», 1994. – 304 с.

 

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-07-13; Просмотров: 1259; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.049 с.)
Главная | Случайная страница | Обратная связь