Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Лабораторная работа 9.Статистический анализ выборок с категорийными переменными.
Фиктивной или категорийной переменной называется переменная, которые определяют наличие или отсутствие у объектов исследования определенного свойства. Такие переменные принимают два значения 1 если объект удовлетворяет свойству и 0 в противном случае. Пример жарко или холодно, пол мужской или женский и т.д.Если имеется несколько свойств, то вводятся несколько переменных, например для указания времени года можно ввести 3 переменных х1-лето, х2-весна, х3-осень, четвертая переменная зима=1, если все х1, х2, х3 равны нулю. Фиктивными могут быть как зависимая, так и независимые переменные. Рассмотрим задачу. Цена на недвижимость определяется площадью и состоянием. Переменная состояние может быть в трех значениях «плохое», «хорошее» и «среднее»
Требуется провести анализ данных. Вырежем столбец состояние и сместим его вправо на два столбца.
Проведем регрессионный анализ. Первое построим модель регрессии по двум переменным Цена- Площадь. Самостоятельно выполнить анализ и оценить модель График приведён ниже. Заполним пустые два столбца в таблице данных. Для этого введем формулу ЕСЛИ(ссылка на ячейку столбца состояние=”плохое“; 1; 0) и скопируем ее вниз Во второй столбец введем ЕСЛИ(ссылка на ячейку столбца состояние=”среднее“; 1; 0) и скопируем ее вниз.
Построим модель регрессии. Переменные: У –цена, Х –хорошее и среднее Обратите внимание, что качество модели в целом улучшилось.
Модель имеет вид Цена= 14, 6»хорошее»- 14, 4 «среднее» +29, 33 Если состояние плохое, то переменная хорошее =0, среднее =0 Если хорошее, то переменная хорошее =1, среднее =0 Если состояние среднее, то переменная хорошее =0, среднее =1 Самостоятельно, заполните столбцы прогнозируемая цена и отклонение
Постройте гистограмму остатков. Включим в состав независимых переменных, переменную площадь и еще раз построим модель регрессии. Качество модели еще раз улучшилось
Самостоятельно, заполните столбцы прогнозируемая цена и отклонение Постройте гистограмму остатков.
Статистический анализ выборок с зависимыми категорийными переменными (дискриминантный анализ) Наиболее распространенной сегодня операцией интеллектуального анализа данных является классификация. С ее помощью выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил, которым должен удовлетворять анализируемый объект. Одним из методов классификации является дискриминантный анализ, который используется для принятия решения о том, какие переменные различают (дискриминируют) две или более возникающие совокупности (группы). Рассмотрим пример. Даны сведения о финансовом состоянии 16 компаний. Семь из них обанкротились, а девять остались финансово состоятельными. В качестве независимых переменных использованы финансовые показатели: Отношение чистой прибыли к активам; Отношение текущих активов к числу продаж.
Задача состоит в нахождении закономерности банкротства от указанных показателей. Построим модель регрессии. В качестве зависимой переменной возьмем переменную банкротство.
Модель имеет вид Банкротство=-0, 158-1, 755 К1+0, 985К2, где К1 и К2 соответствующие показатели. Заполните столбцы предсказанное банкротство, используя функцию ОКРУГЛ( модель регрессии), а для столбца отклонения функцию ЕСЛИ(значение банкротства = значению предсказанного банкротства; 0; 1). Подсчитайте число совпадений и оцените качество модели в процентах.
Самостоятельно. Рассчитать потребление мяса в г.п. Пуховичи, зимой. если известны данные выборки
|
Последнее изменение этой страницы: 2019-05-17; Просмотров: 271; Нарушение авторского права страницы