Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Показатели разброса значений
Объективация средних показателей: методика вычисления отклонения от средней частоты
Стандартные и распространенные показатели разброса значений: дисперсия среднее квадратическое отклонение
Эти показатели взаимосвязаны
Дисперсия (Variance, Var.) Мера разброса случайной величины, то есть её отклонения от среднего значения:
сумма возведенных в квадрат отклонений частот от среднего показателя, поделенная на n (число выборок) – 1. Вычисление дисперсии Допустим, частота слова война в 10 массивах текстах СМИ (ipm) колеблется след. образом: 1000, 970, 1010, 1100, 950, 1002, 980, 999, 1030, 1015 = 1005, 6 соотв. 25, 6, 1229, 2, 24, 4… сумма квадратов отклонений = 14719, 32 делим на 10 – 1 = 9 показатель дисперсии = 1635, 48
! Дисперсия постоянной величины равна 0.
Среднее квадратическое (стандартное) отклонение (Standard Deviation, Std.Dev.), обозначается s или s Наиболее распространённый показатель разброса значений. Используется при расчёте стандартной ошибки среднего арифметического в статистических измерениях. Определяется как квадратный корень из дисперсии.
Вычисление СКО (дополнение к примеру со словом война) Допустим, частота слова война в 10 массивах текстах СМИ (ipm) колеблется след. образом: 1000, 970, 1010, 1100, 950, 1002, 980, 999, 1030, 1015 = 1005, 6 соотв. 25, 6, 1229, 2, 24, 4… сумма квадратов отклонений = 14719, 32 показатель дисперсии = 1635, 48 СКО:
Интерпретация СКО (дополнение к примеру со словом война) Значения нормально распределённой случайной величины обычно лежат в интервале
(1005, 6 – 121, 32); (1005, 6 + 121, 32) 884, 28 ~ 1126, 92
1000, 970, 1010, 1100, 950, 1002, 980, 999, 1030, 1015 Практическая арифметика для гуманитариев (? ) На практике статистические функции встроены в различные приложения – не только в совсем специализированные (SPSS, Statistica, Statgraphics etc.), но и в универсальные: Access, Excel… Поэтому главное для гуманитария не столько умение считать (хотя это важно J), сколько знание функциональности статистического инструментария. Это знание позволяет избежать вульгаризации статистики.
Примеры использования показателей разброса: НКРЯ, НЧС РЯ [Шаров, Ляшевская] Выравнивание распределения частот в сегментах корпуса (коэф. Жуйана, D): корпус разбивается на n сегментов (100), отражающих жанрово-стилевую разбивку известны средняя частота слова по всему корпусу (μ ) и s – среднее квадратическое отклонение μ для отдельных сегментов. D вычисляется по формуле:
Примеры использования показателей разброса в НКРЯ [Шаров, Ляшевская] Значение D у слов, частотных в большинстве документов, близко к 100, а в небольшом количестве – к 0. Примеры: союз но (встречается во всех сегментах): D = 97 сущ. статья (преобладает в юридич. документах): D = 76 сущ. конунг (встречается только в 9, преим. литературно-худож. сегментах): D = 9
Примеры использования показателей разброса при изучении стихотворного ритма [Коломогоров, Баевский] Каждому слогу стиха ставится в соответствие мера выделенности m, где m принимает значение исходя из ударности/редуцированности (5 степеней градации). Вычисляется средняя выделенность одного слога по стихотворению в целом. Среднее квадратическое отклонение выделенности слогов отражает индивидуальные характеристики строки → строфы → текста → стиля → направления…
В.С.Баевский: «Строки с наибольшим средним квадратическим отклонением суть ритмические раритеты. Они больше всего отличаются от идеального «усредненного» ритма, имеют наиболее заметный индивидуальный ритмический облик». В итоге среднее квадратическое отклонение выделенности слогов строки «отражает процесс восприятия стиха как результат взаимодействия между ожидаемым вследствие предшествующего читательского опыта и индивидуальным ритмическим обликом данной строки».
В.С.Баевский: «Стих Б. Пастернака, Н. Ушакова, Л. Мартынова, А. Прокофьева, Д. Самойлова, А. Вознесенского — поэтов разных поколений и разных творческих установок — отличается высокой изменчивостью ритма Стиху позднего П. Антокольского, А. Твардовского, Я. Смелякова, Е. Винокурова, Е. Евтушенко — опять-таки поэтов очень разных — свойственно ограничение изменчивости ритма. Первая установка носит новаторский характер, вторая ориентирована на традицию XIX в.».
|
Последнее изменение этой страницы: 2017-04-12; Просмотров: 79; Нарушение авторского права страницы