Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Выяснение наличия связей между изучаемыми явлениями – одна из важных задач статистики. Существует две формы связи – функциональная и корреляционная.



Функциональная связь отражает огромную зависимость процессов или явлений. Ряд примеров функциональной связи можно привести из физики: объем газа зависит от давления, скорость движения частиц жидкости - от площади сечения трубы.

Во всех этих случаях каждому конкретному значению одной величины будет соответствовать определенное, заранее известное значение другой переменной величины.

Особенность корреляционной связи заключается в том, что каждому значению одной величины признака будет соответствовать не одно единственное значение другого признака, а несколько его значений, варьирующих в определенных пределах.

Различают прямую (или положительную) корреляционную связь и обратную (или отрицательную).

Например, с увеличением длины тела обычно возрастает масса тела; частота пульса зависит от температуры; частота рака легких связана с интенсивностью и продолжительностью курения. Как видно, большим значениям одного признака в конечном счете соответствуют большие значения другого признака. Это примеры прямой корреляционной связи.

Наоборот, изучая связь между температурой наружного воздуха и простудными заболеваниями, можно убедиться, что более низкие значения одного признака (температуры) сопровождаются большей частотой простудных заболеваний. Это пример обратной корреляционной зависимости.

Известное представление о наличии или отсутствии корреляционной связи между изучаемыми явлениями ли признаками (например, между массой и длиной тела) можно получить графически, не прибегая к специальным расчетам. Для этого достаточно на чертеже в системе прямоугольных координат отложить, например, на оси абсцисс общие величины, длина тела, а на оси ординат – массу тела и нанести ряд точек, каждая из которых соответствует индивидуальной величине массы тела при данной длине тела обследуемого.

Если полученные точки располагаются кучно, по наклонной прямой к осям ординат в виде овала (элипса) или по кривой линии это свидетельствует о зависимости между явлениями. Если же точки расположены беспорядочно или на прямой, параллельной абсциссе или ординате, это говорит об отсутствии зависимости. Однако графически степень связи между признаками не всегда выявляется достаточно ярко и графический метод не дает нам числовой характеристики имеющейся связи.

Вычисление коэффициента корреляции позволяет установить количественную меру этой связи, объективно оценить степень ее тесноты: сильная, средняя, слабая или отсутствие связи.

Значение коэффициента корреляции варьирует в пределах от 0 до 1; (0) означает отсутствие связи; единица (1) – полную (функциональную) связь.

Считается, что размеры коэффициента корреляции до 0, 30 отражают слабую связь между явлениями, от 0, 31 до 0, 69 – среднюю, от 0, 70 – 0, 99 – сильную степень связи.

Следует подчеркнуть, что причинная зависимость между явлениями должна устанавливаться исследователем предварительно и основываться исключительно на качественном анализе.

Наиболее простым методом определения степени связи является метод ранговой корреляции (корреляции рангов) Спирмена.

Ранговая корреляция применяется для оценки связи порядковых мест (рангов), занимаемых соответствующими величинами в двух связанных количественных рядах.

Для нахождения коэффициента ранговой корреляции величины одного из признаков (определяющего) – в рассматриваемом примере количества йода, - располагаются в порядке увеличения или уменьшения их числовых значений (Х). Параллельно записываются соответствующие им числовые значения второго признака (результативного) – в данном примере доля пораженности зобом (Y), населения некоторых регионов России.

Естественно, что порядок следования больших или меньших чисел во втором ряду может быть любым даже обратным. Обозначение цифрами порядковых мест признаков в обоих рядах и есть их ранжирование. Если в ряду встречаются два одинаковых по величине числа, то порядковое место каждого из них следует обозначить средней из суммы их очередных порядковых мест.

Пример вычисления коэффициента ранговой корреляции. Определить зависимость пораженности зобом населения от содержания йода в воде и пище некоторых регионов России.

Количест- во йода в воде, пище (Х) Поражен ность населения зобом (Y) Порядковые номера (ранги) Разность рангов d Квадрат разности рангов d²
Количество йода (Х) Пораженность населения зобом (Y)
Х Y Х Y d= Х- Y
0, 2 -6
0, 6 -4
1, 1 -1
0, 8 -1
2, 5
4, 4
16, 9
          ∑ d=110

Коэффициент корреляции рангов обозначается греческой буквой ρ (ро) и вычисляется по следующей формуле:

6 х ∑ d²

ρ xy=1- -----------

n(n² - 1)

 

6 х 110

ρ xy=1- ----------- = 1-1, 964= - 0, 96

7(49-1)

 

Вычисленный коэффициент ранговой корреляции показывает, что связь сильная (0, 96), обратная (-). Следовательно, можно сделать вывод, что между содержанием йода в пище и воде и пораженностью жителей России зобом корреляционная связь сильная и обратная, т.е. чем больше содержится йода в продуктах питания и воде, тем меньше доля пораженных зобом среди населения. Так как исследование носит выборочный характер, необходимо определить ошибку коэффициента корреляции (m ρ xy), а также критерий Стьюдента (t).

______________ _______ ____ ______

m ρ xy= ± √ -1- Р² xy = ±√ 1-0, 96² = ± √ 1-0, 96² = ±√ 0, 08 = ±√ 0, 016=0, 13

n – 2 7-2 5 5

ρ xy

t= ---------=0, 96 =7, 4, при t> =1, 96

m 0, 13

При величине критерия достоверности t > = 1, 96 степень вероятности безошибочного прогноза составляет > 95, 5%. Следовательно, между содержанием йода в пище и воде и пораженностью зобом населения некоторых регионов России имеется достоверная прямая и сильная корреляционная зависимость.

Нецелесообразно вычислять коэффициент связи при числе коррелируемых пар меньше четырех.

Задача №1.

Определить методом корреляции рангов характер и величину связи между обеспеченностью врачами и числом зарегистрированных заболеваний по обращаемости за медицинской помощью в городах Удмуртии, если имеются следующие данные:

Наименование городов Обеспеченность врачами на 10000 населения. Зарегистрировано заболеваний на 1000 населения.
г. Ижевск 45, 8 1060, 5
г. Сарапул 33, 7 727, 2
г. Воткинск 34, 6 857, 7
г. Глазов 43, 7 915, 9

 

Оценить достоверность полученного коэффициента.

 

 

Задача №2

Методом корреляции рангов установить направление и силу связи между возрастом работающих и числом травм, определить достоверность результатов, если получены следующие данные:

Возраст (в годах) Число травм
До 20 лет
21-30
31-40
41-50
51-60
61 и старше

 

СРЕДНИЕ ВЕЛИЧИНЫ.

Средние величины наряду с относительными находят широкое применение в санитарной статистике.

Средняя величина является общей сводной характеристикой признака, имеющего количественное выражение, например, длина и масса, длительность пребывания больного на койке, уровень кровяного давления и т.д. В средней величине нивелируются случайные отклонения, и выявляется основное, типичное свойство явления.

Средние величины используются:

Для характеристики физического развития (длина и масса, окружность груди, спирометрия, сила кисти, становая сила и др.).

Для характеристики отдельных сторон медицинской деятельности. Например, среднее число дней работы койки в году, длительность пребывания больного на койке, среднее число посещений 1 жителя к врачу, средняя длительность случая нетрудоспособности и др.

Для характеристики санитарно-противоэпидемической работы. В качестве показателей санитарных условий пользуются данными о средней площади и уровне освещенности на человека, средними нормами потребления жиров, белков, углеводов, средним количеством витаминов, калорий, коли-титр тоже представляет среднюю величину.

Для характеристики физиологических особенностей организма: температура, число дыхательных движений, ударов пульса в минуту, средний уровень артериального давления, содержание различных биохимических элементов в крови, в моче и т.д.

Средние величины получают из рядов числовых значений изучаемого варьирующего (изменяющегося по величине) признака. Каждое числовое значение признака называется вариантой и обозначается буквой V; число, показывающее, как часто встречается каждая варианта в данном ряду, носит название частоты и обозначается буквой Р. Ряд вариант, расположенных в определенной ранговой последовательности (по возрастающей или убывающей) и соответствующих им частот, называется вариационным рядом. Частоты в вариационном ряду при достаточно большом числе наблюдений к середине ряда нарастают, а затем снова уменьшаются.

Если варианты выражены в виде целых чисел (число заболеваний, число дней пребывания на койке и т.д.), то ряд называется прерывным (дискретным). В непрерывном ряду варианты выражены дробными числами, например, ряд по росту, массе, артериальному давлению. Ряды бывают простые и сгруппированные. В простых рядах – разность между соседними вариантами (интервал) равна единице, в сгруппированных – больше единицы. Величина интервала зависит от изменчивости признака и задач исследования і = Vmx –Vmп.

число групп

Число групп зависит от:

1.Числа наблюдений.

2. Необходимости обеспечить определенную точность средней. Теория статистики позволила определить, что при числе наблюдений от 31 до 45 число групп должно быть ровно 6-7, от 46 до 100 равно 8-10, от 101 до 200 равно 11-12, от 200 до 500 равно от 12 до 17. Не должно быть «открытых групп» - «более 20»; «менее 10» и т.д. Нельзя повторять границы групп: 55-60, 65-65 и т.д. Разбивку материала по группам лучше делать с помощью карточек или соответствующей программы для ЭВМ.

В сгруппированном ряду за величину варианты принимают середину интервала (центральную варианту). Центральную варианту в прерывном ряду получают как полусумму начального и конечного значений данного интервала. В непрерывном ряду – как полусумму начальных членов групповых вариант.

Для характеристики вариационного ряда используют также моду (Мо) – это наиболее часто встречаемая варианта и медиану (Ме) – это варианта, которая делит вариационный ряд на две равные части.

После составления вариационных рядов переходят к вычислению средней арифметической. В ряду, где частоты (р) равны 1, вычисляют простую среднюю арифметическую, ее вычисляют так:

М = Σ V х Р, т.к. Р=1, то

n

М = Σ V

n

 

n= Σ р

 

М=26+27+28+29 …..+46 = 756 = 36, 0 (кг.)

21 21

__

δ =± √ d²

n-1

 

___ ____

δ =± √ 771 = ±√ 36, 2 = 6, 1 (кг.)

 

М ± δ = 36, 0 ± 6, 1

От 29, 9 до 42, 1

21 – 100

14 – Х Х = 66, 7%

 

m= ± δ = ± 6, 1 = ± 6, 1 = ± 1, 4 (кг.)

√ n-1 √ 20

 

Если же частоты больше единицы, определяют арифметическую взвешенную, т.е. учитывают, сколько раз каждая варианта встречалась в вариационном ряду. Существуют несколько способов вычисления средней арифметической взвешенной. В тех случаях, когда значения вариант небольшие (число случаев заболеваний у одного человека, кратность посещений в поликлинику по поводу 1 заболевания, длительность пребывания в родильном доме и т.п.) среднюю арифметическую можно определить путем непосредственного вычисления:

М = Σ V Р

n

V кг Р Р х V d d ² d² р
-10, 7 114, 49 114, 49
-9, 7 94, 09 188, 18
-8, 7 75, 69 151, 38
-7, 7 59, 29 118, 58
-6, 7 44, 89 134, 67
-5, 7 32, 49 97, 47
-4, 7 22, 09 88, 36
-3, 7 13, 69 69, 45
-2, 7 7, 29 43, 74
-1, 7 2, 89 20, 23
-0, 7 0, 49 4, 9
+0, 3 0, 09 0, 81
+1, 3 1, 69 13, 52
+2, 3 7, 59 22, 77
+3, 3 10, 89 54, 45
+4, 3 18, 49 73, 96
+5, 3 27, 09 108, 36
+6, 3 39, 69 119, 07
+7, 3 53, 29 159, 87
+8, 3 68, 89 137, 78
+9, 3 86, 49 172, 98

n=91, Σ рV =3345, Σ =1925, 02

d² р

 

М = Σ V р = 3345 = 36, 7(кг.)

n 91

_____ _______ ____

δ = ±√ Σ d² р = ± √ 1925, 02 = ± √ 21, 1 = ± 4, 6 (кг.)

n 91

 

91 – 100%

64 - Х Х=70, 3%

 

М ± δ = 36, 1 + 4, 6 от 32, 1 до 41, 3

 

m= ± δ = ± 4, 6 = ±0, 5 (кг.) М ±2m от 35, 7 до 37, 7

√ n 9, 1

 

Если ряд сгруппированный, М определяется как і х Σ V р, где і – величина интервала. n

Средняя арифметическая может только тогда правильно характеризовать изучаемый признак, когда она типична для данного ряда, когда она вычислена на основании вариант достаточно к ней близких, т.е. размах (амплитуда) ряда была небольшой, или другими словами-колеблемость, изменчивость признака невелика. Из этого следует, что каждый раз после вычисления М надо определить колеблемость вариационного ряда. Мерой колеблемости (вариабельности) является среднее квадратичное отклонение, обозначаемое буквой δ (сигма). Вычисление ее показано в тех же примерах, что и вычисление М.

 

---------

Простой средней соответствует δ = ± √ Σ d² р

______ n

Средней взвешенной δ = ± √ Σ d² р ;

n

Если в пределе М ± δ будет располагаться не менее 68, 3% всех частот вариационного ряда, то колеблемость признака велика и ряд считается плотным, а средняя для него типична и, следовательно, может быть использована для характеристики изучаемого признака.

Ряд считают плотным, а среднюю арифметическую типичной, когда в пределе М ± δ располагается более 68, 3% частот. В пределе М± 2δ будет располагаться 95, 5% всех частот и 99, 7% всех частот укладывается в пределе М± 3δ

Эти соотношения вытекают из того, что согласно теории статистики площадь, заключенная внутри кривой нормального распределения (Гаусса-Ляпунова) М± δ равна 68, 7%, в пределах М± 2δ - 95, 5% и М± 3δ – 99, 7%.

Предел средних значений принято считать «нормой», т.к. эти величины встречаются у большинства при достаточном числе наблюдений. Все, что ниже М- δ – это ниже нормы, а выше М+ δ – выше нормы. Отсюда, норма сахара в крови, гипогликемия, гипергликемия, нормальное АД, гипотония и гипертония, средний уровень физического развития – ниже среднего и выше среднего и т.д.

Средняя, среднее квадратическое отклонение – величины именованные. Поэтому при сравнении вариабельности признаков с разными наименованиями (рост, масса и д.р) переводят в проценты, получая коэффициент вариабельности

V = δ х 100%

М

Если V> 20% разнообразие признака сильнее, если V= 10 - 20% среднее и если V< 10% - слабое.

При любом выборочном исследовании, (а практически мы почти всегда имеем дело именно с такими наблюдением), средняя, полученная нами, всегда будет отличатся от средней, полученной в генеральной совокупности ( или при сплошном исследовании). Величина, на которую наша средняя отличается от той, что была при бесконечно большом числе наблюдений (или в генеральной совокупности) называется ошибкой репрезентативности или ошибка средней арифметической величины. С ее помощью можно найти доверительные границы, т. е. границы средних величин размеров признака, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность. Мген. = М выб. ± t m; t m=Δ – это максимально возможная погрешность оценки генерального параметра; t – степень точности. При t= 1 вероятность безошибочного прогноза Р=68, 3%, при t=2 – 95, 5%, при t=3 – 99, 7%. Большая ошибка может зависеть от неоднородности группы, недостаточного числа наблюдений. Обычно в практике социальной гигиены и организации здравоохранения достаточна вторая степень точности, т.е. 2m при вероятности безошибочного прогноза (р ) 95, 5%.

Пример с подбором белья в стационаре:

Из 1000 больных

± δ 683 имеют средний 48 размер

317 < - 1δ размер 46

± 2δ 272 < +1δ размер 50

- 45 < - 1δ размер 44

± 3δ 42 < + 1δ размер 52

3 – индивидуальный размеры

1. Рассчитать среднегодовое количество коек за 2006 г. в терапевтическом стационаре районной больницы, а также определить среднее квадратическое отклонение и среднюю ошибку средней арифметической, если в январе 2006 г. в отделении действовало 52 койки

Во II. 06 г. 48 коек
В II. 06 г. 52 койки
В IV. 06 г. 30 коек
В V. 06 г. 47 коек
В VI 06 г. 47 коек
В VII. 06 г. 50 коек
В VIII. 06 г. 48 коек
В IX. 06 г. 512 коек

 

2. Рассчитать среднегодовое количество коек за 2006 г., а также определить среднее квадратическое отклонение, среднюю ошибку средней арифметической в стоматологическом отделении РКБ, если в отделении действовало:

На XII. 05 г. 40 коек
На 31.01.06 г. 42 койки
В II 06 г. 43 койки
В III 06 г. 40 коек
В IV 06 г. 38 коек
В V 06 г. 42 койки
В VI 06 г. 44 койки
В VII 06 г. 39 коек
В VIII 06 г. 40 коек
В IX 06 г. 43 койки
В X 06 г. 44 койки
В XI 06 г. 44 койки
В XII 06 г. 45 коек

 

 

Раздел 4.

Медицинская статистика.

 

1.1. Статистика – самостоятельная общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной с целью выявления закономерностей.

Отличие статистики, как науки, от математики заключается в том, что предметом изучения статистики являются количественные закономерности материальных явлений, имеющие определенные качественные характеристики. Тогда как наука математика изучает только количественные отношения, абстрагированные от качественной стороны явлений.

Статистика, изучающая массовые явления в общественном здоровье и здравоохранении, носит название медицинской статистики, которая рассматривает человека как социальное существо, а все стороны его жизни, деятельности и состояния здоровья как социально обусловленные.

Медицинская статистика делится на два основных раздела: статистика здоровья населения и статистика здравоохранения.

Статистика здоровья изучает основные показатели, характеризующие санитарное состояние общества (смертность, рождаемость, естественный прирост (или убыль) населения, заболеваемость, инвалидизация и основные параметры физического развития) посредствам исследований и анализа полученных статистических данных; выявляет и устанавливает взаимосвязь этих показателей с различными факторами окружающей среды, это служит основой для разработки оздоровительных и профилактических мероприятий.

В понятие статистики здравоохранения входит сбор и изучение данных о кадрах и сети лечебно-профилактических учреждений с целью планирования лечебных и профилактических мероприятий и оценки качества работы отдельных ЛПУ и органов здравоохранения регионов и всего здравоохранения в целом и т.д.

Если методологической основой медицинской статистики являются законы диалектики (единства и борьбы противоположностей, перехода количества в качество, категории необходимости и случайности и т.д.), то математическая основа – закон больших чисел, который представляет одно из выражений диалектической связи между случайностью и необходимостью, а также теория вероятностей.

При использовании закона больших чисел удается освободить статистические показатели от влияния случайных причин и выявить в массе изучаемых явлений действие объективных закономерностей. Теория вероятностей позволяет установить шансы «за» и «против» реальной возможности наступления данного события.

Основными задачами медицинской (санитарной) статистики являются:

- изучение здоровья (санитарного состояния) населения, которое характеризуется демографическими показателями, заболеваемостью и параметрами физического развития и показателями инвалидности (статистика здоровья населения);

- изучение и анализ результатов деятельности медицинских учреждений и оценка эффективности их работы (статистика здравоохранения);

- оценка достоверности результатов научных исследований.

Статистическое исследование проводят с целью получения:

- сведений о заболеваемости и воспроизводстве населения;

- данных о физическом развитии отдельных групп населения;

- результатов анализа деятельности лечебно-профилактических учреждений и оценка эффективности их функционирования, в т.ч. и диспансерного наблюдения и т.д.

Статистическое исследование строится на основе определенных, выработанных в процессе многолетней практики и научно обобщенных принципах, правилах и приемах, составляющих статистическую методологию. Работа, как правило, проводится в строгой последовательности по следующим этапам:

5. Составление плана и программы исследования;

6. Регистрация и сбор материала;

7. Группировка и сводка материала;


Поделиться:



Последнее изменение этой страницы: 2017-03-15; Просмотров: 368; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.079 с.)
Главная | Случайная страница | Обратная связь