Доказательная гипертензиология: количественная оценка результата антигипертензивной терапии.
Николаев Н. А.,
Поскольку функционирующий организм человека в статистическом поле должен рассматриваться как сложная стохастическая система, находящаяся под постоянным воздействием контролируемых (измеряемых количественно) и неконтролируемых (случайных и неизвестных) факторов [16], а больные ГБ, включенные в настоящее исследование, представляют собой выборную совокупность генеральной совокупности, репрезентативность выборки обеспечивали случайностью отбора объектов однородной генеральной совокупности и достаточной численностью независимых наблюдений.
Для проверки свойств распределения генеральной совокупности выдвигали статистические гипотезы. В качестве нулевой (Н0) выдвигали гипотезу о принадлежности показателей одной генеральной совокупности, в качестве альтернативной (Н1) - о принадлежности показателей различным генеральным совокупностям. Уровнем значимости α, определяющим размер критической области Vk, устанавливали вероятность α менее 0,05.
В статистических пакетах SPSS 13.0 и Stat Soft Statistica 6.0 for Windows оценивали p-значение (p-level), принимая р = Р [Z > |zВ||Н0]. При р > α гипотезу Н0 принимали на уровне значимости р. При р < α гипотезу Н0 отклоняли, поскольку zВ попадала в критическую область. За ошибку первого рода (отклонение правильной гипотезы Н0) принимали величину α, поскольку Р [Z є Vk / Н0] = α. За ошибку второго рода (неверное принятие Н0, когда верна альтернативная Н1) принимали β, вероятность которой рассчитывали: β = Р [Z є V \ Vk / Н1]. Мощность критерия μ(Vk, Ө), расцениваемую как вероятность отклонения Н0 при конкретном Ө принимали равной α, так как
μ(Vk, Ө) = Р [Z є Vk / Н0] = α.
Минимальный объем выборки (с учетом принятых в настоящем исследовании пределов ошибок α=0,05 и β≤0,1) определяли решением системы уравнений:
{ Р [Z є Vk / Н0] = 0,05; Р [Z є V \ Vk / Н1] ≤ 0,1.
Требуемое число наблюдений для получения значимых различий в независимых выборках определяли как n1,n2 ≥ [t052 (Sx12 + Sx22)] : [(x1 - x2)2]. Требуемое число наблюдений для получения значимых различий показателей в связанных выборках устанавливали по формуле:
n ≥ [t052 SΔx2] : (Δx)2.
Гипотезы о виде распределения проверяли, используя критерии Shapiro-Wilkin и χ2 Kolmogorov-Smirnov. χ2 По формуле
χ2 = Σ [(nk - npk)2 : npk]
для принятого уровня значимости α гипотеза Н0 признавалась согласующейся с результатами наблюдений при χ2 < χ21-α (r-l-1), где: χ21-α (r-l-1) - квантиль порядка 1-α распределения χ2 с (r-l-1) степенями свободы, l - число неизвестных параметров распределения, оцениваемых по выборке. Гипотезу Н0 отклоняли при χ2 ≥ χ21-0,05 (r - l - 1). Если распределение сравниваемых признаков удовлетворяло требованиям проведения параметрического исследования, применяли t-критерий Student. Расчет t-критерия в связанных выборках выполняли как t = |Δx| : [SΔx : √n]. В независимых выборках для расчетов t-критерия использовали формулу:
t = |x1 - x2| : √ [{S12 (n1 - 1) + (S22 (n2 - 1)} (n1 + n2)] : [(n1 + n2 - n) n1n2].
В случаях, когда распределение сравниваемых признаков не удовлетворяло требованиям проведения параметрического исследования, а также при небольших объемах выборок (n < 30) и/или когда поставленные задачи не могли быть решены параметрическими методами исследования, применяли непараметрические методы.
Для проверки гипотезы Н0 о принадлежности двух независимых выборок (объемов n1 и n2) однородным генеральным совокупностям использовали критерий серий Wald-Wolfowitz (Wald-Wolfowitz runs test). Учитывая большие объемы выборок (n>20), вычисления выполняли, используя статистику Z. Статистику Z критерия Wald-Wolfowitz рассчитывали по формуле:
Z = [|N - ([2n1n2] : [n1 + n2] + 1)| - ½] : √[2n1n2(2n1n2 - n1 - n2)] : [(n1 + n2)2 (n1 + n2 - 1)].
Гипотезу Н0 принимали на уровне значимости α, если выборочное значение zВ статистики Z, удовлетворяло неравенству |zВ| ≤ u1-α/2, где u1-α/2 - квантиль нормального распределения (N 0, 1) с одной степенью свободы порядка 1-α/2; гипотезу Н0 отклоняли, если |zВ| < u1-α/2.
Для проверки гипотезы Н0 о некоррелированности двух признаков (X, Y) измеренных в порядковых или количественных шкалах из пар наблюдений (xi, yi, i = 1, 2, ..., n) в качестве мер статистической зависимости употребляли ранговые коэффициенты корреляции Spearman (ρs) и Kendall (τ). Выборочный коэффициент ранговой корреляции Spearman вычисляли по формуле:
rs = 1 - [6 Σ (x'I - y'i)2] : [n(n2 - 1)],
где x'i, y'i - ранги переменных; n - число наблюдений.
Коэффициент ранговой корреляции Spearman определяли как модуль выборочного коэффициента: ρs = |rs|. Гипотезу Н0 принимали на уровне значимости α, если rs > 0 и ρs < ρ(α, n), при альтернативной гипотезе Н1, что ρs > 0. Коэффициент ранговой корреляции Kendall вычисляли по формуле:
τ = 1 - [4k] : [n(n - 1)],
где k - число инверсий в ряду рангов второй переменной (y'i) при условии, что ранги первой переменной (x'i) упорядочены; n - число наблюдений.
При n > 10 для вычисления коэффициента ранговой корреляции Kendall использовали Z статистику: Z = (√ [9n (n - 1)] : [2 (2n + 5)]) τ. Для проверки гипотезы Н0 о некоррелированности более чем двух признаков использовали методы множественной логистической регрессии.
Количественный материал представлен в виде графиков и таблиц. Во всех случаях при сравнении выборок предпочтение отдавалось наиболее чувствительному из использованных критериев. Средние выборочные значения количественных признаков приведены в тексте в виде M±SE, где M - среднее выборочное, SE - стандартная ошибка среднего. Анализируемый материал представлен как медиана, верхний и нижний квартили (Q1-Me-Q2). При ненормальном распределении значений указывалась медиана (V0,5), 25-процентиль (V0,25) и 75-процентиль (V0,75).
Статистическая обработка материала, построение графиков и таблиц производились на персональном компьютере с процессором AMD Semptron 3000 box S754 с использованием программных пакетов статистической обработки данных SPSS 13.0 и Stat Soft Statistica 6.0 и редактора электронных таблиц MS Excel в Windows ХР.