Порівняння двох незалежних вибірок. U-тест за методом Манна-Уітні.
У цьому розділі описано чотири тести. Найбільш часто вживаним є U-тест Манна-Уітні. який тому і буде представлений в першу чергу.
Це найвідоміший і найпоширеніший тест непараметричного порівняння двох незалежних вибірок. Він заснований на використанні однієї загальної послідовності значень обох вибірок.
Ми хочемо перевірити, чи відрізняються показники цукру в крові для чоловіків і жінок в прикладі про дослідження гіпертонії (файл hyper.sav).
Якщо Ви побудуєте гистограмму показника цукру в крові (змінна bz0), то помітите явну деформацію розподілу в ліву сторону. Тест Колмогорова-Смирнова (див. Гл. 14.5) також показує дуже значне відхилення від нормального розподілу. Стало бути, для порівняння обох вибірок слід замість t-тесту Стьюдента застосувати U-тест за методом Манна-Уітні.
- Відкрийте файл hyper.sav.
- Виберіть в меню Analyze (Аналіз) › Nonparametric Tests (Непараметричні тести) › 2 Independent Samples ... (Дві незалежні вибірки)
З'явиться діалогове вікно Two Independent Samples Tests (Тести для двох незалежних вибірок) (див. Рис. 14.1).
U-тест за методом Манна-Уітні є попередньою установкою.
- Перенесіть змінну bz0 з поля вихідних змінних в поле тестованих змінних, а змінну g в поле групових змінних.
- Після клацання на кнопці Define Groups (Визначити групи). Ви отримаєте можливість внести коди (1 - чоловічий і 2 - жіночий), необхідні для ідентифікації груп.
- Після клацання на Continue Ви знову потрапляєте в вихідне діалогове вікно.
- Запустіть програму обчислення шляхом натискання на ОК.
Мал. 14.1: Діалогове вікно Two Independent Samples Tests (Тести для двох незалежних вибірок)
- a Grouping Variable: Geschlecht (Групова змінна: стать).
Виведені результати включають такі показники:
- кількість спостережень, усереднені ранги і ранговая сума для двох вибірок (причому великим значенням присвоюються нижчі рангові місця),
- тестову величину U, певну за допомогою тесту Манна-Уітні,
- найменше значення з обох рангових сум (W-тест Уилкоксона),
- точне значення ймовірності помилки р при кількості спостережень менше 30 і
- тестову величину z, визначену за тесту Колмогорова-Смирнова, а також відноситься до неї ймовірність помилки р, яку слід використовувати при кількості спостережень більше 30.
З'ясовується, що в розглянутому прикладі різниця показників цукру в крові між статями не є статистично значущою (р = 0.273).
Натиснувши кнопку Options. Ви можете вибрати додаткові можливості виведення даних, що відносяться до розглянутого і до інших непараметрическим тестів. Поряд зі звичайною обробкою пропущених значень, можна організувати розрахунок дескриптивних статистик (середнє значення, мінімум, максимум, стандартне відхилення, кількість спостережень) і квартилей (25, 50 і 75 процентилю). Однак в цьому випадку характеристики дескриптивної статистики будуть визначатися одночасно для кого тестують і групуються змінних. Це абсолютно марно, так як в даному випадку дескриптивна статистика має сенс тільки для тестованих змінних, розбитих на групи по групують змінним. На жаль, дана помилка була виправлена і в 10 версії SPSS.
У розглянутому прикладі проведення U-тесту був би також дуже корисний розрахунок медіан обох груп. Медіани визначаються за допомогою інших засобів SPSS. У нашому прикладі медіана показника цукру для чоловіків дорівнює 93, а для жінок 97.
НАШІ ПРОЕКТИ
- Навігатор в океані ароматів
SamoYchiteli.ru
ілюстровані самовчителі