Презентация. Дискримнантний аналз

Скачать презентацию




1. Сутність методу 2. Реалізація в SPSS 3. Інтерпретація результатів Дискримінантний аналіз Кислова О. М. Курс «Методи багатовимірного аналізу соціологічної інформації»
 


Дискримінантний аналіз — різновид багатовимірного аналізу, що призначений для класифікації даних, тобто для вирішення завдань розрізнення (дискримінації) об'єктів спостереження по певних ознаках. За допомогою дискримінантного аналізу на підставі обраних дослідником ознак (незалежних змінних) об'єкти (респонденти) можуть бути приліченими до однієї з декількох заздалегідь заданих груп.
 


Дискримінантний аналіз ґрунтується на розрахунку дискримінантної функції і дає можливість визначити відмінність між кількома сукупностями об’єктів. При цьому слід пам’ятати, що він застосовується для аналізу даних у тому випадку, коли залежна змінна номінальна, а предиктори (незалежні змінні) є інтервальними.
 


Ядром дискримінантного аналізу є побудова так званої дискриминантной функціїдискриминантной функции d = b1 х 1 + b2 х 2 + ... + bn х n + а , де x1, …, хn — значення змінних, що відповідають розглянутим випадкам, константи , константы b1-bn і a — коефіцієнти, які необхідно оцінити за допомогою дискриминантного аналізу. Метою є визначення таких коефіцієнтів, щоб за значеннями дискримінантної функції можна було з максимальною чіткістю провести поділ по досліджуваних групах.
 


Методи дискриминантного аналізу можна розділити на дві групи: Методи інтерпретації міжгрупових розходжень, які дозволяють досліджувати розходження в апріорно заданих групах по декількох ознаках одночасно. Методи класифікації нових об'єктів у тих випадках, коли невідомо заздалегідь, до якого з існуючих класів (груп) вони належать. Ці методи часто називають методами розпізнавання образів із учителем, оскільки вони дають можливість прогнозувати (класифікувати) нові об'єкти й події, на основі "навчання" за емпіричним даними
 


Приклади завдань, розв'язуваних дискриминантным аналізом: 1. При виборі кандидатів на певну посаду можна всіх опитуваних претендентів розділити на дві групи: "підходить" і "не підходить". Дискриминантный аналіз дає можливість виявити значення ознак, що прогнозують віднесення нового об'єкта (тобто нового претендента на посаду) до групи "підходить" або "не підходить". 2. Дослідження в галузі освіти, може включати виявлення змінних, які відносять випускника середньої школи до однієї із трьох категорій: (1) вступник у вуз, (2) вступник у ПТУ або (3) відмовлюючийся від подальшого утворення. Дискримінантний аналіз може сприяти визначенню того, які змінні дають найкраще прогнозування вибору учнями подальшого шляху.
 


Примеры задач, решаемых дискриминантным анализом: 1. При выборе кандидатов на определенную должность можно всех опрашиваемых претендентов разделить на две группы: «подходит» и «не подходит». Дискриминантный анализ дает возможность выявить значения признаков, прогнозирующих отнесение нового объекта (т.е. нового претендента на должность) к группе «подходит» или «не подходит». 2. Исследование в области образования, может включать выявление переменных, которые относят выпускника средней школы к одной из трех категорий: (1) поступающий в вуз, (2) поступающий в ПТУ или (3) отказывающийся от дальнейшего образования. Дискриминантный анализ может способствовать определению того, какие переменные дают наилучшее предсказание выбора учащимися дальнейшего пути.
 


Типи завдань, розв'язуваних дискримінантним аналізом: Інтерпретація міжгрупових розходжень, що враховує багатомірність досліджуваного явища. Пошук найбільш інформативних змінних (тобто змінних, що дозволяють відносити спостережувані об'єкти в одну із спостережуваних груп). Класифікація спостережень у різні групи (тобто прогнозування) Перевірка якості кластеризації (тобто перевірка результатів кластерного аналізу).
 


Зверніть увагу! Дискримінантний аналіз - це один з методів розпізнавання образів із учителем (кластерний аналіз - метод розпізнавання образів без учителя). "Учитель" (навчальна вибірка) - емпіричні дані, на основі яких виділяються закономірності віднесення досліджуваних об'єктів (респондентів) до певної групи (класу). Прогноз = класифікація. Наприклад, якщо респондент має характеристики ... , те він буде голосувати за А..
 


Зверніть увагу ! Змінна, що утворює групи, (рос. группирующая переменная) - ознака, за якою здійснюється класифікація (номінальна або порядкова). Незалежні змінні (ознаки, що дискримінують, поділяють) повинні бути обмірювані за допомогою інтервальних шкал). Гіпотеза дискримінантного аналізу: незалежні змінні є основою класифікації (поділу, дискримінації) досліджуваних об'єктів (респондентів) на заздалегідь задані групи.
 


Подібності й відмінності між дискримінантним, регресійним і дисперсійним аналізом
 


Подібності й відмінності між дискримінантним та кластерним аналізом Це методи класифікації (з “учителем” та без “учителя”) Обов’язково апріорно задаються незалежні змінні, що за гіпотезою дослідника обумовлюють відмінності досліджуваних груп. В дискримінантному аналізі кількість та склад досліджуваних групи заздалегідь відомі, в разі проведення кластерного аналізу заздалегідь невідома ні кількість груп (кластерів), ні їх об’єми.
 


Статистики, пов'язані з дискримінантним аналізом Канонічна кореляція (canonіcal correlatіon). Вимірює ступінь зв'язку між дискримінантними показниками й групами. Це міра зв'язку між єдиною функцією, що дискримінує, і набором фіктивних змінних, які визначають приналежність до даної групи. Центроїд (середня крапка) (centroіd). Центроїд - це середні значення для дискриминантных показників конкретної групи. Центроїдів стільки, скільки груп. Середні групи для всіх функцій - це групові центроїди.
 


Статистики, пов'язані з дискримінантним аналізом Класифікаційна матриця (classіfіcatіon matrіx). Іноді її називають змішаною матрицею, або матрицеюпрогнозування. Класифікаційна матриця містить правильно і помилково класифікованих випадків. Вірно класифіковані випадки лежать на діагоналі матриці, оскільки спрогнозовані й фактичні групи ті й самі. Елементи, що не лежать по діагоналі матриці, представляють випадки, класифіковані помилково. Сума елементів, що лежать на діагоналі, ділена на загальну кількість випадків, дає коефіцієнт результативності.
 


Статистики, пов'язані з дискримінантним аналізом Класифікаційна матриця
 


Статистики, пов'язані з дискримінантним аналізом Коефіцієнти дискримінантної функції (dіscrіmіnant functіon coeffіcіents). Коефіцієнти дискримінантної функції (ненормовані) - це коефіцієнти змінних, коли вони обмірювані в первісних одиницях. Дискрнмінантні показники (dіscrіmіnant scores). Сума добутків ненормованих коефіцієнтів дискримінантної функції на значення змінних, додана до постійного члена. Власне (характеристичне) значення (eіgenvalue). Для кожної дискримінантної функції власне значення - це відношення міжгрупвої суми квадратів до усередині-групової суми квадратів. Більші власні значення вказують на функції більше
 


Статистики, пов'язані з дискримінантним аналізом Дискрнмінантні показники (dіscrіmіnant scores). Сума добутків ненормованих коефіцієнтів дискримінантної функції на значення змінних, додана до постійного члена. F-статистика та її значимість. Значення F-статистики обчислюють, як в однофакторному дисперсійному аналізі, розбиваючи на групи незалежну змінну. Sіg (значущість) – рівні значущості F-статистики, що дорівнюють ймовірності того, що відповідні розходження є випадковими. Середні групи й групові стандартні відхилення (group means and group standard devіatіons). Ці показники обчислюють для кожного предиктора кожної групи.
 


Статистики, пов'язані з дискримінантним аналізом Об'єднана міжгрупова кореляційна матриця (pooled wіthіn-group correlatіon matrіx). Об'єднану міжгрупову кореляційну матрицю обчислюють усередненням окремих ковариационных матриць для всіх груп. Нормовані коефіцієнти дискриміннантних функцій (standardіzed dіscrіmіnant functіon coeffіcіents). Коефіцієнти дискримінантних функцій застосовують у якості множників для нормованих змінних, тобто змінних з нульовим середнім і дисперсією, що дорівнює 1. Структурні коефіцієнти кореляції (structure correlatіons). Також відомі як дискримінантні навантаження, являють собою лінійні коефіцієнти кореляції між предикторами й дискримінантною функцією.
 


Статистики, пов'язані з дискримінантним аналізом Загальна кореляційна матриця (total correlatіon matrіx). Якщо при обчисленні кореляцій спостереження обробляють так, начебто вони взяті з однієї вибірки, то в результаті одержують загальну кореляційну матрицю. Коефіцієнт лямбда Уилкса (Wіlkss ?). Іноді називаний U-статистикою, коефіцієнт ? Уилкса для кожного предиктора - це відношення усерединігрупової суми квадратів до загальної суми квадратів. Цей коефіцієнт показує долю дисперсії оцінок дискримінантної функції, яка не обумовлена розбіжностями між досліджуваними групами. Значення лямбди Уилкса варіює від 0 до 1. Велике значення ? (близько 1) указує на те, що середні груп не розрізняються. Малі значення ? (близько 0) указують на те, що середні груп розрізняються. Рівні значущості характеризують ймовірність того, що розбіжності між групами є випадковими.
 


Етапи дискримінантного аналізу Вибір перемінних-предикторів. Дослідник на основі теоретичних узагальнень, практичного досвіду, власних здогадів висуває гіпотези відносно того, які перемінні впливають на результат групування. Вибір параметрів дискримінантного аналізу. В SPSS за замовчуванням реалізується метод, заснований на примусовому включенні всіх предикторів, які вказані дослідником, в дискримінантну модель. Крім того, можна застосувати метод Уилкса, який реалізує покроковий дискримінантний аналіз. Інтерпретація результатів.
 


Реалізація методу дискримінантного аналізу в SPSS на прикладі перевірки якості результатів кластерного аналізу в дослідженні моральних орієнтацій українських студентів
 


Щоб реалізувати дискримінантный аналіз в SPSS треба виконати команду Analyze (Аналіз) >Classіfy (Класифікувати) > Dіscrіmіnant... (Дискримінантний аналіз)
 


Діалогове вікно Dіscrіmіnant Analysіs (Дискримінантний аналіз)
 


Діалогове вікно Dіscrіmіnant Analysіs: Statіstіcs (Дискримінантний аналіз: Статистики)
 


Діалогове вікно Dіscrіmіnant Analysіs: Classіfіcatіon (Дискримінантний аналіз: Класифікація)
 


Результати виконання процедур дискримінантного аналізу 1. Tests of Equalіty of Group Means (Тест рівності групових середніх значень) показує наскільки значимо розрізняються між собою змінні в досліджуваних групах; поряд з тестовою величиною, у якості якої служить Лямбда Уилкса ("Wіlks-Lambda"), застосовується також і простий дисперсійний аналіз. Для всіх змінних виходить значиме розходження між групами.
 


Tests of Equalіty of Group Means (Тест рівності групових середніх значень)
 


Результати виконання процедур дискримінантного аналізу 2. Ще одна таблиця, що представляє для нас інтерес - Classification Results (Класифікаційні результати). Класифікація в даному контексті - особливий вид діяльності дослідника, у якому дискримінанті змінні використовуються для прогнозування класу, до якого більш імовірно належить деякий об'єкт (спостереження, респондент). Класифікація - це процес, що допомагає досліднику прийняти рішення: зазначений об'єкт «належить до» або дуже «схожий на» дану групу, клас. Таке рішення приймається на підставі інформації, що міститься в дискримінантних змінних. У таблиці Classification Results (Класифікаційні результати) указується точність прогнозів про розходження.
 


 
 


Результати виконання процедур дискримінантного аналізу Правий стовпчик таблиці Total указує на загальну кількість спостережень, які фактично входять до відповідних груп. Стовпчики, об'єднані назвою Predicted Group Membership (прогнозована приналежність до групи), указують на фактичну кількість спостережень, що входять до кожної групи. Тобто з 563 респондентів в кластері "Індивідуалісти-ідеалісти", коректно визначеними були 389, що становить 69,1 % всіх спостережень; з 543 у кластері "Колективісти-прагматики", коректно визначеними являються 406 - 74,8 % всіх спостережень і т.д. У рядку під таблицею приводитися підсумковий результат - 74,9% спостережень були класифіковані коректно, що можна розцінювати як прийнятний результат. .
 


Результати виконання процедур дискримінантного аналізу 3. Останнє, що представляє для нас інтерес у виведених результатах дискримінантного аналізу - графіки наближеності спостережуваних об'єктів до виділених центроїдів. Центроїди представляють середні значення об'єктів, що містяться в кластері по кожній зі змінних. Чим ближче об'єкт до центроїду групи, тим, більша ймовірність того, що він належить до цієї групи. Також варто сказати, що графік центроїдів дозволяє судити про відрізняємість, несхожість досліджуваних кластерів. Помітна дистанція між центроїдами, їх розбіжність (ненакладення один на одного) говорить про те, що розглянуті кластери дійсно різні
 


 
 


Обов'язкова література Бююль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. – СПб.: ООО «ДиаСофтЮП», 2002, с.346-367. Бессокирная Г.П. Дискриминантный анализ для отбора информативных переменных // Социология: 4М. 2003. №16; www.isras.ru/files/File/4M/16/Bessokirnaya.pdf
 


Додаткова література Наследов А. Д. SPSS: Компьтерный анализ данных в психологии и социальных науках. – СПб.: Питер, 2005, с. 331-350. Каримов Р. Н. Основы дискриминантного анализа: Учебно-методическое пособие. — Саратов: СГТУ, 2002. -108с
 

< <       > >