Аналіз даних та моделювання взаємозв'язку в R. R-аналіз, або прийнятність критеріальних підходів Лабораторні роботи r аналіз даних

Аналіз даних у середовищі R

Інститут обчислювальної математики та інформаційних технологій, кафедра аналізу даних та дослідження операцій


Напрям
: 01.03.02 "Прикладна математика та інформатика. Системне програмування" (бакалаврат, 3 курс)

Дисципліна: "Аналіз даних у середовищі R"

Навчальний план: "Очне навчання, 2017 р."

Кількість годин: 90 (у тому числі: лекції – 18, лабораторні заняття – 36, самостійна робота – 36); форма контролю – залік.

Напрям: 38.03.05 "Бізнес інформатика" (бакалаврат, 4 курс)

Дисципліна: "Аналіз даних"

Навчальний план: "Очне навчання, 2018 р."

Кількість годин: 78 (у тому числі: лекції – 18, лабораторні заняття – 36, самостійна робота – 24); форма контролю – залік.


Ключові слова
: Data Mining, Machine Learning, regression, classification, clusterization, support vector, SVM, artificial neutron, neural network, recommendation system, аналіз даних, машинне навчання, модель, вибірка, змінна відгуки, навчання вибірки, перенавчання вибірки, навчання з учителем, навчання без вчителя, пакет R, мова програмування R, статистика, випадкова величина, с.в., закон розподілу, нормальний розподіл, вибірка, статистика, метод максимальної правдоподібності, розподіл Хі-квадрат, розподіл Стьюдента, розподіл Фішера, гіпотеза, область прийняття гіпотези , рівень значущості, помилки першого та другого роду, порівняння вибірок, критерії згоди, таблиця сполученості ознак, кореляція, регресія, лінійна регресія, нелінійна регресія, фактор, предиктор, однофакторна регресія, множинна регресія, класифікація, рег. підхід, наївний Байєс, метод опорних векторів, розділяюча гіперплощина, дерева рішень, нейронна мережа, нейрон, функція активації, рекомендаційна система, кластеризація, функціонал якості.

Теми: 1. Середовище розробки R: відомості з історії. встановлення та запуск пакету. 2. Програмуємо у R. перші кроки. 3. Побудова графіків серед R. 4. Введення даних і з файлами серед R. 4.1. Робота з одновимірними масивами даних. 4.2. Робота з матрицями та таблицями даних. 5. Перевірка статистичних гіпотез серед R. 5.1. Перевірка гіпотези про закон розподілу ймовірностей довільної величини (критерій Хі-квадрат Пірсона). 5.2. Перевірка гіпотези про незалежність ознак із якісним угрупованням (критерій Хі-квадрат Пірсона). 5.3. Перевірка гіпотези про рівність математичних очікувань нормальних генеральних сукупностей (критерій Стьюдента). 5.4. Перевірка гіпотези про рівність дисперсії нормальних генеральних сукупностей (критерій Фішера). 6. Завдання побудови моделі однофакторної лінійної регресії. Прогнозування. 7. Завдання багатожественної лінійної регресії. 7.1. Завдання однофакторної лінійної регресії як окремий випадок множинної регресії. 7.2. Дослідження залежності змінної відгуку від фактора в регресійній моделі. 8. Завдання класифікації, підходи до її вирішення. 8.1. Логістична регресія. 8.2. Лінійний дискримінантний аналіз. 8.3. Дерева рішень - принцип "поділяй і володарюй" ("divide and con-quer"). 9. Нейронні мережі (neural networks) та їх застосування у машинному навчанні. 10. Опорні вектори, метод опорних векторів ("support vector machines", SVM) у машинному навчанні. 11. Рекомендаційні системи ("recommendation system"), їх призначення, побудова, застосування. 12. Спеціальні завдання машинного навчання.


Дата початку експлуатації: 1 вересня 2014 року
  • Місаров Мукадас Дмухтасібович, зав. кафедрою аналізу даних та дослідження операцій КФУ, д.ф.-м.н., професор, email: [email protected]
  • Кашина Ольга Андріївна, к.ф.-м.н., доцент кафедри аналізу даних та дослідження операцій, email: [email protected]

Досить часто виробничі процеси вимагають контролю не пов'язаного з вимірами. Причин тому багато, наприклад, визначення параметрів, які неможливо виміряти або вимірювальне обладнання занадто дороге, в той же час параметри можуть бути легко визначені людиною з певним ступенем підготовки.

Уявіть, що ви купуєте звичайні чорні туфлі. Ви визначилися з моделлю, приміряли пару – вона вам підійшла. На що ще Ви звернете увагу перед покупкою?

  • Ймовірно, ви захочете, щоб туфлі були рівномірно забарвлені;
  • Щоб колір правої туфлі відповідав кольору лівого;
  • Щоб на видимій частині були відсутні грубі подряпини;
  • Щоб прошивка підошви була рівною;

Навіть якщо уявити, що існують автоматичні пристрої контролю якості туфель, що оцінюють усі зазначені пункти, швидше за все їхня вартість призвела б до значного подорожчання продукції. З іншого боку, якщо кінцевий покупець оцінює якість туфель "на око", то цілком логічно було б впровадити імітацію такого контролю на підприємстві, причому це цілком могло б замінити з десяток дорогих пристроїв, що оцінюють перелічені вище критерії. У цьому прикладі, контролер, що оцінює якість виготовлених туфель може виступати в ролі вимірювальної системи.

Але не слід забувати про підготовку такого працівника і деякі початкові умови, якими він повинен керуватися. Без цього кожен контролер буде судити про якість продукції, ґрунтуючись на особистих міркуваннях та почуттях. Оцінити, наскільки добре контролер виконує роботу вимірювальної системи, дає можливість атрибутивний Gage R&R.

Атрибутивний Gage R&R або Attribute Agreement Analysis спеціально розроблений для оцінки вимірювальних систем, які виключають використання вимірювального інструменту, коли оператори самі визначають якість виробів візуально або за певним критерієм (відсутність грубих подряпин на видимій частині туфель). Само собою, що числову характеристику таким вимірам привласнити неможливо. Натомість виробам, що перевіряються, надають атрибут: "хороший"-"поганий", "годний"-"не придатний" і т.д. Даний вид аналізу може бути використаний також для градуювальної оцінки: "відмінно"-"добре"-"задовільно"-"незадовільно" або ж для оцінки наявності та кількості дефектів.

Мета аналізу полягає в оцінці близькості суджень операторів до стандарту та збіжності суджень операторів (згідно з попереднім судженням). Результат аналізу, таким чином, вказуватиме, наскільки близькі результати вимірювальної системи до стандартних критеріїв і наскільки оператори згодні зі своїми судженнями, тобто. чи можна довіряти міркуванням контролерів.

Приклади, для яких можна застосувати атрибутивний аналіз Gage R&R:

  • Хорошим прикладом може бути виробничий процес виготовлення контактних лінз. Будь-яке оптичне тіло так чи інакше містить певну кількість аберацій, але не всі з них видно людському оку. Кожна лінза проходить вихідний контроль якості: оператор-контролер візуально оцінює наявність дефектів/забруднень за допомогою потужного збільшувального скла та спеціального підсвічування. Атрибутивний Gage R&R може бути застосований для визначення, наскільки добре контролер може відрізнити дефекти лінз від забруднень розчину перевірки.
  • Іншим прикладом може бути перевірочний контроль цілісності таблеток на фармацевтичному підприємстві. Контроль цілісності також проводиться людиною під час огляду блістера, що містить до 2000 таблеток. Вимірюваннями в даному випадку є наявність дефектів або дефектних виробів у зразку.

У прикладі з таблетками оператор може представляти судження в бінарній формі: "проходить"-"не проходить", але, зважаючи на специфіку зразка, відповіді можна надавати і в іншому вигляді. Наприклад, до 2 пошкоджених таблеток - "відмінно", до 5 - "задовільно", до 20 - "незадовільно", вище 20 - "критично" або оцінювати за шкалою від 1 до 5.

Розглянемо проведення аналізу атрибутивного Gage R&R у статистичному пакеті Minitab на прикладі контролю якості таблеток.

У ході аналізу оцінювалися три оператори, які перевіряли 20 таблеток двічі. Атрибути таблеток були визначені за стандартними критеріями на наявність тріщин та інших ушкоджень.

Для проведення Attribute Agreement Analysis(атрибутивного Gage R&R), виберіть Stat > Quality Tools > Attribute Agreement Analysis:

Мал. 1: Вікно конфігурації Attribute Agreement Analysis

У діалоговому вікні програми визначте колонки, що вказують операторів, зразки та результати вимірювань – атрибути, як показано в діапазоні 1. За умовою завдання правильні атрибути зразків були відомі – у цьому випадку слід внести стовпчик “Standard” у поле “Known standard attribute”, як показано в діапазоні 2.

    Аналіз можна проводити і без свідомо відомих атрибутів зразків або ж не повторюючи експеримент двічі. У першому випадку не буде визначено, наскільки близькі судження операторів до стандарту, а в другому – наскільки оператори впевнені у своїх судженнях.

Натисніть “OK”, щоб отримати результати аналізу:


Рис 2: Результати аналізу у графічному вигляді

Діаграма Within Appraiser відображає відсоток згоди операторів із попередніми судженнями. Діаграма буде відображена лише в тому випадку, якщо кожен оператор оцінив зразок два або більше разів, тобто якщо доступні дані для порівняння. У даному випадку, оператор А впевнений у своїх судженнях на 85%, хоча довірчий інтервал лежить в межах від 60 до 97%. Чим вище збіжність суджень оператора, тим менше варіації він вносить результати спостережень.

Діаграма Appraiser vs Standard показує, наскільки близькі відповіді операторів до правильних атрибутів зразків. Навіть незважаючи на те, що оператор А впевнений у своїх судженнях на 85%, його відповіді є вірними лише у 70% випадках.

У розглянутому прикладі, тільки оператор має достатню кваліфікацію контролю якості продукції: збіжність суджень і близькість до стандарту становить 95%, тобто. його внесок у варіацію спостережень 5%.

Результати аналізу у вікні Session дають трохи чіткіше уявлення про те, як оператори впоралися зі своєю роботою:


Мал. 3: результати Attribute Agreement Analysis

Таблиця Within Appraisers вихідні дані діаграми Within Appraisers, і навіть таблицю коефіцієнтів каппа. Каппа коефіцієнти вказують, наскільки оператори статистично впевнені у своїх рішеннях. При каппа рівним 0, можна зробити висновок, що оператор не впевнений у своїх судженнях, його вибір нагадує лотерею або підкидання монетки в повітря. Каппа 1 означає, що оператор на 100% упевнений у своїх судженнях, відповідно, при коефіцієнті -1 – оператор повністю не впевнений і щоразу надає зразку новий атрибут. Зважаючи на рекомендації посібника з аналізу вимірювальних систем AIAG, достатнім для визнання вимірювальної системи придатною є коефіцієнт 0,75. Значення 0,4 або нижче свідчить про непридатність вимірювальної системи.

Значення ймовірності (P-value) оцінюється для гіпотез:

    H 0: оператори не згодні зі своїми рішеннями;
    H α: оператори погоджуються зі своїми судженнями.

Значення каппа та ймовірності є основними в оцінці вимірювальних систем за допомогою атрибутивного Gage R&R. Розглядаючи отримані результати, можна зробити висновок, що виходячи з каппа рівному 0,48 і значення ймовірності 0,0158 оператор впевнений у своїх рішеннях, але така вимірювальна система не прийнятна для критичних ділянок контролю.


Мал. 4: результати Attribute Agreement Analysis

Розглядаючи коефіцієнти каппа в таблиці аналізу Each Appraiser vs Standard, можна зробити висновок, що оператори А і В слабо орієнтуються в умовах оцінки, але оператор С досить добре володіє критеріями якості виробів. Таблиця Assessment Disagreement відображає пункти, в яких думка операторів відмінна від стандарту. Наприклад, оператор А визнав 3 блістери з таблетками придатними, тоді як критерії стандарту свідчать про їхню непридатність. Також оператор А тричі показав різні результати за першої та другої спроб, тобто. спочатку визначив виріб як придатний, а при другій спробі змінив судження. Оператор Тричі відхилив якісні вироби і також тричі змінив свою думку. Оператор З усього лише раз змінив свою думку щодо атрибуту зразка.

Результати таблиці Between Appraiser ілюструють, наскільки оператори загалом відтворюють свої судження, тобто. наскільки вони згодні між собою, не зважаючи на справжні атрибути. Згода між операторами аж ніяк не означає правильності суджень.


Мал. 5: таблиці результатів Between Appraisers та Appraiser vs Standard

Таблиця All Appraisers vs Standard, відповідно, відображає, наскільки судження всіх операторів подібні до вірних атрибутів, тобто. наскільки оператори загалом згодні зі стандартом. Як і попередньому випадку, згоду зі стандартом означає згоду між операторами.

Таблиці Kappa Statistics показує, що у обох випадках коефіцієнт каппа нижче 0,75. Показання операторів як єдиної групи статистично малозначущі. Згода операторів загалом з атрибутами стандарту трохи вища, але все ж таки недостатньо. Високий коефіцієнт згоди зі стандартом щодо згоди між операторами спричинений високим коефіцієнтом згоди зі стандартом оператора С.

Резюме

  • У цілому нині, використання аналізованої вимірювальної системи пов'язані з низкою труднощів. Оператор А допускає дуже багато помилок, у результаті непридатна продукція визнається якісною. У той же час оператор В оцінює продукцію надто критично, що призводить до відхилення придатних виробів.
  • Оператор С показав як близькість суджень до стандартних і впевненість у них.
  • З вище сказаного випливає, що операторам А та В необхідне додаткове навчання чи практика.

У цьому прикладі спостерігається дуже широкий довірчий інтервал. що приносить певну невизначеність результатам аналізу. Для зменшення діапазону можна провести повторне дослідження з великою кількістю зразків.

Вступ

Насамперед, давайте обговоримо термінологію. Йдеться про область, яка в західній літературі називається Data Mining, а російською мовою частіше перекладається як «аналіз даних». Термін не зовсім вдалий, оскільки слово «аналіз» у математиці досить звичне, має усталене значення і входить у назву багатьох класичних розділів: математичний аналіз, функціональний аналіз, опуклий аналіз, нестандартний аналіз, багатовимірний комплексний аналіз, дискретний аналіз, стохастичний аналіз, квантовий аналіз і т.д. У всіх перелічених галузях науки вивчається математичний апарат, який базується на деяких фундаментальних результатах і дозволяє вирішувати завдання цих областей. В аналізі даних ситуація набагато складніша. Це, перш за все, прикладна наука, в якій математичного апарату немає, в тому сенсі, що немає кінцевого набору базових фактів, з яких слід вирішувати завдання. Багато завдань «індивідуальні», і зараз з'являються нові і нові класи завдань, під які необхідно розробляти математичний апарат. Тут ще більшу роль відіграє той факт, що аналіз даних щодо нового напряму в науці.

Далі треба пояснити, що таке «аналіз даних». Я назвав це "областю", але областю чого? Тут починається найцікавіше, оскільки це не лише галузь науки. Справжній аналітик вирішує, перш за все, прикладні завдання та націлений на практику. З іншого боку, аналізувати дані доводиться економіки, біології, соціології, психології тощо. Рішення

нових завдань, як я вже сказав, вимагає винаходи нових технік (це не завжди теорії, а й прийоми, способи тощо), тому деякі кажуть, що аналіз даних це також мистецтво та ремесло.

У прикладних областях найважливіше – це практика! Неможливо уявити хірурга, який не зробив жодної операції. Власне, це й не хірург. Також аналітик даних може обійтися без вирішення реальних прикладних завдань. Чим більше таких завдань ви самостійно вирішите, тим кваліфікованішими фахівцями ви станете.

По-перше, аналіз даних це практика, практика та ще раз практика. Треба вирішувати реальні завдання, багато з різних областей. Оскільки, наприклад, класифікація сигналів і текстів дві абсолютно різні області. Фахівці, які з легкістю збудують алгоритм діагностики двигуна на основі сигналів датчиків, можливо, не зможуть зробити найпростіший спам-фільтр для електронних листів. Але дуже бажано отримати базові навички під час роботи з різними об'єктами: сигналами, текстами, зображеннями, графами, ознаковими описами тощо. Крім того, це дозволить вам вибрати завдання до душі.

По-друге, важливо грамотно вибрати собі навчальні курси та наставників.

У в принципі, можна всьому навчитися самому. Адже ми не маємо справу з областю, де єякісь секрети, що передаються з вуст до уст. Навпаки, є багато грамотних навчальних курсів, вихідних програм та даних. Крім того, дуже корисно, коли одне завдання вирішують кілька людей паралельно. Справа в тому, що при вирішенні таких завдань доводиться стикатися з специфічним програмуванням. Допустимо, ваш алгоритм

видав 89% вірних відповідей. Запитання: багато це чи мало? Якщо мало, то в чому річ: ви неправильно запрограмували алгоритм, вибрали неправильні параметри алгоритму чи сам алгоритм поганий і не підходить для вирішення цього завдання? Якщо робота дублюється, то помилки у програмі та неправильні параметри вдається швидко знайти. А якщо вона дублюється фахівцем, то питання оцінки результату та прийнятності моделі теж вирішуються швидко.

По-третє, корисно запам'ятати, що вирішення завдання аналізу даних потрібно багато часу.

Статистика

Аналіз даних у R

1. Змінні

У R, як і в інших мовах програмування, існують змінні. Що таке змінна? По суті, це адреса, за допомогою якої ми можемо знайтиякісь дані, які ми зберігаємо у пам'яті.

Змінні складаються з лівої та правої частини, розділених оператором присвоєння. У R оператором присвоювання є конструкція “<-”, если название переменной находится слева, а значение, которое сохраняется в памяти - справа, и она аналогична “=” в других языках программирования. В отличии от других языков программирования, хранимое значение может находиться слева от оператора присваивания, а имя переменной - справа. В таком случае, как можно догадаться, оператор присваивания примет конструкцию следующего вида: “->”.

У Залежно від збережених даних, змінні можуть бути різного типу: цілими, речовими, рядковими. Наприклад:

my.var1<- 42 my.var2 <- 35.25

В даному випадку змінна my.var1 буде цілою чисельністю типу, а my.var2 - речовинного.

Як і в інших мовах програмування, зі змінними можна виконувати різні арифметичні операції.

my.var1 + my.var2 - 12

my.var3<- my.var1^2 + my.var2^2

Крім арифметичних операцій можна виконувати логічні операції, тобто операції порівняння.

my.var3 > 200 my.var3 > 3009 my.var1 == my.var2 my.var1 != my.var2 my.var3 >= 200 my.var3<= 200

Результатом логічної операції буде правдиве (TRUE) чи хибне (FALSE) висловлювання. Також можна виконувати логічні операції як між змінної з якимось значенням, а й з інший змінної.

my.new.var<- my.var1 == my.var2

Цільпроведення тренінгу «Аналіз даних та моделювання взаємозв'язку в пакеті R» –вивчити базові можливості програми R – безкоштовної мови програмування щодо статистичних обчислень, і навіть навчитися організовувати введення даних і управляти ними, проводити первинний статистичний аналіз даних, представляти в графічному вигляді, вміти знаходити взаємозв'язку у даних. Навчання розраховане на слухачів без досвіду роботи у R або з початковими знаннями пакета.

Слухачам бажано мати навички програмування та бути знайомим із основами статистичного аналізу.

Після закінчення навчання Ви вмітимете в програмі R:

  • Правильно формувати вибірку даних для аналізу
  • Організовувати введення даних та керувати даними
  • Виконувати описовий статистичний аналіз
  • Вивчати взаємозв'язок у таблицях сполученості
  • Перевіряти статистичні гіпотези про рівність середніх
  • Використовувати графічні можливості
  • Проводити кореляційний аналіз
  • Проводити регресійний аналіз
  • Проводити дисперсійний аналіз

Тривалість тренінгу: 32 ак. чи 4 дні.

Програма навчання:

Тема 1. Основні поняття статистичного аналізу даних – 2 ак.

  • Статистичне дослідження
  • Способи отримання даних
  • Відмінність спостереження від експерименту
  • Генеральна сукупність та вибірка
  • Вимоги до даних при формуванні вибірки
  • Поняття точкової та інтервальної статистичної оцінки
  • Ознаки та змінні
  • Шкали вимірювання змінних
  • Напрями аналіз статистичних даних
  • Описова та аналітична статистика
  • Вибір методів статистичного аналізу залежно від шкал вимірювання змінних
  • Статистична гіпотеза
  • Види статистичних помилок
  • Принципи перевірки статистичних гіпотез
  • Вибір рівня значущості під час перевірки гіпотез

Тема 2. Введення у роботу серед R – 2 ак.ч.

  • Особливості роботи з R
  • Встановлення програми
  • Запуск програми
  • Середовище R
  • Інтерфейс командного рядка та діалогових вікон
  • Правила завдання команд
  • Створення робочої директорії
  • Пакети
  • Графічні інтерфейси
  • R як калькулятор
  • Довідкова система

Тема 3. Основи програмування у R – 2 ак.ч.

  • Види об'єктів у R
  • Вектор
  • Списки
  • Матриці
  • Чинники
  • Таблиці даних
  • Вирази
  • Оператори доступу до даних
  • Функції та аргументи
  • Цикли та умовні оператори
  • Управління базами даних у R
  • Векторизація операцій
  • Налагодження
  • Об'єктно-орієнтоване програмування

Тема 4. Введення та організація даних у R – 2 ак.ч.

  • Способи завантаження даних
  • Безпосереднє введення даних
  • Введення даних у таблиці
  • Імпорт даних із MS Excel
  • Імпорт даних з інших статистичних пакетів та баз даних
  • Збереження результатів аналізу
  • Завдання кількісних даних
  • Завдання порядкових та номінальних даних
  • Завдання пропущених значень даних
  • Виявлення викидів та помилок
  • Принципи перетворення даних

Тема 5. Графічні можливості R – 2 ак.

  • Графічні функції
  • Графічні пристрої
  • Графічні параметри
  • Інтерактивна графіка
  • Складові зображення
  • Пристрої виведення

Тема 6. Описовий статистичний аналіз у R – 4 ак.

  • Статистики центральної тенденції
  • Середня арифметична
  • Модальне значення
  • Медіанне значення
  • Статистики розкиду
  • Дисперсія та стандартне відхилення
  • Коефіцієнт варіації
  • Відсотку
  • Гістограми
  • Скринькові діаграми
  • Z-перетворення
  • Нормальний закон розподілу
  • Асиметрія та ексцес
  • Перевірка розподілу на нормальність
  • Деякі закони розподілу
  • Біноміальний розподіл
  • Розподіл Пуассона
  • Рівномірний розподіл
  • Експонентний розподіл
  • Логнормальний розподіл
  • Стандартна помилка та інтервал для середньої

Тема 7. Формування даних для аналізу вибірковим методом – 2 ак.

  • Генеральна та вибіркова сукупність
  • Характеристики вибірки
  • Особливості вибіркового методу дослідження
  • Класифікація вибірок
  • Види та методи ймовірнісного відбору
  • Способи формування вибірок
  • Простий випадковий відбір
  • Систематичний випадковий відбір
  • Кластерний відбір
  • Одноступінчастий кластерний відбір
  • Багатоступінчастий кластерний відбір
  • Алгоритм проведення вибіркових обстежень
  • Визначення необхідного обсягу вибірки

Тема 8. Статистичні тести виявлення відмінностей у вибірках R – 4 ак.ч.

  • Гіпотези про порівняння середніх
  • Z-критерій для порівняння середніх
  • Z-критерій для порівняння часток
  • Одновибраковий t-критерій
  • T-критерій для незалежних вибірок
  • T-критерій для залежних вибірок
  • Умови застосування непараметричних критеріїв
  • Одновибірковий критерій знакових рангів Вілкоксону
  • Критерій Манна-Уітні
  • Критерій знаків для пов'язаних вибірок
  • Критерій знаків Вілкоксону для пов'язаних вибірок
  • Непараметричний дисперсійний аналіз Крускала-Уолліса
  • Критерій Фрідмана для залежних вибірок

Тема 9. Оцінка взаємозв'язку між змінними R – 4 ак.ч.

  • Аналіз взаємозв'язку між категоріальними змінними
  • Таблиці сполученості
  • Очікувані частоти та залишки в таблицях сполученості
  • Критерій хі-квадрат
  • Критерій згоди
  • Класифікація видів взаємозв'язку між кількісними змінними
  • Діаграми розсіювання
  • Передумови та умови проведення кореляційного аналізу
  • Коефіцієнт кореляції Пірсона
  • Рангові коефіцієнти кореляції
  • Коефіцієнт кореляції Спірмена
  • Перевірка значущості зв'язку
  • Інтервальні оцінки коефіцієнтів кореляції
  • Приватні коефіцієнти кореляції

Тема 10. Моделювання форми зв'язку за допомогою регресійного аналізу в R-4 ак.

  • Основні поняття регресійного аналізу
  • Парна та множинна лінійна модель регресії
  • Передумови лінійного регресійного аналізу
  • Оцінка коефіцієнтів регресії
  • Перевірка обґрунтованості моделі регресії
  • Значущість рівняння регресії
  • Значимість коефіцієнтів регресії
  • Відбір змінних у регресійному аналізі
  • Оцінка точності рівняння регресії
  • Оцінка статистичної стійкості рівняння регресії
  • Точкова та інтервальна оцінка залежної змінної
  • Нелінійні регресійні моделі
  • Категоріальні незалежні змінні моделі регресії

Тема 11. Моделювання взаємозв'язку за допомогою дисперсійного аналізу у R-4 ак.ч.

  • Моделі дисперсійного аналізу
  • Передумови застосування дисперсійного аналізу
  • Перевірка гіпотези про рівність дисперсій
  • Модель однофакторного дисперсійного аналізу
  • Таблиця однофакторного дисперсійного аналізу
  • Оцінка ступеня впливу фактора
  • Апостеріорні критерії парних порівнянь
  • Дисперсійний аналіз із двома та більше факторами
  • Таблиця двофакторного дисперсійного аналізу із взаємодією
  • Графічна інтерпретація взаємодії факторів
  • Аналіз багатофакторної моделі