Исследование корреляционной зависимости случайных величин, регрессионный анализ.
Заказать уникальную курсовую работу- 20 20 страниц
- 3 + 3 источника
- Добавлена 25.08.2012
- Содержание
- Часть работы
- Список литературы
- Вопросы/Ответы
Введение
1. Теоретические основы корреляционного и регрессионного анализа
2. Практическая часть
2.1 Графическое представление данных.
2.2 Выборочные параметры вариации рядов Х и Y
2.3 Корреляционная таблица
2.4 Графическое представление данных выборки
2.5 Выборочные параметры по сгруппированной выборке
2.6 Вычисление параметров для уравнения линейной регрессии
Заключение
Список источников
Решив эту систему, найдем искомые параметры:
а = -3,869; b = 7,956.
Следовательно, уравнение линейной регрессии Y на X для нашей выборки имеет вид:
y = -3,869x + 7,956.
Видим, что оно очень близко к тому, что было получено непосредственно из рассмотрения диаграммы рассеяния.
Угловой коэффициент прямой линии регрессии Y на X называют выборочным коэффициентом регрессии Y на X и обозначают через :
= а = -3,869x.
Мы нашли наилучший набор параметров а и b. Эта кривая с параметрами, которые определяются методом наименьших квадратов, и будет искомой линией — линией линейной регрессии. Она нанесена на диаграмму рассеяния на Рис. 8.
Необходимо помнить, что эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Искать и строить линию регрессии х = a1 y + b1 не имеет смысла, т.к. при коэффициенте корреляции 1 угол между этими прямыми будет пренебрежимо мал [3, С. 425 – 426].
Рис. 8.
Заключение
При исследовании наличия и тесноты связи между данными случайными величинами были получены следующие результаты:
- на основе визуального анализа диаграммы рассеяния (поля корреляции) сделан вывод о наличии очень сильной связи между ними, практически функциональной в данном диапазоне;
- построена линия тренда ("на глаз") и определена её аналитическая форма, как приближение к расчетной линии регрессии;
- расчетным путем проверена эффективность полученной математической модели, и она оказалась достаточно высокой (в районе 5%);
- определены выборочные параметры вариации на несгруппированных рядах, как смещенные, так и не смещенные; сделан вывод о том, что разброс вариантов Y значительно больше, чем Х, но относительный разброс имеет один порядок величины;
- коэффициент корреляции, как и ожидалось после построения диаграммы рассеивания, оказался очень близок к 1;
- составлены корреляционные таблицы и по ним построены для двух рядов данных полигоны, гистограммы относительных частот, эмпирические функции распределения и кумуляты; они, как и ожидалось, оказались подобной формы; т.е. при подобии формы таких кривых можно ожидать сильную линейную корреляцию между величинами;
- сравнение параметров по сгруппированной и несгруппированной выборками показало, что группирование и приписывание соответствующей частости значения варианты в середине интервала группирования вносят некоторые искажения, но средние квадратичные отклонения остаются практически неизменными;
Вычисление параметров лини регрессии методом наименьших квадратов показало, что в случае такой сильной связи величин, как в данной работе, этот метод дает избыточную точность при достаточно трудоемких вычислениях (имеются в виду "ручные" расчеты).
Список источников
1. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. – М.: Высш. шк., 2003. – 479 с.
2. Теория статистики с основами теории вероятностей. Учеб. пособие для вузов/Под ред. И.И. Елисеевой. – М.: ЮНИТИ-ДАНА, 2001. – 446 с.
3. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. – М.: ЮНИТИ–ДАНА, 2004. – 573 с.
2
-114 -95 -79,8 -60,8 -45,6
1. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. – М.: Высш. шк., 2003. – 479 с.
2. Теория статистики с основами теории вероятностей. Учеб. пособие для вузов/Под ред. И.И. Елисеевой. – М.: ЮНИТИ-ДАНА, 2001. – 446 с.
3. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. – М.: ЮНИТИ–ДАНА, 2004. – 573 с.
Вопрос-ответ:
Что такое корреляционный анализ?
Корреляционный анализ - это метод исследования статистической взаимосвязи между двумя или более случайными величинами.
Какие теоретические основы у корреляционного анализа?
Основы корреляционного анализа базируются на понятии корреляции, коэффициента корреляции и их свойствах. Корреляция - это мера степени линейной зависимости между двумя величинами, а коэффициент корреляции - числовая характеристика этой зависимости.
Какие есть методы графического представления данных в корреляционном анализе?
В корреляционном анализе данные можно представить графически с помощью диаграмм рассеяния, коробчатых диаграмм и графиков.
Как можно определить выборочные параметры вариации рядов?
Выборочные параметры вариации рядов можно определить с помощью таких показателей, как среднее значение, дисперсия, стандартное отклонение, коэффициент вариации и др.
Какие данные можно получить из корреляционной таблицы?
Из корреляционной таблицы можно получить значения коэффициентов корреляции между парами переменных и их статистическую значимость.
Какие теоретические основы лежат в основе корреляционного и регрессионного анализа?
Корреляционный анализ основывается на исследовании связи между двумя или более случайными величинами, позволяя определить, насколько они линейно связаны между собой. Регрессионный анализ, в свою очередь, используется для предсказания значения одной переменной на основе значения другой переменной или нескольких переменных. Оба подхода позволяют определить силу и направление связи между переменными, что может быть полезно для прогнозирования и понимания их взаимодействия.
Какие методы графического представления данных используются в практике корреляционного анализа?
В практике корреляционного анализа используются различные методы графического представления данных. Один из них - это диаграмма рассеяния, которая позволяет визуально оценить наличие и характер связи между двумя переменными. Также часто используются линейные графики, такие как линейные тренды и точечные диаграммы. Эти методы позволяют легко определить наличие связи между переменными и её характеристики.
Какие параметры вариации выборки Х и Y могут быть использованы в корреляционном анализе?
Для оценки вариации выборки Х и Y в корреляционном анализе обычно используются такие параметры, как среднее, дисперсия и стандартное отклонение выборки. Эти параметры позволяют определить степень изменчивости данных и оценить их рассеяние относительно среднего значения. Также могут использоваться квантили или перцентили, которые позволяют определить позицию переменной в выборке относительно других значений.