Корреляционно-регрессионный анализ: области применения, основные этапы

Понятие корреляционно-регрессионного анализа подразумевает проведение ряда операций, а именно: определение тесноты связи, ее направления и установление уравнения, описывающего форму связи. Этот вид анализа содержит две отдельные составляющие: корреляционный и регрессионный анализ.

Значение и основные этапы процесса корреляционно-регрессионного анализа экономических явлений

Корреляционно-регрессионный анализ – это один из способов решения задач и поиска информации. Он позволяет определить совместное влияние множества взаимосвязанных и единовременно действующих признаков, а также отдельное влияние каждого признака на экономическое явление (процесс). Благодаря этому типу анализа можно оценить степень взаимосвязи между несколькими признаками, между признаками и полученным результатом, а также смоделировать уравнение регрессии, описывающие форму взаимосвязи.корреляционно регрессионный анализ

Этапы анализа

Корреляционно-регрессионный анализ экономических процессов разделяется на несколько этапов:

  1. Определение аргументов и предварительная обработка условной информации.
  2. Определение тесноты и формы взаимосвязи между несколькими признаками.
  3. Моделирование представленного экономического процесса и анализ полученной модели.
  4. Применение конечных результатов для усовершенствования планирования и менеджмента модели.

Статистическую однородность информации можно определить с помощью двух приемов. Для начала необходимо определить и откинуть значение факторов, резко отличающихся от всех величин. Потом осуществляется статистическое исследование однородности с помощью проверки независимости выборки и ее принадлежности к единственной совокупности с нормальным распределением.корреляционно регрессионный анализ пример

Модель регрессии определяется через метод наименьших квадратов, благодаря которому обеспечивается самое лучшее приближение оценки результата, определенного через уравнение регрессии, к его факторам.

Корреляционно-регрессионный анализ: параметры созданной модели

Самыми главными факторами, определяющими характеристики модели, принято считать:

  • Коэффициенты парной корреляции (демонстрируют силу взаимосвязи двух факторов).
  • Коэффициент множественной корреляции (определяет взаимосвязь результата и факторов).
  • Коэффициенты частной детерминации (показывают влияние вариации аргумента на вариацию искомого признака).
  • Коэффициент множественной детерминации (показывает удельный вес всех аргументов на вариацию искомого признака).
  • Частные коэффициенты эластичности (характеризуют влияние факторов на результат, выраженное в едином масштабе в процентах).

метод корреляционно регрессионного анализа

Цель анализа

Основные задачи корреляционно-регрессионного анализа – это выявление факторов, существенно влияющих на экономический результат явления или процесса, и использование полученной информации для усовершенствования планирования экономического процесса или явления.

Параметрические методы анализа

Все производственные процессы находятся в тесной взаимосвязи. Эта взаимосвязь бывает стохастической (результат зависит от множества факторов) и функциональной (результат изменяться на такую же величину, как и фактор). Стохастическая зависимость чаще всего имеет корреляционный характер, то есть значению фактора одновременно соответствует несколько значений результата, имеющих абсолютно разные направления.

задачи корреляционно регрессионного анализа

Корреляционная решетка

Корреляционная взаимосвязь может иметь один или несколько факторов-признаков, обладать положительной или отрицательной направленностью, быть прямолинейной или криволинейной (в зависимости от выражения). Определить, к какому именно типу относится связь, можно с помощью корреляционной решетки. Ее строят в пределах прямоугольных осей координат.

Частоты, размещенные близко к диагоналям, свидетельствуют о высокой взаимосвязи признаков. Частоты, размещенные близко к диагонали, проходящей через левый нижний и правый верхний углы, говорят о положительном направлении, а проходящие через верхний левый и правый нижний угол – о противоположном направлении. Частоты, расположенные в форме дуги, свидетельствуют о криволинейной взаимосвязи, а беспорядочно разбросанные – об отсутствии взаимосвязи вообще.

Основной метод корреляционного анализа – это линейный коэффициент корреляции. Он может принимать значение от -1 до +1. Чем ближе значение к 1, тем сильнее связь между фактором и результатом. Положительные значения говорят о прямой взаимосвязи, а отрицательные – об обратной. Коэффициент принимает значение "ноль" в том случае, если между признаками отсутствует взаимосвязь.

корреляционно регрессионный анализ в статистике

Непараметрические методы анализа

Ряд методов позволяет оценить взаимосвязь явлений без количественного выражения признака и, соответственно, параметров распределения. Их называют непараметрическими. Среди них выделяют:

  • Коэффициент ранговой корреляции Кендалла (определяет взаимосвязь количественных и качественных значений показателей, в случае если они подлежат ранжированию).
  • Коэффициент ранговой корреляции Спирмена (присваивает ранги каждому аргументу и результату, на основе которых определяются разности и вычисляется показатель).
  • Коэффициент корреляции знаков Фехнера (определяет количество совпадений и несовпадений отклонений аргументов и результатов от их среднего значения).
  • Еще один немаловажный метод корреляционно-регрессионного анализа — Метод наименьших квадратов, позволяющий определить аналитическое выражение взаимосвязи результативного признака и его фактора. Он заключается в построении системы уравнений и определении параметров этих уравнений.

понятие корреляционно регрессионного анализа

Корреляционно-регрессионный анализ: пример

В статистике и экономике применяются самые разнообразные виды и объекты анализа. Статистические методы анализа направлены на изучение повторяющихся процессов, для того чтобы составить длительные прогнозы поведения экономических явлений.

Например, для того чтобы проанализировать социально-экономическое развитие территории, необходимо изучить показатели уровня жизни населения. Корреляционно-регрессионный анализ в статистике позволяет создать уравнение регрессии и определить коэффициенты корреляции, демонстрирующие взаимосвязь между уровнем жизни и развитием территории. Уровень жизни определяется доходами, а основной источник доходов – зарплата. В таком случае фактором выступает уровень зарплаты, а результатом - численность населения с невысокими доходами.

Программное обеспечение анализа

Для облегчения расчетов можно проводить корреляционный анализ в Excel. В данной программе существует ряд инструментов, помогающих облегчить расчеты. Среди них функция «Корреляция», позволяющая сформировать матрицу из коэффициентов и разных параметров. Она изображается в форме таблицы. В качестве столбцов и строк используются корреляционные коэффициенты. На основе полученных данных таблицы необходимо будет провести корреляционный анализ. Пример последовательности проведения анализа:

  1. В команде «Сервис» выбрать пункт «Анализ данных».
  2. В качестве инструмента анализа выбрать пункт «Корреляция».
  3. В появившемся окне в строке «Входной интервал» указать диапазон анализируемых данных, выбрать пункт «Группировка» в строке «Параметры вывода», ввести диапазон вывода результатов и нажать «ОК».

В результате получится корреляционная матрица, расположенная в диапазоне вывода. Внутри будет указан коэффициент линейной корреляции, оценивающий тесноту и форму связи между показателями.

метод корреляционного анализа

Проведение анализа в Excel

В MS Excel используется функция «Корреляция» для того, чтобы провести корреляционно-регрессионный анализ. Пример расчета коэффициентов рассмотрим далее. Эта функция формирует матрицу с коэффициентами тесноты взаимосвязи между разными параметрами. В итоге формируется квадратная таблица, содержащая коэффициенты корреляции на пересечении строк и столбцов.

Для проведения анализа необходимо будет выполнить ряд определенных действий:

  1. Открыть команду «Сервис», а в ней пункт «Анализ данных».
  2. В появившемся окне указать в перечне «Инструменты анализа» пункт «Корреляция».
  3. В раскрывшемся окне «Корреляция» указать входной интервал в виде диапазона ячеек, содержащих анализируемую информацию (он должен быть не менее двух столбцов), поставить галочку в пункте «Группировка», а в поле «Параметры вывода» выбрать верхнюю левую ячейку, где будет начинаться корреляционная матрица.
  4. Нажать на кнопку ОК.

В результате вычислений появится квадратная таблица с коэффициентами корреляции.

Регрессионный анализ в MS Excel

Для того чтобы вычислить уравнение линейной регрессии, описывающие взаимосвязь между факторами и результатом, в MS Excel применяется статистическая функция «Линейн». Для того чтобы ее использовать, необходимо:

  1. Выделить пустую область, в которую будут выведены результаты анализа.
  2. Открыть «Мастер функций», в нем найти категорию «Статистические», а в ней функцию «Линейн» и нажать ОК.
  3. В поле «Известные значения у» ввести диапазон анализируемых результатов, в поле «Известные значения х» – диапазон анализируемых факторов.
  4. В поле «Константа» указывается присутствие свободного члена уравнения (1 – да, 0 – нет), а в поле «Статистика» – необходимость вывода дополнительных сведений (1 – появится дополнительная информация, 0 – появятся только оценки параметров). По умолчанию можно указывать в обоих полях 1.
  5. Нажать кнопку ОК.

Вверху ранее выделенной области появится начальный элемент таблицы. Для того чтобы раскрыть все данные, необходимо нажать F2, а потом одновременно комбинацию клавиш Ctrl + Shift + Enter.

В итоге регрессионная информация будет изображаться в качестве таблицы из двух столбцов и пяти строк:

Столбец 1

Столбец 2

Строка 1

Коэффициент b

Коэффициент a

Строка 2

Среднеквадратическое отклонение b

Среднеквадратическое отклонение a

Строка 3

Коэффициент детерминации

Среднеквадратическое отклонение y

Строка 4

F-статистика

Число степеней свободы

Строка 5

Регрессионная сумма квадратов

Остаточная сумма квадратов

Полученные результаты необходимо подставить в линейное уравнение регрессии, которое выглядит следующим образом: y = a + bx. В качестве коэффициента a подставляется значение из ячейки на пересечении строки 1 и столбца 2. В качестве коэффициента b – значение на пересечение строки 1 и столбца 1.

Коэффициент детерминации говорит о том, какая часть результата объясняется с помощью исследуемого фактора. Оставшаяся часть результатов определяется факторами, неучтенными в линейной модели.