Рубрики

ML | R-квадрат в регрессионном анализе

R-квадрат — это статистическая мера, которая отражает соответствие модели регрессии. Идеальное значение для r-квадрата — 1. Чем ближе значение r-квадрата к 1, тем лучше будет модель.

R-квадрат — это сравнение остаточной суммы квадратов (SS res ) с общей суммой квадратов (SS tot ) . Общая сумма квадратов рассчитывается путем суммирования квадратов перпендикулярного расстояния между точками данных и средней линией.

Остаточная сумма квадратов рассчитывается путем суммирования квадратов перпендикулярного расстояния между точками данных и наиболее подходящей линией.

R квадрат рассчитывается по следующей формуле:

Где SS res — это остаточная сумма квадратов, а SS tot — общая сумма квадратов.

Достоверность подбора регрессионных моделей может быть проанализирована на основе метода R-квадрата. Чем больше значение r-квадрата около 1, тем лучше модель.

Примечание . Значение R-квадрата также может быть отрицательным, если установленная модель хуже средней установленной модели.

Ограничение использования метода R-квадрата —

  • Значение r-квадрата всегда увеличивается или остается таким же, когда новые переменные добавляются в модель, без определения значимости этой новой добавленной переменной (т. Е. Значение r-квадрата никогда не уменьшается при добавлении новых атрибутов в модель). В результате, незначительные атрибуты также могут быть добавлены в модель с увеличением значения r-квадрата.
  • Это связано с тем, что SS tot всегда постоянен, и регрессионная модель пытается уменьшить значение SS res , находя некоторую корреляцию с этим новым атрибутом и, следовательно, общее значение r-квадрата увеличивается, что может привести к плохой модели регрессии.

Рекомендуемые посты:

ML | R-квадрат в регрессионном анализе

0.00 (0%) 0 votes