Рубрики

Сиборн | Участки регрессии

Графики регрессии в морском заливе в первую очередь предназначены для добавления наглядного руководства, которое помогает выделить шаблоны в наборе данных во время анализа поисковых данных. Графики регрессии, как следует из названия, создают линию регрессии между двумя параметрами и помогают визуализировать их линейные отношения. В этой статье рассматриваются такие виды участков в морском заливе и показаны способы, которые можно адаптировать для изменения размера, формата, соотношения и т. Д. Таких участков.

Seaborn — это не только библиотека визуализации, но и поставщик встроенных наборов данных. Здесь мы будем работать с одним из таких наборов данных в seaborn под названием «tips». Набор данных советов содержит информацию о людях, у которых, вероятно, была еда в ресторане, и о том, оставили ли они чаевые или нет. Он также предоставляет информацию о поле людей, курят ли они, день, время и так далее.

Давайте сначала посмотрим на набор данных, прежде чем мы начнем с графиков регрессии.

Загрузить набор данных

# импортировать библиотеку

import seaborn as sns

  
# загрузить набор данных

dataset = sns.load_dataset('tips')

  
# первые пять записей набора данных
dataset.head()

Выход

Теперь давайте начнем с графиков регрессии в морском заливе.
Графики регрессии в seaborn могут быть легко реализованы с помощью функции lmplot (). lmplot () можно понимать как функцию, которая в основном создает линейный график модели. lmplot () создает очень простой график линейной регрессии. Он создает точечный график с линейной подгонкой поверх него.
Простой линейный сюжет

sns.set_style('whitegrid')

sns.lmplot(x ='total_bill', y ='tip', data = dataset)

Выход

объяснение
Параметры x и y задаются для предоставления значений для осей x и y. sns.set_style () используется для создания сетки на заднем плане вместо белого фона по умолчанию. Параметр data используется для указания источника информации для рисования графиков.
Линейный график с дополнительными параметрами

sns.set_style('whitegrid')

sns.lmplot(x ='total_bill', y ='tip', data = dataset, 

           hue ='sex', markers =['o', 'v'])

Выход

объяснение
Чтобы лучше анализировать с помощью этих графиков, мы можем указать оттенок, чтобы иметь категориальное разделение на нашем графике, а также использовать маркеры, которые берутся из символов маркера matplotlib. Поскольку у нас есть две отдельные категории, нам нужно указать список символов при указании маркера.
Установка размера и цвета сюжета

sns.set_style('whitegrid')

sns.lmplot(x ='total_bill', y ='tip', data = dataset, hue ='sex'

           markers =['o', 'v'], scatter_kws ={'s':100}, 

           palette ='plasma')

Выход

объяснение
В этом примере, что делает Seabron, так это то, что он вызывает параметры matplotlib косвенно, чтобы влиять на графики рассеяния. Мы указываем параметр с именем scatter_kws. Следует отметить, что параметр scatter_kws изменяет размер только графиков рассеяния, а не линий регрессии. Линии регрессии остаются нетронутыми. Мы также используем параметр палитры, чтобы изменить цвет графика. Остальные вещи остаются такими же, как описано в первом примере.
Отображение нескольких графиков

sns.lmplot(x ='total_bill', y ='tip', data = dataset, 

           col ='sex', row ='time', hue ='smoker')

Выход

объяснение
В приведенном выше коде мы рисуем несколько графиков, определяя разделение с помощью строк и столбцов. Каждая строка содержит графики советов против общего счета за разное время, указанное в наборе данных. Каждый столбец содержит графики советов по сравнению с общим счетом для разных полов. Дальнейшее разделение выполняется путем указания параметра оттенка на основе того, курит ли человек.
Размер и соотношение сторон участков

sns.lmplot(x ='total_bill', y ='tip', data = dataset, col ='sex'

           row ='time', hue ='smoker', aspect = 0.6

           size = 4, palette ='coolwarm')

Выход

объяснение
Предположим, у нас есть большое количество графиков в выходных данных, нам нужно установить его размер и аспект, чтобы лучше его визуализировать.
aspect: scalar, необязательный параметр указывает соотношение сторон каждого фасета, так что «aspect * height» дает ширину каждого фасета в дюймах.

Рекомендуемые посты:

Сиборн | Участки регрессии

0.00 (0%) 0 votes