Barcharts: гистограммы хорошо использовать, когда у вас есть две переменные, одна из которых числовая, а другая может быть категориальной переменной. бар-плот может показать отношения между ними.
Сгруппированная гистограмма: Сгруппированная гистограмма полезна, когда у вас есть несколько категориальных переменных. Библиотека построения графиков Python Seaborn позволяет легко формировать сгруппированные гистограммы.
Groupby: функция Pandas dataframe.groupby() используется для разделения данных на группы на основе некоторых критериев. Объекты Pandas можно разделить по любой из их осей. Абстрактное определение группировки состоит в том, чтобы обеспечить сопоставление меток с именами групп.
(.env) boris@boris-All-Series:~/GROUPBY$ cat groupBySea.py
import seaborn as sb
import matplotlib.pyplot as plt
# load dataset
df = sb.load_dataset('tips')
print(df)
print(df.info())
# perform groupby
df = df.groupby(['size', 'day']).agg(mean_total_bill=("total_bill", 'mean'))
df = df.reset_index()
# plot barplot
sb.barplot(x="size",
y="mean_total_bill",
hue="day",
data=df)
plt.show()
(.env) boris@boris-All-Series:~/GROUPBY$ cat groupBySea1.py
import seaborn as sb
import matplotlib.pyplot as plt
# load dataset
df = sb.load_dataset('anagrams')
print(df)
print(df.info())
# perform groupby
df = df.groupby(['num1', 'attnr']).agg(mean_num3=("num3", 'mean'))
df = df.reset_index()
# plot barplot
sb.barplot(x="num1",
y="mean_num3",
hue="attnr",
data=df)
plt.show()
No comments:
Post a Comment