Matplotlib과 Seaborn은 워낙 유명한 툴이라 어느 정도 경험이 있었는데, 3주 차에 미니 프로젝트를 하면서 시각화가 정말 중요해서 정리할 필요성을 느꼈습니다.
사실 파라미터나 옵션은 검색하면 바로 뜨기 때문에 뭔지 대충 알 수 있을 정도로만 정리해두시면 좋을 것 같습니다!
.
인공지능 정부 지원 교육을 듣기 전에 시간이 넉넉하다면 컴퓨터과학과 통계학을 공부하는 것을 추천한다.
한 달 정도 남았다면 기본 Python 구문을 완전히 정리하는 것이 좋습니다.
로드 라이브러리
import matplotlib.pyplot as plt
import seaborn as sns
from statsmodels.graphics.mosaicplot import mosaic # 모자이크 플롯
from pandas.plotting import parallel_coordinates # 평행좌표
시각화 설정
plt.rc('font', family='Malgun Gothic')
sns.set(font="Malgun Gothic",
rc={"axes.unicode_minus":False}, # 마이너스 부호 깨짐 현상 해결
style='darkgrid')
다이어그램 그리기의 기초
plt.plot(data('컬럼명1'), data('컬럼명2'))
plt.plot(x = '컬럼명1', y = '컬럼명2', data = df) # 이 방식이 seaborn 과 같고 컬럼명이 적용됨
plt.plot(x, y, color, linestyle, marker)
df.plot(동일) # df에서 바로 plot 메소드 사용 가능
그래픽을 장식하다
plt.figure(figsize=(행인치, 열인치))
fig, ax = plt.subplots(ncols=2, figsize=(15,5))
plt.subplot(행, 열, 인덱스)
plt.title("그래프의 제목")
plt.legend() # 범례 추가
plt.xlabel('x축 범례') # seaborn 은 자동 생성
plt.ylabel('y축 범례') # seaborn 은 자동 생성
plt.grid() # 그래프에 격자 추가
sns.color_palette('hls', length) # color 파라미터에 넣을 인자
plt.tight_layout()
plt.show()
차트 유형
plt.bar()
plt.pie(series, labels, startangle, counterclock, autopct)
plt.hist()
sns.boxplot(x, y, data) # 주식 그래프처럼 생김 (IQR, 1Q, 3Q, border, 이상치)
sns.scatterplot(x, y, data) # 산점도
sns.histplot(series, bins, kde, ax) # 히스토그램
sns.kdeplot(x, y, data) # 커널밀도추정
sns.regplot(x, y, data) # scatterplot + 선형회귀선
sns.jointplot(x, y, data, hue) # scatterplot + histplot(densityplot)
sns.barplot(x, y, data) # 평균과 오차범위 표시
sns.countplot(x, y, data) # 집계 barplot
sns.heatmap(df.corr(), annot, cmap) # df.corr() 대신 grouped_df.pivot('컬럼명1', '컬럼명2')도 가능
sns.pairplot(df, hue="범주형 컬럼명") # scatter + histplot (모든 변수들간의 산점도)
mosaic(df, (컬럼들), gap )
parallel_coordinates(df, '컬럼명, colormap, alpha)