KT AIVLE School 2주차

Matplotlib과 Seaborn은 워낙 유명한 툴이라 어느 정도 경험이 있었는데, 3주 차에 미니 프로젝트를 하면서 시각화가 정말 중요해서 정리할 필요성을 느꼈습니다.

사실 파라미터나 옵션은 검색하면 바로 뜨기 때문에 뭔지 대충 알 수 있을 정도로만 정리해두시면 좋을 것 같습니다!
.

인공지능 정부 지원 교육을 듣기 전에 시간이 넉넉하다면 컴퓨터과학과 통계학을 공부하는 것을 추천한다.
한 달 정도 남았다면 기본 Python 구문을 완전히 정리하는 것이 좋습니다.


로드 라이브러리

import matplotlib.pyplot as plt
import seaborn as sns
from statsmodels.graphics.mosaicplot import mosaic # 모자이크 플롯
from pandas.plotting import parallel_coordinates # 평행좌표

시각화 설정

plt.rc('font', family='Malgun Gothic')
sns.set(font="Malgun Gothic",
        rc={"axes.unicode_minus":False}, # 마이너스 부호 깨짐 현상 해결
        style='darkgrid')  

다이어그램 그리기의 기초

plt.plot(data('컬럼명1'), data('컬럼명2'))
plt.plot(x = '컬럼명1', y = '컬럼명2', data = df) # 이 방식이 seaborn 과 같고 컬럼명이 적용됨
plt.plot(x, y, color, linestyle, marker)
df.plot(동일) # df에서 바로 plot 메소드 사용 가능

그래픽을 장식하다

plt.figure(figsize=(행인치, 열인치))

fig, ax = plt.subplots(ncols=2, figsize=(15,5)) 
plt.subplot(행, 열, 인덱스)

plt.title("그래프의 제목")
plt.legend() # 범례 추가
plt.xlabel('x축 범례') # seaborn 은 자동 생성
plt.ylabel('y축 범례') # seaborn 은 자동 생성
plt.grid() # 그래프에 격자 추가

sns.color_palette('hls', length) # color 파라미터에 넣을 인자

plt.tight_layout()
plt.show()

차트 유형

plt.bar()
plt.pie(series, labels, startangle, counterclock, autopct)
plt.hist()


sns.boxplot(x, y, data) # 주식 그래프처럼 생김 (IQR, 1Q, 3Q, border, 이상치)
sns.scatterplot(x, y, data) # 산점도
sns.histplot(series, bins, kde, ax) # 히스토그램

sns.kdeplot(x, y, data) # 커널밀도추정
sns.regplot(x, y, data) # scatterplot + 선형회귀선
sns.jointplot(x, y, data, hue) # scatterplot + histplot(densityplot)

sns.barplot(x, y, data) # 평균과 오차범위 표시
sns.countplot(x, y, data) # 집계 barplot

sns.heatmap(df.corr(), annot, cmap) # df.corr() 대신 grouped_df.pivot('컬럼명1', '컬럼명2')도 가능
sns.pairplot(df, hue="범주형 컬럼명") # scatter + histplot (모든 변수들간의 산점도)

mosaic(df, (컬럼들), gap )
parallel_coordinates(df, '컬럼명, colormap, alpha)