21년 3월 8일
코드스테이츠 부트캠프 5일차
Week1 Artificail Intelligence
오늘의 나를 뒤돌아보며,
아직 코드를 입력하는 게 낯설다.
5일차 Data Manipulation
키워드
- concat & merge
- Tidy data
Concat (Concatenate)
데이터를 물리적으로 합치는 것으로 열이나 행이 다르면 결측값으로 표기되며 합쳐진다.
1
|
df = pd.concat([df1, df2, df3, df4, df5, df6]) #6개의 데이터 합치기
# axis = 0(default)는 열 # axis = 1는 행 |
cs |
Merge
key를 기준으로 병합한다.
1
|
df = df1.merge(df2, how, on)
|
cs |
medium.com/swlh/merging-dataframes-with-pandas-pd-merge-7764c7e2d46d
Merging DataFrames with pandas | pd.merge()
링크에 들어가면 Merge를 이해하기 참고할 내용이다.
Tidy data
데이터가 원래 특정 분석에 염두에 두고 만들어지는 경우는 거의 없기 때문에 분석할 때 보기 좋게 하기위해서 전처리 과정을 해야한다. 이런 전처리 과정을 줄이기 위해서 표준화한 데이터이다.
꼭 기억하고 넘어가야 하는 것
★ index번호 있는 열 삭제하는 코드 2가지!
1
2
3
|
df = df.drop('index', axis=1) # index번호 열 삭제
df = df.drop(df.columns[0], axis = 1) # index번호 열 삭제
|
cs |
★ 구글 코랩(colab) 한글 깨짐 현상 해결방법 (순서대로 하면 됨
1
2
3
4
5
6
|
# 구글 코랩(colab) 한글 깨짐 현상 해결방법
# STEP 1. 나눔 폰트 설치 (Nanum)를 먼저 실행한다.
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
|
cs |
나눔 폰트를 설치를 한 후에 코랩(Colab) 런타임을 재시작한다.
그 후에 아래의 코드를 입력하고 실행하면 된다.ㄴㅁㅇㅁㄴ암니암ㄴ
1
2
3
4
5
6
7
8
|
# STEP 2. 코랩(Colab) 런타임을 재시작
# STEP 3. matplotlib의 폰트를 Nanum 폰트로 지정
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')
|
cs |
'개발 관련자료' 카테고리의 다른 글
chi square test (카이제곱 검정) (0) | 2021.04.01 |
---|---|
Hypothesis Test (가설검정) (0) | 2021.03.22 |
Data Visualize (데이터시각화) (0) | 2021.03.21 |
Feature Engineering (0) | 2021.03.18 |
Data Preprocess & EDA (0) | 2021.03.18 |