21년 3월 8일 

코드스테이츠 부트캠프 5일차

Week1 Artificail Intelligence


오늘의 나를 뒤돌아보며,

아직 코드를 입력하는 게 낯설다.

 


5일차 Data Manipulation

 

키워드

  • concat & merge
  • Tidy data

Concat (Concatenate)

데이터를 물리적으로 합치는 것으로 열이나 행이 다르면 결측값으로 표기되며 합쳐진다.

1
df = pd.concat([df1, df2, df3, df4, df5, df6]) #6개의 데이터 합치기
# axis = 0(default)는 열
# axis = 1는 행

cs

 

 

Merge

key를 기준으로 병합한다.

1
df = df1.merge(df2, how, on)
cs

medium.com/swlh/merging-dataframes-with-pandas-pd-merge-7764c7e2d46d

Merging DataFrames with pandas | pd.merge()

링크에 들어가면 Merge를 이해하기 참고할 내용이다.

 

Tidy data

데이터가 원래 특정 분석에 염두에 두고 만들어지는 경우는 거의 없기 때문에 분석할 때 보기 좋게 하기위해서 전처리 과정을 해야한다. 이런 전처리 과정을 줄이기 위해서 표준화한 데이터이다.

 


꼭 기억하고 넘어가야 하는 것

 

★ index번호 있는 열 삭제하는 코드 2가지!

1
2
3
df = df.drop('index', axis=1# index번호 열 삭제
 
df = df.drop(df.columns[0], axis = 1# index번호 열 삭제
cs

 

구글 코랩(colab) 한글 깨짐 현상 해결방법 (순서대로 하면 됨

1
2
3
4
5
6
# 구글 코랩(colab) 한글 깨짐 현상 해결방법
# STEP 1. 나눔 폰트 설치 (Nanum)를 먼저 실행한다.
 
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
cs

나눔 폰트를 설치를 한 후에 코랩(Colab) 런타임을 재시작한다. 

그 후에 아래의 코드를 입력하고 실행하면 된다.ㄴㅁㅇㅁㄴ암니암ㄴ

1
2
3
4
5
6
7
8
# STEP 2. 코랩(Colab) 런타임을 재시작
 
# STEP 3. matplotlib의 폰트를 Nanum 폰트로 지정
 
import matplotlib.pyplot as plt
 
plt.rc('font', family='NanumBarunGothic')
 
cs

'개발 관련자료' 카테고리의 다른 글

chi square test (카이제곱 검정)  (0) 2021.04.01
Hypothesis Test (가설검정)  (0) 2021.03.22
Data Visualize (데이터시각화)  (0) 2021.03.21
Feature Engineering  (0) 2021.03.18
Data Preprocess & EDA  (0) 2021.03.18

+ Recent posts