본문 바로가기
파이썬/판다스, 넘파이

파이썬 기초 판다스 데이터 프레임 합치기-concat(), merge()

by 큰고양2 2023. 8. 27.

concat()

 

pd.concat([데이터프레임1, 데이터프레임2], join = 'inner' , axis=1)

형태로 데이터 프레임을 합친다

데이터프레임은 한 개가 아니라 여러개를 합치는 것도 가능하다

join 옵션은 inner와 outer를 선택 할 수 있는데

inner를 선택하는 경우 인덱스가 같은 값만 합쳐지며 나머지 값은 그냥 버린다

outer을 사용해 합치는 경우 인덱스가 비어있는 곳은 결측치가 된다

 

axis옵션으로 축을 선택 할 수 있는데 0으로 지정하면

열 이름을 인덱스로 세로로 합치고 1로 지정하면 인덱스를 기준으로 합치게 된다

 

merge()

pd.merge( 데이터프레임1, 데이터프레임2, on= ‘기준열’ , how=’inner’)

형태로 사용한다

concat과는 다르게 세로로 합칠 수는 없지만 인덱스를 직접 열로 지정하여 합칠 수 있다는 장점이 있다

how 옵션은

left와 right, outer, inner을 사용 할 수 있다

 

집합으로 이해하자면

left는 A와 B에서 A에 해당하는 열들 기준으로 값을 가져오고 right는 B에 해당하는 열 기준으로 값을 가져온다

inner은 교집합으로 이해하면 되고

outer는 합집합이다