Jay's Cookbook
Menu
  • Tags
  • Categories
  • Projects
Computer Science
OS
Network
Data Structure
Algorithm
Language
Code Architecture
Python
Javascript
Typescript
Java
Backend
Backend Theory
TypeORM
Node.js
NestJS
FastAPI
Frontend
HTML/CSS
React
Next.js
Data Engineering
DE Theory
MySQL
MongoDB
Elastic
Redis
Kafka
Spark
Airflow
AI
Basic
Pytorch
NLP
Computer Vision
Data Analytics
Statistics
Pandas
Matplotlib
DevOps
Git
Docker
Kubernetes
AWS
Pandas Series [Part6] 판다스 조인
data_analytics
pandas

Pandas Series [Part6] 판다스 조인

Jay Kim
Jay Kim 20 Jan 2022
Pandas Series [Part5] 판다스 그루핑 Pandas Series [Part7] 판다스 시계열 데이터

Table of Contents

  • 컬럼에 대해 조인

df1 = pd.DataFrame([['A0', 'B0'], ['A1', 'B1'], ['A2', 'B2']], 
                   columns=['A', 'B'], 
                   index=['K0', 'K1', 'K2'])

df2 = pd.DataFrame([['C0', 'D0'], ['C2', 'D2'], ['C3', 'D3']], 
                   columns=['C', 'D'], 
                   index=['K0', 'K2', 'K3'])

df1
df2

# 기본적으로 left join
df1.join(df2)

# how='inner'
df1.join(df2, how='inner')

# how='outer'
df1.join(df2, how='outer')

컬럼에 대해 조인

  • join 을 사용할 때: 드리븐(driven) 데이터프레임(=df2) 의 인덱스를 조인하려는 컬럼으로 바꿔야 한다
df1 = pd.DataFrame([['A0', 'B0'], ['A1', 'B1'], ['A2', 'B2']], 
                   columns=['A', 'B'], 
                   index=['K0', 'K1', 'K2'])

df2 = pd.DataFrame([['B0', 'C0'], ['B2', 'C2'], ['B3', 'C3']], 
                   columns=['B', 'C'], 
                   index=['K0', 'K2', 'K3'])

df1
df2

# 컬럼에 대해 조인하려면 드리븐(driven) 데이터프레임(=df2) 의 인덱스를 조인하려는 컬럼으로 바꿔야 한다
df2.set_index('B', inplace=True)
df2

df1.join(df2, on='B')

  • merge 를 사용할 때: 컬럼을 각각 원하는대로 지정할 수 있다
# merge 는 둘다 컬럼 사용할 때 굉장히 편하다
# 심지어 컬럼이름이 다를 때도 가능하다 left_on='B_left', right_on='B_right' 이런식으로
pd.merge(left=df1, right=df2, on='B')
pd.merge(left=df1, right=df2, on='B', how='left')
pd.merge(left=df1, right=df2, on='B', how='outer')

Pandas Series [Part5] 판다스 그루핑 Pandas Series [Part7] 판다스 시계열 데이터

You may also like

See all pandas
21 Jan 2022 Pandas Series [Part10]: 주피터 노트북에서 시각화를 위한 대시보드 만들기
data_analytics
pandas

Pandas Series [Part10]: 주피터 노트북에서 시각화를 위한 대시보드 만들기

20 Jan 2022 Pandas Series [Part7] 판다스 시계열 데이터
data_analytics
pandas

Pandas Series [Part7] 판다스 시계열 데이터

20 Jan 2022 Pandas Series [Part5] 판다스 그루핑
data_analytics
pandas

Pandas Series [Part5] 판다스 그루핑

Jay Kim

Jay Kim

Web development, data engineering for human for the Earth. I share posts, free resources and inspiration.

Rest
Lifestyle
Hobby
Hobby
Hobby
Hobby
2025 © Jay's Cookbook. Crafted & Designed by Artem Sheludko.