본문 바로가기
Research/Google products

Googlesheet_데이터 전처리하기

by RIEM 2022. 1. 14.
728x90

자료 출처 : 일잘러의 비밀, 구글 스프레드 시트, 강남석 지음

 

중복 항목 삭제로 고유값 추출하기

데이터 메뉴에서 Data clean-up / Remove duplicates 기능으로 중복값을 제거해보자.

 

그러면 아래와 같은 창이 뜰 것이다. 데이터의 헤더(‘본부’)가 있으니 header row 있음 옵션을 체크해준다.

 

 

중복없는 데이터들만 이렇게 남았다.

 

공백 제거

공백 제거는 파이썬의 trim 함수와 유사하다. 

아래 데이터들을 선택하고 Trim 기능을 활용해보자.

 

 

아래와 같이 깔끔하게 정리되었다.

 

텍스트를 열로 분할

아래 데이터들을 특정 텍스트를 기준으로 잘라주자. 이는 파이썬의 slice 기능으로 보면 된다.

 

자 아래의 데이터가 있다.

 

 

Comma를 Separator로 했더니 콤마 기준으로 텍스트가 슬라이싱 되었다. 나머지 텍스트는 오른쪽 컬럼으로 이동했다. 구글시트에 split 함수가 있으나 데이터 원본을 직접 처리하지 않고 결과값만 가져온다. 하지만 현재와 같은 방식으로 처리하면 데이터 원본을 바로 처리할 수 있다는 편리함이 있다.

 

728x90

댓글