본문 바로가기

pandas3

Pandas 로 4분위수 및 4분위범위(IQR) 쉽게 구하기 Pandas 에서 4분위 수 구하는 방법은 크게 두 가지가 있다. 첫번째 quantile, 두번째 describe 이다. 1. quantile 이용 quantile 은 수치 데이터를 크기 순서로 정렬했을 때 0% ~ 100% (0 ~ 1) 위치에 해당하는 숫자를 리턴해 준다. 즉, Q1 은 25% , Q2 는 50%, Q3 는 75%, Q4 는 100% 를 파라미터로 주면 되는데, 각 퍼센트는 소수로 입력하면 된다. (Serise, DataFrame 모두가능) 예를 들면 다음과 같다. >>> import pandas as pd >>> num = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) >>> Q1 = num.quantile(.25) >>> Q3 = num.quantil.. 2020. 1. 17.
Pandas DataFrame 컬럼 이름 쉽게 변경 df.rename(columns={"변경전":"변경후"}, inplace=True) DataFrame 의 컬럼이름 1개를 가장 쉽게 바꾸는 방법은 위와 같다. 2019. 12. 11.
Pandas DataFrame 이나 Series 를 txt, csv, tsv 파일로 깔끔하게 저장하기 pandas DataFrame 이나 Series 를 기본 txt (csv, tsv 등) 형태 파일로 바꾸고 싶을 경우 참고 # DataFrame 이나 Serises 를 txt 파일로 깔끔하게 바꿀경우 (이건 tsv) sample.to_csv('sample_file.txt', index=False, header=None, sep="\t") 이름이 to_csv 이지 그냥 text 형태로 저장되는 것이면 이걸 사용 index = False : 자동으로 가장 왼쪽 컬럼에 생성된 0 부터 시작하는 인덱스 지울 때 header = None : 헤더 이름 지울 때 sep = "\t" : CSV 파일 기본이 comma 라서, 별도의 구분자를 두려면 변경. 예제는 탭(\t) 으로 바꿔 줌 2019. 11. 27.