Pandas에서 데이터를 다룰 때 결측치가 섞여있는 데이터를 정수형으로 변경해 사용하고자 할 때 어떤 방법을 사용하는게 좋을까요? 저는 평소 .astype(int)를 쓰다가 숫자가 크면 제대로 변환이 되지 않아 .astype('int64')를 사용했었는데요. 결측치가 있을 때는 오류가 나서 알아보고 .astype('Int64')를 사용해서 해결했습니다. 이 글에서는 세 가지 타입의 차이와 함께 사용하면서 제가 만났던 오류를 피하는 팁을 간단한 예제를 통해 정리해보겠습니다. int, int64, Int64 비교 — 결측치 수용import pandas as pd# 예제1values = [None, 2, 7]df = pd.DataFrame(values, columns=['values']) # 1-1. int..
DataFrame
안녕하세요! 오늘은 VSCode와 Cursor에서 주피터 노트북을 사용하는 분들이 좋아할 도구를 소개하고자 합니다. DataFrame 탐색 도구인 Data Wrangler인데요! 데이터를 더 직관적으로 탐색할 수 있는 기능을 제공하며, 특히 Kaggle의 Data Explorer처럼 DataFrame을 깔끔하게 시각화하고 조작할 수 있습니다. Python에서 데이터를 다루는 과정에서 더 빠르고 효율적인 탐색이 가능해지니, 주피터 노트북을 사용하면서 DataFrame을 편하게 확인하고 싶었던 분들은 꼭 한번 사용해보면 좋을 것 같습니다. Data Wrangler란?Data Wrangler는 VSCode와 Cursor에서 Pandas DataFrame을 시각적으로 탐색하고 조작할 수 있는 확장 프로그램입니..
안녕하세요! 이번 포스팅에서는 Python의 pandas 라이브러리를 사용하여 DataFrame을 오름차순, 내림차순이 아닌 특정 컬럼의 값을 원하는 순서대로 정렬하는 방법을 소개하고자 합니다. 정렬의 기준으로 만들고 싶은 컬럼을 pandas의 Categorical과 sort_values() 메서드를 사용해 순서형 변수로 만드는 방법인데요. 예시로 Pokemon Database에 있는 불, 물, 풀, 전기 포켓몬 데이터를 활용해 어떻게 사용할 수 있는지 알아보겠습니다. 포켓몬 데이터 가져오기먼저 예시로 사용할 포켓몬 데이터를 가져오겠습니다. (데이터 출처: Pokemon Database)import requestsimport pandas as pdfrom bs4 import BeautifulSoup a..
안녕하세요! 오늘은 Python의 pandas 라이브러리를 사용하여 DataFrame을 엑셀 파일에 저장할 때, 여러 시트를 만드는 방법에 대해 소개하고자 합니다. 여러 개의 DataFrame을 하나의 엑셀파일로 만들고 싶을 때 자주 사용하는 방법인데요. 필요할 때마다 찾아 쓰는 코드이다 보니 공유하면 좋을 것 같아 가져와봤습니다. pandas 라이브러리에서 DataFrame을 엑셀 파일로 저장할 때 사용하는 메서드는 to_excel()를 사용하지만, 여러 개의 시트를 만들려면 ExcelWriter 객체를 사용해야 합니다. ExcelWriter 객체를 생성하고, to_excel() 메서드를 사용해 여러 개의 DataFrame을 각각 다른 시트에 저장할 수 있습니다. 아래 코드는 두 개의 DataFram..