DataFrame

·Study/Python
Pandas에서 데이터를 다룰 때 결측치가 섞여있는 데이터를 정수형으로 변경해 사용하고자 할 때 어떤 방법을 사용하는게 좋을까요? 저는 평소 .astype(int)를 쓰다가 숫자가 크면 제대로 변환이 되지 않아 .astype('int64')를 사용했었는데요. 결측치가 있을 때는 오류가 나서 알아보고 .astype('Int64')를 사용해서 해결했습니다. 이 글에서는 세 가지 타입의 차이와 함께 사용하면서 제가 만났던 오류를 피하는 팁을 간단한 예제를 통해 정리해보겠습니다. int, int64, Int64 비교 — 결측치 수용import pandas as pd# 예제1values = [None, 2, 7]df = pd.DataFrame(values, columns=['values']) # 1-1. int..
·Study/IDE
안녕하세요! 오늘은 VSCode와 Cursor에서 주피터 노트북을 사용하는 분들이 좋아할 도구를 소개하고자 합니다. DataFrame 탐색 도구인 Data Wrangler인데요! 데이터를 더 직관적으로 탐색할 수 있는 기능을 제공하며, 특히 Kaggle의 Data Explorer처럼 DataFrame을 깔끔하게 시각화하고 조작할 수 있습니다. Python에서 데이터를 다루는 과정에서 더 빠르고 효율적인 탐색이 가능해지니, 주피터 노트북을 사용하면서 DataFrame을 편하게 확인하고 싶었던 분들은 꼭 한번 사용해보면 좋을 것 같습니다. Data Wrangler란?Data Wrangler는 VSCode와 Cursor에서 Pandas DataFrame을 시각적으로 탐색하고 조작할 수 있는 확장 프로그램입니..
·Study/Python
안녕하세요! 이번 포스팅에서는 Python의 pandas 라이브러리를 사용하여 DataFrame을 오름차순, 내림차순이 아닌 특정 컬럼의 값을 원하는 순서대로 정렬하는 방법을 소개하고자 합니다. 정렬의 기준으로 만들고 싶은 컬럼을 pandas의 Categorical과 sort_values() 메서드를 사용해 순서형 변수로 만드는 방법인데요. 예시로 Pokemon Database에 있는 불, 물, 풀, 전기 포켓몬 데이터를 활용해 어떻게 사용할 수 있는지 알아보겠습니다.  포켓몬 데이터 가져오기먼저 예시로 사용할 포켓몬 데이터를 가져오겠습니다. (데이터 출처: Pokemon Database)import requestsimport pandas as pdfrom bs4 import BeautifulSoup a..
·Study/Python
안녕하세요! 오늘은 Python의 pandas 라이브러리를 사용하여 DataFrame을 엑셀 파일에 저장할 때, 여러 시트를 만드는 방법에 대해 소개하고자 합니다. 여러 개의 DataFrame을 하나의 엑셀파일로 만들고 싶을 때 자주 사용하는 방법인데요. 필요할 때마다 찾아 쓰는 코드이다 보니 공유하면 좋을 것 같아 가져와봤습니다.  pandas 라이브러리에서 DataFrame을 엑셀 파일로 저장할 때 사용하는 메서드는 to_excel()를 사용하지만, 여러 개의 시트를 만들려면 ExcelWriter 객체를 사용해야 합니다. ExcelWriter 객체를 생성하고, to_excel() 메서드를 사용해 여러 개의 DataFrame을 각각 다른 시트에 저장할 수 있습니다. 아래 코드는 두 개의 DataFram..
Super-Son
'DataFrame' 태그의 글 목록