GroupBy

·Study/Python
안녕하세요! 오늘은 Pandas를 사용해 DataFrame의 특정 열 값(카테고리)을 기준으로 상위 30% 데이터를 추출하는 방법을 소개하려고 합니다. 데이터 분석 작업에서 그룹화된 데이터를 처리하거나 중요한 데이터를 선별하는 경우, 이 방법을 활용하면 유용합니다. 이번 포스팅에서는 groupby()와 nlargest()를 조합하여 각 카테고리에서 상위 30% 데이터를 효율적으로 추출하는 방법을 살펴보겠습니다. 데이터 샘플 준비import pandas as pd# 예시 데이터 (여기서는 score_1과 category가 이미 있는 DataFrame을 가정)data = { 'score_1': [1.3, 22.2, 3.2, 43.4, 2.7, 35.5, 4.1, 2.3, 11.8, 3.7, 10.3,..
·Study/Python
안녕하세요! 이번에는 Pandas를 사용하여 특정 그룹별 상위 N개의 데이터를 추출하는 방법을 소개합니다. 데이터 분석 작업 중에 그룹화된 데이터에서 상위 몇 개의 행만 선택하고자 하는 경우가 자주 발생합니다. 이번 글에서는 두 가지 방법으로 그룹별 상위 데이터를 추출해보겠습니다. 예제 데이터이번에 비트코인 가격이 많이 올라왔던 게 생각나서 데이터는 캐글에 있는 코인 가격에 대한 데이터 중 일부를 활용해보았습니다. (출처: Kaggle, Top 100 Cryptocurrencies Historical Dataset)Name: 코인의 이름 (Bitcoin, Ethereum...)Date: 가격 데이터의 날짜Close: 해당 날짜의 종가데이터 행수: 13,474import osimport pandas as..
Super-Son
'GroupBy' 태그의 글 목록