안녕하세요! 이번에는 Pandas DataFrame에서 중복된 데이터를 쉽게 확인하는 방법을 소개하려고 합니다. 데이터 분석이나 처리 작업 중에 중복된 데이터가 있는지 확인하고 싶을 때가 자주 있는데요. 간단한 코드 한줄로 확인하는 법을 알아보겠습니다. 중복 데이터 필터링 코드예제 DataFrame을 사용하여 중복 데이터를 필터링하는 코드입니다. Pandas의 duplicated() 메서드를 활용하여 특정 열을 기준으로 중복된 데이터를 확인할 수 있습니다.import pandas as pd# 예시 DataFramedata = { 'column1': [1, 2, 2, 3, 4, 4, 5], 'column2': ['A', 'B', 'B', 'C', 'D', 'D', 'E']}df = pd.Dat..
Study/Python
안녕하세요! 이번에는 Python에서 모듈을 import할 때 시간을 가변적으로 사용하는 방법을 소개하겠습니다. 문제 상황이번에 모듈에서 datetime.datetime.today()를 사용해 날짜를 선언해 사용하다가 다음날 어제의 날짜로 코드가 작동하는 문제가 발생했었습니다. 확인해보니 모듈을 import한 시점의 날짜로 고정되어 발생한 문제였는데요. 예를 들어 아래와 같이 모듈을 만들면, 시간이 지나도 날짜가 변하지 않습니다. 이를 해결하려면 어떻게 해야할까요?# time_module.pyfrom datetime import datetime# 현재 시간을 고정하는 방식 (문제 발생 가능)current_time = datetime.today()# main.pyfrom time_module import..
안녕하세요! 오늘은 Python에서 문자열에 특정 패턴이 있는지 확인하는 방법을 소개하려고 합니다. 문자열 작업을 하다 보면 특정 패턴의 문자가 포함되어 있는지 확인해야 할 때가 있는데요, 이를 위해 정규식을 활용한 간단한 코드를 작성해 보았습니다. 비슷한 작업을 필요로 하는 분들에게 도움이 되길 바랍니다. 패턴 체크 코드제가 필요했던 패턴은 '*[숫자]*' 입니다. 아래 코드는 문자열에 해당 패턴이 있는지 확인하는 코드입니다.import redef contains_number_pattern(text): # 숫자를 포함한 '*[숫자]*' 패턴을 찾는 정규식 pattern = r'\*\d+\*' # 정규식 검색 return bool(re.search(pattern, text))# 테..
안녕하세요! 전에 Python의 logging 모듈을 사용하는 방법에 대해 포스팅한 적이 있었는데요, 이번에는 logging 파일에서 발생하는 한글 깨짐 현상을 해결하는 방법을 소개하려고 합니다. Python에서 로그 파일에 한글로 로그를 남기면 글자가 깨지는 문제를 만날 수 있는데, 이를 해결하기 위한 두 가지 방법을 가져왔습니다. 1. 로그 파일 생성 시 인코딩 설정하기로그 파일을 처음 생성할 때부터 UTF-8 인코딩을 설정하면, 한글 깨짐 현상을 예방할 수 있습니다. 이를 위해 FileHandler를 설정할 때 encoding='utf-8' 옵션을 추가하면 됩니다.import logging# 로깅 설정logger = logging.getLogger('my_logger')logger.setLevel..