joblib

·Study/Python
안녕하세요! 오늘은 joblib 라이브러리를 활용해 여러 파일을 병렬로 읽는 방법을 소개합니다. 대량의 데이터를 처리할 때 반복적으로 read_excel()을 사용하면 속도가 느려질 수 있는데요. 이때 joblib을 활용하면 CPU의 여러 코어를 동시에 활용해 처리 속도를 크게 높일 수 있습니다. joblib 병렬 처리 기본 개념joblib의 핵심은 Parallel과 delayed입니다. delayed는 각 작업을 지연시켜 함수로 감싸고, Parallel은 이 함수들을 병렬로 실행해줍니다. 예제 코드아래 예제에서는 지정된 폴더 내 .xlsx 파일을 병렬로 읽어와 하나의 DataFrame으로 병합합니다.import osimport pandas as pdfrom joblib import Parallel, d..
Super-Son
'joblib' 태그의 글 목록