🔥알림🔥
① 테디노트 유튜브 - 구경하러 가기!
② LangChain 한국어 튜토리얼 바로가기 👀
③ 랭체인 노트 무료 전자책(wikidocs) 바로가기 🙌

1 분 소요

데이터 분석이나 머신러닝 프로젝트 진행시 자주 사용하는 옵션 값을 정리 해 보았습니다. 거의 매번 노트북 파일을 만들 때마다 import 를 해주어야 하는데, 저는 하나의 파일에 정리해 두고 필요한 옵션을 찾아서 사용하는 편입니다. 앞으로 유용한 옵션이 있다면 계속 추가해 나갈 예정입니다.

import os
import random
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings

# SEED 설정
SEED = 123

#####################    Pandas   #####################

# DataFrame 행과 열의 출력 개수 지정. None은 전체 출력.
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

# 소수점 이하 3째 자리까지 반올림 출력
pd.options.display.float_format = '{:.3f}'.format
# 1,000 단위 표기
pd.options.display.float_format = '{:,.3f}'.format

##################### Matplotlib #####################

# Unicode warning 제거 (폰트 관련 경고메시지)
plt.rcParams['axes.unicode_minus']=False

### 한글 폰트 설정 ###
# 나눔고딕 폰트
plt.rcParams['font.family'] = "NanumGothic"
# 맑은고딕 폰트
# plt.rcParams['font.family'] = "Malgun Gothic"
# 애플고딕 (Mac OS)
# plt.rcParams['font.family'] = "AppleGothic"

# 그래프 출력 사이즈 설정
plt.rcParams["figure.figsize"] = (12, 8)

# Seaborn
# sns.set_style("white")

%matplotlib inline
######################## Others  #########################

# 노트북 출력에 나타나는 경고(warning) 메시지 무시
warnings.filterwarnings('ignore')

PyTorch 사용하는 경우

import torch

# 성능 재현을 위한 시드 고정
def seed_everything(seed):
    random.seed(seed)
    np.random.seed(seed)
    os.environ["PYTHONHASHSEED"] = str(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = True
    
seed_everything(SEED)

Google Colab 환경 분기 체크

# Google Colab 환경 체크
IN_COLAB = None
try:
    import google.colab
    IN_COLAB = True
    print('Using Colab Environment')
except:
    IN_COLAB = False
    print('Using Normal Environment')
    
if IN_COLAB:
    # Google Colab 에서의 데이터 폴더 경로 지정
    DATA_DIR = 'content'
else:
    # 서버에서의 데이터 폴더 경로 지정
    DATA_DIR = 'data'
Using Normal Environment

댓글남기기