Page 10.
-
데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1)
데이터 분석과 인공지능을 공부하려는 분들께 국내 서적을 기준으로 목적에 맞는 책과 공부를 해왔던 경험담에 대하여 공유드리고자 합니다. 데이터 분석 및 인공지능에 관심있는 분들께 도움이 되셨으면 좋겠습니다.
-
Docker를 활용하여 딥러닝/머신러닝 환경을 10분만에 구성하고 jupyter notebook 원격 연결하기
도커(Docker)를 활용하면 CUDA, CuDNN과 같은 복잡한 설치환경의 충돌 걱정 없이 미리 설치된 dependency 셋팅으로 매우 편리하게 딥러닝/머신러닝을 위한 환경을 구성할 수 있습니다. Docker를 활용하여 Kaggle에서 발행한 Kaggle Docker를 Pull 하여...
-
[Keras] 콜백함수 (3) - 조기종료: EarlyStopping
EarlyStopping
콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다.EarlyStopping
과 이전에 언급한ModelCheckpoint
콜백의 조합을 통하여, 개선되지 않는...
-
[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint
keras의 콜백함수인
ModelCheckpoint
는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시...
-
[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau
keras의 콜백함수인
ReduceLROnPlateau
는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지...
-
train_test_split 모듈을 활용하여 학습과 테스트 세트 분리
사이킷런(scikit-learn)의 model_selection 패키지 안에
train_test_split
모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는train_test_split
에 대해 자세히 소개해 드리고자...
-
[Keras] 손실함수(Loss Function)와 평가지표(metric) 커스텀하기
이번 포스팅에서는 Keras 딥러닝 프레임워크 활용시 loss function과 metric 을 커스텀하는 방법에 대하여 다뤄보도록 하겠습니다.
-
Github 블로그의 방문자 숫자, 구글 애드센스(adsense), 그리고 검색 유입의 관계
현재 운영하고 있는 블로그의 일일 방문객 수 400명 돌파를 자축하며, 방문객 수와 구글 애드센스(Google Adsense) 그리고 검색 유입량의 관계에 대하여 공유 드리고자 합니다.
-
카테고리형 데이터를 수치형으로 변환하기 (LabelEncoder와 type Category)
카테고리형 데이터(Categorical Data)를 수치형 데이터(Numerical Data)로 변환해주는 작업은 머신러닝 모델을 돌려보기 위해서 필수로 해줘야하는 전처리 작업입니다.
-
keras를 활용한 word2vec pre-trained 모델을 로딩하여 IMDB 감정분석 분류문제 해결하기
이번 포스팅에서는 keras api를 활용하여 텍스트에 대한 전처리(Tokenization)와 Word Embdding, 그리고 구글이 공개한 word2vec (Google News 300) 모델을 다운로드 받아, pre-trained 모델을 통해 IMDB 데이터의 감정을 분류하는 문제를 풀어보도록 하겠습니다.
...