Page 12.
-
Kaggle(캐글) API 사용법 - 데이터셋 다운로드와 제출을 손쉽게
local 환경의 jupyter notebook 에서 작업을 한 뒤 Kaggle에 제출할 때면, 다음과 같은 상황마다 번거로운 순간들이 있습니다.
-
더 나은 딥러닝/머신러닝 서버 환경을 위하여 지금 바로 메모리에 투자하세요.
얼마 전, 개인용 딥러닝 서버에 문제가 생겨서 용산을 방문했습니다.
-
ubuntu에서 패키지 설치시 mirror를 kakao로 변경하는 방법
ubuntu 환경에서 패키지 설치시 (특히 apt-get을 이용한 패키지 설치시) 에러가 나는 경우가 있는데, 이는 보통 mirror 사이트를 변경해주는 것으로 해결할 수 있다.
-
딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기
Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.
-
git clean으로 untracked files 제거하기
git의 untracked files에 단 2개의 명령어로 clean하기 전에 확인하는 방법과 실제 clean하는 방법을 공유드리고자 합니다.
-
Kaggle(캐글) 타이타닉 생존자 예측 81% 이상 달성하기
캐글(Kaggle)의 대표적인 입문용 데이터 분석 경진대회인 타이타닉 생존자 예측 (Titanic: Machine Learning from Disaster) 에서 81% 이상의 정확도를 기록하여 상위 5% 안에 들 수 있는 Solution을 공유하고자 합니다.
-
뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기
최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다.
request
와BeautifulSoup4
를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를...
-
sklearn의 K-Nearest Neighbors 분류기를 활용하여 Iris 꽃 종류 분류하기 (Classifier)
K-최근접 이웃 (K-Nearest Neighbors) 알고리즘은 분류(Classifier)와 회귀(Regression)에 모두 쓰입니다. 처음 접하는 사람들도 이해하기 쉬운 알고리즘이며, 단순한 데이터를 대상으로 분류나 회귀를 할 때 사용합니다.
-
python의 pickle 기능을 활용하여 data를 저장하고 불러오는 방법
큰 용량의 dataset을 다루다 보면, 중간에 binary file 형태로 저장하고, 이를 나중에 불러와야하는 경우가 있습니다.
-
sklearn.datasets 모듈을 활용하여 샘플데이터 로딩하기
sklearn.datasets 모듈에는 대표적인 sample dataset들을 제공하고 손쉽게 다운로드 및 로딩할 수 있습니다.