최근 포스트

sklearn의 KMeans 모듈을 활용한 뉴스 클러스터링

5 분 소요

하루에도 수만개의 뉴스기사가 쏟아져 나옵니다. 수많은 뉴스기사들을 중복되거나 매우 유사도가 높은 기사들은 구독자에게 중복되게 노출시키지 않기 위해서 뉴스기사를 서비스 하고 있는 포털 사이트나 언론사에서도 뉴스기사 클러스터링 기법을 사용하고 있습니다.

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

AWS에서 딥러닝 인스턴스 만들고 jupyter notebook 실행까지!

2 분 소요

Deep learning 을 모델 학습을 위해서 high computing power가 필수 입니다. 아마존의 AWS를 통해 ‘Tesla K80’ GPU를사용하여 학습할 수 있는 인스턴스를 만들고 jupyter notebook 을 실행시켜 아마존 EC2 인스턴스에서 학습시키는 방법...