구글 코랩(Google Colab)에서 Mecab 형태소 분석기, konlpy 쉽게 설치하기
Jan 13, 2022

Google Colab (구글 코랩) 에서 Mecab 형태소 분석기 설치 과정이 복잡하기 때문에 배시 스크립트(bash script)로 만들어 코드 1줄 실행으로 복잡한 설치 과정을 건너뛸 수 있도록 만들었습니다.

아래와 같이 1줄만 실행하면 Google Colab에서 mecab 형태소 분석기를 설치 및 사용할 수 있습니다.

Mecab 형태소 분석기 설치 (konlpy도 같이 설치)

# konlpy, Mecab 형태소 분석기 설치 스크립트 실행
!curl -s https://raw.githubusercontent.com/teddylee777/machine-learning/master/99-Misc/01-Colab/mecab-colab.sh | bash

아래의 코드를 실행하여 정상 설치 및 동작함을 확인하였습니다.

# 정상 동작 확인
from konlpy.tag import Okt, Mecab

okt = Okt()
mecab = Mecab()

Okt 형태소 분석기

okt.morphs('한글 형태소 분석기(오케이티)로 테스트를 해보았습니다. 정상 설치 및 동작이 잘 됩니다.')
['한글',
 '형태소',
 '분석',
 '기',
 '(',
 '오',
 '케이티',
 ')',
 '로',
 '테스트',
 '를',
 '해보았습니다',
 '.',
 '정상',
 '설치',
 '및',
 '동작',
 '이',
 '잘',
 '됩니다',
 '.']

Mecab 형태소 분석기

mecab.morphs('한글 형태소 분석기(미켑)로 테스트를 해보았습니다. 정상 설치 및 동작이 잘 됩니다.')
['한글',
 '형태소',
 '분석기',
 '(',
 '미',
 '켑',
 ')',
 '로',
 '테스트',
 '를',
 '해',
 '보',
 '았',
 '습니다',
 '.',
 '정상',
 '설치',
 '및',
 '동작',
 '이',
 '잘',
 '됩니다',
 '.']


관련 글 더보기

- Colab에서 구글 드라이브(Google Drive) 압축파일 다운로드 쉽게하기 (코드 3줄!)

- 텐서플로우(tensorflow) 윈도우 10 GPU 설치

- 구글 코랩(colab) 한글 깨짐 현상 해결방법

- Google Colab에서 코드 한 줄(magic command)로 tensorflow2.0으로 업그레이드

- Google Colab에서 python 패키지를 영구적(permanently)으로 설치하는 방법

데이터 분석, 머신러닝, 딥러닝의 대중화를 꿈 꿉니다.