태그

python

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

셀레니움(selenium)을 활용한 네이버 환율 정보 크롤링

29 분 소요

이번 튜토리얼에서는 네이버의 환율 정보를 크롤링하는 방법에 대해 알아보겠습니다. 이 과정에서 Python의 셀레니움(selenium)을 사용할 예정입니다. 크롤링 과정에서 발생할 수 있는 다양한 오류들을 어떻게 처리 하는지에 대해서도 알아보겠습니다. 튜토리얼 마지막 부분에서는 코드...

파이썬, 데이터분석가를 위한 초간단 파일공유 서비스

최대 1 분 소요

본 내용은 자체 제작한 파일공유 서비스에 대한 내용입니다. 말그대로 파일을 가장 쉬운 방법으로 공유할 수 있는 서비스이며, 링크를 활용하여 공유할 수 있습니다. Python, wget 명령어로 다운로드 받는 코드를 제공하며, 비밀번호로 암호화 하여 공유도 가능합니다.

나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기

2 분 소요

PYPI는 Python Package Index의 약어로 Python 패키지 저장소의 개념으로 생각하시면 됩니다. 수 많은 개발자들이 본인이 만든 파이썬 소프트웨어를 손쉽게 설치하고 활용할 수 있도록 패키지화 하여 저장소에 업로드를 하는데요. 저장소에 업로드된 패키지를 pip in...

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기

4 분 소요

최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다. request와 BeautifulSoup4를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를 표시하는 tag와 class...

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

Anaconda를 활용한 python 가상환경(virtual env) 설정하기

3 분 소요

이번 포스팅에서는 Python을 활용하여 개발 / 혹은 jupyter notebook을 사용할 때 필수인 가상환경 (Virtual Environment) 설정하는 법에 대한 팁과 간단한 강좌를 공유해 드리도록 하겠습니다.

맨 위로 이동 ↑

딥러닝

[pytorch] Early Stopping 조기종료 구현 및 적용

4 분 소요

조기 종료(Early Stopping)는 학습시 일정기간(여기서 기간은 보통 N번의 Epoch을 기준으로 합니다)동안 Loss 나 Score 기준으로 개선이 일어나지 않으면 학습을 조기에 종료해 주는 기능입니다. 만약, 20번의 Epoch 동안 학습이 진행한다고 가정했을 때, 아래...

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

[tensorflow] 오토인코더 구현 (MNIST)

5 분 소요

이번 포스팅에서는 오토인코더의 기본 개념에 대하여 알아보고, TensorFlow 2.0으로 오토인코더(Autoencoder)를 구현해 보겠습니다.

TensorFlow Datasets API 활용법

3 분 소요

TensorFlow Datasets 는 다양한 데이터셋을 TensorFlow에서 활용하기 쉽도록 제공합니다. 굉장히 많고, 다양한 데이터셋이 학습하기 편한 형태로 제공 되기 때문에, 간단한 사용법만 알아두어도, 샘플로 모델을 돌려보고 학습하기에 매우 유용합니다.

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

맨 위로 이동 ↑

deep learning

[pytorch] Early Stopping 조기종료 구현 및 적용

4 분 소요

조기 종료(Early Stopping)는 학습시 일정기간(여기서 기간은 보통 N번의 Epoch을 기준으로 합니다)동안 Loss 나 Score 기준으로 개선이 일어나지 않으면 학습을 조기에 종료해 주는 기능입니다. 만약, 20번의 Epoch 동안 학습이 진행한다고 가정했을 때, 아래...

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

[tensorflow] 오토인코더 구현 (MNIST)

5 분 소요

이번 포스팅에서는 오토인코더의 기본 개념에 대하여 알아보고, TensorFlow 2.0으로 오토인코더(Autoencoder)를 구현해 보겠습니다.

TensorFlow Datasets API 활용법

3 분 소요

TensorFlow Datasets 는 다양한 데이터셋을 TensorFlow에서 활용하기 쉽도록 제공합니다. 굉장히 많고, 다양한 데이터셋이 학습하기 편한 형태로 제공 되기 때문에, 간단한 사용법만 알아두어도, 샘플로 모델을 돌려보고 학습하기에 매우 유용합니다.

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

Deep Learning - Softmax 함수란

최대 1 분 소요

인공신경망에서 출력층의 정규화를 위한 함수인 소프트맥스(softmax)함수에 대하여 알아보겠다.

맨 위로 이동 ↑

tensorflow

TensorFlow 와 PyTorch 중 무엇을 써야할까?

7 분 소요

TensorFlow는 딥러닝 프레임워크 시장에서 초기에 막강한 선두 주자 였습니다. 그러나 최근에 들어 PyTorch가 연구 커뮤니티에서 큰 사랑을 받기 시작했습니다.

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

[tensorflow] 오토인코더 구현 (MNIST)

5 분 소요

이번 포스팅에서는 오토인코더의 기본 개념에 대하여 알아보고, TensorFlow 2.0으로 오토인코더(Autoencoder)를 구현해 보겠습니다.

TensorFlow Datasets API 활용법

3 분 소요

TensorFlow Datasets 는 다양한 데이터셋을 TensorFlow에서 활용하기 쉽도록 제공합니다. 굉장히 많고, 다양한 데이터셋이 학습하기 편한 형태로 제공 되기 때문에, 간단한 사용법만 알아두어도, 샘플로 모델을 돌려보고 학습하기에 매우 유용합니다.

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

pytorch

TensorFlow 와 PyTorch 중 무엇을 써야할까?

7 분 소요

TensorFlow는 딥러닝 프레임워크 시장에서 초기에 막강한 선두 주자 였습니다. 그러나 최근에 들어 PyTorch가 연구 커뮤니티에서 큰 사랑을 받기 시작했습니다.

데이터 분석(pandas, matplotlib) 모듈과 머신러닝/딥러닝 모듈 사용시 자주 사용하는 옵션 정리

1 분 소요

데이터 분석이나 머신러닝 프로젝트 진행시 자주 사용하는 옵션 값을 정리 해 보았습니다. 거의 매번 노트북 파일을 만들 때마다 import 를 해주어야 하는데, 저는 하나의 파일에 정리해 두고 필요한 옵션을 찾아서 사용하는 편입니다. 앞으로 유용한 옵션이 있다면 계속 추가해 나갈 예...

[pytorch] Seq2Seq with Attention 구현 및 한 줄씩 코드 설명

17 분 소요

이번 포스팅에서는 Attention 메카니즘이 적용된 Seq2Seq 모델을 pytorch로 구현하고, 코드 한 줄씩 직접 shape를 찍어보고 확인하면서 구현된 코드 통해 동작 원리와 Attention 구조를 이해해 보도록 하겠습니다.

[pytorch] GRU 입력 텐서와 출력 텐서의 shape 이해

1 분 소요

이번에는 지난 LSTM 입력 텐서와 출력 텐서의 shape 이해 의 후속편으로써, pytorch의 GRU layer의 입출력 텐서의 shape에 대하여 이해해 보고 세부 옵션에 대하여 자세히 알아보도록 하겠습니다.

WandB 를 활용하여 모델의 학습을 추적하는 방법

2 분 소요

WandB는 weights and biases 의 약어입니다. 머신러닝을 하시는 분들은 weights & biases 와 굉장히 친숙할텐데요. WandB의 네이밍에서 알 수 있듯이 모델이 학습할 때 실험 결과를 저장 및 시각화, 하이퍼파라미터를 저장, 모델 뿐만아니라 시스템...

[pytorch] Early Stopping 조기종료 구현 및 적용

4 분 소요

조기 종료(Early Stopping)는 학습시 일정기간(여기서 기간은 보통 N번의 Epoch을 기준으로 합니다)동안 Loss 나 Score 기준으로 개선이 일어나지 않으면 학습을 조기에 종료해 주는 기능입니다. 만약, 20번의 Epoch 동안 학습이 진행한다고 가정했을 때, 아래...

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

AlexNet Implementation(구현) by PyTorch

6 분 소요

AlexNet(2012) 의 PyTorch 구현 입니다. 논문에 대한 세부 인사이트는 생략하며, 오직 코드 구현만 다룹니다.

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

파이썬

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

파이썬, 데이터분석가를 위한 초간단 파일공유 서비스

최대 1 분 소요

본 내용은 자체 제작한 파일공유 서비스에 대한 내용입니다. 말그대로 파일을 가장 쉬운 방법으로 공유할 수 있는 서비스이며, 링크를 활용하여 공유할 수 있습니다. Python, wget 명령어로 다운로드 받는 코드를 제공하며, 비밀번호로 암호화 하여 공유도 가능합니다.

나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기

2 분 소요

PYPI는 Python Package Index의 약어로 Python 패키지 저장소의 개념으로 생각하시면 됩니다. 수 많은 개발자들이 본인이 만든 파이썬 소프트웨어를 손쉽게 설치하고 활용할 수 있도록 패키지화 하여 저장소에 업로드를 하는데요. 저장소에 업로드된 패키지를 pip in...

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기

4 분 소요

최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다. request와 BeautifulSoup4를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를 표시하는 tag와 class...

맨 위로 이동 ↑

튜토리얼

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

넘파이(Numpy) 튜토리얼

11 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 수치계산용 라이브러리인 넘파이(numpy) 를 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

깃헙(GitHub) 웹사이트 기능들로 GitHub 입문하기

최대 1 분 소요

Git, GitHub은 프로젝트의 협업을 위해서 꼭 필요한 소스코드 형상 관리 시스템입니다. 형상 관리 시스템은 소스코드의 버전 관리 시스템이라고도 불리웁니다. 다수의 인원이 하나의 프로젝트를 진행할 때, 소스코드의 충돌을 효율적으로 해결하고, 업데이트되는 사항들을 병합해주기도 ...

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

맨 위로 이동 ↑

머신러닝

머신러닝 실전 앙상블 (Ensemble)과 Hyperparameter 튜닝

18 분 소요

머신러닝 알고리즘의 끝판왕인 앙상블(Ensemble) 알고리즘에 대하여 알아보도록 하겠습니다. 앙상블 알고리즘은 방법론 적인 측면에서 Voting, Bagging, Boosting 알고리즘등으로 나뉠 수 있겠고, 앙상블의 앙상블 알고리즘인 Stacking 그리고 Weighted B...

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

최근접 이웃 (KNN) 알고리즘을 활용한 분류

3 분 소요

K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용한 간단한 머신러닝 분류 문제를 풀어보도록 하겠습니다. 알고리즘은 동작 원리는 매우 직관적이고 단순 합니다. 이해는 어렵지 않으나, 복잡한 분류 문제에 있어서는 모델의 성능에 대한 큰 기대를 하기 어렵습니...

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

경사하강법 (Gradient Descent) 직접 구현하기

8 분 소요

이번에는 머신러닝 뿐만아니라, 인공신경망 모델의 가장 기초가 되는 경사하강법 (Gradient Descent)에 대하여 알아보도록 하겠습니다. 경사하강법을 Python으로 직접 구현해보는 튜토리얼 입니다. 자세한 설명은 유튜브 영상을 참고해 보셔도 좋습니다.

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

Tree기반 모델(DecisionTree, RandomForest)의 분할 그래프 시각화하기 (graphviz)

2 분 소요

Tree 기반 모델은 RandomForest 모델때문에 참 인기있게 활용되는 알고리즘 입니다. RandomForest 모델은 데이터 분석 대회인 캐글에서도 활발히 활용되고 있으며, 성능이 좋을 뿐만아니라 쉽고 간편하게 사용할 수 있기 때문에 저 또한 데이터 분석 대회에서 basel...

GridSearch를 이용한 머신러닝 Hyperparameter 튜닝

1 분 소요

Hyperparameter 튜닝을 위해서는 다양한 방법론이 존재합니다. 가장 쉬운 방법으로는 일명 손튜닝이 있을 수 있겠구요. RandomSearch, GridSearch, HyperOpt등 다양한 방법으로 Hyperparameter를 튜닝할 수 있습니다.

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

Kaggle(캐글) 타이타닉 생존자 예측 81% 이상 달성하기

5 분 소요

캐글(Kaggle)의 대표적인 입문용 데이터 분석 경진대회인 타이타닉 생존자 예측 (Titanic: Machine Learning from Disaster) 에서 81% 이상의 정확도를 기록하여 상위 5% 안에 들 수 있는 Solution을 공유하고자 합니다.

sklearn의 KMeans 모듈을 활용한 뉴스 클러스터링

5 분 소요

하루에도 수만개의 뉴스기사가 쏟아져 나옵니다. 수많은 뉴스기사들을 중복되거나 매우 유사도가 높은 기사들은 구독자에게 중복되게 노출시키지 않기 위해서 뉴스기사를 서비스 하고 있는 포털 사이트나 언론사에서도 뉴스기사 클러스터링 기법을 사용하고 있습니다.

맨 위로 이동 ↑

machine learning

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

머신러닝 실전 앙상블 (Ensemble)과 Hyperparameter 튜닝

18 분 소요

머신러닝 알고리즘의 끝판왕인 앙상블(Ensemble) 알고리즘에 대하여 알아보도록 하겠습니다. 앙상블 알고리즘은 방법론 적인 측면에서 Voting, Bagging, Boosting 알고리즘등으로 나뉠 수 있겠고, 앙상블의 앙상블 알고리즘인 Stacking 그리고 Weighted B...

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

최근접 이웃 (KNN) 알고리즘을 활용한 분류

3 분 소요

K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용한 간단한 머신러닝 분류 문제를 풀어보도록 하겠습니다. 알고리즘은 동작 원리는 매우 직관적이고 단순 합니다. 이해는 어렵지 않으나, 복잡한 분류 문제에 있어서는 모델의 성능에 대한 큰 기대를 하기 어렵습니...

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

Tree기반 모델(DecisionTree, RandomForest)의 분할 그래프 시각화하기 (graphviz)

2 분 소요

Tree 기반 모델은 RandomForest 모델때문에 참 인기있게 활용되는 알고리즘 입니다. RandomForest 모델은 데이터 분석 대회인 캐글에서도 활발히 활용되고 있으며, 성능이 좋을 뿐만아니라 쉽고 간편하게 사용할 수 있기 때문에 저 또한 데이터 분석 대회에서 basel...

GridSearch를 이용한 머신러닝 Hyperparameter 튜닝

1 분 소요

Hyperparameter 튜닝을 위해서는 다양한 방법론이 존재합니다. 가장 쉬운 방법으로는 일명 손튜닝이 있을 수 있겠구요. RandomSearch, GridSearch, HyperOpt등 다양한 방법으로 Hyperparameter를 튜닝할 수 있습니다.

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

Kaggle(캐글) 타이타닉 생존자 예측 81% 이상 달성하기

5 분 소요

캐글(Kaggle)의 대표적인 입문용 데이터 분석 경진대회인 타이타닉 생존자 예측 (Titanic: Machine Learning from Disaster) 에서 81% 이상의 정확도를 기록하여 상위 5% 안에 들 수 있는 Solution을 공유하고자 합니다.

sklearn의 KMeans 모듈을 활용한 뉴스 클러스터링

5 분 소요

하루에도 수만개의 뉴스기사가 쏟아져 나옵니다. 수많은 뉴스기사들을 중복되거나 매우 유사도가 높은 기사들은 구독자에게 중복되게 노출시키지 않기 위해서 뉴스기사를 서비스 하고 있는 포털 사이트나 언론사에서도 뉴스기사 클러스터링 기법을 사용하고 있습니다.

맨 위로 이동 ↑

tutorial

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

넘파이(Numpy) 튜토리얼

11 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 수치계산용 라이브러리인 넘파이(numpy) 를 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

깃헙(GitHub) 웹사이트 기능들로 GitHub 입문하기

최대 1 분 소요

Git, GitHub은 프로젝트의 협업을 위해서 꼭 필요한 소스코드 형상 관리 시스템입니다. 형상 관리 시스템은 소스코드의 버전 관리 시스템이라고도 불리웁니다. 다수의 인원이 하나의 프로젝트를 진행할 때, 소스코드의 충돌을 효율적으로 해결하고, 업데이트되는 사항들을 병합해주기도 ...

맨 위로 이동 ↑

텐서플로

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

[tensorflow] 오토인코더 구현 (MNIST)

5 분 소요

이번 포스팅에서는 오토인코더의 기본 개념에 대하여 알아보고, TensorFlow 2.0으로 오토인코더(Autoencoder)를 구현해 보겠습니다.

TensorFlow Datasets API 활용법

3 분 소요

TensorFlow Datasets 는 다양한 데이터셋을 TensorFlow에서 활용하기 쉽도록 제공합니다. 굉장히 많고, 다양한 데이터셋이 학습하기 편한 형태로 제공 되기 때문에, 간단한 사용법만 알아두어도, 샘플로 모델을 돌려보고 학습하기에 매우 유용합니다.

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

pandas

데이터 분석(pandas, matplotlib) 모듈과 머신러닝/딥러닝 모듈 사용시 자주 사용하는 옵션 정리

1 분 소요

데이터 분석이나 머신러닝 프로젝트 진행시 자주 사용하는 옵션 값을 정리 해 보았습니다. 거의 매번 노트북 파일을 만들 때마다 import 를 해주어야 하는데, 저는 하나의 파일에 정리해 두고 필요한 옵션을 찾아서 사용하는 편입니다. 앞으로 유용한 옵션이 있다면 계속 추가해 나갈 예...

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

pandas 를 활용한 기본적인 산술과 통계 적용 & 이해

4 분 소요

Pandas를 활용한 통계부분을 좀 더 다뤄보려고 합니다. 평균, 표준 편차, 분산, 중간값등 통계를 전공하셨거나, 조금이라도 공부하신 분들은 물론 익숙하시겠지만, 그렇지 않고 데이터 분석에 뛰어든 분들은 용어만 봐도 머리속에 혼란이 찾아오기 마련입니다.

맨 위로 이동 ↑

파이토치

TensorFlow 와 PyTorch 중 무엇을 써야할까?

7 분 소요

TensorFlow는 딥러닝 프레임워크 시장에서 초기에 막강한 선두 주자 였습니다. 그러나 최근에 들어 PyTorch가 연구 커뮤니티에서 큰 사랑을 받기 시작했습니다.

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

AlexNet Implementation(구현) by PyTorch

6 분 소요

AlexNet(2012) 의 PyTorch 구현 입니다. 논문에 대한 세부 인사이트는 생략하며, 오직 코드 구현만 다룹니다.

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

데이터 분석

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

matplotlib/seaborn으로 시각화할 때 한글 폰트 깨짐현상 해결방법

2 분 소요

matplotlib/seaborn 을 활용하여 시각화를 할 때, 한 번씩 필연적으로 겪는 당황스러운 모먼트는 바로 한글 폰트 깨짐 입니다. 데이터를 다룰 때 한글 데이터는 흔히 존재하며, 이를 jupyter notebook 에서 inline으로 시각화하려 한다면, 분명히 깨짐 현상...

pandas 를 활용한 기본적인 산술과 통계 적용 & 이해

4 분 소요

Pandas를 활용한 통계부분을 좀 더 다뤄보려고 합니다. 평균, 표준 편차, 분산, 중간값등 통계를 전공하셨거나, 조금이라도 공부하신 분들은 물론 익숙하시겠지만, 그렇지 않고 데이터 분석에 뛰어든 분들은 용어만 봐도 머리속에 혼란이 찾아오기 마련입니다.

맨 위로 이동 ↑

강의

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

넘파이(Numpy) 튜토리얼

11 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 수치계산용 라이브러리인 넘파이(numpy) 를 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

scikit-learn

머신러닝 실전 앙상블 (Ensemble)과 Hyperparameter 튜닝

18 분 소요

머신러닝 알고리즘의 끝판왕인 앙상블(Ensemble) 알고리즘에 대하여 알아보도록 하겠습니다. 앙상블 알고리즘은 방법론 적인 측면에서 Voting, Bagging, Boosting 알고리즘등으로 나뉠 수 있겠고, 앙상블의 앙상블 알고리즘인 Stacking 그리고 Weighted B...

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

최근접 이웃 (KNN) 알고리즘을 활용한 분류

3 분 소요

K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용한 간단한 머신러닝 분류 문제를 풀어보도록 하겠습니다. 알고리즘은 동작 원리는 매우 직관적이고 단순 합니다. 이해는 어렵지 않으나, 복잡한 분류 문제에 있어서는 모델의 성능에 대한 큰 기대를 하기 어렵습니...

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

경사하강법 (Gradient Descent) 직접 구현하기

8 분 소요

이번에는 머신러닝 뿐만아니라, 인공신경망 모델의 가장 기초가 되는 경사하강법 (Gradient Descent)에 대하여 알아보도록 하겠습니다. 경사하강법을 Python으로 직접 구현해보는 튜토리얼 입니다. 자세한 설명은 유튜브 영상을 참고해 보셔도 좋습니다.

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

Tree기반 모델(DecisionTree, RandomForest)의 분할 그래프 시각화하기 (graphviz)

2 분 소요

Tree 기반 모델은 RandomForest 모델때문에 참 인기있게 활용되는 알고리즘 입니다. RandomForest 모델은 데이터 분석 대회인 캐글에서도 활발히 활용되고 있으며, 성능이 좋을 뿐만아니라 쉽고 간편하게 사용할 수 있기 때문에 저 또한 데이터 분석 대회에서 basel...

sklearn의 KMeans 모듈을 활용한 뉴스 클러스터링

5 분 소요

하루에도 수만개의 뉴스기사가 쏟아져 나옵니다. 수많은 뉴스기사들을 중복되거나 매우 유사도가 높은 기사들은 구독자에게 중복되게 노출시키지 않기 위해서 뉴스기사를 서비스 하고 있는 포털 사이트나 언론사에서도 뉴스기사 클러스터링 기법을 사용하고 있습니다.

맨 위로 이동 ↑

판다스

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

pandas 를 활용한 기본적인 산술과 통계 적용 & 이해

4 분 소요

Pandas를 활용한 통계부분을 좀 더 다뤄보려고 합니다. 평균, 표준 편차, 분산, 중간값등 통계를 전공하셨거나, 조금이라도 공부하신 분들은 물론 익숙하시겠지만, 그렇지 않고 데이터 분석에 뛰어든 분들은 용어만 봐도 머리속에 혼란이 찾아오기 마련입니다.

맨 위로 이동 ↑

OpenAI

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

torch

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

AlexNet Implementation(구현) by PyTorch

6 분 소요

AlexNet(2012) 의 PyTorch 구현 입니다. 논문에 대한 세부 인사이트는 생략하며, 오직 코드 구현만 다룹니다.

맨 위로 이동 ↑

실습

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

넘파이(Numpy) 튜토리얼

11 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 수치계산용 라이브러리인 넘파이(numpy) 를 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

data science

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

matplotlib/seaborn으로 시각화할 때 한글 폰트 깨짐현상 해결방법

2 분 소요

matplotlib/seaborn 을 활용하여 시각화를 할 때, 한 번씩 필연적으로 겪는 당황스러운 모먼트는 바로 한글 폰트 깨짐 입니다. 데이터를 다룰 때 한글 데이터는 흔히 존재하며, 이를 jupyter notebook 에서 inline으로 시각화하려 한다면, 분명히 깨짐 현상...

pandas 를 활용한 기본적인 산술과 통계 적용 & 이해

4 분 소요

Pandas를 활용한 통계부분을 좀 더 다뤄보려고 합니다. 평균, 표준 편차, 분산, 중간값등 통계를 전공하셨거나, 조금이라도 공부하신 분들은 물론 익숙하시겠지만, 그렇지 않고 데이터 분석에 뛰어든 분들은 용어만 봐도 머리속에 혼란이 찾아오기 마련입니다.

맨 위로 이동 ↑

이미지 분류

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

AlexNet Implementation(구현) by PyTorch

6 분 소요

AlexNet(2012) 의 PyTorch 구현 입니다. 논문에 대한 세부 인사이트는 생략하며, 오직 코드 구현만 다룹니다.

맨 위로 이동 ↑

ChatGPT

맨 위로 이동 ↑

파이썬 튜토리얼

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

파이썬 강의

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

python 강의

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

파이썬 코딩

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

코딩 강의

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

랭체인

맨 위로 이동 ↑

langchain

맨 위로 이동 ↑

ChatOpenAI

맨 위로 이동 ↑

데이터프레임

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

맨 위로 이동 ↑

시각화

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

matplotlib/seaborn으로 시각화할 때 한글 폰트 깨짐현상 해결방법

2 분 소요

matplotlib/seaborn 을 활용하여 시각화를 할 때, 한 번씩 필연적으로 겪는 당황스러운 모먼트는 바로 한글 폰트 깨짐 입니다. 데이터를 다룰 때 한글 데이터는 흔히 존재하며, 이를 jupyter notebook 에서 inline으로 시각화하려 한다면, 분명히 깨짐 현상...

맨 위로 이동 ↑

kaggle

Kaggle(캐글) 타이타닉 생존자 예측 81% 이상 달성하기

5 분 소요

캐글(Kaggle)의 대표적인 입문용 데이터 분석 경진대회인 타이타닉 생존자 예측 (Titanic: Machine Learning from Disaster) 에서 81% 이상의 정확도를 기록하여 상위 5% 안에 들 수 있는 Solution을 공유하고자 합니다.

맨 위로 이동 ↑

numpy

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

넘파이(Numpy) 튜토리얼

11 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 수치계산용 라이브러리인 넘파이(numpy) 를 다룹니다.

맨 위로 이동 ↑

google colab

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

Google Colaboratory에 대한 간단 팁과 활용법

5 분 소요

이번 포스팅에서는 Google Colaboratory (colab)을 활용하여 jupyter notebook을 구글 플랫폼 내에서 활용하는 방법에 대하여 팁을 드리도록 하겠습니다.

맨 위로 이동 ↑

jupyter notebook

AWS에서 딥러닝 인스턴스 만들고 jupyter notebook 실행까지!

2 분 소요

Deep learning 을 모델 학습을 위해서 high computing power가 필수 입니다. 아마존의 AWS를 통해 ‘Tesla K80’ GPU를사용하여 학습할 수 있는 인스턴스를 만들고 jupyter notebook 을 실행시켜 아마존 EC2 인스턴스에서 학습시키는 방법...

맨 위로 이동 ↑

리눅스

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

맨 위로 이동 ↑

linux

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

맨 위로 이동 ↑

visualization

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

matplotlib/seaborn으로 시각화할 때 한글 폰트 깨짐현상 해결방법

2 분 소요

matplotlib/seaborn 을 활용하여 시각화를 할 때, 한 번씩 필연적으로 겪는 당황스러운 모먼트는 바로 한글 폰트 깨짐 입니다. 데이터를 다룰 때 한글 데이터는 흔히 존재하며, 이를 jupyter notebook 에서 inline으로 시각화하려 한다면, 분명히 깨짐 현상...

맨 위로 이동 ↑

matplotlib

matplotlib 에서 신규 폰트 추가하는 방법

2 분 소요

이번 포스팅에서는 matplotlib 에서 누락된 폰트를 추가 하는 방법에 대해 알아보겠습니다. 만약 설치된 폰트가 matplotlib 에서 사용할 수 없다면, 아래의 가이드를 따라 진행해 보시기 바랍니다.

데이터 분석(pandas, matplotlib) 모듈과 머신러닝/딥러닝 모듈 사용시 자주 사용하는 옵션 정리

1 분 소요

데이터 분석이나 머신러닝 프로젝트 진행시 자주 사용하는 옵션 값을 정리 해 보았습니다. 거의 매번 노트북 파일을 만들 때마다 import 를 해주어야 하는데, 저는 하나의 파일에 정리해 두고 필요한 옵션을 찾아서 사용하는 편입니다. 앞으로 유용한 옵션이 있다면 계속 추가해 나갈 예...

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

matplotlib/seaborn으로 시각화할 때 한글 폰트 깨짐현상 해결방법

2 분 소요

matplotlib/seaborn 을 활용하여 시각화를 할 때, 한 번씩 필연적으로 겪는 당황스러운 모먼트는 바로 한글 폰트 깨짐 입니다. 데이터를 다룰 때 한글 데이터는 흔히 존재하며, 이를 jupyter notebook 에서 inline으로 시각화하려 한다면, 분명히 깨짐 현상...

맨 위로 이동 ↑

크롤링

셀레니움(selenium)을 활용한 네이버 환율 정보 크롤링

29 분 소요

이번 튜토리얼에서는 네이버의 환율 정보를 크롤링하는 방법에 대해 알아보겠습니다. 이 과정에서 Python의 셀레니움(selenium)을 사용할 예정입니다. 크롤링 과정에서 발생할 수 있는 다양한 오류들을 어떻게 처리 하는지에 대해서도 알아보겠습니다. 튜토리얼 마지막 부분에서는 코드...

뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기

4 분 소요

최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다. request와 BeautifulSoup4를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를 표시하는 tag와 class...

맨 위로 이동 ↑

캐글

Kaggle(캐글) 타이타닉 생존자 예측 81% 이상 달성하기

5 분 소요

캐글(Kaggle)의 대표적인 입문용 데이터 분석 경진대회인 타이타닉 생존자 예측 (Titanic: Machine Learning from Disaster) 에서 81% 이상의 정확도를 기록하여 상위 5% 안에 들 수 있는 Solution을 공유하고자 합니다.

맨 위로 이동 ↑

도커

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

맨 위로 이동 ↑

docker

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

맨 위로 이동 ↑

자연어처리

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

판다스 자료구조

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

맨 위로 이동 ↑

판다스 튜토리얼

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

맨 위로 이동 ↑

파이썬 데이터 분석

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

맨 위로 이동 ↑

GPT3.5

맨 위로 이동 ↑

GPT4

맨 위로 이동 ↑

랭체인 튜토리얼

맨 위로 이동 ↑

langchain tutorial

맨 위로 이동 ↑

anaconda

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

Anaconda를 활용한 python 가상환경(virtual env) 설정하기

3 분 소요

이번 포스팅에서는 Python을 활용하여 개발 / 혹은 jupyter notebook을 사용할 때 필수인 가상환경 (Virtual Environment) 설정하는 법에 대한 팁과 간단한 강좌를 공유해 드리도록 하겠습니다.

맨 위로 이동 ↑

구글 코랩

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

Google Colaboratory에 대한 간단 팁과 활용법

5 분 소요

이번 포스팅에서는 Google Colaboratory (colab)을 활용하여 jupyter notebook을 구글 플랫폼 내에서 활용하는 방법에 대하여 팁을 드리도록 하겠습니다.

맨 위로 이동 ↑

keras

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

lstm

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

맨 위로 이동 ↑

gpt

AutoGPT 설치 및 실행 방법

2 분 소요

인간의 일을 전부 대체할 수 있는 범용 인공지능의 시작점 이라 불리는 새로운 AI 프로그램이 등장했는데요, 그건 바로 AutoGPT 프로젝트 입니다.

맨 위로 이동 ↑

Python

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

전처리

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

cnn

Google Colaboratory에 대한 간단 팁과 활용법

5 분 소요

이번 포스팅에서는 Google Colaboratory (colab)을 활용하여 jupyter notebook을 구글 플랫폼 내에서 활용하는 방법에 대하여 팁을 드리도록 하겠습니다.

맨 위로 이동 ↑

aws

aws ec2(ubuntu 18.04)에서 flask와 nginx 설정하기

2 분 소요

AWS의 EC2 인스턴스를 열고, ubuntu 18.04에서 Python으로 Flask 앱을 만든 후 nginx 설정하여 내가 호스팅하고 싶은 도메인과 연결하여 80포트에서 접속가능하도록 설정하는 방법에 대해서 알아보도록 하겠습니다.

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

AWS에서 딥러닝 인스턴스 만들고 jupyter notebook 실행까지!

2 분 소요

Deep learning 을 모델 학습을 위해서 high computing power가 필수 입니다. 아마존의 AWS를 통해 ‘Tesla K80’ GPU를사용하여 학습할 수 있는 인스턴스를 만들고 jupyter notebook 을 실행시켜 아마존 EC2 인스턴스에서 학습시키는 방법...

맨 위로 이동 ↑

책 추천

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

colab

맨 위로 이동 ↑

한글

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

맨 위로 이동 ↑

chatgpt

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

가상환경

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

Anaconda를 활용한 python 가상환경(virtual env) 설정하기

3 분 소요

이번 포스팅에서는 Python을 활용하여 개발 / 혹은 jupyter notebook을 사용할 때 필수인 가상환경 (Virtual Environment) 설정하는 법에 대한 팁과 간단한 강좌를 공유해 드리도록 하겠습니다.

맨 위로 이동 ↑

아나콘다

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

Anaconda를 활용한 python 가상환경(virtual env) 설정하기

3 분 소요

이번 포스팅에서는 Python을 활용하여 개발 / 혹은 jupyter notebook을 사용할 때 필수인 가상환경 (Virtual Environment) 설정하는 법에 대한 팁과 간단한 강좌를 공유해 드리도록 하겠습니다.

맨 위로 이동 ↑

ubuntu

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

aws ec2(ubuntu 18.04)에서 flask와 nginx 설정하기

2 분 소요

AWS의 EC2 인스턴스를 열고, ubuntu 18.04에서 Python으로 Flask 앱을 만든 후 nginx 설정하여 내가 호스팅하고 싶은 도메인과 연결하여 80포트에서 접속가능하도록 설정하는 방법에 대해서 알아보도록 하겠습니다.

맨 위로 이동 ↑

cudnn

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

맨 위로 이동 ↑

케라스

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

dataframe

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

맨 위로 이동 ↑

openai

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

LangChain

맨 위로 이동 ↑

합성곱신경망

맨 위로 이동 ↑

아마존

aws ec2(ubuntu 18.04)에서 flask와 nginx 설정하기

2 분 소요

AWS의 EC2 인스턴스를 열고, ubuntu 18.04에서 Python으로 Flask 앱을 만든 후 nginx 설정하여 내가 호스팅하고 싶은 도메인과 연결하여 80포트에서 접속가능하도록 설정하는 방법에 대해서 알아보도록 하겠습니다.

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

맨 위로 이동 ↑

데이터셋

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

맨 위로 이동 ↑

dataset

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

맨 위로 이동 ↑

패키지

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

맨 위로 이동 ↑

git

깃헙(GitHub) 웹사이트 기능들로 GitHub 입문하기

최대 1 분 소요

Git, GitHub은 프로젝트의 협업을 위해서 꼭 필요한 소스코드 형상 관리 시스템입니다. 형상 관리 시스템은 소스코드의 버전 관리 시스템이라고도 불리웁니다. 다수의 인원이 하나의 프로젝트를 진행할 때, 소스코드의 충돌을 효율적으로 해결하고, 업데이트되는 사항들을 병합해주기도 ...

git clean으로 untracked files 제거하기

최대 1 분 소요

git의 untracked files에 단 2개의 명령어로 clean하기 전에 확인하는 방법과 실제 clean하는 방법을 공유드리고자 합니다.

git diff를 gui tool인 p4 merge로 설정하기 (global config)

2 분 소요

visual Diff Tool인 P4Merge를 설치하고, 이를 활용하여 git diff를 터미널이나 vim이 아닌 GUI Tool에서 diff를 보거나, merge를 할 수 있도록 global config를 설정하는 방법에 대해 알아보겠습니다.

맨 위로 이동 ↑

seaborn

데이터 분석(pandas, matplotlib) 모듈과 머신러닝/딥러닝 모듈 사용시 자주 사용하는 옵션 정리

1 분 소요

데이터 분석이나 머신러닝 프로젝트 진행시 자주 사용하는 옵션 값을 정리 해 보았습니다. 거의 매번 노트북 파일을 만들 때마다 import 를 해주어야 하는데, 저는 하나의 파일에 정리해 두고 필요한 옵션을 찾아서 사용하는 편입니다. 앞으로 유용한 옵션이 있다면 계속 추가해 나갈 예...

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

matplotlib/seaborn으로 시각화할 때 한글 폰트 깨짐현상 해결방법

2 분 소요

matplotlib/seaborn 을 활용하여 시각화를 할 때, 한 번씩 필연적으로 겪는 당황스러운 모먼트는 바로 한글 폰트 깨짐 입니다. 데이터를 다룰 때 한글 데이터는 흔히 존재하며, 이를 jupyter notebook 에서 inline으로 시각화하려 한다면, 분명히 깨짐 현상...

맨 위로 이동 ↑

crawling

셀레니움(selenium)을 활용한 네이버 환율 정보 크롤링

29 분 소요

이번 튜토리얼에서는 네이버의 환율 정보를 크롤링하는 방법에 대해 알아보겠습니다. 이 과정에서 Python의 셀레니움(selenium)을 사용할 예정입니다. 크롤링 과정에서 발생할 수 있는 다양한 오류들을 어떻게 처리 하는지에 대해서도 알아보겠습니다. 튜토리얼 마지막 부분에서는 코드...

뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기

4 분 소요

최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다. request와 BeautifulSoup4를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를 표시하는 tag와 class...

맨 위로 이동 ↑

cuda

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

맨 위로 이동 ↑

앙상블

머신러닝 실전 앙상블 (Ensemble)과 Hyperparameter 튜닝

18 분 소요

머신러닝 알고리즘의 끝판왕인 앙상블(Ensemble) 알고리즘에 대하여 알아보도록 하겠습니다. 앙상블 알고리즘은 방법론 적인 측면에서 Voting, Bagging, Boosting 알고리즘등으로 나뉠 수 있겠고, 앙상블의 앙상블 알고리즘인 Stacking 그리고 Weighted B...

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

맨 위로 이동 ↑

ensemble

머신러닝 실전 앙상블 (Ensemble)과 Hyperparameter 튜닝

18 분 소요

머신러닝 알고리즘의 끝판왕인 앙상블(Ensemble) 알고리즘에 대하여 알아보도록 하겠습니다. 앙상블 알고리즘은 방법론 적인 측면에서 Voting, Bagging, Boosting 알고리즘등으로 나뉠 수 있겠고, 앙상블의 앙상블 알고리즘인 Stacking 그리고 Weighted B...

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

맨 위로 이동 ↑

하이퍼파라미터 튜닝

머신러닝 실전 앙상블 (Ensemble)과 Hyperparameter 튜닝

18 분 소요

머신러닝 알고리즘의 끝판왕인 앙상블(Ensemble) 알고리즘에 대하여 알아보도록 하겠습니다. 앙상블 알고리즘은 방법론 적인 측면에서 Voting, Bagging, Boosting 알고리즘등으로 나뉠 수 있겠고, 앙상블의 앙상블 알고리즘인 Stacking 그리고 Weighted B...

GridSearch를 이용한 머신러닝 Hyperparameter 튜닝

1 분 소요

Hyperparameter 튜닝을 위해서는 다양한 방법론이 존재합니다. 가장 쉬운 방법으로는 일명 손튜닝이 있을 수 있겠구요. RandomSearch, GridSearch, HyperOpt등 다양한 방법으로 Hyperparameter를 튜닝할 수 있습니다.

맨 위로 이동 ↑

csv

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

맨 위로 이동 ↑

비전공자

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

취업

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

텐서플로 자격증

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

pyplot

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

맨 위로 이동 ↑

머신러닝 책 추천

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

api

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

설치

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

image augmentation

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

맨 위로 이동 ↑

문서요약

맨 위로 이동 ↑

API

맨 위로 이동 ↑

chat completion

맨 위로 이동 ↑

client

맨 위로 이동 ↑

linear regression

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

맨 위로 이동 ↑

convolution neural network

맨 위로 이동 ↑

amazon

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

AWS에서 딥러닝 인스턴스 만들고 jupyter notebook 실행까지!

2 분 소요

Deep learning 을 모델 학습을 위해서 high computing power가 필수 입니다. 아마존의 AWS를 통해 ‘Tesla K80’ GPU를사용하여 학습할 수 있는 인스턴스를 만들고 jupyter notebook 을 실행시켜 아마존 EC2 인스턴스에서 학습시키는 방법...

맨 위로 이동 ↑

원격접속

맨 위로 이동 ↑

mnist

맨 위로 이동 ↑

통계

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

pandas 를 활용한 기본적인 산술과 통계 적용 & 이해

4 분 소요

Pandas를 활용한 통계부분을 좀 더 다뤄보려고 합니다. 평균, 표준 편차, 분산, 중간값등 통계를 전공하셨거나, 조금이라도 공부하신 분들은 물론 익숙하시겠지만, 그렇지 않고 데이터 분석에 뛰어든 분들은 용어만 봐도 머리속에 혼란이 찾아오기 마련입니다.

맨 위로 이동 ↑

datasets

맨 위로 이동 ↑

classification

최근접 이웃 (KNN) 알고리즘을 활용한 분류

3 분 소요

K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용한 간단한 머신러닝 분류 문제를 풀어보도록 하겠습니다. 알고리즘은 동작 원리는 매우 직관적이고 단순 합니다. 이해는 어렵지 않으나, 복잡한 분류 문제에 있어서는 모델의 성능에 대한 큰 기대를 하기 어렵습니...

맨 위로 이동 ↑

정형데이터

맨 위로 이동 ↑

gpu

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

맨 위로 이동 ↑

random forest

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

Tree기반 모델(DecisionTree, RandomForest)의 분할 그래프 시각화하기 (graphviz)

2 분 소요

Tree 기반 모델은 RandomForest 모델때문에 참 인기있게 활용되는 알고리즘 입니다. RandomForest 모델은 데이터 분석 대회인 캐글에서도 활발히 활용되고 있으며, 성능이 좋을 뿐만아니라 쉽고 간편하게 사용할 수 있기 때문에 저 또한 데이터 분석 대회에서 basel...

맨 위로 이동 ↑

콜백

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

callback

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

학습률

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

learning rate

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

인공지능 공부법

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

데이터 분석 공부법

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

인공지능

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

머신러닝 공부법

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

강의 추천

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

입문

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

학습법

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

취준

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

이직

[2023년 업데이트] 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 - 데이터분석편

5 분 소요

지난 2020년에 작성한 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (1), 글과 후속 글인 데이터 분석/인공지능을 공부하려는 분들께 경험을 토대로 학습 방법과 책 추천 (2) 을 많이 읽어 주셔서 감사드립니다. 작성 당시에는 가벼운 마음으로 개인...

맨 위로 이동 ↑

주가예측

맨 위로 이동 ↑

삼성전자

맨 위로 이동 ↑

시계열

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

맨 위로 이동 ↑

한글폰트

matplotlib 에서 신규 폰트 추가하는 방법

2 분 소요

이번 포스팅에서는 matplotlib 에서 누락된 폰트를 추가 하는 방법에 대해 알아보겠습니다. 만약 설치된 폰트가 matplotlib 에서 사용할 수 없다면, 아래의 가이드를 따라 진행해 보시기 바랍니다.

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

맨 위로 이동 ↑

딥러닝 자격증

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

pycharm

맨 위로 이동 ↑

rnn

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

[tensorflow] LSTM layer 활용법

5 분 소요

시계열 데이터 그리고 NLP에서 흔히 사용되는 LSTM Layer의 주요 Hyper Parameter에 대하여 알아보고, 많이 헷갈려 하시는 input_shape 지정과 결과 값 (output)에 대해서도 직접 실행해 보면서 어떻게 동작하는지 살펴보도록 하겠습니다.

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

맨 위로 이동 ↑

경사하강법

경사하강법 (Gradient Descent) 직접 구현하기

8 분 소요

이번에는 머신러닝 뿐만아니라, 인공신경망 모델의 가장 기초가 되는 경사하강법 (Gradient Descent)에 대하여 알아보도록 하겠습니다. 경사하강법을 Python으로 직접 구현해보는 튜토리얼 입니다. 자세한 설명은 유튜브 영상을 참고해 보셔도 좋습니다.

맨 위로 이동 ↑

gradient descent

경사하강법 (Gradient Descent) 직접 구현하기

8 분 소요

이번에는 머신러닝 뿐만아니라, 인공신경망 모델의 가장 기초가 되는 경사하강법 (Gradient Descent)에 대하여 알아보도록 하겠습니다. 경사하강법을 Python으로 직접 구현해보는 튜토리얼 입니다. 자세한 설명은 유튜브 영상을 참고해 보셔도 좋습니다.

맨 위로 이동 ↑

seq2seq

[pytorch] Seq2Seq with Attention 구현 및 한 줄씩 코드 설명

17 분 소요

이번 포스팅에서는 Attention 메카니즘이 적용된 Seq2Seq 모델을 pytorch로 구현하고, 코드 한 줄씩 직접 shape를 찍어보고 확인하면서 구현된 코드 통해 동작 원리와 Attention 구조를 이해해 보도록 하겠습니다.

맨 위로 이동 ↑

데이터 분석 책 추천

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

미분

맨 위로 이동 ↑

캐글 노트북

맨 위로 이동 ↑

도커 사용법

맨 위로 이동 ↑

도커 설치

맨 위로 이동 ↑

배포

맨 위로 이동 ↑

mecab

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

lgbm

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

lightgbm

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

딥러닝 책 추천

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

형태소 분석기

맨 위로 이동 ↑

konlpy

맨 위로 이동 ↑

bert

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

tokenizer

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

요약

맨 위로 이동 ↑

자동화

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

dataloader

맨 위로 이동 ↑

학습

맨 위로 이동 ↑

검증

맨 위로 이동 ↑

평가

맨 위로 이동 ↑

embedding

맨 위로 이동 ↑

huggingface

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

주피터 노트북

맨 위로 이동 ↑

PromptTemplate

맨 위로 이동 ↑

임베딩

맨 위로 이동 ↑

프롬프트

맨 위로 이동 ↑

gpt-3.5

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

지킬블로그

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

마크다운

맨 위로 이동 ↑

비동기

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

안드로이드(Android) - AsyncTask

3 분 소요

우연치 않은 계기로 안드로이드에서 Open Source로 올려놓은 Bitmap Displaying을 그대로 따라 구현해 보려고, 소스코드를 import 시킨 후, 분석을 시작했다.

맨 위로 이동 ↑

pip

나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기

2 분 소요

PYPI는 Python Package Index의 약어로 Python 패키지 저장소의 개념으로 생각하시면 됩니다. 수 많은 개발자들이 본인이 만든 파이썬 소프트웨어를 손쉽게 설치하고 활용할 수 있도록 패키지화 하여 저장소에 업로드를 하는데요. 저장소에 업로드된 패키지를 pip in...

맨 위로 이동 ↑

one hot encoding

맨 위로 이동 ↑

원핫인코딩

맨 위로 이동 ↑

pre-processing

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

클러스터링

sklearn의 KMeans 모듈을 활용한 뉴스 클러스터링

5 분 소요

하루에도 수만개의 뉴스기사가 쏟아져 나옵니다. 수많은 뉴스기사들을 중복되거나 매우 유사도가 높은 기사들은 구독자에게 중복되게 노출시키지 않기 위해서 뉴스기사를 서비스 하고 있는 포털 사이트나 언론사에서도 뉴스기사 클러스터링 기법을 사용하고 있습니다.

맨 위로 이동 ↑

package

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

맨 위로 이동 ↑

내장 데이터셋

맨 위로 이동 ↑

iris

맨 위로 이동 ↑

크롤러

뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기

4 분 소요

최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다. request와 BeautifulSoup4를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를 표시하는 tag와 class...

맨 위로 이동 ↑

nvidia

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

맨 위로 이동 ↑

memory

맨 위로 이동 ↑

gpu 설정

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

hyperparameter

머신러닝 실전 앙상블 (Ensemble)과 Hyperparameter 튜닝

18 분 소요

머신러닝 알고리즘의 끝판왕인 앙상블(Ensemble) 알고리즘에 대하여 알아보도록 하겠습니다. 앙상블 알고리즘은 방법론 적인 측면에서 Voting, Bagging, Boosting 알고리즘등으로 나뉠 수 있겠고, 앙상블의 앙상블 알고리즘인 Stacking 그리고 Weighted B...

GridSearch를 이용한 머신러닝 Hyperparameter 튜닝

1 분 소요

Hyperparameter 튜닝을 위해서는 다양한 방법론이 존재합니다. 가장 쉬운 방법으로는 일명 손튜닝이 있을 수 있겠구요. RandomSearch, GridSearch, HyperOpt등 다양한 방법으로 Hyperparameter를 튜닝할 수 있습니다.

맨 위로 이동 ↑

decision tree

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

Tree기반 모델(DecisionTree, RandomForest)의 분할 그래프 시각화하기 (graphviz)

2 분 소요

Tree 기반 모델은 RandomForest 모델때문에 참 인기있게 활용되는 알고리즘 입니다. RandomForest 모델은 데이터 분석 대회인 캐글에서도 활발히 활용되고 있으며, 성능이 좋을 뿐만아니라 쉽고 간편하게 사용할 수 있기 때문에 저 또한 데이터 분석 대회에서 basel...

맨 위로 이동 ↑

built in function

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

맨 위로 이동 ↑

lambda

맨 위로 이동 ↑

filter

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

맨 위로 이동 ↑

labelencoder

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

github pages

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

조기종료

[pytorch] Early Stopping 조기종료 구현 및 적용

4 분 소요

조기 종료(Early Stopping)는 학습시 일정기간(여기서 기간은 보통 N번의 Epoch을 기준으로 합니다)동안 Loss 나 Score 기준으로 개선이 일어나지 않으면 학습을 조기에 종료해 주는 기능입니다. 만약, 20번의 Epoch 동안 학습이 진행한다고 가정했을 때, 아래...

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

맨 위로 이동 ↑

패스트캠퍼스

맨 위로 이동 ↑

google tensorflow developers certificate

맨 위로 이동 ↑

tdc

맨 위로 이동 ↑

딥러닝 자격증 취득

맨 위로 이동 ↑

image classification

맨 위로 이동 ↑

nlp

맨 위로 이동 ↑

그래프

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

맨 위로 이동 ↑

차트

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

맨 위로 이동 ↑

텐서보드

맨 위로 이동 ↑

tensorboard

맨 위로 이동 ↑

전이학습

맨 위로 이동 ↑

transfer learning

맨 위로 이동 ↑

fillna

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

맨 위로 이동 ↑

시계열데이터

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

맨 위로 이동 ↑

파이참

맨 위로 이동 ↑

선형회귀

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

맨 위로 이동 ↑

attention

[pytorch] Seq2Seq with Attention 구현 및 한 줄씩 코드 설명

17 분 소요

이번 포스팅에서는 Attention 메카니즘이 적용된 Seq2Seq 모델을 pytorch로 구현하고, 코드 한 줄씩 직접 shape를 찍어보고 확인하면서 구현된 코드 통해 동작 원리와 Attention 구조를 이해해 보도록 하겠습니다.

맨 위로 이동 ↑

AI주가

맨 위로 이동 ↑

금융

맨 위로 이동 ↑

prophet

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

상속

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

pandas tutorial

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

맨 위로 이동 ↑

sort

맨 위로 이동 ↑

타입 변환

맨 위로 이동 ↑

튜닝

맨 위로 이동 ↑

자료구조

넘파이(Numpy) 튜토리얼

11 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 수치계산용 라이브러리인 넘파이(numpy) 를 다룹니다.

#01-파이썬(Python) 기본 자료구조

4 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

딥러닝 도커

맨 위로 이동 ↑

실행

맨 위로 이동 ↑

xgboost

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

groupby

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

피벗테이블

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

판다스 데이터 분석

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

인공지능 책

맨 위로 이동 ↑

테디노트 책

맨 위로 이동 ↑

테디노트 실험실

맨 위로 이동 ↑

캐글 대회

맨 위로 이동 ↑

eda

맨 위로 이동 ↑

pycaret

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

커널 필사

맨 위로 이동 ↑

api key

맨 위로 이동 ↑

옵튜나

맨 위로 이동 ↑

optuna

맨 위로 이동 ↑

tensor

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

맨 위로 이동 ↑

텐서

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

맨 위로 이동 ↑

copying

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

맨 위로 이동 ↑

sharing

[PyTorch] numpy로부터 텐서 변환(copying과 sharing의 차이)

1 분 소요

이번 포스팅에서는 Tensor의 기본 특징과 PyTorch에서 정의한 Tensor타입, PyTorch에서 numpy array를 tensor 변환시 3가지 함수 from_numpy(), as_tensor(), tensor()의 사용법과 그 차이점에 대하여 알아보도록 하겠습니다.

맨 위로 이동 ↑

imagefolder

맨 위로 이동 ↑

fashion mnist

맨 위로 이동 ↑

자동미분

맨 위로 이동 ↑

autograd

맨 위로 이동 ↑

회귀

맨 위로 이동 ↑

회귀 예측

맨 위로 이동 ↑

보스톤 주택가격

맨 위로 이동 ↑

custom dataset

맨 위로 이동 ↑

cats and dogs

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

맨 위로 이동 ↑

image transforms

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

맨 위로 이동 ↑

ilsvrc

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

AlexNet Implementation(구현) by PyTorch

6 분 소요

AlexNet(2012) 의 PyTorch 구현 입니다. 논문에 대한 세부 인사이트는 생략하며, 오직 코드 구현만 다룹니다.

맨 위로 이동 ↑

논문

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

AlexNet Implementation(구현) by PyTorch

6 분 소요

AlexNet(2012) 의 PyTorch 구현 입니다. 논문에 대한 세부 인사이트는 생략하며, 오직 코드 구현만 다룹니다.

맨 위로 이동 ↑

miniconda

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

텍스트 분류

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

허깅페이스

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

gpt3

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

airtable

파이썬, 데이터분석가를 위한 초간단 파일공유 서비스

최대 1 분 소요

본 내용은 자체 제작한 파일공유 서비스에 대한 내용입니다. 말그대로 파일을 가장 쉬운 방법으로 공유할 수 있는 서비스이며, 링크를 활용하여 공유할 수 있습니다. Python, wget 명령어로 다운로드 받는 코드를 제공하며, 비밀번호로 암호화 하여 공유도 가능합니다.

맨 위로 이동 ↑

데이터분석

파이썬, 데이터분석가를 위한 초간단 파일공유 서비스

최대 1 분 소요

본 내용은 자체 제작한 파일공유 서비스에 대한 내용입니다. 말그대로 파일을 가장 쉬운 방법으로 공유할 수 있는 서비스이며, 링크를 활용하여 공유할 수 있습니다. Python, wget 명령어로 다운로드 받는 코드를 제공하며, 비밀번호로 암호화 하여 공유도 가능합니다.

맨 위로 이동 ↑

gru

[pytorch] GRU 입력 텐서와 출력 텐서의 shape 이해

1 분 소요

이번에는 지난 LSTM 입력 텐서와 출력 텐서의 shape 이해 의 후속편으로써, pytorch의 GRU layer의 입출력 텐서의 shape에 대하여 이해해 보고 세부 옵션에 대하여 자세히 알아보도록 하겠습니다.

맨 위로 이동 ↑

chatbot

맨 위로 이동 ↑

arima

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

sarimax

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

PDF

맨 위로 이동 ↑

whisper

맨 위로 이동 ↑

dalle

맨 위로 이동 ↑

openai api

맨 위로 이동 ↑

문서 검색

맨 위로 이동 ↑

AI

맨 위로 이동 ↑

챗봇

맨 위로 이동 ↑

GPT-4

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

API KEY

맨 위로 이동 ↑

LangSmith

맨 위로 이동 ↑

RAG

맨 위로 이동 ↑

리트리버

맨 위로 이동 ↑

벡터DB

맨 위로 이동 ↑

synology

[Windows] 시놀로지 외부 네트워크 드라이브 설정 (WebDAV)

최대 1 분 소요

시놀로지를 네트워크 드라이브에 추가하여 사용한다면 편리한 점들이 많다. 특히, 노트북으로 작업할 때, 용량 부족으로 허덕이는 경우가 많은데, 외부 네트워크를 추가하여 마치 작업할 때는 로컬 폴더 처럼 활용하지만, 실제 로컬 상으로는 아무런 용량 낭비가 없고 시놀로지에서 보관하기 때...

맨 위로 이동 ↑

시놀로지

[Windows] 시놀로지 외부 네트워크 드라이브 설정 (WebDAV)

최대 1 분 소요

시놀로지를 네트워크 드라이브에 추가하여 사용한다면 편리한 점들이 많다. 특히, 노트북으로 작업할 때, 용량 부족으로 허덕이는 경우가 많은데, 외부 네트워크를 추가하여 마치 작업할 때는 로컬 폴더 처럼 활용하지만, 실제 로컬 상으로는 아무런 용량 낭비가 없고 시놀로지에서 보관하기 때...

맨 위로 이동 ↑

나스

[Windows] 시놀로지 외부 네트워크 드라이브 설정 (WebDAV)

최대 1 분 소요

시놀로지를 네트워크 드라이브에 추가하여 사용한다면 편리한 점들이 많다. 특히, 노트북으로 작업할 때, 용량 부족으로 허덕이는 경우가 많은데, 외부 네트워크를 추가하여 마치 작업할 때는 로컬 폴더 처럼 활용하지만, 실제 로컬 상으로는 아무런 용량 낭비가 없고 시놀로지에서 보관하기 때...

맨 위로 이동 ↑

Nas

[Windows] 시놀로지 외부 네트워크 드라이브 설정 (WebDAV)

최대 1 분 소요

시놀로지를 네트워크 드라이브에 추가하여 사용한다면 편리한 점들이 많다. 특히, 노트북으로 작업할 때, 용량 부족으로 허덕이는 경우가 많은데, 외부 네트워크를 추가하여 마치 작업할 때는 로컬 폴더 처럼 활용하지만, 실제 로컬 상으로는 아무런 용량 낭비가 없고 시놀로지에서 보관하기 때...

맨 위로 이동 ↑

typone mars pro

맥(Mac) 호환 기계식 키보드 - Typone Mars Pro

3 분 소요

Mac을 주 컴퓨터로 사용하는 사람들에게는 희소식이다. 맥용 기계식 키보드가 출시 되었기 때문이다. 제품명은 Typone Mars Pro 이며, 오리지널 Cherry MX 스위치를 사용하였다. 그럼 오늘 수령한 제품에 대하여 따끈따끈한 리뷰를 해보도록 하겠다.

맨 위로 이동 ↑

타이폰 마스 프로

맥(Mac) 호환 기계식 키보드 - Typone Mars Pro

3 분 소요

Mac을 주 컴퓨터로 사용하는 사람들에게는 희소식이다. 맥용 기계식 키보드가 출시 되었기 때문이다. 제품명은 Typone Mars Pro 이며, 오리지널 Cherry MX 스위치를 사용하였다. 그럼 오늘 수령한 제품에 대하여 따끈따끈한 리뷰를 해보도록 하겠다.

맨 위로 이동 ↑

맥용 기계식 키보드

맥(Mac) 호환 기계식 키보드 - Typone Mars Pro

3 분 소요

Mac을 주 컴퓨터로 사용하는 사람들에게는 희소식이다. 맥용 기계식 키보드가 출시 되었기 때문이다. 제품명은 Typone Mars Pro 이며, 오리지널 Cherry MX 스위치를 사용하였다. 그럼 오늘 수령한 제품에 대하여 따끈따끈한 리뷰를 해보도록 하겠다.

맨 위로 이동 ↑

jekyll

맨 위로 이동 ↑

markdown

맨 위로 이동 ↑

android

안드로이드(Android) - AsyncTask

3 분 소요

우연치 않은 계기로 안드로이드에서 Open Source로 올려놓은 Bitmap Displaying을 그대로 따라 구현해 보려고, 소스코드를 import 시킨 후, 분석을 시작했다.

맨 위로 이동 ↑

asynctask

안드로이드(Android) - AsyncTask

3 분 소요

우연치 않은 계기로 안드로이드에서 Open Source로 올려놓은 Bitmap Displaying을 그대로 따라 구현해 보려고, 소스코드를 import 시킨 후, 분석을 시작했다.

맨 위로 이동 ↑

mysql

맨 위로 이동 ↑

mysqlclient

맨 위로 이동 ↑

선형회귀 알고리즘

맨 위로 이동 ↑

보스톤 주택가격 예측

맨 위로 이동 ↑

softmax

Deep Learning - Softmax 함수란

최대 1 분 소요

인공신경망에서 출력층의 정규화를 위한 함수인 소프트맥스(softmax)함수에 대하여 알아보겠다.

맨 위로 이동 ↑

소프트맥스

Deep Learning - Softmax 함수란

최대 1 분 소요

인공신경망에서 출력층의 정규화를 위한 함수인 소프트맥스(softmax)함수에 대하여 알아보겠다.

맨 위로 이동 ↑

mnist 손글씨

맨 위로 이동 ↑

xor

맨 위로 이동 ↑

neural network

맨 위로 이동 ↑

virtual env

Anaconda를 활용한 python 가상환경(virtual env) 설정하기

3 분 소요

이번 포스팅에서는 Python을 활용하여 개발 / 혹은 jupyter notebook을 사용할 때 필수인 가상환경 (Virtual Environment) 설정하는 법에 대한 팁과 간단한 강좌를 공유해 드리도록 하겠습니다.

맨 위로 이동 ↑

파이썬 가상환경

Anaconda를 활용한 python 가상환경(virtual env) 설정하기

3 분 소요

이번 포스팅에서는 Python을 활용하여 개발 / 혹은 jupyter notebook을 사용할 때 필수인 가상환경 (Virtual Environment) 설정하는 법에 대한 팁과 간단한 강좌를 공유해 드리도록 하겠습니다.

맨 위로 이동 ↑

conv2d

맨 위로 이동 ↑

cond2d 계산

맨 위로 이동 ↑

인스턴스

AWS에서 딥러닝 인스턴스 만들고 jupyter notebook 실행까지!

2 분 소요

Deep learning 을 모델 학습을 위해서 high computing power가 필수 입니다. 아마존의 AWS를 통해 ‘Tesla K80’ GPU를사용하여 학습할 수 있는 인스턴스를 만들고 jupyter notebook 을 실행시켜 아마존 EC2 인스턴스에서 학습시키는 방법...

맨 위로 이동 ↑

네임서버

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

맨 위로 이동 ↑

가비아

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

맨 위로 이동 ↑

cafe24

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

맨 위로 이동 ↑

도메인 설정

아마존 AWS에서 생성한 인스턴스와 도메인 네임서버(가비아/cafe24) 설정하기

1 분 소요

아마존 AWS에 워드프레서 AMI(무료 인스턴스)를 생성하고, 이를 이전에 미리 구매한 도메인과 네임서버 연결하는 작업을 해 보았습니다. 우선, 워드프레스 호스팅을 위하여 아마존에 인스턴스를 생성하고 셋업하는 과정은 매우 간단하였고 불과 10분남짓이면 생성할 수 있었습니다. 이에 ...

맨 위로 이동 ↑

django

맨 위로 이동 ↑

ec2 인스턴스

맨 위로 이동 ↑

visual studio code

맨 위로 이동 ↑

ftp simple

맨 위로 이동 ↑

aws 원격작업

맨 위로 이동 ↑

aws 인스턴스

맨 위로 이동 ↑

크론탭

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

맨 위로 이동 ↑

crontab

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

맨 위로 이동 ↑

virtualenv

[Linux] Python(.py)을 가상환경(virtualenv)에서 주기별로 실행하기

1 분 소요

python으로 주기적으로 크롤링 작업을 하거나, 또는 기타 여러가지 상황때문에 .py 파일을 리눅스 환경에서 주기적으로 실행하고 싶은 경우가 있을 겁니다. 그리고 대부분 .py 파일별로 다른 가상환경에서 .py를 실행시켜야 하는 경우도 있을 겁니다.

맨 위로 이동 ↑

tmux

맨 위로 이동 ↑

zsh

맨 위로 이동 ↑

oh my zsh

맨 위로 이동 ↑

zsh 스타일링

맨 위로 이동 ↑

kmeans clustering

sklearn의 KMeans 모듈을 활용한 뉴스 클러스터링

5 분 소요

하루에도 수만개의 뉴스기사가 쏟아져 나옵니다. 수많은 뉴스기사들을 중복되거나 매우 유사도가 높은 기사들은 구독자에게 중복되게 노출시키지 않기 위해서 뉴스기사를 서비스 하고 있는 포털 사이트나 언론사에서도 뉴스기사 클러스터링 기법을 사용하고 있습니다.

맨 위로 이동 ↑

비지도학습

sklearn의 KMeans 모듈을 활용한 뉴스 클러스터링

5 분 소요

하루에도 수만개의 뉴스기사가 쏟아져 나옵니다. 수많은 뉴스기사들을 중복되거나 매우 유사도가 높은 기사들은 구독자에게 중복되게 노출시키지 않기 위해서 뉴스기사를 서비스 하고 있는 포털 사이트나 언론사에서도 뉴스기사 클러스터링 기법을 사용하고 있습니다.

맨 위로 이동 ↑

손글씨 인식

맨 위로 이동 ↑

remote

맨 위로 이동 ↑

ec2 instance

aws ec2(ubuntu 18.04)에서 flask와 nginx 설정하기

2 분 소요

AWS의 EC2 인스턴스를 열고, ubuntu 18.04에서 Python으로 Flask 앱을 만든 후 nginx 설정하여 내가 호스팅하고 싶은 도메인과 연결하여 80포트에서 접속가능하도록 설정하는 방법에 대해서 알아보도록 하겠습니다.

맨 위로 이동 ↑

flask

aws ec2(ubuntu 18.04)에서 flask와 nginx 설정하기

2 분 소요

AWS의 EC2 인스턴스를 열고, ubuntu 18.04에서 Python으로 Flask 앱을 만든 후 nginx 설정하여 내가 호스팅하고 싶은 도메인과 연결하여 80포트에서 접속가능하도록 설정하는 방법에 대해서 알아보도록 하겠습니다.

맨 위로 이동 ↑

nginx

aws ec2(ubuntu 18.04)에서 flask와 nginx 설정하기

2 분 소요

AWS의 EC2 인스턴스를 열고, ubuntu 18.04에서 Python으로 Flask 앱을 만든 후 nginx 설정하여 내가 호스팅하고 싶은 도메인과 연결하여 80포트에서 접속가능하도록 설정하는 방법에 대해서 알아보도록 하겠습니다.

맨 위로 이동 ↑

10 minutes to pandas

맨 위로 이동 ↑

부동산 데이터 분석

맨 위로 이동 ↑

git alias

맨 위로 이동 ↑

git global config

맨 위로 이동 ↑

git diff

git diff를 gui tool인 p4 merge로 설정하기 (global config)

2 분 소요

visual Diff Tool인 P4Merge를 설치하고, 이를 활용하여 git diff를 터미널이나 vim이 아닌 GUI Tool에서 diff를 보거나, merge를 할 수 있도록 global config를 설정하는 방법에 대해 알아보겠습니다.

맨 위로 이동 ↑

p4 merge

git diff를 gui tool인 p4 merge로 설정하기 (global config)

2 분 소요

visual Diff Tool인 P4Merge를 설치하고, 이를 활용하여 git diff를 터미널이나 vim이 아닌 GUI Tool에서 diff를 보거나, merge를 할 수 있도록 global config를 설정하는 방법에 대해 알아보겠습니다.

맨 위로 이동 ↑

git merge

git diff를 gui tool인 p4 merge로 설정하기 (global config)

2 분 소요

visual Diff Tool인 P4Merge를 설치하고, 이를 활용하여 git diff를 터미널이나 vim이 아닌 GUI Tool에서 diff를 보거나, merge를 할 수 있도록 global config를 설정하는 방법에 대해 알아보겠습니다.

맨 위로 이동 ↑

손글씨 분류

맨 위로 이동 ↑

machine-learning

맨 위로 이동 ↑

피클

맨 위로 이동 ↑

pickle

맨 위로 이동 ↑

kneighbors

맨 위로 이동 ↑

뉴스기사 수집

뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기

4 분 소요

최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다. request와 BeautifulSoup4를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를 표시하는 tag와 class...

맨 위로 이동 ↑

rss 크롤링

뉴스 기사 와 RSS 피드에서 손쉽게 크롤링 하여 정보 수집하기

4 분 소요

최근 뉴스 기사를 크롤링하여 군집화 하는 작업을 하기 위해서, 국내 신문기사의 정보들을 크롤링해야하는 작업이 필요하였습니다. request와 BeautifulSoup4를 사용해서 크롤링하는 것은 간단하지만, 언론사 웹사이트 별로 기사의 contents를 표시하는 tag와 class...

맨 위로 이동 ↑

타이타닉 생존자 예측

Kaggle(캐글) 타이타닉 생존자 예측 81% 이상 달성하기

5 분 소요

캐글(Kaggle)의 대표적인 입문용 데이터 분석 경진대회인 타이타닉 생존자 예측 (Titanic: Machine Learning from Disaster) 에서 81% 이상의 정확도를 기록하여 상위 5% 안에 들 수 있는 Solution을 공유하고자 합니다.

맨 위로 이동 ↑

git clean

git clean으로 untracked files 제거하기

최대 1 분 소요

git의 untracked files에 단 2개의 명령어로 clean하기 전에 확인하는 방법과 실제 clean하는 방법을 공유드리고자 합니다.

맨 위로 이동 ↑

untracked files

git clean으로 untracked files 제거하기

최대 1 분 소요

git의 untracked files에 단 2개의 명령어로 clean하기 전에 확인하는 방법과 실제 clean하는 방법을 공유드리고자 합니다.

맨 위로 이동 ↑

gpu 설치

딥러닝 PC에 Ubuntu 18.04 설치 후 CUDA 10, cuDNN 설치하기

3 분 소요

Amazon AWS에서 좋은 GPU 자원으로 딥러닝을 돌리다보니 요금폭탄을 맞았습니다.. 그래서 이참에 딥러닝 PC를 구매를 하게 되었고 딥러닝 서버를 위한 CUDA 및 cuDNN까지 설치하는 방법에 대하여 알려드리고자 합니다.

맨 위로 이동 ↑

mirror

맨 위로 이동 ↑

kakao

맨 위로 이동 ↑

딥러닝 서버

맨 위로 이동 ↑

메모리

맨 위로 이동 ↑

ssd

맨 위로 이동 ↑

캐글 api

맨 위로 이동 ↑

kaggle api

맨 위로 이동 ↑

voting ensemble

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

맨 위로 이동 ↑

보팅 앙상블

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

맨 위로 이동 ↑

hard_vote

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

맨 위로 이동 ↑

soft_vote

앙상블 학습(ensemble learning)으로 알고리즘 성능 개선하기(1) - Voting

2 분 소요

Kaggle의 상위 솔루션들만 봐도 알겠지만, 단일 모델로는 어느 정도 성능을 극으로 끌어올리기는 한계가 있습니다. 그렇기 때문에 거의 모든 상위권에 랭크되는 솔루션들을 살펴보면 앙상블 학습(emsemble learning)으로 랭크를 올리는 모습을 볼 수 있습니다. 이번 포스팅에...

맨 위로 이동 ↑

bagging ensemble

맨 위로 이동 ↑

boosting

맨 위로 이동 ↑

stacking

맨 위로 이동 ↑

gbm

맨 위로 이동 ↑

gradient

맨 위로 이동 ↑

gridsearch

GridSearch를 이용한 머신러닝 Hyperparameter 튜닝

1 분 소요

Hyperparameter 튜닝을 위해서는 다양한 방법론이 존재합니다. 가장 쉬운 방법으로는 일명 손튜닝이 있을 수 있겠구요. RandomSearch, GridSearch, HyperOpt등 다양한 방법으로 Hyperparameter를 튜닝할 수 있습니다.

맨 위로 이동 ↑

그래프 시각화

Tree기반 모델(DecisionTree, RandomForest)의 분할 그래프 시각화하기 (graphviz)

2 분 소요

Tree 기반 모델은 RandomForest 모델때문에 참 인기있게 활용되는 알고리즘 입니다. RandomForest 모델은 데이터 분석 대회인 캐글에서도 활발히 활용되고 있으며, 성능이 좋을 뿐만아니라 쉽고 간편하게 사용할 수 있기 때문에 저 또한 데이터 분석 대회에서 basel...

맨 위로 이동 ↑

graphviz

Tree기반 모델(DecisionTree, RandomForest)의 분할 그래프 시각화하기 (graphviz)

2 분 소요

Tree 기반 모델은 RandomForest 모델때문에 참 인기있게 활용되는 알고리즘 입니다. RandomForest 모델은 데이터 분석 대회인 캐글에서도 활발히 활용되고 있으며, 성능이 좋을 뿐만아니라 쉽고 간편하게 사용할 수 있기 때문에 저 또한 데이터 분석 대회에서 basel...

맨 위로 이동 ↑

차원축소

맨 위로 이동 ↑

주성분 분석

맨 위로 이동 ↑

pca

맨 위로 이동 ↑

utf8

맨 위로 이동 ↑

인코딩

맨 위로 이동 ↑

encoding

맨 위로 이동 ↑

공공데이터

맨 위로 이동 ↑

map

맨 위로 이동 ↑

reduce

맨 위로 이동 ↑

imdb

맨 위로 이동 ↑

word2vec

맨 위로 이동 ↑

pre-trained 모델

맨 위로 이동 ↑

감정분류

맨 위로 이동 ↑

라벨인코더

맨 위로 이동 ↑

category dtype

맨 위로 이동 ↑

google adsense

맨 위로 이동 ↑

구글 애드센스

맨 위로 이동 ↑

구글 광고

맨 위로 이동 ↑

블로그 수익화

맨 위로 이동 ↑

github blog

맨 위로 이동 ↑

seo

맨 위로 이동 ↑

google search engine

맨 위로 이동 ↑

google analytics

맨 위로 이동 ↑

키워드 분석

맨 위로 이동 ↑

손실함수

맨 위로 이동 ↑

loss function

맨 위로 이동 ↑

평가지표

맨 위로 이동 ↑

metrics

맨 위로 이동 ↑

데이터셋 분할

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

맨 위로 이동 ↑

train_test_split

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

맨 위로 이동 ↑

train set

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

맨 위로 이동 ↑

validation set

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

맨 위로 이동 ↑

test set

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

맨 위로 이동 ↑

stratify

train_test_split 모듈을 활용하여 학습과 테스트 세트 분리

2 분 소요

사이킷런(scikit-learn)의 model_selection 패키지 안에 train_test_split 모듈을 활용하여 손쉽게 train set(학습 데이터 셋)과 test set(테스트 셋)을 분리할 수 있습니다. 이번 포스팅에서는 train_test_split 에 대해 자세...

맨 위로 이동 ↑

reducelronplateau

[Keras] 콜백함수 (1) - 학습률(learning rate): ReduceLROnPlateau

최대 1 분 소요

keras의 콜백함수인 ReduceLROnPlateau는 학습률이 개선되지 않을 때, 학습률을 동적으로 조정하여 학습률을 개선하는 효과를 기대할 수 있습니다. 경사하강법에 의하여 학습을 하는 경우 Local Minima에 빠져버리게 되면, 더이상 학습률이 개선되지 않고 정체되거나,...

맨 위로 이동 ↑

모델 체크포인트

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

맨 위로 이동 ↑

model checkpoint

[Keras] 콜백함수 (2) - weight 중간 저장: ModelCheckpoint

최대 1 분 소요

keras의 콜백함수인 ModelCheckpoint는 모델이 학습하면서 정의한 조건을 만족했을 때 Model의 weight 값을 중간 저장해 줍니다. 학습시간이 꽤 오래걸린다면, 모델이 개선된 validation score를 도출해낼 때마다 weight를 중간 저장함으로써, 혹시 ...

맨 위로 이동 ↑

earlystopping

[Keras] 콜백함수 (3) - 조기종료: EarlyStopping

최대 1 분 소요

EarlyStopping 콜백을 활용하면, model의 성능 지표가 설정한 epoch동안 개선되지 않을 때 조기 종료할 수 있습니다. EarlyStopping과 이전에 언급한 ModelCheckpoint 콜백의 조합을 통하여, 개선되지 않는 학습에 대한 조기 종료를 실행하고, Mo...

맨 위로 이동 ↑

런타임

맨 위로 이동 ↑

우분투

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

맨 위로 이동 ↑

nanum

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

맨 위로 이동 ↑

나눔고딕 설치

Ubuntu의 Docker환경에서 matplotlib 한글폰트 설치 및 적용

최대 1 분 소요

Ubuntu 의 Docker 환경으로 Jupyter Notebook 서버를 돌리고 있을 때 matplotlib 한글 깨짐 현상이 종종일어납니다. 이럴 땐 한 번 한글폰트 설치 후 Image를 백업시키는 것도 방법이 될 수 있습니다.

맨 위로 이동 ↑

kbo

맨 위로 이동 ↑

데이터 분석 강의

맨 위로 이동 ↑

coding

맨 위로 이동 ↑

lecture

맨 위로 이동 ↑

magic command

맨 위로 이동 ↑

digit recognizer

맨 위로 이동 ↑

canvas

맨 위로 이동 ↑

워드임베딩

맨 위로 이동 ↑

word embedding

맨 위로 이동 ↑

sarsasm dataset

맨 위로 이동 ↑

통계차트

Seaborn의 통계 차트 및 데이터 시각화 예제

6 분 소요

seaborn은 matplotlib의 상위 호환 데이터 시각화를 위한 라이브러리입니다. seaborn패키지는 데이터프레임으로 다양한 통계 지표를 낼 수 있는 시각화 차트를 제공하기 때문에 데이터 분석에 활발히 사용되고 있는 라이브러리입니다.

맨 위로 이동 ↑

batch

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

맨 위로 이동 ↑

window

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

맨 위로 이동 ↑

flat_map

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

맨 위로 이동 ↑

data loader

[tensorflow] Dataset, batch, window, flat_map을 활용한 loader 만들기

9 분 소요

tf.data.Dataset을 활용하여 다양한 Dataset 로더를 만들 수 있습니다. 그리고, 로더를 활용하여, shuffle, batch_size, window 데이터셋 생성등 다양한 종류를 데이터 셋을 상황에 맞게 생성하고 모델에 feed할 수 있도록 제공해 줍니다.

맨 위로 이동 ↑

imagedatagenerator

맨 위로 이동 ↑

datasets api

TensorFlow Datasets API 활용법

3 분 소요

TensorFlow Datasets 는 다양한 데이터셋을 TensorFlow에서 활용하기 쉽도록 제공합니다. 굉장히 많고, 다양한 데이터셋이 학습하기 편한 형태로 제공 되기 때문에, 간단한 사용법만 알아두어도, 샘플로 모델을 돌려보고 학습하기에 매우 유용합니다.

맨 위로 이동 ↑

gan

맨 위로 이동 ↑

vanilla gan

맨 위로 이동 ↑

vgg16

맨 위로 이동 ↑

오토인코더

[tensorflow] 오토인코더 구현 (MNIST)

5 분 소요

이번 포스팅에서는 오토인코더의 기본 개념에 대하여 알아보고, TensorFlow 2.0으로 오토인코더(Autoencoder)를 구현해 보겠습니다.

맨 위로 이동 ↑

autoencoder

[tensorflow] 오토인코더 구현 (MNIST)

5 분 소요

이번 포스팅에서는 오토인코더의 기본 개념에 대하여 알아보고, TensorFlow 2.0으로 오토인코더(Autoencoder)를 구현해 보겠습니다.

맨 위로 이동 ↑

github

깃헙(GitHub) 웹사이트 기능들로 GitHub 입문하기

최대 1 분 소요

Git, GitHub은 프로젝트의 협업을 위해서 꼭 필요한 소스코드 형상 관리 시스템입니다. 형상 관리 시스템은 소스코드의 버전 관리 시스템이라고도 불리웁니다. 다수의 인원이 하나의 프로젝트를 진행할 때, 소스코드의 충돌을 효율적으로 해결하고, 업데이트되는 사항들을 병합해주기도 ...

맨 위로 이동 ↑

deep-learning

맨 위로 이동 ↑

gradient-tape

맨 위로 이동 ↑

interpolation

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

맨 위로 이동 ↑

interpolate

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

맨 위로 이동 ↑

결측치 보간

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

맨 위로 이동 ↑

결측치 처리

Pandas를 활용한 결측치 보간(interpolation) 하기

2 분 소요

탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을 볼 수 있습니다. 우리는 이런 경우 결측치를 버릴건지(drop), 혹은 채워주어야 합니다. 그러나, 데이터를 함부로 drop하여 머신러닝 예측을 ...

맨 위로 이동 ↑

나라장터

맨 위로 이동 ↑

입찰공고

맨 위로 이동 ↑

입찰

맨 위로 이동 ↑

토건

맨 위로 이동 ↑

토목

맨 위로 이동 ↑

입찰강의

맨 위로 이동 ↑

text_generation

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

맨 위로 이동 ↑

텐서플로 강의

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

맨 위로 이동 ↑

텐서플로 튜토리얼

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

맨 위로 이동 ↑

shakespear

[tensorflow] RNN Text 생성 (셰익스피어 글 생성)

6 분 소요

텐서플로우 공식 튜토리얼인 순환 신경망을 활용한 문자열 생성에 대한 클론 코드입니다. 셰익스피어 글 데이터셋을 활용하여 인공지능 모델을 학습시키고, 셰익스피어 스타일의 글을 생성할 수 있는 모델을 만들어 보도록 하겠습니다.

맨 위로 이동 ↑

코랩

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

맨 위로 이동 ↑

코랩 한글

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

맨 위로 이동 ↑

colab 한글

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

맨 위로 이동 ↑

한글깨짐

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

맨 위로 이동 ↑

코랩 한글깨짐

구글 코랩(colab) 한글 깨짐 현상 해결방법

최대 1 분 소요

구글 colab에서 시각화 라이브러리(matplotlib, seaborn)을 사용하게 되면 한글 깨짐 현상이 나타나게 됩니다. 한글 폰트 깨짐 현상에 대한 해결 방법에 대하여 알려드리겠습니다.

맨 위로 이동 ↑

dll

맨 위로 이동 ↑

dll load failed

맨 위로 이동 ↑

dll 오류

맨 위로 이동 ↑

dll 에러

맨 위로 이동 ↑

visual studio

맨 위로 이동 ↑

윈도우10

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

windows10

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

tensorflow gpu install

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

tensorflow gpu

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

tensorflow windows

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

텐서플로 설치

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

텐서플로 GPU

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

텐서플로 윈도우

텐서플로(tensorflow) 윈도우 10 GPU 설치

1 분 소요

텐서플로우(TensorFlow) 2.0 를 윈도우(Windows) 10에서 GPU를 활용하여 학습할 수 있도록 설치하는 방법에 대하여 공유드리고자 합니다.

맨 위로 이동 ↑

캡스톤 프로젝트

맨 위로 이동 ↑

capstone

맨 위로 이동 ↑

비전공장

맨 위로 이동 ↑

입문자

맨 위로 이동 ↑

빅데이터

맨 위로 이동 ↑

포트폴리오

맨 위로 이동 ↑

멘토링

맨 위로 이동 ↑

국민연금

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

맨 위로 이동 ↑

연봉추정

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

맨 위로 이동 ↑

크레딧잡

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

맨 위로 이동 ↑

kreditjob

국민연금 데이터를 활용한 연봉추정 분석

16 분 소요

국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.

맨 위로 이동 ↑

최소제곱법

맨 위로 이동 ↑

least ordinary squares

맨 위로 이동 ↑

ols

맨 위로 이동 ↑

machine leaerning

경사하강법 (Gradient Descent) 직접 구현하기

8 분 소요

이번에는 머신러닝 뿐만아니라, 인공신경망 모델의 가장 기초가 되는 경사하강법 (Gradient Descent)에 대하여 알아보도록 하겠습니다. 경사하강법을 Python으로 직접 구현해보는 튜토리얼 입니다. 자세한 설명은 유튜브 영상을 참고해 보셔도 좋습니다.

맨 위로 이동 ↑

sgdregressor

경사하강법 (Gradient Descent) 직접 구현하기

8 분 소요

이번에는 머신러닝 뿐만아니라, 인공신경망 모델의 가장 기초가 되는 경사하강법 (Gradient Descent)에 대하여 알아보도록 하겠습니다. 경사하강법을 Python으로 직접 구현해보는 튜토리얼 입니다. 자세한 설명은 유튜브 영상을 참고해 보셔도 좋습니다.

맨 위로 이동 ↑

load_iris

맨 위로 이동 ↑

scaler

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

standardscaler

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

minmaxscaler

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

스케일러

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

inverse transform

scikit-learn 데이터 전처리

6 분 소요

데이터 전처리는 데이터 분석 및 머신러닝 학습을 위해서 매우 중요한 단계 입니다. 실무 프로젝트에서는 전체 프로젝트 기간 중 평균 50~70% 이상 시간을 전처리 및 EDA에 투자한다고 합니다. 그만큼 좋은 전처리를 하면 할수록 좋은 성능을 내는 머신러닝 모델을 만들 수 있습니다.

맨 위로 이동 ↑

knn

최근접 이웃 (KNN) 알고리즘을 활용한 분류

3 분 소요

K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용한 간단한 머신러닝 분류 문제를 풀어보도록 하겠습니다. 알고리즘은 동작 원리는 매우 직관적이고 단순 합니다. 이해는 어렵지 않으나, 복잡한 분류 문제에 있어서는 모델의 성능에 대한 큰 기대를 하기 어렵습니...

맨 위로 이동 ↑

최근접 이웃 분류

최근접 이웃 (KNN) 알고리즘을 활용한 분류

3 분 소요

K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용한 간단한 머신러닝 분류 문제를 풀어보도록 하겠습니다. 알고리즘은 동작 원리는 매우 직관적이고 단순 합니다. 이해는 어렵지 않으나, 복잡한 분류 문제에 있어서는 모델의 성능에 대한 큰 기대를 하기 어렵습니...

맨 위로 이동 ↑

분류 알고리즘

최근접 이웃 (KNN) 알고리즘을 활용한 분류

3 분 소요

K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용한 간단한 머신러닝 분류 문제를 풀어보도록 하겠습니다. 알고리즘은 동작 원리는 매우 직관적이고 단순 합니다. 이해는 어렵지 않으나, 복잡한 분류 문제에 있어서는 모델의 성능에 대한 큰 기대를 하기 어렵습니...

맨 위로 이동 ↑

lasso

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

맨 위로 이동 ↑

ridge

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

맨 위로 이동 ↑

elasticnet

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

맨 위로 이동 ↑

규제

Lasso, Ridge, ElasticNet-L1, L2규제를 적용한 선형 알고리즘

15 분 소요

선형 알고리즘에 기반한 알고리즘에 대해서 알아보고 회귀 (Regression) 문제를 다뤄보도록 하겠습니다. 이번 선형 알고리즘에 기반한 회귀 문제를 다룰 때 L1, L2 규제의 개념이 등장합니다. L1, L2 규제는 딥러닝까지 쭉 이어지는 개념이고, 앞으로 머신러닝/딥러닝 학습시...

맨 위로 이동 ↑

로지스틱회귀

맨 위로 이동 ↑

logistic regression

맨 위로 이동 ↑

분류

맨 위로 이동 ↑

precision

맨 위로 이동 ↑

recall

맨 위로 이동 ↑

f1 score

맨 위로 이동 ↑

의사결정 나무

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

맨 위로 이동 ↑

entropy

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

맨 위로 이동 ↑

gini

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

맨 위로 이동 ↑

엔트로피

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

맨 위로 이동 ↑

지니계수

의사결정 나무 (Decision Tree)와 Entropy, 그리고 Gini 계수

14 분 소요

Decision Tree는 Random Forest Ensemble 알고리즘의 기본이 되는 알고리즘이며, Tree 기반 알고리즘입니다. 의사결정나무 혹은 결정트리로 불리우는 이 알고리즘은 머신러닝의 학습 결과에 대하여 시각화를 통한 직관적인 이해가 가능하다는 것이 큰 장점입니다. ...

맨 위로 이동 ↑

어텐션

맨 위로 이동 ↑

ai 주가예측

맨 위로 이동 ↑

finance data reader

맨 위로 이동 ↑

facebook prophet

맨 위로 이동 ↑

meta prophet

맨 위로 이동 ↑

맨 위로 이동 ↑

데이터과학 트레이닝북

맨 위로 이동 ↑

인사이트 출판사

맨 위로 이동 ↑

인공지능 책 추천

맨 위로 이동 ↑

functional api

맨 위로 이동 ↑

함수형 api

맨 위로 이동 ↑

inheritance

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

class

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

클래스

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

클래스 인스턴스

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

instance

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

부모 클래스

Python 클래스의 상속 (inheritance)

3 분 소요

텐서플로의 Model Subclassing 구현을 위해서는 python의 상속(inheritance) 개념을 필히 알고 있어야 합니다. 그래서, 이번 포스팅에서는 python의 클래스 그리고 상속에 대한 내용을 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

series

#01-Pandas(판다스) 기본 자료구조

7 분 소요

Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Micro...

맨 위로 이동 ↑

엑셀

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

맨 위로 이동 ↑

json

#02-Pandas(판다스) 파일 입출력 - Excel, CSV

5 분 소요

이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 C...

맨 위로 이동 ↑

조회

맨 위로 이동 ↑

정렬

맨 위로 이동 ↑

조건 필터

맨 위로 이동 ↑

loc

맨 위로 이동 ↑

iloc

맨 위로 이동 ↑

파이썬 통계

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

맨 위로 이동 ↑

통계 분석

#04-Pandas(판다스) 통계

5 분 소요

이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.

맨 위로 이동 ↑

결측치

맨 위로 이동 ↑

복사

맨 위로 이동 ↑

데이터 타입

맨 위로 이동 ↑

컬럼 추가

맨 위로 이동 ↑

컬럼 삭제

맨 위로 이동 ↑

행 삭제

맨 위로 이동 ↑

ai수학

맨 위로 이동 ↑

처음 만나는 ai수학

맨 위로 이동 ↑

딥러닝 수학

맨 위로 이동 ↑

파이썬 수학

맨 위로 이동 ↑

선형대수

맨 위로 이동 ↑

영진닷컴

맨 위로 이동 ↑

베이시안 최적화

맨 위로 이동 ↑

baysian optimization

맨 위로 이동 ↑

hyperopt

맨 위로 이동 ↑

넘파이

넘파이(Numpy) 튜토리얼

11 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 수치계산용 라이브러리인 넘파이(numpy) 를 다룹니다.

맨 위로 이동 ↑

리스트

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

맨 위로 이동 ↑

list

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

맨 위로 이동 ↑

튜플

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

맨 위로 이동 ↑

tuple

#02-파이썬(Python) 리스트(list)와 튜플(tuple)

6 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬 리스트(list)와 튜플(tuple)을 다룹니다.

맨 위로 이동 ↑

세트

맨 위로 이동 ↑

set

맨 위로 이동 ↑

딕셔너리

맨 위로 이동 ↑

dictionary

맨 위로 이동 ↑

문자열

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

string

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

문자열 포맷팅

#04-파이썬(Python) 문자열(str)

5 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

연산

#05-파이썬(Python) 연산

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 파이썬에 대한 기본 지식을 다룹니다.

맨 위로 이동 ↑

비교연산자

맨 위로 이동 ↑

삼항연산자

맨 위로 이동 ↑

논리연산자

맨 위로 이동 ↑

조건문

맨 위로 이동 ↑

if

맨 위로 이동 ↑

elif

맨 위로 이동 ↑

else

맨 위로 이동 ↑

반복문

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

맨 위로 이동 ↑

for in

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

맨 위로 이동 ↑

while

#07-파이썬(Python) 반복문

3 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다.

맨 위로 이동 ↑

comprehension

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

맨 위로 이동 ↑

컴프리헨션

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

맨 위로 이동 ↑

리스트 컴프리헨션

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

맨 위로 이동 ↑

list comprehension

#08-파이썬(Python) 컴프리헨션(Comprehension)

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 컴프리헨션(Comprehension)을 다룹니다.

맨 위로 이동 ↑

함수

맨 위로 이동 ↑

function

맨 위로 이동 ↑

lambda 함수

맨 위로 이동 ↑

argument

맨 위로 이동 ↑

parameter

맨 위로 이동 ↑

인수

맨 위로 이동 ↑

매개변수

맨 위로 이동 ↑

내장함수

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

맨 위로 이동 ↑

zip

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

맨 위로 이동 ↑

enumerate

#10-파이썬(Python) 내장함수-map, zip, filter, enumerate

2 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 내장함수(built-in function) 중 map(), zip(), filter(), enumerate()를 다룹니다.

맨 위로 이동 ↑

모듈

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

맨 위로 이동 ↑

module

#11-파이썬(Python) 패키지(package)와 모듈(module)

1 분 소요

본 포스팅은 파이썬(Python) 코딩 입문자를 위한 튜토리얼 시리즈 연재 중 일부입니다. 이번 튜토리얼에서는 파이썬의 패키지(package)와 모듈(module)을 다룹니다.

맨 위로 이동 ↑

캐글 도커

맨 위로 이동 ↑

gpu 테스트

머신러닝/딥러닝 라이브러리 - GPU 사용 테스트

9 분 소요

본 포스팅은 딥러닝 도커 설치 후 머신러닝/딥러닝 라이브러리의 GPU 사용 여부를 테스트하는 코드를 공유 드립니다. 머신러닝/딥러닝(PyTorch, TensorFlow) 최신 도커(docker)글을 참고하셔서 도커로 딥러닝 환경 구성을 하신 후, 아래 코드로 테스트 해 볼 수 있습...

맨 위로 이동 ↑

yes24

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

SQL

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

정규식 표현

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

도서 추천

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

무료 전자책

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

database 책 추천

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

e book

무료 E-Book 소개 - Python, 데이터분석, SQL, 정규식 표현

1 분 소요

이번 포스팅에서는 yes24.com 에서 2021년 6월 9일 기준 무료로 제공되는 e-book 중 Python, 데이터분석, SQL, 정규식 표현 등에 도움이 되는 책과 링크들을 정리하여 공유 드려 보고자 합니다. 본 포스팅은 광고글은 아니며, 언제까지 무료로 제공될지는 모릅니다...

맨 위로 이동 ↑

그룹바이

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

pivot table

#07-Pandas(판다스) Groupby와 Pivot table

6 분 소요

이번 에피소드에서는 Pandas DataFrame의 groupby(), pivot_table()을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

데이터 병합

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

데이터 연결

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

concat

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

merge

#08-Pandas(판다스) Concat(연결), Merge(병합)

7 분 소요

이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인 concat()(연결), merge()(병합)에 대하여 다뤄 보도록 하겠습니다.

맨 위로 이동 ↑

알고리마

맨 위로 이동 ↑

algorima

맨 위로 이동 ↑

텀블벅

맨 위로 이동 ↑

책 리뷰

맨 위로 이동 ↑

테디노트

맨 위로 이동 ↑

파이썬 책 추천

맨 위로 이동 ↑

파이썬 딥러닝 텐서플로

맨 위로 이동 ↑

텐서플로우 책 추천

맨 위로 이동 ↑

텐서플로 책

맨 위로 이동 ↑

인공지능 서적

맨 위로 이동 ↑

jekyll 블로그

맨 위로 이동 ↑

노트북 변환

맨 위로 이동 ↑

colab 변환

맨 위로 이동 ↑

html

맨 위로 이동 ↑

변환

맨 위로 이동 ↑

주식

맨 위로 이동 ↑

코사인유사도

맨 위로 이동 ↑

cosine similarity

맨 위로 이동 ↑

주가 예측

맨 위로 이동 ↑

ai 주가

맨 위로 이동 ↑

패턴검색

맨 위로 이동 ↑

파이썬 주식

맨 위로 이동 ↑

판다스 주식

맨 위로 이동 ↑

유사 종목 검색

맨 위로 이동 ↑

캔들 패턴

맨 위로 이동 ↑

성인 인구조사

맨 위로 이동 ↑

소득

맨 위로 이동 ↑

kakr

맨 위로 이동 ↑

tacademy

맨 위로 이동 ↑

folium

맨 위로 이동 ↑

지도 시각화

맨 위로 이동 ↑

원격 서버

맨 위로 이동 ↑

iptime

맨 위로 이동 ↑

원격 접속 허용

맨 위로 이동 ↑

google cloud api

맨 위로 이동 ↑

위도

맨 위로 이동 ↑

경도

맨 위로 이동 ↑

지도 api

맨 위로 이동 ↑

google 지도

맨 위로 이동 ↑

google cloud platform

맨 위로 이동 ↑

발급

맨 위로 이동 ↑

ai spark 챌린지

맨 위로 이동 ↑

수도관 누수 탐지

맨 위로 이동 ↑

음성

맨 위로 이동 ↑

오디오

맨 위로 이동 ↑

푸리에 변환

맨 위로 이동 ↑

color

맨 위로 이동 ↑

palette

맨 위로 이동 ↑

컬러 팔레트

맨 위로 이동 ↑

color name

맨 위로 이동 ↑

색상

맨 위로 이동 ↑

팔레트

맨 위로 이동 ↑

카카오브레인

맨 위로 이동 ↑

kakao brain

맨 위로 이동 ↑

뽀로로

맨 위로 이동 ↑

pororo

맨 위로 이동 ↑

트랜스포머

맨 위로 이동 ↑

토크나이저

맨 위로 이동 ↑

문장 생성

맨 위로 이동 ↑

문장 예측

맨 위로 이동 ↑

summary

맨 위로 이동 ↑

기계번역

맨 위로 이동 ↑

mask

맨 위로 이동 ↑

구글 드라이브

맨 위로 이동 ↑

google drive

맨 위로 이동 ↑

drive api

맨 위로 이동 ↑

file download

맨 위로 이동 ↑

파일 다운로드

맨 위로 이동 ↑

베이스라인

맨 위로 이동 ↑

catboost

맨 위로 이동 ↑

하이퍼파라미터

맨 위로 이동 ↑

install

맨 위로 이동 ↑

from_numpy

맨 위로 이동 ↑

as_tensor

맨 위로 이동 ↑

view

맨 위로 이동 ↑

reshape

맨 위로 이동 ↑

dtype

맨 위로 이동 ↑

torchsummary

맨 위로 이동 ↑

모델 구조

맨 위로 이동 ↑

shape

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

맨 위로 이동 ↑

차원

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

맨 위로 이동 ↑

입출력

[PyTorch] RNN Layer 입출력 파라미터와 차원(shape) 이해

2 분 소요

이번 포스팅에서는 pytorch의 rnn 레이어의 input 차원, output 차원, hidden dimension, num_layers 파라미터를 직접 확인하면서 동작 결과를 눈으로 직접 확인해 보고 코딩시 적절하게 활용하는 방법에 대하여 알아보도록 하겠습니다.

맨 위로 이동 ↑

도커 실행

맨 위로 이동 ↑

tensorflow docker

맨 위로 이동 ↑

텐서플로 도커

맨 위로 이동 ↑

파이토치 도커

맨 위로 이동 ↑

pytorch docker

맨 위로 이동 ↑

이미지정규화

맨 위로 이동 ↑

torchvision

맨 위로 이동 ↑

transform

맨 위로 이동 ↑

image transform

맨 위로 이동 ↑

이미지 전처리

맨 위로 이동 ↑

이미지 정규화

맨 위로 이동 ↑

그룹화

맨 위로 이동 ↑

데이터 전처리

맨 위로 이동 ↑

판다스 데이터분석

맨 위로 이동 ↑

DataFrame

맨 위로 이동 ↑

통계. 파이썬 데이터 분석

맨 위로 이동 ↑

pytorch datasets

맨 위로 이동 ↑

이미지 데이터셋

맨 위로 이동 ↑

파이토치 데이터셋

맨 위로 이동 ↑

regression

맨 위로 이동 ↑

subclassing

맨 위로 이동 ↑

심층신경망

맨 위로 이동 ↑

deep neural network

맨 위로 이동 ↑

dnn

맨 위로 이동 ↑

train

맨 위로 이동 ↑

evaluate

맨 위로 이동 ↑

rps

맨 위로 이동 ↑

가위바위보

맨 위로 이동 ↑

fine tuning

맨 위로 이동 ↑

미세조정

맨 위로 이동 ↑

image dataset

맨 위로 이동 ↑

alexnet

AlexNet Implementation(구현) by PyTorch

6 분 소요

AlexNet(2012) 의 PyTorch 구현 입니다. 논문에 대한 세부 인사이트는 생략하며, 오직 코드 구현만 다룹니다.

맨 위로 이동 ↑

m1 맥북

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

m2 맥북

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

실리콘

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

mac

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

metal

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

맥 os

실리콘(M1, M2) 맥(Mac) OS 에서 텐서플로(TensorFlow) 설치 방법

2 분 소요

실리콘(M1, M2) 맥(Mac) 사용하는 유저가 최근 1~2년 안에 급격하게 늘어나면서, m1, m2 칩셋을 사용하는 맥 사용자를 위한 가상 환경 설치와 TensorFlow 설치에 대한 문의가 많았습니다. 아쉽게도 그동안 제가 실리콘 맥이 없어 직접 테스트를 해볼 수 없었기 때문...

맨 위로 이동 ↑

이미지 증강

[pytorch] 변환(Transform)을 활용한 이미지 증강(Image Augmentation) 적용

5 분 소요

데이터 증강(Data Augmentation)은 학습을 위한 데이터에 변형을 가하여 데이터의 규모를 키울 뿐만 아니라, 데이터에 대한 변형된 다양한 케이스를 학습하게 만들 수 있는 좋은 수단 중 하나입니다. 또한, 모델이 과적합(overfitting) 되는 것을 방지해주는 효과도 ...

맨 위로 이동 ↑

pypi

나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기

2 분 소요

PYPI는 Python Package Index의 약어로 Python 패키지 저장소의 개념으로 생각하시면 됩니다. 수 많은 개발자들이 본인이 만든 파이썬 소프트웨어를 손쉽게 설치하고 활용할 수 있도록 패키지화 하여 저장소에 업로드를 하는데요. 저장소에 업로드된 패키지를 pip in...

맨 위로 이동 ↑

파이썬 패키지

나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기

2 분 소요

PYPI는 Python Package Index의 약어로 Python 패키지 저장소의 개념으로 생각하시면 됩니다. 수 많은 개발자들이 본인이 만든 파이썬 소프트웨어를 손쉽게 설치하고 활용할 수 있도록 패키지화 하여 저장소에 업로드를 하는데요. 저장소에 업로드된 패키지를 pip in...

맨 위로 이동 ↑

패키지 생성

나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기

2 분 소요

PYPI는 Python Package Index의 약어로 Python 패키지 저장소의 개념으로 생각하시면 됩니다. 수 많은 개발자들이 본인이 만든 파이썬 소프트웨어를 손쉽게 설치하고 활용할 수 있도록 패키지화 하여 저장소에 업로드를 하는데요. 저장소에 업로드된 패키지를 pip in...

맨 위로 이동 ↑

패키지 등록

나만의 파이썬 패키지(PYPI) 만들기 및 등록하고 배포하기

2 분 소요

PYPI는 Python Package Index의 약어로 Python 패키지 저장소의 개념으로 생각하시면 됩니다. 수 많은 개발자들이 본인이 만든 파이썬 소프트웨어를 손쉽게 설치하고 활용할 수 있도록 패키지화 하여 저장소에 업로드를 하는데요. 저장소에 업로드된 패키지를 pip in...

맨 위로 이동 ↑

googlenet

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

맨 위로 이동 ↑

inception module

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

맨 위로 이동 ↑

pytorch implementation

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

맨 위로 이동 ↑

going deeper with convolutions

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

맨 위로 이동 ↑

imagenet

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

맨 위로 이동 ↑

inceptionnet

GoogLeNet의 Inception Module, 1x1 컨볼루션의 의미와 구현

4 분 소요

Going Deeper with Convolutions(2015) Inception 모듈에 대한 내용입니다. 해당 논문에서는 Inception Module이라는 새로운 neural network architecture 를 공개하였습니다. 논문의 제목과 같이 Going Deeper ...

맨 위로 이동 ↑

환경설치

맨 위로 이동 ↑

bbc-text.csv

맨 위로 이동 ↑

tensorflow certificate

맨 위로 이동 ↑

자연어 처리

맨 위로 이동 ↑

stopwords

맨 위로 이동 ↑

자격증 강의

맨 위로 이동 ↑

nsmc

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

네이버 댓글

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

한글 자연어처리

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

사전학습

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

토큰화

[huggingface] 한글 pre-trained 사전학습 BERT 모델로 텍스트 분류하기

20 분 소요

이번 포스팅에서는 Huggingface의 한글 데이터셋으로 사전 학습된 kykim/bert-kor-base 모델을 가져와서 한글 자연어 데이터에 대한 텍스트 분류기를 만들어 보겠습니다. 이미지넷에서는 전이학습을 통해 손쉽게 Transfer Learning을 수행할 수 있습니다. ...

맨 위로 이동 ↑

머신러닝 도커

맨 위로 이동 ↑

gpu 사용

맨 위로 이동 ↑

torchtext

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

맨 위로 이동 ↑

텍스트 전처리

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

맨 위로 이동 ↑

토치텍스트

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

맨 위로 이동 ↑

tabulardataset

torchtext를 활용한 텍스트 데이터 전처리 방법

7 분 소요

torchtext는 pytorch 모델에 주입하기 위한 텍스트 데이터셋을 구성하기 편하게 만들어 주는 데이터 로더(Data Loader) 입니다. torchtext 를 활용하여 CSV, TSV, JSON 등의 정형 데이터셋을 쉽게 로드하도록 도와주는 TabularDataset 클래...

맨 위로 이동 ↑

블로그

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

수익

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

깃헙블로그

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

automation

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

blog

OPENAI API(ChatGPT)를 활용한 블로그 생성 자동화

11 분 소요

이번 포스팅에서는 OPENAI의 API를 활용하여 ChatGPT 의 텍스트 생성 모델인 text-davinci-003로 주제와 세부요구사항에 맞게 자동으로 블로그를 생성하고 이를 GitHub Pages에 블로그로 포스팅으로 자동 배포하는 튜토리얼을 진행해 보도록 하겠습니다.

맨 위로 이동 ↑

investing.com

맨 위로 이동 ↑

영문뉴스기사

맨 위로 이동 ↑

번역

맨 위로 이동 ↑

경제기사

맨 위로 이동 ↑

로또

맨 위로 이동 ↑

lotto

맨 위로 이동 ↑

requests

맨 위로 이동 ↑

beautifulsoup4

맨 위로 이동 ↑

bs4

맨 위로 이동 ↑

데이터 수집

맨 위로 이동 ↑

pyairtable

맨 위로 이동 ↑

에어테이블

맨 위로 이동 ↑

테이블

맨 위로 이동 ↑

table

맨 위로 이동 ↑

base

맨 위로 이동 ↑

base_id

맨 위로 이동 ↑

데이터

맨 위로 이동 ↑

db

맨 위로 이동 ↑

dropbox

파이썬, 데이터분석가를 위한 초간단 파일공유 서비스

최대 1 분 소요

본 내용은 자체 제작한 파일공유 서비스에 대한 내용입니다. 말그대로 파일을 가장 쉬운 방법으로 공유할 수 있는 서비스이며, 링크를 활용하여 공유할 수 있습니다. Python, wget 명령어로 다운로드 받는 코드를 제공하며, 비밀번호로 암호화 하여 공유도 가능합니다.

맨 위로 이동 ↑

파일공유

파이썬, 데이터분석가를 위한 초간단 파일공유 서비스

최대 1 분 소요

본 내용은 자체 제작한 파일공유 서비스에 대한 내용입니다. 말그대로 파일을 가장 쉬운 방법으로 공유할 수 있는 서비스이며, 링크를 활용하여 공유할 수 있습니다. Python, wget 명령어로 다운로드 받는 코드를 제공하며, 비밀번호로 암호화 하여 공유도 가능합니다.

맨 위로 이동 ↑

wget

파이썬, 데이터분석가를 위한 초간단 파일공유 서비스

최대 1 분 소요

본 내용은 자체 제작한 파일공유 서비스에 대한 내용입니다. 말그대로 파일을 가장 쉬운 방법으로 공유할 수 있는 서비스이며, 링크를 활용하여 공유할 수 있습니다. Python, wget 명령어로 다운로드 받는 코드를 제공하며, 비밀번호로 암호화 하여 공유도 가능합니다.

맨 위로 이동 ↑

데이콘

맨 위로 이동 ↑

dacon

맨 위로 이동 ↑

자동차충돌

맨 위로 이동 ↑

AI경진대회

맨 위로 이동 ↑

conv3d

맨 위로 이동 ↑

early stopping

[pytorch] Early Stopping 조기종료 구현 및 적용

4 분 소요

조기 종료(Early Stopping)는 학습시 일정기간(여기서 기간은 보통 N번의 Epoch을 기준으로 합니다)동안 Loss 나 Score 기준으로 개선이 일어나지 않으면 학습을 조기에 종료해 주는 기능입니다. 만약, 20번의 Epoch 동안 학습이 진행한다고 가정했을 때, 아래...

맨 위로 이동 ↑

콤마구분자

맨 위로 이동 ↑

소수점표기

맨 위로 이동 ↑

과학표기법

맨 위로 이동 ↑

wandb

WandB 를 활용하여 모델의 학습을 추적하는 방법

2 분 소요

WandB는 weights and biases 의 약어입니다. 머신러닝을 하시는 분들은 weights & biases 와 굉장히 친숙할텐데요. WandB의 네이밍에서 알 수 있듯이 모델이 학습할 때 실험 결과를 저장 및 시각화, 하이퍼파라미터를 저장, 모델 뿐만아니라 시스템...

맨 위로 이동 ↑

wights and biases

WandB 를 활용하여 모델의 학습을 추적하는 방법

2 분 소요

WandB는 weights and biases 의 약어입니다. 머신러닝을 하시는 분들은 weights & biases 와 굉장히 친숙할텐데요. WandB의 네이밍에서 알 수 있듯이 모델이 학습할 때 실험 결과를 저장 및 시각화, 하이퍼파라미터를 저장, 모델 뿐만아니라 시스템...

맨 위로 이동 ↑

input tensor

맨 위로 이동 ↑

output tensor

맨 위로 이동 ↑

hidden state

맨 위로 이동 ↑

cell state

맨 위로 이동 ↑

bidirectional

[pytorch] GRU 입력 텐서와 출력 텐서의 shape 이해

1 분 소요

이번에는 지난 LSTM 입력 텐서와 출력 텐서의 shape 이해 의 후속편으로써, pytorch의 GRU layer의 입출력 텐서의 shape에 대하여 이해해 보고 세부 옵션에 대하여 자세히 알아보도록 하겠습니다.

맨 위로 이동 ↑

cuda12.1

맨 위로 이동 ↑

cuda11.8

맨 위로 이동 ↑

ubuntu20.04

맨 위로 이동 ↑

gradio

맨 위로 이동 ↑

google bard

맨 위로 이동 ↑

bard api

맨 위로 이동 ↑

time-series

맨 위로 이동 ↑

ar

맨 위로 이동 ↑

ma

맨 위로 이동 ↑

bbc-news

맨 위로 이동 ↑

text-classification

맨 위로 이동 ↑

selenium

셀레니움(selenium)을 활용한 네이버 환율 정보 크롤링

29 분 소요

이번 튜토리얼에서는 네이버의 환율 정보를 크롤링하는 방법에 대해 알아보겠습니다. 이 과정에서 Python의 셀레니움(selenium)을 사용할 예정입니다. 크롤링 과정에서 발생할 수 있는 다양한 오류들을 어떻게 처리 하는지에 대해서도 알아보겠습니다. 튜토리얼 마지막 부분에서는 코드...

맨 위로 이동 ↑

셀레니움

셀레니움(selenium)을 활용한 네이버 환율 정보 크롤링

29 분 소요

이번 튜토리얼에서는 네이버의 환율 정보를 크롤링하는 방법에 대해 알아보겠습니다. 이 과정에서 Python의 셀레니움(selenium)을 사용할 예정입니다. 크롤링 과정에서 발생할 수 있는 다양한 오류들을 어떻게 처리 하는지에 대해서도 알아보겠습니다. 튜토리얼 마지막 부분에서는 코드...

맨 위로 이동 ↑

네이버 환율

셀레니움(selenium)을 활용한 네이버 환율 정보 크롤링

29 분 소요

이번 튜토리얼에서는 네이버의 환율 정보를 크롤링하는 방법에 대해 알아보겠습니다. 이 과정에서 Python의 셀레니움(selenium)을 사용할 예정입니다. 크롤링 과정에서 발생할 수 있는 다양한 오류들을 어떻게 처리 하는지에 대해서도 알아보겠습니다. 튜토리얼 마지막 부분에서는 코드...

맨 위로 이동 ↑

autogpt

AutoGPT 설치 및 실행 방법

2 분 소요

인간의 일을 전부 대체할 수 있는 범용 인공지능의 시작점 이라 불리는 새로운 AI 프로그램이 등장했는데요, 그건 바로 AutoGPT 프로젝트 입니다.

맨 위로 이동 ↑

llm

AutoGPT 설치 및 실행 방법

2 분 소요

인간의 일을 전부 대체할 수 있는 범용 인공지능의 시작점 이라 불리는 새로운 AI 프로그램이 등장했는데요, 그건 바로 AutoGPT 프로젝트 입니다.

맨 위로 이동 ↑

automl

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

time series

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

시계열 데이터

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

sarima

[AutoML] PyCaret을 활용한 시계열 데이터 예측 모형 생성

30 분 소요

이번 포스트의 주제는 “PyCaret을 활용한 시계열 데이터 예측 모형 생성” 입니다. 이 글에서는 시계열 데이터 예측 모형을 구축하는 과정을 세심하게 탐구하게 될 것입니다. 특히, PyCaret 라이브러리를 활용하여 기계 학습 프로세스를 효과적으로 자동화하는 방법을 중점적으로 다...

맨 위로 이동 ↑

font

matplotlib 에서 신규 폰트 추가하는 방법

2 분 소요

이번 포스팅에서는 matplotlib 에서 누락된 폰트를 추가 하는 방법에 대해 알아보겠습니다. 만약 설치된 폰트가 matplotlib 에서 사용할 수 없다면, 아래의 가이드를 따라 진행해 보시기 바랍니다.

맨 위로 이동 ↑

font_manager

matplotlib 에서 신규 폰트 추가하는 방법

2 분 소요

이번 포스팅에서는 matplotlib 에서 누락된 폰트를 추가 하는 방법에 대해 알아보겠습니다. 만약 설치된 폰트가 matplotlib 에서 사용할 수 없다면, 아래의 가이드를 따라 진행해 보시기 바랍니다.

맨 위로 이동 ↑

폰트 추가

matplotlib 에서 신규 폰트 추가하는 방법

2 분 소요

이번 포스팅에서는 matplotlib 에서 누락된 폰트를 추가 하는 방법에 대해 알아보겠습니다. 만약 설치된 폰트가 matplotlib 에서 사용할 수 없다면, 아래의 가이드를 따라 진행해 보시기 바랍니다.

맨 위로 이동 ↑

폰트 삭제

matplotlib 에서 신규 폰트 추가하는 방법

2 분 소요

이번 포스팅에서는 matplotlib 에서 누락된 폰트를 추가 하는 방법에 대해 알아보겠습니다. 만약 설치된 폰트가 matplotlib 에서 사용할 수 없다면, 아래의 가이드를 따라 진행해 보시기 바랍니다.

맨 위로 이동 ↑

container

맨 위로 이동 ↑

datetime

맨 위로 이동 ↑

to_datetime

맨 위로 이동 ↑

strftime

맨 위로 이동 ↑

strptime

맨 위로 이동 ↑

format

맨 위로 이동 ↑

날짜

맨 위로 이동 ↑

파싱

맨 위로 이동 ↑

glob

맨 위로 이동 ↑

파일 검색

맨 위로 이동 ↑

와일드카드

맨 위로 이동 ↑

파워쉘

맨 위로 이동 ↑

powershell

맨 위로 이동 ↑

텐서플로우

TensorFlow 와 PyTorch 중 무엇을 써야할까?

7 분 소요

TensorFlow는 딥러닝 프레임워크 시장에서 초기에 막강한 선두 주자 였습니다. 그러나 최근에 들어 PyTorch가 연구 커뮤니티에서 큰 사랑을 받기 시작했습니다.

맨 위로 이동 ↑

google

TensorFlow 와 PyTorch 중 무엇을 써야할까?

7 분 소요

TensorFlow는 딥러닝 프레임워크 시장에서 초기에 막강한 선두 주자 였습니다. 그러나 최근에 들어 PyTorch가 연구 커뮤니티에서 큰 사랑을 받기 시작했습니다.

맨 위로 이동 ↑

meta

TensorFlow 와 PyTorch 중 무엇을 써야할까?

7 분 소요

TensorFlow는 딥러닝 프레임워크 시장에서 초기에 막강한 선두 주자 였습니다. 그러나 최근에 들어 PyTorch가 연구 커뮤니티에서 큰 사랑을 받기 시작했습니다.

맨 위로 이동 ↑

단축 명령어

맨 위로 이동 ↑

alias 지정

맨 위로 이동 ↑

iterm

맨 위로 이동 ↑

terminal

맨 위로 이동 ↑

베이지안 최적화

맨 위로 이동 ↑

bayesian optimization

맨 위로 이동 ↑

HuggingFace

맨 위로 이동 ↑

HuggingFace Hub

맨 위로 이동 ↑

ConversationChain

맨 위로 이동 ↑

ConversationBufferMemory

맨 위로 이동 ↑

ConversationSummaryBufferMemory

맨 위로 이동 ↑

excel

맨 위로 이동 ↑

스키마

맨 위로 이동 ↑

schema

맨 위로 이동 ↑

독서감상문

맨 위로 이동 ↑

회의록

맨 위로 이동 ↑

뉴스레터

맨 위로 이동 ↑

질의응답

맨 위로 이동 ↑

coroutine

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

맨 위로 이동 ↑

async

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

맨 위로 이동 ↑

코루틴

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

맨 위로 이동 ↑

동기

파이썬 비동기(async)함수와 코루틴(coroutine) 흐름 이해하기

4 분 소요

파이썬에서 async 함수는 비동기 프로그래밍 을 위한 기능입니다. 파이썬 함수에서 def 키워드로 정의할 때 앞에 async 가 붙습니다. 파이썬의 비동기 함수가 많이 사용될 때는 I/O 바운드 작업 이나 높은 대기 시간이 예상되는 작업을 처리 할 때 유용합니다.

맨 위로 이동 ↑

api키 발급

맨 위로 이동 ↑

달리

맨 위로 이동 ↑

stable diffusion

맨 위로 이동 ↑

midjourney

맨 위로 이동 ↑

whisper api

맨 위로 이동 ↑

STT

맨 위로 이동 ↑

TTS

맨 위로 이동 ↑

Speech To Text

맨 위로 이동 ↑

Text To Speech

맨 위로 이동 ↑

음성인식

맨 위로 이동 ↑

YAML

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

데이터 직렬화

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

프로그래밍

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

IT 기술

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

설정 파일

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

개발자 가이드

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

기술 블로깅

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

데이터 구조

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

코드 작성

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

YAML 예시

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

YAML 사용법

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

YAML 주의점

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

IT 비전공자

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

소프트웨어 개발

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

기술 교육

YAML: 단 몇 분 만에 이해하기

5 분 소요

오늘은 IT 세계에서 자주 사용되지만, 비전공자 분들에게는 조금 생소할 수 있는 'YAML' 에 대해 이야기해보려고 합니다.

맨 위로 이동 ↑

Gemini Pro API

맨 위로 이동 ↑

Google Colab

맨 위로 이동 ↑

Apache License

맨 위로 이동 ↑

Google LLC

맨 위로 이동 ↑

생성적 AI

맨 위로 이동 ↑

Google Car

맨 위로 이동 ↑

Q&A 시스템

맨 위로 이동 ↑

이상 탐지

맨 위로 이동 ↑

Gemini API

맨 위로 이동 ↑

t-SNE

맨 위로 이동 ↑

유클리드 거리

맨 위로 이동 ↑

차원 축소

맨 위로 이동 ↑

API 키

맨 위로 이동 ↑

중심점

맨 위로 이동 ↑

이상치

맨 위로 이동 ↑

다중 에이전트

맨 위로 이동 ↑

LangGraph

맨 위로 이동 ↑

AutoGen

맨 위로 이동 ↑

LLM

맨 위로 이동 ↑

협업

맨 위로 이동 ↑

멀티에이전트

맨 위로 이동 ↑

그래프 기반 시스템

맨 위로 이동 ↑

상태 정의

맨 위로 이동 ↑

노드

맨 위로 이동 ↑

에지 로직

맨 위로 이동 ↑

호출

맨 위로 이동 ↑

데이터 스트리밍

맨 위로 이동 ↑

이미지 코드 변환

맨 위로 이동 ↑

파이썬 코드

맨 위로 이동 ↑

REPL

맨 위로 이동 ↑

vision preview

맨 위로 이동 ↑

gpt-4-vision-preview

맨 위로 이동 ↑

PythonREPL

맨 위로 이동 ↑

gpt-4

맨 위로 이동 ↑

gpt-4 turbo

맨 위로 이동 ↑

gpt-3.5 turbo

맨 위로 이동 ↑

gpt-4 vision preview

맨 위로 이동 ↑

embedding models

맨 위로 이동 ↑

Assistant API

맨 위로 이동 ↑

Fine Tuning Models

맨 위로 이동 ↑

python api

맨 위로 이동 ↑

instruct

맨 위로 이동 ↑

체인 생성

맨 위로 이동 ↑

파이프라인

맨 위로 이동 ↑

모델

맨 위로 이동 ↑

출력 파서

맨 위로 이동 ↑

LCEL

맨 위로 이동 ↑

ChatMessage

맨 위로 이동 ↑

LangChain Expression Language

맨 위로 이동 ↑

LLMs

맨 위로 이동 ↑

문서 요약

맨 위로 이동 ↑

Stuff

맨 위로 이동 ↑

Map-Reduce

맨 위로 이동 ↑

Refine

맨 위로 이동 ↑

load_summarize_chain

맨 위로 이동 ↑

LLMChain

맨 위로 이동 ↑

ReduceDocumentsChain

맨 위로 이동 ↑

WebBaseLoader

맨 위로 이동 ↑

GPT 모델

맨 위로 이동 ↑

텍스트 분석

맨 위로 이동 ↑

메타데이터

맨 위로 이동 ↑

문서 변환기

맨 위로 이동 ↑

JSON Schema

맨 위로 이동 ↑

Pydantic

맨 위로 이동 ↑

태깅

맨 위로 이동 ↑

문서 관리

맨 위로 이동 ↑

검색 최적화

맨 위로 이동 ↑

Q&A

맨 위로 이동 ↑

gpt-4-turbo-preview

맨 위로 이동 ↑

네이버 뉴스 Q&A

맨 위로 이동 ↑

Retrieval

맨 위로 이동 ↑

VectorStore

맨 위로 이동 ↑

질문 처리

맨 위로 이동 ↑

답변 생성

맨 위로 이동 ↑

아키텍처

맨 위로 이동 ↑

데이터 인덱싱

맨 위로 이동 ↑

검색

맨 위로 이동 ↑

생성 모델

맨 위로 이동 ↑

인덱싱

맨 위로 이동 ↑

검색 및 생성

맨 위로 이동 ↑

문서 로드

맨 위로 이동 ↑

벡터스토어

맨 위로 이동 ↑

언어모델

맨 위로 이동 ↑

ensemble retriever

맨 위로 이동 ↑

vectorstore

맨 위로 이동 ↑

mmr

맨 위로 이동 ↑

similarity

맨 위로 이동 ↑

에이전트

맨 위로 이동 ↑

검색도구

맨 위로 이동 ↑

Retriever

맨 위로 이동 ↑

FAISS

맨 위로 이동 ↑

Agent

맨 위로 이동 ↑

tools

맨 위로 이동 ↑

Assistants API

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

Chat Completions API

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

스레드

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

메시지

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

Thread

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

Message

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

Openai Functions

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

어시스턴트

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

34 분 소요

OpenAI의 새로운 Assistants API는 대화와 더불어 강력한 도구 접근성을 제공합니다. 본 튜토리얼은 OpenAI Assistants API를 활용하는 내용을 다룹니다. 특히, Assistant API 가 제공하는 도구인 Code Interpreter, Retrieval...

맨 위로 이동 ↑

langgraph

맨 위로 이동 ↑

retrieval agent

맨 위로 이동 ↑

AI 애플리케이션

맨 위로 이동 ↑

데이터베이스 관리

맨 위로 이동 ↑

그래프 기반 데이터 처리

맨 위로 이동 ↑

검색 에이전트

맨 위로 이동 ↑

정보 처리

맨 위로 이동 ↑

poetry

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

맨 위로 이동 ↑

python 가상환경

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

맨 위로 이동 ↑

poetry tutorial

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

맨 위로 이동 ↑

poetry 튜토리얼

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

맨 위로 이동 ↑

poetry 활용

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

맨 위로 이동 ↑

poetry 배포

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

맨 위로 이동 ↑

세마틱 버저닝

poetry 의 거의 모든것 (튜토리얼)

5 분 소요

Python 개발에 있어서 poetry는 매우 강력한 도구로, 프로젝트의 의존성 관리와 패키지 배포를 간소화하는 데 큰 도움을 줍니다. 지금부터 poetry 활용 튜토리얼을 살펴 보겠습니다.

맨 위로 이동 ↑