"pandas"
-
코사인 유사도(cosine similarity)로 과거 주가의 유사 패턴을 찾아 미래 예측하기
주가의 과거 패턴을 찾아 미래를 예측하는 것이 가능할까요?
-
#08-Pandas(판다스) Concat(연결), Merge(병합)
이번 에피소드에서는 Pandas DataFrame의 여러 개의 DataFrame으로 이루어진 데이터를 합치는 방법인
concat()
(연결),merge()
(병합)에 대하여 다뤄 보도록 하겠습니다.
-
#07-Pandas(판다스) Groupby와 Pivot table
이번 에피소드에서는 Pandas DataFrame의
groupby()
,pivot_table()
을 활용한 데이터 분석 방법에 대하여 다뤄 보도록 하겠습니다.
-
#06-Pandas(판다스) 데이터 전처리, 추가, 삭제, 데이터 type 변환
이번 에피소드에서는 Pandas DataFrame의 row, column의 추가, 삭제, 컬럼간 연산, 타입의 변환 그리고 데이터 전처리 방법에 대하여 다뤄 보도록 하겠습니다.
-
#05-Pandas(판다스) DataFrame의 복사(Copy)와 결측치(NaN values) 처리
이번 에피소드에서는 Pandas 데이터프레임(DataFrame) 의 복사(Copy)와 중요한 전처리 Task 중의 하나인 결측치 처리 에 대해서 알아보겠습니다.
-
#04-Pandas(판다스) 통계
이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 유용하면서 탐색적 데이터 분석(Exploratory Data Analysis)에서 가장 유용하게 사용되는 기능인 통계 입니다.
-
#03-Pandas(판다스) 데이터프레임(DataFrame) 조회, 정렬(sort), 조건필터(loc, iloc)
이번 에피소드에서는 Pandas 데이터프레임(DataFrame)의 가장 많이 사용하는 기능인 조회, 정렬 그리고 조건필터 입니다.
-
#02-Pandas(판다스) 파일 입출력 - Excel, CSV
이번 에피소드에서는 Pandas의 파일 입출력에 대하여 알아보겠습니다. 그리고, 데이터 분석에서 DB를 제외한 가장 많이 사용되는 파일 형식인 엑셀(Excel)과 CSV (Comma Separated Value)을 로드하고 데이터프레임(DataFrame)을 엑셀(Excel)이나 CSV형식으로 저장하는 방법에 대하여 공유하고자...
-
#01-Pandas(판다스) 기본 자료구조
Pandas(판다스) 는 막강한 오픈소스 데이터 분석 도구 입니다. Pandas는 업무자동화, 크롤링(Crawling), 데이터베이스 입출력, 시계열 데이터분석, 시각화 등등 다양한 분야에 활용할 수 있는 방대한 기능을 갖추고 있습니다. Pandas의 DataFrame은 Microsoft사의 엑셀과...
-
국민연금 데이터를 활용한 연봉추정 분석
국민연금 데이터를 공공 데이터 포털에서 제공합니다. 국민연금 데이터를 활용하여 특정 회사의 임직원 평균 연봉을 역추정해보는 것도 가능합니다.
-
나라장터 입찰공고 데이터 분석 및 머신러닝 예측
나라장터에서 토건, 토목 등 다양한 시공에 대한 입찰 공고를 고지합니다.
-
Pandas를 활용한 결측치 보간(interpolation) 하기
탐색적 데이터 분석 (Exploratory Data Analysis)를 진행하다보면, 매우 흔한 확률로 결측치가 존재하는 것을...
[pandas] 공공데이터(csv) 활용시 한글 깨짐 현상 해결
이번 포스팅에서는 공공데이터 포털에서 다운로드 받은 csv파일을 pandas에서 로딩할 때 한글깨짐 현상을 해결하는 방법에 대하여 알아보겠습니다.
pandas 를 활용한 기본적인 산술과 통계 적용 & 이해
Pandas를 활용한 통계부분을 좀 더 다뤄보려고 합니다. 평균, 표준 편차, 분산, 중간값등 통계를 전공하셨거나, 조금이라도 공부하신 분들은 물론 익숙하시겠지만, 그렇지 않고 데이터 분석에 뛰어든 분들은 용어만 봐도 머리속에
혼란이 찾아오기...
10분만에 pandas 정복하기 - 대한민국 부동산 데이터 활용편
Data 분석을 위해서는 pandas는 당연히 기본입니다.