[book] 『데이터 분석의 힘』정리
데이터의 상관관계는 인과관계가 아니다. 인과관계를 입증하기 어렵다. X가 Y에 영향을 미쳤다. 이유1 : 다른 요인이 영향을 미쳤을 가능성이 존재한다. Y가 변화한 것의 원인이 X이외의 다른 요인 때문일 수도 있다. 이유2: 인과관계가 반대일 가능성이 있다. Y가...
데이터의 상관관계는 인과관계가 아니다. 인과관계를 입증하기 어렵다. X가 Y에 영향을 미쳤다. 이유1 : 다른 요인이 영향을 미쳤을 가능성이 존재한다. Y가 변화한 것의 원인이 X이외의 다른 요인 때문일 수도 있다. 이유2: 인과관계가 반대일 가능성이 있다. Y가...
[Pandas] DataFrame 데이터 조회 (2) isin 지난번 loc에 이어 같이 알면 좋은 isin에 관하여 학습해보고자 한다. isin은 지난번 loc에서처럼 SQL의 WHERE절과 유사하다. 메소드를 학습하기에 앞서 예제에서 사용할 데이터를 가져온다. 해당 데이터들은 KOSIS국가통계포털에서 찾을 수 있었던 2020년 6월 행...
평소에 pandas라이브러리로 데이터프레임을 이리저리 다루다 보면 항상 마주치는 에러중에 loc, iloc등을 사용을 권장하는 경고 메시지를 자주 보았었다. 하지만, 매번 공부한다는게 다른거 보기 바빠서 제대로 공부를 못했었고, 가끔 필요할 때 마다 구글링을 하여 사용법을 찾아보았기 때문에 시간 소모를 발생시켰었던 적이 많았다.이를 대체할 문법들은 p...
필요 라이브러리 import import mglearn import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from mpl_toolkits.mplot3d import Axes3D, axes3d from sklearn....
[ML with Python] 2. 지도 학습 알고리즘 (4) 앙상블 - Bagging/Extra/Ada 본 포스팅은 지도 학습 알고리즘인 앙상블-Bagging/Extra/Ada에 관한 기본적인 내용에 관하여 다룹니다. 앙상블 (ensemble) 배깅(Bagging) 엑스트라 트리(Extra_Tree) 에이다부스팅(AdaBoosti...
[Python] Python 3에서 다른 경로에 저장된 파일 import하기 본 포스팅은 Python3에서 다른 경로에 저장되어 있는 모듈을 import하는 방법을 소개한다. 동일/하위/상위 경로 절대 경로 pip등의 명령어로 install 할 수 없는 깃허브에서 개인적으로 다운 받은 모듈이나 직접 만든 모듈이 현재 작업하는 공간과...