[Pandas] 함수매핑2 : applymap, pipe
이전 포스팅에 이어서 dataframe의 applymap과 pipe메소드에 대해서 정리하였습니다. applymap 메소드 applymap은 apply와 비슷한 기능을 수행하는 함수이다. 하지만, applymap은 apply와 달리 dataframe의 요소 별로 매핑 함수를 적용할 수 있다는 장점이 있다. (Apply a functio...
이전 포스팅에 이어서 dataframe의 applymap과 pipe메소드에 대해서 정리하였습니다. applymap 메소드 applymap은 apply와 비슷한 기능을 수행하는 함수이다. 하지만, applymap은 apply와 달리 dataframe의 요소 별로 매핑 함수를 적용할 수 있다는 장점이 있다. (Apply a functio...
본 포스팅은 pandas의 map과 apply메소드에 관한 내용을 정리하였습니다. 파이썬의 내장 함수에는 list와 같은 iterable객체의 각 원소를 매핑 함수에 대입하여 각 원소에 대하여 결과값을 출력하는 map함수가 존재한다. 이와 동일하게 pandas의 Series와 DataFrame객체에도 map, apply, applymap, ...
본 포스팅은 중복 데이터의 전처리에 관하여 정리하였습니다. 중복 데이터 확인 : duplicated 중복 데이터의 경우 duplicated메소드를 이용하여 확인할 수 있다. 하지만 해당 메소드를 이용해서 데이터프레임의 중복을 처리할 수는 없다. duplicated메소드는 boolean Series를 반환하며, 중복되는 행의 경우 True, ...
본 포스팅은 누락데이터의 전처리에 관하여 정리하였습니다. 누락 데이터 확인 메소드 info 메소드로 데이터프레임의 요약된 정보에는 누락 데이터(NaN)가 아닌 유효 데이터의 개수를 알 수 있다. RangeIndex : 데이터프레임의 레코드(혹은 행) 수를 출력한다. 다음의 데이터셋에는 총 891개의 데이터 레코드가 존재하는 것을 알...
본 포스팅은 Pandas의 DataFrame 연산에 관하여 정리하였습니다. with 숫자 데이터프레임과 숫자의 연산도 시리즈의 연산과 동일하게 데이터프레임의 모든 원소에 숫자를 연산시킨다. 더불어, 연산 클래스의 결과로 데이터프레임을 반환시킨다. df = \ pd.DataFrame({'c0':[10, 20, 30], ...
본 포스팅은 Pandas의 Series 연산에 관하여 정리하였습니다. with 숫자 시리즈 객체에 숫자를 연산할 경우, 시리즈의 각 원소마다 연산이 진행된다. 더불어, 연산 결과 시리즈 객체를 반환한다. sr1 = pd.Series({'A':100, 'B':200, 'C':300}) sr_add = sr1+100 sr_sub = sr...