ML - Pandas(Series)
·
Data Analyst/ML
Series- 우선, Series는 pandas의 데이터 타입입니다.- Series는 넘파이 배열(NumPy array)과 매우 비슷합니다(사실 넘파이 배열 객체 위에 구축되어 있습니다).- 넘파이 배열과 시리즈의 차이점은 시리즈는 축 레이블(axis labels)을 가질 수 있다는 것입니다.- 즉, 숫자 위치 대신 레이블로 인덱싱할 수 있습니다. 또한 시리즈는 숫자 데이터만 담을 필요가 없고, 임의의 파이썬 객체를 담을 수 있습니다. - Series에는 여러 옵션 값(매개변수)이 존재한다. (dtype, name, copy들 도 있으나, data와 index에 대해서만 설명 하겠습니다.)- data : 배열과 유사한 형태, Iterable, 딕셔너리 또는 스칼라 값이 들어갈 수 있으며, 시리즈에 저장된..
ML - Pandas(Combining DataFrames) - 2
·
Data Analyst/ML
Pandas 함수 - (pd.merge(DataFrame, DataFrame, how=(inner, outer, left of right), on=(어떤 열을 기준으로 합 칠지)- 한 데이터 프레임에는 있지만 다른 데이터 프레임에는 없는 열이 있을 수 있고 혹은 한 데이터 프레임에 없는 행이 있을 수 있는 경우에는 데이터 프레임을 merge 시켜야 한다.merge 함수 사용 시 중요한 점1. 'on'  = 열은 각 행마다 고유한 기본 식별자여야 한다.(열의 값이 각 행마다 모두 다르게 설정되어야 한다는 것입니다.)2. 'how' = 열에서 테이블 어떻게 merge 할 지 결정해야 한다. 3. 즉,  how = 어떤 방법으로 merge할지 on = 어떤 열을 기준으로 merge할 지 결정하는 것이다.Inn..
ML - Pandas(Combining DataFrames) - 1
·
Data Analyst/ML
Pandas 함수 - (pd.concat([DataFrame, DataFrame], axis=0 or 1)- Pandas는 두 개의 표에서 행과 열 중 하나라도 동일한 것이 있다면 서로 합칠 수 있다.- axis = 0 : 행(row)을 기준으로 합친다는 의미이다. (두개의 data frame에서 행이 같은 인덱스라면 그 인덱스를 기준으로 합쳐지게 된다. )- axis = 1 : 열(column)을 기준으로 합친다는 의미이다.(두개의 data frame에서 열이 같은 인덱스라면 그 인덱스를 기준으로 합쳐지게 된다.) import numpy as npimport pandas as pddata_one = {'A':['A0', 'A1', 'A2', 'A3'], 'B':['B0', 'B1', 'B2', 'B3'..
hmm06