ML - Matplotlib Figure Object
·
Data Analyst/ML
Figure 생성우선 객체 지향 방식에서는 figure 객체를 인스턴스화한 후, 해당 객체에서 메서드나 속성을 호출하여 그래프를 그립니다.figure 객체를 생성한 후, 해당 객체에서 메서드나 속성을 호출하는 것입니다. 특히, 여러 개의 플롯을 포함한 캔버스를 다룰 때 이 방법이 더 효율적입니다.즉, 여러 플롯이 있는 복잡한 그래프를 구성할 때, 각 플롯을 독립적으로 제어할 수 있어 더욱 유연하게 그래프를 다룰 수 있습니다.# 비어있는 캔버스 그리는 구문입니다.fig = plt.figure()# 도형에 좌표축을 추가합니다.axes = fig.add_axes([0, 0, 1, 1]) # left, bottom, width, height (range 0 ~ 1) 캔버스 위치 또한 조정 가능# 만든 축에 그래..
ML - Matplotlib-Basics
·
Data Analyst/ML
Matplotlib Basics이 라이브러리는 2D 및 3D 그래픽을 생성하는 과학적 시각화 도구로 뛰어납니다.Matplotlib의 주요 장점은 다음과 같습니다:간단한 플롯을 그릴 때 쉽게 시작할 수 있음사용자 지정 레이블과 텍스트 지원그림의 각 요소를 세밀하게 제어 가능다양한 형식으로 고품질 출력 지원전반적으로 매우 사용자 정의가 용이함Matplotlib은 프로그래밍적으로 재현 가능한 그림을 생성할 수 있도록 해줍니다. 계속 배우기 전에, Matplotlib의 공식 웹사이트(http://matplotlib.org/)를 검색해보는 것을 추천합니다. 우선, 넘파이 배열 두 개를 사용하는 매우 간단한 예제를 통해 진행해 봅시다. 리스트를 사용할 수도 있지만, 대부분의 경우 넘파이 배열이나 판다스 열(실제로는..
ML - PANDAS(Pivot-Tables)
·
Data Analyst/ML
Pivot Tables- 피벗 테이블은 데이터를 재구성하여 관계와 연결성을 명확하게 보여주는 강력한 도구입니다.- 데이터 분석을 하다 보면 원시 데이터에서 패턴을 파악하거나, 특정 기준에 따라 데이터를 집계하고 요약해야 할 때가 많습니다.- 이럴 때 피벗 테이블을 사용하면 복잡한 데이터도 쉽게 시각화할 수 있습니다.Pivot method- 열 값을 기준으로 데이터를 재구성하고, 인덱스를 재지정하여 데이터를 재배열하는 방법입니다.- 피벗 메서드는 주로 데이터 분석, 시각화, 그리고 탐색에 활용되며, 데이터의 구조를 쉽게 파악하거나 요약된 정보를 제공하는 데 유용합니다.사용 예시# 'Company','Product','Licenses'컬럼 값만 보겠습니다.licenses = df[['Company','Pro..
ML - PANDAS(Text Methods for String Data)
·
Data Analyst/ML
Text Methods- 일반적인 파이썬 문자열에는 다양한 메서드 호출이 가능합니다.mystring = 'hello'mystring.capitalize()# 'Hello'# isdigit() 문자열에 숫자가 있을 경우 True 반환 아닐 시 False 반환mystring.isdigit()# False# 위의 코드 말고도 여러가지 문자열 메소드들이 있습니다.Pandas and Text- Pandas는 기존의 문자열 메소드에서 표시된 것보다 더 많은 일을 할 수 있습니다.names = pd.Series(['andrew','bobo','claire','david','4'])names.str.capitalize()names.str.isdigit()Splitting , Grabbing, and Expandingt..
ML - PANDAS(Combining DataFrames)
·
Data Analyst/ML
연결(Concatenation):pd.concat() 함수를 사용하여 데이터프레임을 수직 또는 수평으로 연결합니다.이 방법은 인덱스나 열이 동일한 데이터프레임을 연결할 때 유용합니다.# 데이터 만들기data_one = {'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3']}data_two = {'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}# 데이터프레임으로 변환one = pd.DataFrame(data_one)two = pd.DataFrame(data_two) # concat을 사용하여 데이터 프레임 합치기, axis=0 행을 기준으로 합치기axis0 = pd.concat([one,two..
ML - PANDAS(Useful Methods) - 2
·
Data Analyst/ML
Pandas에서 자주 사용하는 메서드 및 함수 소개 - 2replacereplace 메서드는 값들을 다른 값으로 빠르게 대체할 수 있는 방법입니다.이 메서드를 사용하면 데이터프레임이나 시리즈 내의 특정 값을 원하는 값으로 일괄적으로 바꿀 수 있습니다. # to_replace가 바꿀 값을 입력# value가 어떤 것으로 바꿀지 입력하는 것df['Tip Quality'].replace(to_replace='Other',value='Ok')unique- unique 메서드는 해당 DataFrame의 컬럼명의 값들의 고유값 가져옵니다.즉, 중복을 없앤 값들을 가져오는 방법입니다.df['size'].unique()# 결과 : array([2, 3, 4, 1, 6, 5], dtype=int64)# 고유값 개수를 세..
ML - PANDAS(Useful Method) - 1
·
Data Analyst/ML
Pandas에서 자주 사용하는 메서드 및 함수 소개소개할 매서드와 함수는 데이터 처리 및 분석 과정에서 매우 유용하며, Pandas 문서를 통해 더 많은 기능들을 탐색할 수 있습니다. The .apply() method- 이 메서드를 사용하면 데이터프레임의 열(column)에 사용자 정의 함수를 적용하고, 해당 함수를 열 전체에 브로드캐스트(적용)할 수 있습니다.# 숫자에서 마지막 4개의 숫자만 가져온다.def last_four(num): return str(num)[-4:] df['last_four'] = df['CC Number'].apply(last_four) df['last_four']- 이와 같이 모든 열의 값들이 사용자 정의 함수들을 적용한 결과로 바뀌게 되었습니다. apply()..
ML - PANDAS(Condition-Filtering)
·
Data Analyst/ML
Condition - 조건- DataFrame에 조건을 추가하여 해당 조건에 부합하는 DataFrame을 출력하는 것들을 보여드리겠습니다.- 이제 보여줄 코드들은 매우 쉬운 코드들로 연산자를 사용하여 필터링 한다 보면 될 거 같습니다.# total_bill의 값이 30보다 큰 값들의 데이터 프레임을 가져온다.bool_series = df['total_bill'] > 30df[bool_series]# 위의 코드와 같은 것이지만 아래 방법으로도 사용 가능하다.df[df['total_bill']>30]- 위의 그림과 같이 total_bill을 확인하면 30보다 큰 값들을 가져온 것을 확인 할 수 있습니다. # 숫자만 가능한 것이 아닌 파이썬에서 사용하는 방식 그대로 문자열 또한 가능하다.df[df['sex']..
ML - PANDAS(DATA FRAME) - 2
·
Data Analyst/ML
Data Frame - 2Data Frame 인덱스 선택하기- column들을 기반으로 선택하는 방법입니다.- 딕셔너리에서 키값을 넣으면 값이 나오는 방법 처럼 해당 컬럼명을 넣으면 해당 컬럼의 값들이 출력 됩니다.df['total_bill']- 그리고 위의 코드 결과의 타입은 Series 타입입니다. - 이번에는 두 개의 컬럼을 가져오겠습니다.# 여기서 중요한 점은 두 개의 컬럼을 가져오는 경우 이중 대괄호를 사용해야 한다.df[['total_bill','tip']]- 여기서 위의 코드에서도 말했듯이 두 개 이상의 컬럼을 사용하는 경우에는 이중 대괄호를 사용해야 합니다.- 이유 : 이중 대괄호를 사용한다는 것은 타입이 DataFrame 값을 출력하는 것입니다. 또 한 가지를 저희는 기억해야 합니다. S..
ML - PANDAS(Data Frame) - 1
·
Data Analyst/ML
Data Frame - 1- 데이터 분석에 유용한 2차원 데이터 구조입니다.- 엑셀의 시트나 SQL 테이블과 비슷한 형식을 가지며, 행(row)과 열(column)로 이루어져 있습니다.- 이를 활용하면 대용량 데이터를 쉽게 조작할 수 있습니다. Data Frame 생성하기- pd.DataFrame(data=값, index=인덱스명, column=컬럼명) 이런 형식으로 데이터 프레임을 생성 할 수 있습니다.- 아래코드를 확인 하겠습니다.# numpy를 사용하여 난수를 고정시킨 후 4행 3열의 배열을 만들게 된다.np.random.seed(101)mydata = np.random.randint(0,101,(4,3))# 인덱스에 넣을 값 변수에 저장myindex = ['CA','NY','AZ','TX']# 컬..
hmm06
'Data Analyst/ML' 카테고리의 글 목록 (3 Page)