본문 바로가기
파이썬 기초 판다스 데이터 프레임 기본 통계 메소드 기본 통계 메소드 .mode() = 최빈값 확인 .sum() = 열 기준 합 , axis 설정으로 행으로 바꿀 수 있음 .max() = 최대값 .mean() = 평균값 .median() = 중앙값 2023. 8. 20.
파이썬 기초 판다스 데이터 프레임 고유값과 value_counts() 고유값이란? 데이터 중에서 일정 범주 안에 들어가는 데이터들을 고유값이라고 한다 ex) 요일, 월 고유값 확인 변수[열 이름].unique() 위 메소드로 열의 고유값을 확인 할 수 있다 고유값과 그 수를 확인하고 싶다면 변수[열 이름].value_counts() 를 사용하면 된다 value_counts에도 여러 옵션이 있는데 dropna 옵션으로 NaN값을 포함할지 정할 수 있고 ascending 옵션으로 정렬 normalize 옵션으로 비율 확인이 가능하다 해당 옵션들은 모두 기본적으로 False 이며 사용을 원할때 True로 바꿔주면 된다 2023. 8. 20.
파이썬 기초 판다스 데이터 프레임 정렬 sort_values() sort_values() 변수.sort_values(기준 , ascending = ) 위의 구문으로 값을 정렬하여 볼 수 있다 ascending 은 기본적으로 True이며 오름차순 정렬을 의미한다 내림차순으로 하고 싶으면 False를 이용 할 수 있다 기준 복합 변수.sort_values(by=[기준1, 기준2] , ascending = [기준1 정렬, 기준2 정렬]) 위 형식으로 앞의 기준부터 여러 기준으로 값을 정렬 할 수 있다 2023. 8. 20.
파이썬 기초 판다스 데이터 프레임 정보 확인 메소드와 함수 데이터 프레임 정보 확인 함수 head(x): 상위 데이터에서 x 행까지의 데이터 확인 , 기본값 = 5 tail(x): 하위 데이터에서 x 행까지의 데이터 확인 , 기본값 = 5 info(): 열에 대한 상세한 정보 확인(열 이름, 행이름, non 값이 아닌 데이터, 각 열의 데이터의 형식) describe(): 기초통계정보 확인 - 데이터 수(count), 평균(mean), 표준편차(std), 최대,최소값(max,min) 첫 데이터와 중앙값 사이의 중앙값(25%) ,중앙값, 중앙값과 마지막 데이터 사이의 중앙값(75%) 데이터 프레임 정보 확인 메소드 shape: 데이터프레임 크기 index: 인덱스 정보 확인 values: 값 정보 확인 columns: 열 정보 확인 dtypes: 열 자료형 확인 2023. 8. 20.
파이썬 기초 판다스 데이터 프레임 인덱스 정하기, 열 이름 바꾸기 인덱스 지정 데이터 프레임을 사용하면서 인덱스를 지정하거나 바꿔야 하는 경우가 있다 우선 인덱스가 없는 경우 변수.set_index(열 이름, inplace = True) 형태로 인덱스를 지정 할 수 있다 inplace = True는 해당 열 지정을 실제로 변수에 반영 할지 물어보는 옵션이다 기본적으로는 False가 되어있다 데이터를 안전하게 사용하기 위해 다른 변수 = 변수.set_index(열 이름) 형태로 다른 변수에 값을 저장하고 원래 변수는 남겨두게 할 수도 있다 이렇게 인덱스를 지정하면 인덱스 이름에 기존 열의 이름이 붙는데 지우고 싶다면 변수.index.name = None 을 사용하자 인덱스 초기화 인덱스를 아무것도 없는 상태로 바꾸고 싶으면 변수.reset_index(inplace = ,.. 2023. 8. 20.
파이썬 기초 판다스 데이터프레임과 pd.read_csv() 데이터 프레임 데이터 프레임은 행과 열 형태로 데이터를 저장하는 자료 형식으로 데이터와 행,열의 이름으로 구성이 된다 여기서 행과 열의 이름은 지정하지 않으면 알아서 0부터 시작해서 이름이 붙는다 형태는 엑셀을 생각하면 이해하기 쉽다 판다스 사용하기 import pandas as pd 코드로 판다스 라이브러리를 불러온다 라이브러리를 꼭 pd라는 이름으로 정의 할 필요는 없지만 대부분 pd로 사용하니 죽어도 pd라는 글자를 쓰기 싫은게 아니면 그냥 pd로 정의하자 판다스로 데이터 프레임 만들기 pd.DataFrame(data=데이터, index = 행 이름, columns = 열 이름 ) 데이터 프레임은 pd.DataFrame() 함수를 사용한다 값을 그냥 넣으면 data로 받아오며 index = 으로 행.. 2023. 8. 20.
파이썬 넘파이 기초 배열과 인덱싱, 슬라이싱, 연산 넘파이 불러오기 import numpy as np 코드로 넘파이를 불러온다 꼭 np로 불러올 필요는 없으나 대부분 np로 사용하니 np라는 글자가 죽도록 싫은게 아니라면 np로 정의를 해주자 넘파이로 배열 선언하기 a = np.array([1,2,3]) np.array()로 넘파이 배열을 선언 할 수 있다 배열의 이해 배열은 axis(각 축) , rank(축의 수), shape(축의 길이, 배열의 크기) 로 이해가 가능하다 축의 수는 차원의 수 라고 생각하면 되고 axis는 여러 차원 배열에서 0부터 가장 높은 차원의 축이라고 생각하자 배열의 형태 확인 변수.ndim 으로 차원 변수.shape 으로 크기 변수.dtype 으로 요소의 자료형을 확인 할 수 있다 배열 형태 변환 reshape()메소드를 통해.. 2023. 8. 20.
파이썬 기초 내장함수 정리 모든 내장함수는 아니고 자주 쓸 만한 내장 함수들을 정리한다 abc(x) x의 절대값 반환all(x) all(x) x의 요소가 모두 참이면 True any(x) x의 요소가 하나라도 참이면 True dir(x) x의 변수나 메소드 목록 반환 divmod(x,y) x를 y로 나눈 몫과 나머지를 튜플로 반환 enumerate(a) 리스트,튜플,문자열의 인덱스와 값을 반환 eval(x) 실행 가능한 문자열을 받아 실행 filter(f,x) f함수에 x를 하나씩 변수로 넣고 값이 True면 리턴값을 반환 input() 사용자에게 입력을 받음 len(x) x의 요소의 개수를 반환 map() f함수에 x를 하나씩 넣어 결과를 반환 min(x) x요소의 최솟값 max(x) x요소의 최대값 pow(x,y) x를 y번 .. 2023. 8. 19.
파이썬 기초 함수 정의하기 함수 만들기 함수는 def 문을 사용하여 직접 만들 수 있다 형식은 def 함수이름(변수) : 실행문 형식으로 선언한다 def example() : print('안녕하세요') example() 위 함수 처럼 꼭 함수에 받을 변수나 return 값이 필요하지는 않다 다만 변수와 리턴값이 아무것도 없을 경우 print 문으로 출력을 하지 않는 이상 실행 내용을 확인 할 수도 없고 함수를 실행한다고 어떤 값이 반환되지 않는다 def sums (a,b): return a+b 위 함수는 a와 b를 받아와 a+b의 값을 리턴하는 함수다 함수 선언에 변수를 2개 받는다고 했으니 사용할때는 sums(2,4) 처럼 두 개의 변수를 넣어주면 된다 변수의 기본값 지정 변수는 선언할때 =기본값 형식으로 기본값을 지정 할 수 .. 2023. 8. 19.
파이썬 기초 - if와 for 그리고 while 파이썬의 제어문 if, for, while 같은 제어문은 코드의 실행을 제어하는 것이 가능하다 여타 다른 언어들 과는 다르게 파이썬은 제어문을 괄호로 묶지 않고 들여쓰기로 블록을 지정한다 때문에 들여쓰기에 주의하는 것이 좋다 if문의 형태 if 문은 if 조건 : 실행 elif 조건 : 실행 else : 실행 형태로 사용한다 실행 할 내용이 없으면 실행 부분에 pass를 넣으면 된다 조건은 위에서 부터 순서대로 처리된다 for 문 for 문은 지정된 범위만큼 변수를 하나씩 가져오며 처리한다 for i in range(5) : # i를 0에서 4까지 하나씩 가져오며 블록 아래 조건식을 처리한다 print(i) list1 = [a,b,c,d,e] for i in list1 :# list 안의 요소를 처음부터.. 2023. 8. 18.