-
판다스 pandas 기초개념 : iloc, loc 비교, 데이터 형식 (numpy, series, dataframe)데이터 분석 공부/파이썬 데이터 분석 2024. 4. 3. 17:20728x90
데이터프레임을 가지고 분석할 때 가장 자주 이용되는 pandas !
여러 번 사용해봤지만 iloc, loc 방식이 뭔지 헷갈렸는데 이번 기회에 정리해봅니다.
예시 파일 조회를 위해 pd.read_csv 를 활용해 파일을 불러옵니다.
# iloc
# iloc 는 데이터에 접근할 때 x,y 좌표를 숫자로 찍어 접근하는 방식
# row, column 순으로 숫자를 기입한다
# 인덱스이므로 0부터 카운트한다
위 파일에서 df.iloc[1,5] 입력 시, 출력값은 96936x 좌표에는 row 인덱스 [1] , y 좌표에는 column 인덱스 [5]
# loc
# loc는 이름으로 접근한다.
row는 숫자로 되어 있으니 숫자 그대로 입력했고, column 명은 문자로 입력
df.loc[1, '거래량'] 입력 시, 출력값은 동일한 96936# dataframe
위에서 살펴본 테이블을 데이터프레임 형식이라고 부른다.
# series
# 1차원 데이터는 시리즈 (series) 형식
# 시리즈가 모이면 테이블, 즉 데이터프레임(dataframe) 형식# numpy
series 데이터의 밸류 값을 하나하나 뜯어놓은 array가 numpy 형식이다.
즉, numpy가 모여 series가 되고, series가 모여 dataframe이 된다.
'데이터 분석 공부 > 파이썬 데이터 분석' 카테고리의 다른 글
파이썬 판다스(Pandas) 자주 쓰는 함수, 기능 연습 (0) 2024.04.11 스포츠 데이터 파이썬 크롤링 -Selenium, By.CSS_SELECTOR, pickle (1) 2024.04.06 파이썬 크롤링 기초 ㅡ Selenium과 BeautifulSoup 차이 (0) 2024.04.03 리눅스 기초 명령어 : ps -ef, |, grep, &, 가상환경, virtualenv, requirements, nohup (1) 2024.04.03 증권 데이터 크롤링 - 네이버 증권 , KRX 활용해 종목별 차트 호가 데이터 저장하기 (0) 2024.04.03