데이터 관리) Pandas

    [Pandas] 자료구조(3): 데이터프레임(DataFrame) 정보 수정, 정렬

    [Pandas] 자료구조(3): 데이터프레임(DataFrame) 정보 수정, 정렬

    *본 게시물은 한양대학교 컴퓨터소프트웨어학과 정소희 교수님의 수업 수강 후, 그 일부를 재구성하여 작성된 게시물입니다. * [DataFrame 예시] 앞선 게시물에서 사용했던 menu 데이터프레임을 동일하게 사용하겠다. menu = pd.DataFrame(data = {'제품명' : ['커피', '주스','밀크티'], '가격' : [5000, 6000, 6500], '판매량' : [60, 45, 30]}) [03. 데이터프레임(DataFrame) 정보 수정] 행인덱스 변경: DataFrame객체.index = [새인덱스리스트] 열 이름 변경: DataFrame객체.columns = [새컬럼명리스트] 행인덱스 변경: DataFrame객체.rename(index={기존인덱스명:새인덱스명,...}) 열 이름 ..

    [Pandas] 자료구조(2): 데이터프레임(DataFrame) 생성, 정보추출

    [Pandas] 자료구조(2): 데이터프레임(DataFrame) 생성, 정보추출

    *본 게시물은 한양대학교 컴퓨터소프트웨어학과 정소희 교수님의 수업 수강 후, 그 일부를 재구성하여 작성된 게시물입니다. * [DataFrame의 구조] 데이터프레임(DataFrame)은 행과 열로 이루어진 2차원 배열 구조로 이루어져 있다. 시리즈(Series)가 여러개 모여 구성되었다고 보면 편할 것 같다. 즉, 인덱스만을 기준으로 데이터가 분류되었던 시리즈와 달리, 데이터 프레임은 가로 행을 나타내는 '행인덱스(Row Index)' 와, 새로 열을 나타내는 '컬럼명(Columns)'을 기준으로 데이터가 분류된다. (따라서 2차원 배열 구조..) [DataFrame 예시] 다음과 같은 DataFrame을 생성하려고 한다. [Pandas 모듈 임포트] import pandas as pd :역시나 동일하게..

    [Pandas] 자료구조(1): 시리즈(Series) 제어 명령어 모음

    [Pandas] 자료구조(1): 시리즈(Series) 제어 명령어 모음

    *본 게시물은 한양대학교 컴퓨터소프트웨어학과 정소희 교수님의 수업 수강 후, 그 일부를 재구성하여 작성된 게시물입니다. * [Series의 구조] 시리즈는 기본적으로 Python의 딕셔너리(Dictionary) 자료형과 구조가 유사하다. Key : Value형식으로 구성된 딕셔너리형과 같이, 각각의 데이터와 이에 대응하는 인덱스로 구성되어 있다. 결국, 시리즈는 데이터로 구성된 1차원 배열 형태!! [Series 예시] 다음과 같은 Series를 생성하려 한다. [Pandas 모듈 임포트] import pandas as pd :판다스 모듈을 alias를 통해 import 해주기 1. Series 생성 [Series 생성] 1) 인덱스 미지정 menu = pd.Series(data = ['data1', '..

    [Pandas] Pandas란 무엇이고, 왜 쓰는것일까?

    [Pandas] Pandas란 무엇이고, 왜 쓰는것일까?

    Pandas란? 데이터 분석 및 관리를 위한 Python의 라이브러리 중 하나인 Pandas. Pandas의 공식 깃헙 페이지에서는 Pandas에 대해 이렇게 소개한다. 요약하자면, 관계형또는 레이블이 된 데이터로 쉽고 직관적 으로 작업할 수 있도록 설계되었고 빠르고, 유연한 데이터 구조를 제공하는 Python 라이브러리. Pandas 공식 문서 확인하기 왜 Pandas 인가? 데이터 관리를 위한 소프트웨어에는 많은 종류가 있다. 하지만 세계적으로 가장 많이 사용되는 데이터 분석 도구는 당연 Python 계열의 라이브러리들이라고 할 수 있다. (위에 나온 예시로는 Pandas, Scipy, matplotlib들이 이에 해당한다. ) 무엇을 근거로? 다음 표를 보자. 다음은 프로그래밍 언어들의 인기 지표를..