본문 바로가기

Python/Pandas

(4)
MySQL에 np.nan을 갖는 pandas.DataFrame 삽입하기 발생한 오류 raise ProgrammingError("%s can not be used with MySQL" % s) sqlalchemy.exc.ProgrammingError: (pymysql.err.ProgrammingError) nan can not be used with MySQL 데이터프레임의 빈 값이 NaN으로 채워져 있는 상태에서 데이터프레임을 MySQL에 넣어주면서 오류 발생했다. np.NaN을 None으로 변경해줘야 한다. 해결법 1. df.where(pd.notnull(df), None) *df.where : 참값에 대해서는 첫번째 처리를 하고, 참이 아니면 두번째 처리를 한다. 데이터프레임 중 notnull이 참이면, 즉, null이 아닌 값은 그대로 값이 들어가고, null인 값은 ..
[Python] Pandas .loc[] 과 .iloc[] loc: index location (index 이름) iloc: index position (index number) 예 loc[:3]은 index 이름이 3인 series까지 출력해주고 iloc[:3]은 index number가 3인 series전까지 출력해주는 것을 볼 수 있다.
[부스트코스] [머신러닝을 위한 파이썬] Pandas Selection & Drop 1. Selection 한 개의 column선택 df["account"] 1개 이상의 column 선택 df[["account", "street", "state"]] column 이름 없이 사용하는 index number는 row 기준 선택 df[:3] column이름과 함께 row index 사용시, 해당 column만 선택 df["account"][:3]
Pandas 1. pandas란pandas는 데이터 분석을 위해 널리 사용되는 파이썬 라이브러리 패키지이다. (python게의 엑셀이다.)고성능 array 계산 라이브러리인 numpy와 통합하여, 강력한 "스프레드시트" 처리 기능을 제공한다.인덱싱, 연산용 함수, 전처리 함수 등을 제공한다.pandas는 과학용 파이썬 배포판인 아나콘다(Anaconda)에서 기본적으로 제공되지만, 아나콘다를 사용하지 않을 경우에는 pip install pandas를 통해 설치할 수 있다. 2. pandas사용법pandas를 사용하기 위해서는 먼저 pandas를 import해야한다.import pandas as pd pands는 크게 세가지 자료구조를 지원하고 있다.1차원 자료구조인 Series, 2차원 자료구조인 DataFrame, ..