[Python Pandas] 2. Pandas 설치 및 파일 불러오기(csv, txt)

2020. 8. 19. 15:51

1. Pandas 설치

명령어 : pip install pandas

Pandas를 설치합니다.

2. CSV파일 불러오기

[원본]

위와 test.csv 파일에는 위와 같은 내용이 작성되어 있습니다.

이제 Pandas를 이용하여 파일을 불러와 보겠습니다.

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test.csv', encoding='euc_kr') #csv파일 불러오기(쉼표로 구분)

[결과]

위처럼 csv 파일을 불러올 수 있습니다.

현재 헤더(번호, 이름, 학점)이 명시되지 않았기 때문에 맨 첫줄이 헤더로 정해져서 위와 같은 결과가 나옵니다.

3. Text 파일 불러오기
[원본]

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_comma.txt', encoding='euc_kr') #text파일 불러오기(쉼표로 구분)

[결과]

txt파일도 csv 파일과 동일한 결과를 확인 할 수 있습니다.

4. Tab으로 구분된 Text 파일 불러오기

[원본]

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t') #tab으로 구분된 경우

[결과]

Tab으로 구분된 경우 delimiter 옵션에 '\t'을 명시하여 Tab으로 구분된 파일을 읽어 올 수 있습니다.

5. 헤더지정 방법1

Tab을 기준으로 불러온 파일을 기준으로 임의로 헤더를 지정해보겠습니다.

[원본]

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t', header = None)

[결과]

header 옵션에 None을 줄 경우 0부터 1씩 증가하면서 컬럼수 만큼 헤더를 지정해줍니다.

사용자가 원하는 내용으로 헤더를 지정하려면 아래 소스를 추가하면 됩니다.

[추가 소스]

df.columns = ['num', 'name', 'score'] #컬럼을 지정할 수 있음

[결과]

6. 헤더지정 방법2

[원본]

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t', header = None, names = ['숫자', '이름', '성적'])

[결과]

위처럼 한줄로 헤더를 지정하고 싶으면 names 속성에 리스트 형태로 순차적으로 작성해주면 됩니다.

이상 Pandas 파일 불러오기 완료!

유용히 사용하세요 ~

[Python Pandas] 4. 데이터프레임 CSV 파일 저장 (707)	2020.08.20
[Python Pandas] 3. 데이터프레임 생성(Dictionaly , List) (751)	2020.08.20
[Python Pandas] 1. 주피터 노트북 설치(Anaconda, Jupyter Notebook) (746)	2020.08.19
Python 멀티쓰레드 기반 실시간 채팅 프로그램(Queue, Socket , Thread) (717)	2020.08.18
Python Socket Programming (TCP/UDP Echo 서버) (955)	2020.08.14

IT, 정보보안 자료실