1. Pandas 설치
명령어 : pip install pandas
Pandas를 설치합니다.
2. CSV파일 불러오기
[원본]
위와 test.csv 파일에는 위와 같은 내용이 작성되어 있습니다.
이제 Pandas를 이용하여 파일을 불러와 보겠습니다.
[소스]
df = pd.read_csv('C:\\Users\\HP\\Desktop\\test.csv', encoding='euc_kr') #csv파일 불러오기(쉼표로 구분)
[결과]
위처럼 csv 파일을 불러올 수 있습니다.
현재 헤더(번호, 이름, 학점)이 명시되지 않았기 때문에 맨 첫줄이 헤더로 정해져서 위와 같은 결과가 나옵니다.
3. Text 파일 불러오기
[원본]
[소스]
df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_comma.txt', encoding='euc_kr') #text파일 불러오기(쉼표로 구분)
[결과]
txt파일도 csv 파일과 동일한 결과를 확인 할 수 있습니다.
4. Tab으로 구분된 Text 파일 불러오기
[원본]
[소스]
df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t') #tab으로 구분된 경우
[결과]
Tab으로 구분된 경우 delimiter 옵션에 '\t'을 명시하여 Tab으로 구분된 파일을 읽어 올 수 있습니다.
5. 헤더지정 방법1
Tab을 기준으로 불러온 파일을 기준으로 임의로 헤더를 지정해보겠습니다.
[원본]
[소스]
df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t', header = None)
[결과]
header 옵션에 None을 줄 경우 0부터 1씩 증가하면서 컬럼수 만큼 헤더를 지정해줍니다.
사용자가 원하는 내용으로 헤더를 지정하려면 아래 소스를 추가하면 됩니다.
[추가 소스]
df.columns = ['num', 'name', 'score'] #컬럼을 지정할 수 있음
[결과]
6. 헤더지정 방법2
[원본]
[소스]
df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t', header = None, names = ['숫자', '이름', '성적'])
[결과]
위처럼 한줄로 헤더를 지정하고 싶으면 names 속성에 리스트 형태로 순차적으로 작성해주면 됩니다.
이상 Pandas 파일 불러오기 완료!
유용히 사용하세요 ~
'프로그래밍 > Python' 카테고리의 다른 글
[Python Pandas] 4. 데이터프레임 CSV 파일 저장 (707) | 2020.08.20 |
---|---|
[Python Pandas] 3. 데이터프레임 생성(Dictionaly , List) (751) | 2020.08.20 |
[Python Pandas] 1. 주피터 노트북 설치(Anaconda, Jupyter Notebook) (746) | 2020.08.19 |
Python 멀티쓰레드 기반 실시간 채팅 프로그램(Queue, Socket , Thread) (717) | 2020.08.18 |
Python Socket Programming (TCP/UDP Echo 서버) (955) | 2020.08.14 |