1. Pandas 설치

명령어 : pip install pandas

Pandas를 설치합니다.

 

 

2. CSV파일 불러오기

[원본]

위와 test.csv 파일에는 위와 같은 내용이 작성되어 있습니다.

이제 Pandas를 이용하여 파일을 불러와 보겠습니다.

 

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test.csv', encoding='euc_kr') #csv파일 불러오기(쉼표로 구분)

 

[결과]

위처럼 csv 파일을 불러올 수 있습니다.

현재 헤더(번호, 이름, 학점)이 명시되지 않았기 때문에 맨 첫줄이 헤더로 정해져서 위와 같은 결과가 나옵니다.

 

3. Text 파일 불러오기
[원본]

 

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_comma.txt', encoding='euc_kr') #text파일 불러오기(쉼표로 구분)

 

[결과]

txt파일도 csv 파일과 동일한 결과를 확인 할 수 있습니다.

 

4. Tab으로 구분된 Text 파일 불러오기

[원본]

 

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t') #tab으로 구분된 경우

 

[결과]

Tab으로 구분된 경우 delimiter 옵션에 '\t'을 명시하여 Tab으로 구분된 파일을 읽어 올 수 있습니다.

 

 

5. 헤더지정 방법1

Tab을 기준으로 불러온 파일을 기준으로 임의로 헤더를 지정해보겠습니다.

 

[원본]

 

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t', header = None)

 

[결과]

header 옵션에 None을 줄 경우 0부터 1씩 증가하면서 컬럼수 만큼 헤더를 지정해줍니다.

사용자가 원하는 내용으로 헤더를 지정하려면 아래 소스를 추가하면 됩니다.

 

[추가 소스]

df.columns = ['num', 'name', 'score'] #컬럼을 지정할 수 있음

 

[결과]

 

6. 헤더지정 방법2

[원본]

 

[소스]

df = pd.read_csv('C:\\Users\\HP\\Desktop\\test_tab.txt', encoding='euc_kr', delimiter = '\t', header = None, names = ['숫자', '이름', '성적'])

 

[결과]

위처럼 한줄로 헤더를 지정하고 싶으면 names 속성에 리스트 형태로 순차적으로 작성해주면 됩니다.

이상 Pandas 파일 불러오기 완료!

 

유용히 사용하세요 ~

+ Recent posts