일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 데이터베이스
- 인공지능
- 네트워크보안
- 컴퓨터공학
- 컴퓨터과학
- 딥러닝
- I'm Sorry
- 자바스크립트
- 프로그래밍
- 클라우드컴퓨팅
- 웹개발
- 데이터구조
- 컴퓨터비전
- 데이터과학
- 코딩
- 파이썬
- Yes
- 보안
- 데이터분석
- 알고리즘
- 사이버보안
- 네트워크
- 소프트웨어
- 빅데이터
- 자료구조
- 프로그래밍언어
- 버전관리
- 머신러닝
- 2
- 소프트웨어공학
- Today
- Total
스택큐힙리스트
판다스는 헤더 없는 테이블을 읽습니다. 본문
판다스를 사용하여 헤더가 없는 .csv 파일의 일부 열(예: 4번째와 7번째 열)만 읽는 방법은 무엇인가요? # $$! @ *! & $ &를 사용하여 그렇게하지 못하는 것 같습니다.
답변 1
헤더가 없고 일부 열만 있는 csv를 읽으려면 4번째와 7번째 열에 대한 header=None 및 usecols=[3,6] 매개 변수를 전달해야합니다.
df = pd.read_csv(file_path, header=None, usecols=[3,6])
docs을 (을) 봅니다.
답변 2
판다스(Pandas)를 사용하여 데이터프레임을 읽어오는 과정에서, 헤더(Headers)가 없는 테이블(Table)을 읽어드릴 수도 있습니다. 이러한 경우, 판다스에서는 데이터프레임을 생성하기 위해 몇 가지 옵션을 제공합니다.먼저, 판다스는 `read_csv`라는 함수를 사용하여 CSV 파일을 읽어들일 수 있습니다. 이 함수는 `header` 인자를 통해 파일의 첫 번째 줄을 헤더로 인식할 것인지 아닌지를 결정할 수 있습니다. `header=None`으로 설정하면 파일의 첫 번째 줄이 헤더가 아님을 지정할 수 있습니다.
```
import pandas as pd
df = pd.read_csv('table.csv', header=None)
```
또한, 파일 내에 데이터의 구분자(Delimiter)가 존재한다면, `read_table` 함수를 사용하여도 헤더 없는 테이블을 읽어들일 수 있습니다. `delimiter` 인자를 통해 구분자를 지정할 수 있습니다.
```
import pandas as pd
df = pd.read_table('table.dat', header=None, delimiter='\t')
```
마지막으로, 헤더의 이름이 불명확한 경우, `read_fwf` 함수를 사용하여 고정 너비 형식(Fixed Width Format) 파일을 읽을 수 있습니다. 이 함수는 `colspecs` 인자를 통해 각 열의 너비를 지정합니다.
```
import pandas as pd
colspecs = [(0,10), (10,20), (20,30)] # 각 열의 너비를 지정
df = pd.read_fwf('table.txt', header=None, colspecs=colspecs)
```
이렇게 판다스에서 제공하는 여러 함수를 이용하여, 헤더 없는 테이블을 읽어들일 수 있습니다. 이를 통해 데이터를 더욱 정확하고 효율적으로 관리할 수 있습니다.