스택큐힙리스트

판다스는 헤더 없는 테이블을 읽습니다. 본문

카테고리 없음

판다스는 헤더 없는 테이블을 읽습니다.

스택큐힙리스트 2023. 4. 18. 07:42
반응형

판다스를 사용하여 헤더가 없는 .csv 파일의 일부 열(예: 4번째와 7번째 열)만 읽는 방법은 무엇인가요? # $$! @ *! & $ &를 사용하여 그렇게하지 못하는 것 같습니다.

답변 1

헤더가 없고 일부 열만 있는 csv를 읽으려면 4번째와 7번째 열에 대한 header=None 및 usecols=[3,6] 매개 변수를 전달해야합니다.

df = pd.read_csv(file_path, header=None, usecols=[3,6])

docs을 (을) 봅니다.

답변 2

판다스(Pandas)를 사용하여 데이터프레임을 읽어오는 과정에서, 헤더(Headers)가 없는 테이블(Table)을 읽어드릴 수도 있습니다. 이러한 경우, 판다스에서는 데이터프레임을 생성하기 위해 몇 가지 옵션을 제공합니다.

먼저, 판다스는 `read_csv`라는 함수를 사용하여 CSV 파일을 읽어들일 수 있습니다. 이 함수는 `header` 인자를 통해 파일의 첫 번째 줄을 헤더로 인식할 것인지 아닌지를 결정할 수 있습니다. `header=None`으로 설정하면 파일의 첫 번째 줄이 헤더가 아님을 지정할 수 있습니다.

```

import pandas as pd

df = pd.read_csv('table.csv', header=None)

```

또한, 파일 내에 데이터의 구분자(Delimiter)가 존재한다면, `read_table` 함수를 사용하여도 헤더 없는 테이블을 읽어들일 수 있습니다. `delimiter` 인자를 통해 구분자를 지정할 수 있습니다.

```

import pandas as pd

df = pd.read_table('table.dat', header=None, delimiter='\t')

```

마지막으로, 헤더의 이름이 불명확한 경우, `read_fwf` 함수를 사용하여 고정 너비 형식(Fixed Width Format) 파일을 읽을 수 있습니다. 이 함수는 `colspecs` 인자를 통해 각 열의 너비를 지정합니다.

```

import pandas as pd

colspecs = [(0,10), (10,20), (20,30)] # 각 열의 너비를 지정

df = pd.read_fwf('table.txt', header=None, colspecs=colspecs)

```

이렇게 판다스에서 제공하는 여러 함수를 이용하여, 헤더 없는 테이블을 읽어들일 수 있습니다. 이를 통해 데이터를 더욱 정확하고 효율적으로 관리할 수 있습니다.

반응형
Comments