스택큐힙리스트

넘파이 어레이에서 판다스 데이터프레임 생성: 인덱스 열과 열 헤더를 어떻게 지정할까요? 본문

카테고리 없음

넘파이 어레이에서 판다스 데이터프레임 생성: 인덱스 열과 열 헤더를 어떻게 지정할까요?

스택큐힙리스트 2023. 4. 4. 20:30
반응형

나는 행 이름과 열 이름을 가진 이차원 배열을 나타내는 리스트의 리스트로 구성된 Numpy 배열을 가지고 있습니다. 아래와 같습니다.

data = np.array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])

나는 결과 데이터프레임이 Row1와 Row2를 인덱스 값으로, Col1와 Col2를 헤더 값으로 가지기를 원합니다.

다음과 같이 인덱스를 지정할 수 있습니다:

df = pd.DataFrame(data, index=data[:,0])

하지만, 어떻게 최상의 열 헤더를 할당해야 할지 확신하지 못합니다.

답변 1

당신은 다음과 같이 DataFrame 생성자에 data, index 및 columns을 지정해야 합니다.

>>> pd.DataFrame(data=data[1:,1:], # values

... index=data[1:,0], # 1st column as index

... columns=data[0,1:]) # 1st row as the column names

수정: @joris 코멘트와 같이 올바른 데이터 유형을 얻으려면 위의 내용을 np.int_(data[1:,1:])으로 변경해야 할 수 있습니다.

답변 2

numpy 배열에서 Pandas DataFrame을 만드는 방법은 쉬우며, 인덱스 열과 열 헤더를 지정할 수도 있습니다. 이 글에서는 numpy 배열을 사용하여 Pandas DataFrame을 생성하는 방법과 인덱스 열과 열 헤더를 지정하는 방법에 대해 알아보겠습니다.

Pandas는 데이터 조작을위한 Python 라이브러리입니다. Pandas DataFrame은 행과 열로 구성된 2D 데이터 구조입니다. Numpy 배열과 유사하지만 좀 더 유연한 데이터 조작이 가능합니다.

먼저 numpy 배열을 생성하겠습니다.

```

import numpy as np

data = np.array([[1, 2], [3, 4], [5, 6]])

```

이제 이 numpy 배열을 사용하여 Pandas DataFrame을 만들어 보겠습니다.

```

import pandas as pd

df = pd.DataFrame(data)

print(df)

```

결과는 다음과 같습니다.

```

0 1

0 1 2

1 3 4

2 5 6

```

DataFrame의 열은 자동으로 숫자로 지정됩니다. 그러나 이러한 열 이름은 데이터를 이해하는 데 도움이되지 않으므로 열 이름을 지정해야합니다.

```

df = pd.DataFrame(data, columns=['A', 'B'])

print(df)

```

결과는 다음과 같습니다.

```

A B

0 1 2

1 3 4

2 5 6

```

이제 인덱스 열을 지정해보겠습니다.

```

df = pd.DataFrame(data, columns=['A', 'B'], index=['a', 'b', 'c'])

print(df)

```

결과는 다음과 같습니다.

```

A B

a 1 2

b 3 4

c 5 6

```

인덱스 열은 열 이름과 마찬가지로 직접 지정할 수 있습니다. 이제 이 정보를 사용하여 보다 읽기 쉬운 데이터 프레임을 만들 수 있습니다.

이것이 numpy 배열에서 Pandas DataFrame을 만드는 방법과 함께 인덱스 열과 열 헤더를 지정하는 방법입니다. pandas의 다양한 기능과 함께 사용하면 데이터 조작에 매우 효과적입니다.

반응형
Comments