일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 자료구조
- 네트워크
- 머신러닝
- 딥러닝
- 인공지능
- 보안
- 데이터베이스
- Yes
- 프로그래밍
- 클라우드컴퓨팅
- 소프트웨어
- 데이터과학
- 컴퓨터비전
- 자바스크립트
- 빅데이터
- 데이터구조
- 소프트웨어공학
- 버전관리
- 코딩
- 파이썬
- 데이터분석
- 사이버보안
- 컴퓨터과학
- 네트워크보안
- 프로그래밍언어
- 컴퓨터공학
- 2
- 웹개발
- I'm Sorry
- 알고리즘
- Today
- Total
스택큐힙리스트
넘파이 어레이에서 판다스 데이터프레임 생성: 인덱스 열과 열 헤더를 어떻게 지정할까요? 본문
나는 행 이름과 열 이름을 가진 이차원 배열을 나타내는 리스트의 리스트로 구성된 Numpy 배열을 가지고 있습니다. 아래와 같습니다.
data = np.array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
나는 결과 데이터프레임이 Row1와 Row2를 인덱스 값으로, Col1와 Col2를 헤더 값으로 가지기를 원합니다.
다음과 같이 인덱스를 지정할 수 있습니다:
df = pd.DataFrame(data, index=data[:,0])
하지만, 어떻게 최상의 열 헤더를 할당해야 할지 확신하지 못합니다.
답변 1
당신은 다음과 같이 DataFrame 생성자에 data, index 및 columns을 지정해야 합니다.
>>> pd.DataFrame(data=data[1:,1:], # values
... index=data[1:,0], # 1st column as index
... columns=data[0,1:]) # 1st row as the column names
수정: @joris 코멘트와 같이 올바른 데이터 유형을 얻으려면 위의 내용을 np.int_(data[1:,1:])으로 변경해야 할 수 있습니다.
답변 2
numpy 배열에서 Pandas DataFrame을 만드는 방법은 쉬우며, 인덱스 열과 열 헤더를 지정할 수도 있습니다. 이 글에서는 numpy 배열을 사용하여 Pandas DataFrame을 생성하는 방법과 인덱스 열과 열 헤더를 지정하는 방법에 대해 알아보겠습니다.Pandas는 데이터 조작을위한 Python 라이브러리입니다. Pandas DataFrame은 행과 열로 구성된 2D 데이터 구조입니다. Numpy 배열과 유사하지만 좀 더 유연한 데이터 조작이 가능합니다.
먼저 numpy 배열을 생성하겠습니다.
```
import numpy as np
data = np.array([[1, 2], [3, 4], [5, 6]])
```
이제 이 numpy 배열을 사용하여 Pandas DataFrame을 만들어 보겠습니다.
```
import pandas as pd
df = pd.DataFrame(data)
print(df)
```
결과는 다음과 같습니다.
```
0 1
0 1 2
1 3 4
2 5 6
```
DataFrame의 열은 자동으로 숫자로 지정됩니다. 그러나 이러한 열 이름은 데이터를 이해하는 데 도움이되지 않으므로 열 이름을 지정해야합니다.
```
df = pd.DataFrame(data, columns=['A', 'B'])
print(df)
```
결과는 다음과 같습니다.
```
A B
0 1 2
1 3 4
2 5 6
```
이제 인덱스 열을 지정해보겠습니다.
```
df = pd.DataFrame(data, columns=['A', 'B'], index=['a', 'b', 'c'])
print(df)
```
결과는 다음과 같습니다.
```
A B
a 1 2
b 3 4
c 5 6
```
인덱스 열은 열 이름과 마찬가지로 직접 지정할 수 있습니다. 이제 이 정보를 사용하여 보다 읽기 쉬운 데이터 프레임을 만들 수 있습니다.
이것이 numpy 배열에서 Pandas DataFrame을 만드는 방법과 함께 인덱스 열과 열 헤더를 지정하는 방법입니다. pandas의 다양한 기능과 함께 사용하면 데이터 조작에 매우 효과적입니다.