반응형
Notice
Link
목록30) (1)
스택큐힙리스트
PySpark에서 데이터프레임의 열 이름을 변경하는 방법은 무엇인가요?
나는 판다 스의 배경에서 왔으며 CSV 파일에서 데이터를 데이터프레임으로 읽어서 간단한 명령인 다음과 같이 열 이름을 유용한 이름으로 변경하는 것에 익숙합니다: df.columns = new_column_name_list 그러나 sqlContext를 사용하여 생성된 PySpark 데이터프레임에서는 동일한 방법이 작동하지 않습니다. 이를 쉽게 수행하기 위한 유일한 해결책은 다음과 같습니다: df = sqlContext.read.format(com.databricks.spark.csv).options(header='false', inferschema='true', delimiter='\t').load(data.txt) oldSchema = df.schema for i,k in enumerate(oldSche..
카테고리 없음
2023. 12. 2. 23:43