목록클라우드컴퓨팅 (134)
스택큐힙리스트
제가 실행 중인 Spark 애플리케이션이 있어서 다른 애플리케이션에게 할당되지 않고 모든 코어를 점유하고 있습니다. 빠른 조사를 해보니 YARN kill 또는 /bin/spark-class를 사용하여 해당 명령을 종료하는 것을 제안했습니다. 그러나 저는 CDH 버전을 사용하고 있으며 /bin/spark-class가 존재하지 않습니다. 또한 YARN 애플리케이션을 종료하는 것도 작동하지 않습니다. 누가 이 문제를 함께 해결해 줄 수 있을까요?답변 1 스파크 스케줄러에서 애플리케이션 ID를 복사하여 붙여넣기하십시오. 예를 들어, application_1428487296152_25597 작업을 시작한 서버에 연결하십시오. yarn application -kill application_1428487296152_..
어떻게 RDD (org.apache.spark.rdd.RDD[org.apache.spark.sql.Row])를 Dataframe org.apache.spark.sql.DataFrame으로 변환할 수 있을까요? 제가 데이터프레임을 .rdd를 사용하여 RDD로 변환했는데, 처리를 한 후에 데이터프레임으로 다시 변환하고 싶습니다. 어떻게 할 수 있을까요?답변 1val dfWithoutSchema = spark.createDataFrame(rdd) dfWithoutSchema.show() +------+--------------------+ | _1| _2| +------+--------------------+ | first|[2.0, 1.0, 2.1, 5.4]| | test|[1.5, 0.5, 0.9, 3.7..
간략히 말하자면: 이 TypeError의 의미를 이해하려고 노력하고 있습니다: 'getComputedStyle'을(를) '윈도우'에서 실행하지 못했습니다: 매개변수 1은 'Element' 타입이 아닙니다. 이 오류는 미디어위키의 VisualEditor를 실행하는 동안 나타납니다. 아래 링크에서 확인할 수 있습니다: http://www.wiki.org.il/index.php?title=new-page&veaction=edit 이 오류로 인해 새 페이지를 만들거나 위키를 익명으로 편집할 수 없습니다. 그러나 다른 스킨을 사용하면 오류가 사라집니다: http://www.wiki.org.il/index.php/Main_Page?useskin=vector 위키는 버전 1.25alpha를 사용합니다.답변 1같은 오..
JavaSparkContext spark = new JavaSparkContext( new SparkConf().setJars(...).setSparkHome....); JavaRDD file = spark.textFile(hdfs://...); // 단계1 JavaRDD words = file.flatMap(new FlatMapFunction() { public Iterable call(String s) { return Arrays.asList(s.split( )); } }); // 단계2 JavaPairRDD pairs = words.map(new PairFunction() { public Tuple2 call(String s) { return new Tuple2(s, 1); } }); // 단계3 ..