| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 네트워크보안
- 인공지능
- 자료구조
- I'm Sorry
- springboot
- 컴퓨터비전
- 데이터구조
- 클라우드컴퓨팅
- 디자인패턴
- 알고리즘
- 컴퓨터과학
- 웹개발
- 소프트웨어공학
- 프로그래밍언어
- 자바스크립트
- 파이썬
- 버전관리
- 컴퓨터공학
- 사이버보안
- 빅데이터
- 소프트웨어
- 딥러닝
- 데이터베이스
- 데이터과학
- 머신러닝
- 데이터분석
- 보안
- 네트워크
- 프로그래밍
- Yes
- Today
- Total
목록2023/11/28 (15)
스택큐힙리스트
Reading Spark method sortByKey : sortByKey([ascending], [numTasks]) K를 Ordered를 구현한 (K, V) 쌍 데이터셋에 대해서 호출될 때, boolean ascending 인수에 지정한 대로 키를 오름차순 또는 내림차순으로 정렬된 (K, V) 쌍 데이터셋을 반환합니다. 결과를 N개만 반환하는 것이 가능한가요? 모든 결과를 반환하는 대신, 상위 10개만 반환하도록 할 수 있을까요? 정렬된 컬렉션을 배열로 변환하고 take 메소드를 사용할 수 있지만, 이는 O(N) 연산이기 때문에 더 효율적인 방법이 있을까요?답변 1만약 상위 10개만 필요하다면 rdd.top(10)을 사용하세요. 정렬을 피하기 때문에 더 빠릅니다. rdd.top은 데이터를 병렬로 하..
이것은 다른 포럼에서 답변을 받지 못한 남의 질문의 사본입니다. 그래서 같은 문제를 가지고 있다고 여기에서 다시 물어보려고 생각했습니다. (http://geekple.com/blogs/feeds/Xgzu7/posts/351703064084736 참조) 제 컴퓨터에는 Spark가 올바르게 설치되어 있으며, ./bin/pyspark를 Python 인터프리터로 사용하여 pyspark 모듈을 사용하여 파이썬 프로그램을 오류 없이 실행할 수 있습니다. 그러나 보통의 Python 쉘을 실행하려고 할 때, pyspark 모듈을 가져오려고하면 다음과 같은 오류가 발생합니다: from pyspark import SparkContext 그리고 다음과 같이 나옵니다 No module named pyspark. 이것을 어떻게..
나는 컬렉션의 내용을 Spark 콘솔에 출력하려고 시도하고 있습니다. 제가 가진 유형은 다음과 같습니다: linesWithSessionId: org.apache.spark.rdd.RDD[String] = FilteredRDD[3] 그리고 다음 명령을 사용합니다: scala> linesWithSessionId.map(line => println(line)) 하지만 다음과 같이 출력됩니다: res1: org.apache.spark.rdd.RDD[Unit] = MappedRDD[4] at map at :19 RDD를 콘솔에 기록하거나 내용을 볼 수 있도록 디스크에 저장하는 방법은 무엇인가요?답변 1만약 RDD의 내용을 보고 싶다면 하나의 방법은 collect()를 사용하는 것입니다: myRDD.collect(..
그러니까, 다음과 같은 것이 있다고 가정해봅시다 (이것은 여기와 여기에서 적용한 것입니다): 세션 저장소 로그인: app.get('/login', function(request, response) { var user = {username: request.body.username, password: request.body.password }; // 어떤 방식으로 유효성을 검사합니다 validate(user, function(isValid, profile) { // 세션 토큰 생성 var token= createSessionToken(); // 키-값 데이터베이스에 추가 KeyValueStore.add({token: {userid: profile.id, expiresInMinutes: 60}}); // 클라..