일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 프로그래밍
- 프로그래밍언어
- 알고리즘
- 네트워크
- 컴퓨터과학
- 컴퓨터비전
- 네트워크보안
- 데이터베이스
- 클라우드컴퓨팅
- 머신러닝
- 2
- 딥러닝
- 버전관리
- 컴퓨터공학
- 사이버보안
- 데이터분석
- 소프트웨어
- 자료구조
- 자바스크립트
- 파이썬
- 빅데이터
- 데이터구조
- Yes
- 소프트웨어공학
- 코딩
- I'm Sorry
- 보안
- 인공지능
- 데이터과학
- 웹개발
- Today
- Total
목록빅데이터처리 (5)
스택큐힙리스트
Spark와 Hadoop 사이에는 의존성이 있나요? 아니라면, Hadoop 없이 Spark를 실행할 때 놓치게 되는 기능은 있나요?답변 1스파크는 하둡 없이 실행할 수 있지만, 그 중 일부 기능은 하둡의 코드에 의존합니다 (예: Parquet 파일 처리). 메소스와 S3에서 스파크를 실행하고 있으며, 설정하는 것은 약간 까다로웠지만 한 번 설정하면 정말 잘 작동합니다 (정확한 설정 방법에 대한 요약은 여기에서 확인할 수 있습니다). (편집) 참고: 2.3.0 버전부터 스파크는 쿠버네티스에 대한 기본 지원도 추가되었습니다.답변 2아파치 스파크는 하둡 없이 사용할 수 있나요? 아파치 스파크는 분산 데이터 처리를 위한 인기있는 오픈 소스 프레임워크입니다. 많은 사람들이 스파크를 하둡과 함께 사용하는 것을 보통..
작업은 다음 구성으로 실행되었습니다: --master yarn-client --executor-memory 19G --executor-cores 7 --num-executors 3 (데이터 노드당 실행자 수, 가능한 만큼 사용) --master yarn-client --executor-memory 19G --executor-cores 4 --num-executors 3 (코어 수 감소) --master yarn-client --executor-memory 4G --executor-cores 2 --num-executors 12 (적은 코어, 많은 실행자) 경과 시간: 50분 15초 55분 48초 31분 23초 놀랍게도, (3)이 훨씬 빨랐습니다. (1)은 셔플링 시 상호 실행자 통신이 덜 발생하기 때문에..
나는 한 대의 노드에서 잘 작동하는 작은 Scala 프로그램을 가지고 있습니다. 그러나 이것을 여러 노드에서 실행되도록 확장하려고 합니다. 이것은 내 첫 번째 시도입니다. Spark에서 RDD가 작동하는 방법을 이해하려고 하기 때문에, 이 질문은 이론을 중심으로 하며 100% 정확하지 않을 수 있습니다. 예를 들어, 다음과 같이 RDD를 생성한다고 가정해 봅시다: val rdd = sc.textFile(file) 이제 이렇게 한 번 해 놓으면, 모든 노드가 파일 경로에 액세스 할 수 있다고 가정할 때, file에서의 파일은 이제 노드들 사이로 분할되어 있는 것을 의미합니까? 두 번째로, RDD의 객체 수를 계산하려고 합니다 (간단합니다). 그러나 RDD의 객체에 적용해야할 계산에 사용해야하는 해당 수를 ..
다음과 같이 일부 문자를 대체해야합니다 : & ➔ \&, # ➔ \#, ...제가 다음과 같이 코딩했는데, 더 좋은 방법이 있을 것 같습니다. 힌트 좀 주실 수 있나요? strs = strs.replace('&', '\&')strs = strs.replace('#', '\#')...답변 1두 문자 바꾸기나는 현재 답변들의 모든 방법들과 한 가지 추가 방법을 모두 시간 측정했습니다.입력 문자열이 # $$ # @$ ^ # $ &이고 &-> \& 및 #-> \ #로 대체하는 경우, 가장 빠른 방법은 다음과 같이 대체를 연결하는 것이었습니다 : #$ * $ ** ^^ $&.각 기능에 대한 시간:a) 3회 중 가장 좋은 결과 1000000 개의 루프, 1.47 μs 당 루프입니다.b) 1000000 번 반복, 3..