'RDD용량관리' 태그의 글 목록

Notice

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록RDD용량관리 (1)

스택큐힙리스트

(왜) 우리는 RDD에 대해 캐시(cache) 또는 지속성(persist)을 호출해야 할까요?

강건한 분산 데이터 세트 (RDD)가 텍스트 파일이나 컬렉션 (또는 다른 RDD)으로부터 생성될 때 RDD 데이터를 메모리에 저장하기 위해 명시적으로 cache 또는 persist를 호출해야 할까요? 아니면 RDD 데이터는 기본적으로 분산 방식으로 메모리에 저장되나요? val textFile = sc.textFile(/user/emp.txt) 내가 이해한대로 위 단계 이후에 textFile은 RDD이며 모든/일부 노드의 메모리에서 사용 가능합니다. 그렇다면 왜 cache 또는 persist를 textFile RDD에 호출해야 할까요?답변 1RDD의 대부분의 작업은 지연됩니다. RDD를 작업들의 설명으로 생각해보세요. RDD는 데이터가 아닙니다. 그래서 이 라인: val textFile = sc.textF..

카테고리 없음 2023. 11. 30. 00:26

이전 Prev 1 Next 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

스택큐힙리스트

목록RDD용량관리 (1)

스택큐힙리스트

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역