'2023/11/02 글 목록 (4 Page)

Notice

Link

« 2023/11 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록2023/11/02 (15)

스택큐힙리스트

데이터 테이블의 잘못된 set 사용으로 인해 음수의 행 수

라이브러리(data.table) dt dput(dt1) structure(list(ID = 29502509, FY = 2012, VAR = 61067.5442975645, startDate = structure(15062L, class = c(IDate, Date)), endDate = structure(, class = c(IDate, Date)), start = 1750, # 여기서 end = 2404, date = structure(15461L, class = c(IDate, Date)), DESCR = JOB, NOTE = NEW), .Names = c(ID, FY, VAR, startDate, endDate, start, end, date, DESCR, NOTE), row.names = c(NA..

카테고리 없음 2023. 11. 2. 18:17

히브 그룹화 연산자에서 원소의 배열/가방을 가져오는 방법은 무엇인가요?

특정 필드로 그룹화하고 그룹화된 필드의 출력을 얻고 싶습니다. 아래의 예시는 제가 이루고자 하는 것을 보여줍니다: 다음과 같은 두 개의 열이 있는 'sample_table'이라는 테이블을 상상해보십시오:- F1 F2 001 111 001 222 001 123 002 222 002 333 003 555 아래 출력을 제공하는 Hive 쿼리를 작성하고 싶습니다:- 001 [111, 222, 123] 002 [222, 333] 003 [555] Pig에서는 다음과 같은 방식으로 매우 쉽게 이루어질 수 있습니다:- grouped_relation = GROUP sample_table BY F1; 누군가 간단하게 Hive에서 이렇게 할 수 있는 방법을 제안해주시겠습니까? 생각나는 것은 이를 위해 사용자 정의 함수 (..

카테고리 없음 2023. 11. 2. 18:17

MongoDB는 파일 저장소로 사용됩니다.

저는 대용량 파일을 위한 확장 가능한 저장소를 생성하는 가장 좋은 솔루션을 찾고 있습니다. 파일의 크기는 1MB에서 500-600GB까지 다양할 수 있습니다. 하둡(Hadoop)과 그의 HDFS에 대해 몇 가지 정보를 찾았는데, Map/Reduce 작업이나 다른 많은 기능이 필요하지 않기 때문에 약간 복잡해 보입니다. 지금은 몽고디비(MongoDB)와 그의 GridFS를 파일 저장소로 사용하기로 생각하고 있습니다. 그리고 이제 질문들입니다: 동시에 몇 개의 파일을 쓰려고 할 때 GridFS에 어떤 일이 발생할까요? 읽기/쓰기 작업에 대한 잠금(Lock)이 있을까요? (저는 파일 저장소로만 사용할 예정입니다) GridFS에서 파일은 RAM에 캐시될까요? 그리고 이것이 읽기/쓰기 성능에 어떤 영향을 미칠까요..

카테고리 없음 2023. 11. 2. 18:17

이전 Prev 1 2 3 4 Next 다음

목록2023/11/02 (15)

스택큐힙리스트

티스토리툴바