| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- Yes
- 디자인패턴
- 머신러닝
- 네트워크보안
- 데이터구조
- 자바스크립트
- I'm Sorry
- 데이터분석
- 프로그래밍
- 데이터베이스
- 소프트웨어공학
- 파이썬
- 네트워크
- 사이버보안
- 알고리즘
- 데이터과학
- 버전관리
- 보안
- 클라우드컴퓨팅
- 프로그래밍언어
- 소프트웨어
- 컴퓨터과학
- 인공지능
- 빅데이터
- 자료구조
- 웹개발
- 딥러닝
- 컴퓨터비전
- 컴퓨터공학
- springboot
- Today
- Total
목록2023/11/02 (15)
스택큐힙리스트
라이브러리(data.table) dt dput(dt1) structure(list(ID = 29502509, FY = 2012, VAR = 61067.5442975645, startDate = structure(15062L, class = c(IDate, Date)), endDate = structure(, class = c(IDate, Date)), start = 1750, # 여기서 end = 2404, date = structure(15461L, class = c(IDate, Date)), DESCR = JOB, NOTE = NEW), .Names = c(ID, FY, VAR, startDate, endDate, start, end, date, DESCR, NOTE), row.names = c(NA..
특정 필드로 그룹화하고 그룹화된 필드의 출력을 얻고 싶습니다. 아래의 예시는 제가 이루고자 하는 것을 보여줍니다: 다음과 같은 두 개의 열이 있는 'sample_table'이라는 테이블을 상상해보십시오:- F1 F2 001 111 001 222 001 123 002 222 002 333 003 555 아래 출력을 제공하는 Hive 쿼리를 작성하고 싶습니다:- 001 [111, 222, 123] 002 [222, 333] 003 [555] Pig에서는 다음과 같은 방식으로 매우 쉽게 이루어질 수 있습니다:- grouped_relation = GROUP sample_table BY F1; 누군가 간단하게 Hive에서 이렇게 할 수 있는 방법을 제안해주시겠습니까? 생각나는 것은 이를 위해 사용자 정의 함수 (..
저는 대용량 파일을 위한 확장 가능한 저장소를 생성하는 가장 좋은 솔루션을 찾고 있습니다. 파일의 크기는 1MB에서 500-600GB까지 다양할 수 있습니다. 하둡(Hadoop)과 그의 HDFS에 대해 몇 가지 정보를 찾았는데, Map/Reduce 작업이나 다른 많은 기능이 필요하지 않기 때문에 약간 복잡해 보입니다. 지금은 몽고디비(MongoDB)와 그의 GridFS를 파일 저장소로 사용하기로 생각하고 있습니다. 그리고 이제 질문들입니다: 동시에 몇 개의 파일을 쓰려고 할 때 GridFS에 어떤 일이 발생할까요? 읽기/쓰기 작업에 대한 잠금(Lock)이 있을까요? (저는 파일 저장소로만 사용할 예정입니다) GridFS에서 파일은 RAM에 캐시될까요? 그리고 이것이 읽기/쓰기 성능에 어떤 영향을 미칠까요..