목록데이터구조 (199)
스택큐힙리스트
나는 몇 명의 소셜 미디어 사용자와 그의/그녀의 팔로워를 가진 데이터 테이블을 가지고 있습니다. 원래의 데이터 테이블은 다음 형식을 갖고 있습니다: X.USERID FOLLOWERS 1081 4053807021,2476584389,4713715543, ... 따라서 각 행은 사용자와 그의/그녀의 ID와 쉼표로 구분된 팔로워 벡터를 포함합니다. 총 24,000개의 고유한 사용자 ID와 160,000,000개의 고유한 팔로워가 있습니다. 원래의 테이블을 다음 형식으로 변환하고 싶습니다: X.USERID FOLLOWERS 1: 1081 4053807021 2: 1081 2476584389 3: 1081 4713715543 4: 1081 580410695 5: 1081 4827723557 6: 1081 7043..
테이블의 문자열 열의 출력이 길이 13의 문자열이 되어야합니다. 어떤 길이든 상관없이 남은 문자열에는 0을 넣어야합니다... 다음 코드를 hive 쿼리에서 사용해보려고 했지만 원하는 출력을 얻지 못했습니다 right('0000000000000' + ProductID, 13) 도움이 필요합니다. 감사합니다답변 1하이브에는 내장 lpad 및 rpad 함수가 있습니다. 여러분의 경우 다음을 사용할 수 있습니다: lpad(ProductId, 13, 0) 또는 13자로 잘라내야 할 수도 있으므로 이것을 right 함수로 감쌀 수 있습니다.답변 2하이브는 널리 사용되는 데이터웨어 하우스 시스템 중 하나입니다. 하이브를 사용하여 데이터를 저장하고 처리하면 많은 시간과 비용을 절약할 수 있습니다. 하이브는 데이터 처리..
저의 컨텍스트는 생물정보학이며 특히 차세대 시퀀싱입니다. 하지만 문제는 일반적이므로 예시로 로그 파일을 사용하겠습니다. 이 파일은 매우 큽니다 (기가바이트 단위로 압축되어 있으므로 메모리에 맞지 않습니다) 하지만 파싱하기 쉽습니다 (각 줄은 항목입니다) 따라서 다음과 같이 간단하게 작성할 수 있습니다: parse :: Lazy.ByteString -> [LogEntry] 이제 로그 파일에서 계산하려는 많은 통계가 있습니다. 가장 쉬운 방법은 다음과 같이 별도의 함수를 작성하는 것입니다: totalEntries = length nrBots = sum . map fromEnum . map isBotEntry averageTimeOfDay = histogram . map extractHour 이 모든 함수들은..
쿠버네티스/도커 생태계에서는 응용 프로그램의 헬스 체크 엔드포인트로 /healthz를 사용하는 관례가 있습니다. 'healthz'라는 이름은 어디에서 비롯되었으며, 그 이름과 관련된 특정한 의미가 있을까요?답변 1이는 역사적으로 Google의 내부 실천 방침에서 비롯되었습니다. 이들은 z-페이지라고 불립니다. 이 이름이 z로 끝나는 이유는 실제 응용 프로그램 엔드포인트와 이름이 충돌을 줄이기 위해서입니다(예: /status와 같은). 자세한 내용은 다음 동영상을 참조하세요: https://vimeo.com/173610242 Google 내에서는 /varz, /statusz, /rpcz와 같은 유사한 엔드포인트가 있습니다. Google에서 개발된 서비스는 자동으로 이러한 엔드포인트를 제공하여 건강 상태와 ..