| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 프로그래밍
- 파이썬
- 자료구조
- 클라우드컴퓨팅
- 네트워크보안
- 인공지능
- 소프트웨어
- 데이터분석
- 사이버보안
- 컴퓨터비전
- 머신러닝
- 데이터구조
- 디자인패턴
- 소프트웨어공학
- 데이터과학
- 데이터베이스
- 네트워크
- 컴퓨터과학
- Yes
- I'm Sorry
- 컴퓨터공학
- 알고리즘
- 프로그래밍언어
- 버전관리
- springboot
- 자바스크립트
- 딥러닝
- 웹개발
- 보안
- 빅데이터
- Today
- Total
목록전체 글 (1964)
스택큐힙리스트
저는 두 개의 HDFS 설정이 있고, HDFS1에서 HDFS2로 테이블을 복사하려고 합니다. HDFS1에서 HDFS2로 데이터를 복사하는 방법은 무엇인가요? Sqoop 또는 다른 명령 줄을 통해 가능한가요?답변 1DistCp (분산 복사)는 클러스터 간 데이터 복사에 사용되는 도구입니다. 맵리듀스를 사용하여 데이터의 분산, 오류 처리 및 복구, 보고를 수행합니다. 이는 파일과 디렉토리 목록을 맵 작업의 입력으로 확장하여 소스 목록에서 지정된 파일의 파티션을 각각 복사합니다. 사용법: $ hadoop distcp 예제: $ hadoop distcp hdfs://nn1:8020/file1 hdfs://nn2:8020/file2 nn1의 file1이 nn2로 file2라는 파일명으로 복사됩니다. 지금을 기준으..
$result = $dynamodbClient->createTable(array( 'TableName' => '피드', 'AttributeDefinitions' => array( array('AttributeName' => '사용자_아이디', 'AttributeType' => 'S'), array('AttributeName' => '피드_가이드', 'AttributeType' => 'S'), array('AttributeName' => '상태_아이디', 'AttributeType' => 'N'), ), 'KeySchema' => array( array('AttributeName' => '피드_가이드', 'KeyType' => 'HASH'), ), 'GlobalSecondaryIndexes' => arra..
나는 방대한 텍스트 데이터를 가지고 있습니다. 전체 데이터베이스는 UTF-8의 텍스트 형식입니다. 내 전체 텍스트 데이터에서 가장 반복되는 구문 목록이 필요합니다. 예를 들어, 원하는 출력은 다음과 같습니다: { 'a': 423412341, 'this': 423412341, 'is': 322472341, 'this is': 222472341, 'this is a': 122472341, 'this is a my': 5235634 } 각 구문을 처리하고 저장하는 데는 큰 데이터베이스의 크기가 필요합니다. 예를 들어 MySQL이나 MongoDB에 저장합니다. 이 결과를 찾기 위해 더 효율적인 데이터베이스나 알고리즘이 있을까요? Solr, Elasticsearch 또는 기타 등등... 내가 각 구문마다 최대 1..
def myJFunc(df): ... # 초기화 jnum 카운터 ... jnum = 0; ... # 각 행의 데이터프레임을 반복 (첫 번째 / 제로 제외) ... for i in range(1,len(df)): ... # 사용자가 변경되었는지 확인 ... if df.User.loc[i] == df.User.loc[i-1]: ... # 시간이 1 (시간) 이상 증가했는지 확인 ... if abs(df.Time.loc[i]-df.Time.loc[i-1])>1: ... # 새로운 열 업데이트 ... df['newcol2'].loc[i-1] = 1; ... df['newcol1'].loc[i] = 1; ... # jnum 증가 ... jnum += 1; ... # 내용이 변경되었는지 확인 ... if df.Co..