목록데이터과학 (85)
스택큐힙리스트
문서를 통해 이해한 것은 다음과 같습니다: kubectl create 클러스터에 새로운 k8s 리소스를 생성합니다. kubectl replace 라이브 클러스터의 리소스를 업데이트합니다. kubectl apply 만약 create + replace를 하고 싶다면 (참고) 제가 가진 질문은 다음과 같습니다. 왜 클러스터에서 같은 작업을 수행하는데 세 가지 연산이 있는 것인가요? 이러한 연산들의 사용 사례는 무엇인가요? 내부에서는 어떻게 다른가요? 답변 1이들은 두 가지 다른 접근 방식입니다: 명령형 관리 kubectl create는 우리가 명령형 관리라고 부르는 것입니다. 이 접근 방식에서는 Kubernetes API에게 무엇을 생성, 대체 또는 삭제하고자 하는지 알려주는 것이며, K8s 클러스터의 상태는..
나는 방대한 텍스트 데이터를 가지고 있습니다. 전체 데이터베이스는 UTF-8의 텍스트 형식입니다. 내 전체 텍스트 데이터에서 가장 반복되는 구문 목록이 필요합니다. 예를 들어, 원하는 출력은 다음과 같습니다: { 'a': 423412341, 'this': 423412341, 'is': 322472341, 'this is': 222472341, 'this is a': 122472341, 'this is a my': 5235634 } 각 구문을 처리하고 저장하는 데는 큰 데이터베이스의 크기가 필요합니다. 예를 들어 MySQL이나 MongoDB에 저장합니다. 이 결과를 찾기 위해 더 효율적인 데이터베이스나 알고리즘이 있을까요? Solr, Elasticsearch 또는 기타 등등... 내가 각 구문마다 최대 1..
닫힘. 이 질문은 의견 기반으로 되어있습니다. 현재로선 답변을 받을 수 없습니다. 이 질문을 개선하고 싶으신가요? 사실과 인용을 통해 질문을 업데이트하여 답변할 수 있도록 만들어주세요. 이 게시글을 편집하십시오. 닫힘 7년 전. 이 질문을 개선하기 위키피디아에 언급된 대로 데이터 마이닝 프로세스의 전반적인 목표는 데이터 세트에서 정보를 추출하고 이를 이해 가능한 구조로 변환하여 추가적인 사용을 위해 활용하는 것입니다. 빅 데이터와 어떤 관련이 있나요? Hadoop이 병렬로 데이터 마이닝을 수행한다고 말해도 되나요?답변 1이것은 여러 문제에 적용되므로, Hadoop에서의 실제 데이터 마이닝은 잘 동작하지 않는 것 같습니다. 모두가 이것을 시도하고 많은 회사들이 이 제품을 판매하지만, 비-빅 버전보다는 그리..
나는 master 브랜치를 가지고 있으며, 이는 원격 브랜치 origin/master를 추적합니다.로컬 및 원격으로 master-old로 이름을 변경하고 싶습니다. 가능한가요?다른 사용자들은 origin/master를 추적하였고 (항상 로컬 master 브랜치를 git pull로 업데이트한 사용자들) 원격 브랜치의 이름을 바꾼 후에 어떻게 될까요? 그들의 git pull은 여전히 작동할까요, 아니면 origin/master을 찾을 수 없다는 오류가 발생할까요?그런 다음에, 더 나아가서 새로운 master 브랜치를 생성하고 싶습니다 (로컬과 원격 모두). 다시 말해, 이 작업을 수행한 후에 다른 사용자들이 git pull을 실행한다면 어떻게 될까요?나는 이 모든 것이 많은 문제로 이어질 것 같다고 생각한다..