목록데이터마이닝 (11)
스택큐힙리스트
나는 null 값들을 채우기 위해 LinearRegression 모델을 사용하여 Rupeepersqft라는 feature에 작업 중이다. 코드를 실행할 때, 다음과 같은 오류가 발생한다: IndexError Traceback (most recent call last) in () 1 test_data = data_with_null.iloc[:,:3] ----> 2 Rupeepersqft_predicted['Rupeepersqft'] = pd.DataFrame(linreg.predict(test_data)) IndexError: only integers, slices (`:`), ellipsis (`...`), numpy.newaxis (`None`) and integer or boolean arrays a..
저는 신경망의 초보자입니다. 퍼셉트론에 대해 배우고 있습니다. 제 질문은 가중치 벡터가 결정 경계(하이퍼플레인)에 수직이 되는 이유는 무엇인가요? 많은 책들을 참고했지만, 모두 가중치 벡터가 결정 경계에 수직이라고 언급하고는 있지만 그 이유를 언급한 책은 없습니다. 누군가 설명이나 책 참고 자료를 제공해 주실 수 있을까요?답변 1여기서 w와 x는 모두 길이 N의 벡터입니다. 이 방정식은 평면 상의 모든 점에서 성립합니다. 위의 방정식을 상수로 곱하여도 여전히 성립하기 때문에 벡터 w의 단위 길이를 갖도록 상수를 정의할 수 있습니다. 이제 종이 조각을 꺼내서 x-y 축 (x1과 x2는 위의 방정식에서 의미합니다)을 그려보세요. 그 다음, 원점 근처에 선 (2D에서의 평면)을 어딘가 그려보세요. w0은 단순..
나는 3차원 벡터의 큰 세트를 가지고 있습니다. 유클리드 거리를 기반으로 이들을 군집화해야 합니다. 여기서 특정 클러스터 내에 있는 모든 벡터들은 서로의 유클리드 거리가 임계값 T보다 작아야 합니다. 몇 개의 클러스터가 존재하는지 알지 못합니다. 마지막에는 공간 내의 벡터 중 어떠한 클러스터에도 속하지 않는 개별 벡터가 존재할 수 있습니다. 그 이유는 해당 벡터의 유클리드 거리가 공간 내의 어떠한 벡터들과도 T보다 작지 않기 때문입니다. 여기서 사용해야 할 기존 알고리즘 / 접근 방식은 무엇인가요?답변 1이 접근 방식은 다른 군집과 유사성 기준, 즉 거리 임계값을 충족하지 못하는 경우에도 작은(단일 점) 군집을 허용한다는 것에 유의하십시오. 더 나은 성능을 발휘할 수 있는 다른 알고리즘도 있으며, 이는 ..
Python 프로그램 내에서 사전을 전역 변수로 저장하고 약 32개의 작업자 프로세스를 분기합니다. 이론적으로는 이 방법이 작동할 수 있습니다. 왜냐하면 사전이 수정되지 않기 때문에 Linux에서의 fork에 대한 COW 메커니즘은 데이터 구조가 프로세스 간에 복사되지 않고 공유되는 것을 의미합니다. 그러나 이를 시도 할 때 multiprocessing.Pool.map 내의 os.fork()에서 프로그램이 OSError: [Errno 12] Cannot allocate memory와 함께 충돌합니다. 나는 이것이 커널이 메모리를 과도하게 할당하지 않도록 구성되어있기 때문이라고 확신합니다 (/proc/sys/vm/overcommit_memory가 2로 설정되어 있으며 루트 액세스가 없는 기계에서이 설정을 ..