반응형
Notice
Link
목록슈퍼스칼라 (1)
스택큐힙리스트
프로세서 폭의 배수가 아닌 uop 개수를 실행하는 루프를 실행할 때 성능이 감소하나요?
나는 최근 x86 프로세서에서 다양한 크기의 루프가 uop의 수에 따라 어떻게 수행되는지 궁금합니다. 다른 질문에서 이 문제를 제기한 Peter Cordes의 인용문이 여기 있습니다. (원본 링크): 루프가 4의 배수가 아닌 경우 루프 버퍼에서 루프 외의 uop 대역폭이 일정하지 않으며(예: abc, abc, ...; abca, bcab, ...가 아님), Agner Fog의 마이크로아키텍처 문서에서 이 루프 버퍼의 이러한 제한에 대해 명확하지 않게 설명되어 있습니다. 문제는 루프가 최대 uop 처리량으로 실행되기 위해 N개의 uop의 배수 여부입니다. 여기서 N은 프로세서의 너비입니다. (예: 최근 Intel 프로세서의 경우 4입니다). 너비와 uop 카운트에 대해 다룰 때 복잡한 요소가 많지만, 나는..
카테고리 없음
2023. 10. 26. 12:26