반응형
Notice
Link
목록주소모드병목현상 (1)
스택큐힙리스트
인덱스 주소 모드를 사용할 때 병목 현상
나는 Haswell 및 Coffee Lake 기계에서 다음 실험을 수행했습니다. The instruction 'cmp rbx, qword ptr [r14+rax] ' 단리시 0.5의 처리량을 가지고 있습니다. 즉, 1사이클당 2개의 명령을 실행합니다. 이것은 예상한 대로입니다. 이 명령은 후에 언-와합 된 µ옵으로 디코딩되며 이에 따라 두 개의 은퇴 슬롯이 필요합니다. (마이크로 퓨전 및 주소 지정 모드 ) 만약 우리가 'nop' 지시문을 추가한다면 'cmp rbx, qword ptr [r14+rax]; nop ' 이 시퀀스는 3개의 리타이어 슬롯을 필요로 하며, 백엔드에는 다른 병목 현상이 없어서 예상되는 처리량은 0.75입니다. 이는 IACA가 보고한 처리량과 일치합니다. 하지만 실제 처리량은 1입니..
카테고리 없음
2023. 9. 1. 10:31