반응형
Notice
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 버전관리
- 자바스크립트
- 사이버보안
- 컴퓨터과학
- 데이터과학
- 2
- Yes
- 딥러닝
- 네트워크보안
- 보안
- 알고리즘
- 코딩
- 네트워크
- 프로그래밍언어
- 컴퓨터비전
- 클라우드컴퓨팅
- 파이썬
- 프로그래밍
- 자료구조
- 머신러닝
- 데이터베이스
- I'm Sorry
- 컴퓨터공학
- 인공지능
- 소프트웨어
- 웹개발
- 빅데이터
- 소프트웨어공학
- 데이터구조
- 데이터분석
Archives
- Today
- Total
목록슈퍼스칼라 (1)
스택큐힙리스트
프로세서 폭의 배수가 아닌 uop 개수를 실행하는 루프를 실행할 때 성능이 감소하나요?
나는 최근 x86 프로세서에서 다양한 크기의 루프가 uop의 수에 따라 어떻게 수행되는지 궁금합니다. 다른 질문에서 이 문제를 제기한 Peter Cordes의 인용문이 여기 있습니다. (원본 링크): 루프가 4의 배수가 아닌 경우 루프 버퍼에서 루프 외의 uop 대역폭이 일정하지 않으며(예: abc, abc, ...; abca, bcab, ...가 아님), Agner Fog의 마이크로아키텍처 문서에서 이 루프 버퍼의 이러한 제한에 대해 명확하지 않게 설명되어 있습니다. 문제는 루프가 최대 uop 처리량으로 실행되기 위해 N개의 uop의 배수 여부입니다. 여기서 N은 프로세서의 너비입니다. (예: 최근 Intel 프로세서의 경우 4입니다). 너비와 uop 카운트에 대해 다룰 때 복잡한 요소가 많지만, 나는..
카테고리 없음
2023. 10. 26. 12:26