스택큐힙리스트

Notice

Link

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (1964)

스택큐힙리스트

64비트 미부호 정수를 실수로 변환하는 방법: g++로부터 이 알고리즘을 왜 사용하는 건가요?

g++ 4.9.2를 사용하여 컴파일한다면 'bool int_dbl_com(const unsigned long long x, const double y){ return x 63-bit ---(round to nearest even)----> binary64 64-bit -(round-to-nearest-even,the conversion the compiler wants)-> binary64'다른 측면에 대한 답변을 드리면:하지만 코드가 하는 것은 그게 아닙니다. 이 코드는 '%rcx'의 최하위 비트를 저장하고, 그 결과에 이를 다시 논리합합니다. 왜죠? 그리고 이 최하위 비트들은 어차피 소실될 거 아닌가요? (아니면 제가 잘못 이해한 건가요?)이 특정한 상황에서 round-to-odd를 구현하는 정확한 ..

카테고리 없음 2023. 8. 29. 19:43

x86-64 어셈블리의 성능 최적화 - 정렬과 분기 예측

나는 현재 x86-64 어셈블리와 SSE-2 명령어를 사용하여 C99 표준 라이브러리 문자열 함수인 'strlen()' , 'memset()' 등의 고도로 최적화된 버전을 코딩 중입니다. 지금까지는 성능 측면에서 탁월한 결과를 얻었지만, 더 최적화하려고 시도할 때 가끔 이상한 동작을 보입니다. 예를 들어, 몇 가지 간단한 지시문을 추가하거나 제거하거나, 점프에 사용되는 로컬 레이블을 간단히 재구성하는 것만으로도 전체 성능이 크게 저하됩니다. 코드적인 측면에서는 아무런 이유가 없습니다. 내 추측은 코드 정렬에 문제가 있거나 잘못 예측된 분기들 때문에 문제가 있을 것이라고 생각합니다. 나는 같은 아키텍처(x86-64)를 가지더라도 다른 CPU들이 분기 예측에 대해 다른 알고리즘을 가지고 있다는 것을 알고 있..

카테고리 없음 2023. 8. 29. 19:05

플로트 벡터의 SSE 감소

SSE intrinsics를 사용하여 float 벡터의 요소들의 합을 어떻게 얻을 수 있나요?간단한 시리얼 코드: #@!'void(float *input, float &result, unsigned int NumElems){ result = 0; for(auto i=0; i

카테고리 없음 2023. 8. 29. 18:14

x86에서 자가 수정 코드(self-modifying code)와 함께 발생하는 오래된 명령어 가져오기 관찰하기

인텔의 메뉴얼에서 제시된 대로, 메모리에 명령을 작성할 수 있는 것으로 알고 있는데, 명령 미리 읽기 큐는 이미 오래된 명령을 미리 가져와서 해당 이전 명령을 실행하게 될 것입니다. 그러나 나는 이러한 동작을 관찰하는 데 실패했습니다. 나의 방법론은 다음과 같습니다. 인텔 소프트웨어 개발 매뉴얼 11.6 절에 따르면, 현재 프로세서에서 캐시된 코드 세그먼트에 대한 메모리 위치 쓰기는 연관된 캐시 라인(또는 라인들)을 무효화시킵니다. 이 체크는 명령어의 물리적 주소를 기반으로 합니다. 더불어 P6 패밀리와 펜티엄 프로세서는 코드 세그먼트에 대한 쓰기가 실행을 위해 미리 가져온 명령어를 수정할 수 있는지 여부도 체크합니다. 쓰기가 미리 가져온 명령어에 영향을 미치면 프리페치 큐가 무효화됩니다. 이후의 체크는..

카테고리 없음 2023. 8. 29. 17:51

이전 Prev 1 ··· 342 343 344 345 346 347 348 ··· 491 Next 다음

목록전체 글 (1964)

스택큐힙리스트

티스토리툴바