| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 인공지능
- 디자인패턴
- 클라우드컴퓨팅
- 버전관리
- 네트워크보안
- 머신러닝
- Yes
- 데이터과학
- 컴퓨터공학
- 알고리즘
- 컴퓨터과학
- 소프트웨어공학
- 파이썬
- 빅데이터
- 자바스크립트
- 보안
- 자료구조
- 프로그래밍언어
- 프로그래밍
- I'm Sorry
- springboot
- 사이버보안
- 데이터분석
- 데이터구조
- 소프트웨어
- 네트워크
- 웹개발
- 데이터베이스
- 딥러닝
- 컴퓨터비전
- Today
- Total
목록전체 글 (1964)
스택큐힙리스트
g++ 4.9.2를 사용하여 컴파일한다면 'bool int_dbl_com(const unsigned long long x, const double y){ return x 63-bit ---(round to nearest even)----> binary64 64-bit -(round-to-nearest-even,the conversion the compiler wants)-> binary64'다른 측면에 대한 답변을 드리면:하지만 코드가 하는 것은 그게 아닙니다. 이 코드는 '%rcx'의 최하위 비트를 저장하고, 그 결과에 이를 다시 논리합합니다. 왜죠? 그리고 이 최하위 비트들은 어차피 소실될 거 아닌가요? (아니면 제가 잘못 이해한 건가요?)이 특정한 상황에서 round-to-odd를 구현하는 정확한 ..
나는 현재 x86-64 어셈블리와 SSE-2 명령어를 사용하여 C99 표준 라이브러리 문자열 함수인 'strlen()' , 'memset()' 등의 고도로 최적화된 버전을 코딩 중입니다. 지금까지는 성능 측면에서 탁월한 결과를 얻었지만, 더 최적화하려고 시도할 때 가끔 이상한 동작을 보입니다. 예를 들어, 몇 가지 간단한 지시문을 추가하거나 제거하거나, 점프에 사용되는 로컬 레이블을 간단히 재구성하는 것만으로도 전체 성능이 크게 저하됩니다. 코드적인 측면에서는 아무런 이유가 없습니다. 내 추측은 코드 정렬에 문제가 있거나 잘못 예측된 분기들 때문에 문제가 있을 것이라고 생각합니다. 나는 같은 아키텍처(x86-64)를 가지더라도 다른 CPU들이 분기 예측에 대해 다른 알고리즘을 가지고 있다는 것을 알고 있..
SSE intrinsics를 사용하여 float 벡터의 요소들의 합을 어떻게 얻을 수 있나요?간단한 시리얼 코드: #@!'void(float *input, float &result, unsigned int NumElems){ result = 0; for(auto i=0; i
인텔의 메뉴얼에서 제시된 대로, 메모리에 명령을 작성할 수 있는 것으로 알고 있는데, 명령 미리 읽기 큐는 이미 오래된 명령을 미리 가져와서 해당 이전 명령을 실행하게 될 것입니다. 그러나 나는 이러한 동작을 관찰하는 데 실패했습니다. 나의 방법론은 다음과 같습니다. 인텔 소프트웨어 개발 매뉴얼 11.6 절에 따르면, 현재 프로세서에서 캐시된 코드 세그먼트에 대한 메모리 위치 쓰기는 연관된 캐시 라인(또는 라인들)을 무효화시킵니다. 이 체크는 명령어의 물리적 주소를 기반으로 합니다. 더불어 P6 패밀리와 펜티엄 프로세서는 코드 세그먼트에 대한 쓰기가 실행을 위해 미리 가져온 명령어를 수정할 수 있는지 여부도 체크합니다. 쓰기가 미리 가져온 명령어에 영향을 미치면 프리페치 큐가 무효화됩니다. 이후의 체크는..