SSE intrinsics를 사용하여 float 벡터의 요소들의 합을 어떻게 얻을 수 있나요?간단한 시리얼 코드: #@!'void(float *input, float &result, unsigned int NumElems){ result = 0; for(auto i=0; i