30.12.2012, 11:25 | #1 (permalink) |
Member
Регистрация: 28.07.2011
Сообщений: 275
Сказал(а) спасибо: 0
Поблагодарили 0 раз(а) в 0 сообщениях
Репутация: 193
|
SSE перемножение матриц
for(int j = 0; j < SIZE ; j++) { for(int i = 0; i < SIZE; i++) { for(int t = 0; t < SIZE; t++) { temp += A[j][t]*B[t][i]; } file_result << temp; file_result << " "; temp = 0; } file_result << endl; } Подскажите пожалуйста, как оптимизировать с помощью SSE . Прочитал про саму концепцию , про функции intrinsics , но в упор не вижу как это оптимизировать. Есть 8 регистров XMM по 128 бит , возможно загрузить 4 данных в 4 части ( по 32 бита) в один из MMX и как то работать. Для матрицы 4*4 всё понятно, загружаем один раз и перемножаем с чем угодно сколько потребуется. А тут как ? Хотя бы на пальцах объясните. |
30.12.2012, 11:25 | |
Helpmaster
Member
Регистрация: 08.03.2016
Сообщений: 0
|
Форум наполнен схожими обсуждениями Samsung N220 Plus, совместимость матриц Взаимозаменяемость матриц Матрица. Как записать матрицу, составленную из трёх единичных матриц? Обработка матриц. Паскаль Обработка матриц |
Ads | |
Member
Регистрация: 31.10.2006
Сообщений: 40200
Записей в дневнике: 0
Сказал(а) спасибо: 0
Поблагодарили 0 раз(а) в 0 сообщениях
Репутация: 55070
|
|
|