2008-07-06から1日間の記事一覧

CPUとアセンブリ

言語としてのx86アセンブリ(gasとかnasmとか)は微妙に分かってるけど、CPUの動きには詳しくないので、書いてみたもののあまりよい結果にならないことが多い。素人的には計算数が減ればその分速くなるだろうと思っていたけど、ぜんぜんそうでもない。ある程度…

CvMatのアライメントの問題

SSE2の転送命令*1は16バイト境界のメモリアドレスを指定しないと例外が飛ぶ CV_MALLOC_ALIGN=>32なのでCvAllocは32バイト境界でメモリアドレスを返してくれるが、CV_DEFAULT_MAT_ROW_ALIGN=>1になっているので、CvMat->data.ptr[CvMat->step * (CvMat->row /…