博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
cblas_sgemm cblas.h
阅读量:5043 次
发布时间:2019-06-12

本文共 821 字,大约阅读时间需要 2 分钟。

BLAS(Basic Linear Algebra Subprograms)库,是用Fortran语言实现的向量和矩阵运算库,是许多数值计算软件库的核心, 但也有一些其它的包装, 如cblas是C语言, 也有C++的包装, boost/ublas 是C++ template class的实现; 另外还有一些特别的实现, 如intel MKL, AMD core math library blas就是做向量、矩阵的基本运算,如加、减、乘等操作。

https://blog.csdn.net/zuoyigexingfude/article/details/50488255

 

函数的定义:cblas_sgemm(order, transA, transB, M, N, K, ALPHA, A, LDA, B, LDB, BETA, C, LDC);

第一个参数的函数是存储的有限性,有行优先和列优先(c语言是行优先)

caffe中使用的也是行优先
第二个参数和第三个参数是是否转置
A矩阵经过transA之后的维度是M×K
B矩阵经过transB之后的维度是K×N
C矩阵的维度是M×N
LDA和LDB是对应矩阵还没变换之前,在主维度方向的维度。(如果是行优先就是列数)。

LDA:A的列

LDB:B的列

LDC:C的列

其他部分:C = alpha*op( A )*op( B ) + beta*C

https://blog.csdn.net/zhuiqiuk/article/details/72916558

https://blog.csdn.net/jacke121/article/details/60143119

https://blog.csdn.net/u012235274/article/details/52769682

 

转载于:https://www.cnblogs.com/ymjyqsx/p/9401684.html

你可能感兴趣的文章
夺命雷公狗---node.js---10之POST的接收
查看>>
自定义的JavaScript定时器
查看>>
smarty对数组进行json_encode
查看>>
Django model 字段类型及选项解析(二)
查看>>
《Linux命令行与shell脚本编程大全》第十四章 处理用户输入
查看>>
189. Rotate Array 从右边开始翻转数组
查看>>
用wget命令下载jdk
查看>>
python之路 Javascript的学习
查看>>
无法远程连接MySQL数据库服务器-(1130错误)
查看>>
激活函数可视化
查看>>
雅虎的这个效果,有机会实现一下
查看>>
第五周学习进度情况
查看>>
【旧文章搬运】Windbg+Vmware驱动调试入门(四)---VirtualKD内核调试加速工具
查看>>
Linux GDB Debugging
查看>>
代码智能提示
查看>>
Bootstrap 模态对话框只加载一次 remote 数据的解决办法
查看>>
SpringBoot源码解析:AOP思想以及相应的应用
查看>>
神的回帖
查看>>
3149 爱改名的小融 2
查看>>
20189208杨晨曦《移动平台开发实践》第9周学习总结
查看>>