文章预览
点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 编辑 | 汽车人 原文链接:https://www.zhihu.com/question/564812763 回答1 作者:张心欣 链接:https://www.zhihu.com/question/564812763/answer/2764785431 事实上不仅仅是cuda 英伟达从cuda里学到的最重要的一课,就是软硬件捆绑。 计算界cuda之所以厉害,不仅仅是因为它可以调用GPU计算, 而是它可以调用GPU硬件加速。 GPU计算 ≠ GPU硬件加速。 这个道理或许很多人不知道。 比如同样一个三线性插值,你在一个gpu数组上手写实现的版本,和当你把它转换为一种纹理内存textureObject后用cuda内置的textureSample函数来做,效率可能差好多倍。 因为后者的三线性插值,你可以理解为是“电路板在做”。 包括tensorCore为什么快,因为人家又把tensor计算做成“电路板计算”了。 那难道你们以为除了科学计算
………………………………