贡献者: addis
对于比较底层的 GPU 或者其他硬件编程,你往往需要根据每种设备使用不同的工具,例如 Nvidia GPU 的 CUDA 或者 AMD 的 ROCm。这些工具往往可以最大化地利用硬件的性能。但为了增加代码的可移植性和降低学习难度,许多人会选择用一些更高级的编程接口(API)。这些接口可以对不同的具体设备进行抽象化,并提供统一的 API。也就是说使用者只需要写一次代码就可以在不同的设备或者混合设备上运行。