深度学习注意力机制并行计算
传统Attention由于在计算时涉及多次访存操作造成计算效率下降,并且由于Softmax的计算机制破坏了并行计算的流畅性,导致几所过程阻塞,本文将探究Flash-Attention怎么优化这些问题的👍

深度学习注意力机制并行计算
传统Attention由于在计算时涉及多次访存操作造成计算效率下降,并且由于Softmax的计算机制破坏了并行计算的流畅性,导致几所过程阻塞,本文将探究Flash-Attention怎么优化这些问题的👍
Rust动态分发类型擦除虚表内存安全错误处理
本文探讨了利用类型擦除技术实现Rust中高性能的任意错误类型处理,通过统一封装异构错误类型消除差异,并支持零成本错误传播与安全向下转型,兼顾开发效率与运行性能。
Cpp汇编多态虚表继承
带你一起探索Cpp虚表的魔力