标签

推理加速

  • DeepSeek 联合北大放出 DSpark:单用户生成速度最高提 85%,一份能从零跑起来的实操指南

    6 月 27 日,DeepSeek 在 GitHub 低调推了一篇新论文,署名里有创始人梁文锋和北京大学团队。论文介绍的是一套推测解码(Speculative Decoding)框架,名字叫 DSpa…

暗夜独行