site stats
DeepSeek 这个速度是在 Prefill-Decode 分离 + 大规模专家并行的条件下才能实现。 就是说需要大量的机器才可以,单台机器就很难达到这个速度。 H100 单机 NVIDIA 给的输出 tokens 应该是 800多。考虑prefill 我们就算成 1K(很粗糙哈) 而DeepSeek H800 单机 decode 平均
sign_in_with_google sign_in_with_google

2810 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前