去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,关于 Medusa 终于有了完整技术论文,还提供了新的版本。
热门文章
查看更多
速递|Anthropic 终于推出企业版以及 iOS 应用!全面对标 OpenAI
2024-05-03
AI机器人“入侵”微博评论区
2024-05-03
黄仁勋:AI 是科技行业对社会提升的最大贡献
2024-05-04
邮件曝光,微软为追谷歌脚步才投资了OpenAI,纳德拉回应:才不是
2024-05-03