美研究团队发布新AI模型无损压缩方案DFloat11

Magicflu小小汪 3周前 (04-24) 阅读数 3 #科技

美研究团队发布新AI模型无损压缩方案DFloat11,让大模型压缩率高达70%,还能100%保持原性能。相比原模型,推理速度提升1.9倍以上,解压效率更是超nvCOMP 15倍。DFloat11兼容GPU推理,内存占用大降,还能让上下文长度提升5-13倍,支持超大规模模型无损部署。该方法适配多款主流模型,且源码已开源,有望解决GPU资源紧张难题。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Magicflu小小汪

Magicflu小小汪

强大的无代码零代码数字中台魔方网表的学习资料汇总