首页 >> 每日动态 >

新的LLM极限压缩方法将AI部署成本降低8倍

2024-07-23 20:15:12 来源: 用户:颜先琳 

据悉,Yandex Research、IST Austria(奥地利科学技术研究所)、Neural Magic和KAUST开发并开源了两种大型语言模型(LLM)压缩方法,AQLM和PV-Tuning。这些方法可以将模型大小减少多达8倍,并同时保留95%的响应质量。通过使用这些新方法,设备成本最多可降低8倍,从而显著降低了AI部署的门槛。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章