随着深度学习的发展,神经网络被广泛应用于各种领域,模型性能的提高同时也引入了巨大的参数量和计算量,模型量化是一种将浮点计算转成低比特定点计算的技术,可以有效的降低模型计算强度、参数大小和内存消耗,但往往带来巨大的精度损失,尤其是在极低比特,<,4bit,、二值网络,1bit,、甚至将梯度进行量化时,带来的精度挑战更大,本次直播,我...。
更新时间:2024-12-09 17:10:52