中国科学院团队首篇LLM模型压缩综述:细聊剪枝、知识蒸馏、量化技术
随着LLM的突破性工作逐渐放缓,对于如何让更多人使用LLM成为时下热门的
2023-08-27声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:Synced,授权站长之家转载发布
随着 LLM 的突破性工作逐渐放缓,对于如何让更多人使用 LLM 成为时下热门的研究方向,模型压缩可能是 LLM 未来的一个出路。此前 OpenAI 首席科学家 Ilya Sutskever 表示可以通过压缩的视角来看待无监督学习。本文首次总结了关于 LLM 的四种模型压缩方法,并提出了未来进一步研究的可能方向,引人深思。
近来,大型语言模型(LLM)在各种任务中表现出色。然而,即便有卓越的任务处理能力,LLM 却面临着巨大的挑战,这些挑战源于其巨大的规模和计算需求。举个例子,GPT-175B 版本具有惊人的1750亿参数,至少需要320GB(使用1024的倍数)的半精度(FP16)格式存储。此外,部署此模型进行推理还需要至少五个 A100GPU,每个 GPU 具有80GB 的内存,这样才能有效地保证运行。
【资料图】
为了解决这些问题,当下一种被称为模型压缩的方法可以成为解决方案。模型压缩可以将大型、资源密集型模型转换为适合存储在受限移动设备上的紧凑版本。此外它可以优化模型,以最小的延迟更快地执行,或实现这些目标之间的平衡。
除了技术方面之外,LLM 还引发了关于环境和伦理问题的讨论。这些模型给发展中国家的工程师和研究人员带来了重大挑战,在这些国家,有限资源可能会成为获得模型所需基本硬件的阻力。LLM 的大量能源消耗会加剧碳排放,人工智能研究与可持续发展也是非常重要的一个问题。解决这些挑战的一个可能的解决方案是利用模型压缩技术,在不显著影响性能的情况下具有减少碳排放的潜力。通过它,人类可以解决环境问题,增强人工智能的可访问性,并促进 LLM 部署中的包容性。
本文中,来自中国科学院信息工程研究所、人大高瓴人工智能学院的研究者阐述了最近在专门为 LLM 量身定制的模型压缩技术领域取得的进展。本文对方法、指标和基准进行详尽的调查,并进行了分类。
论文地址:https://arxiv.org/pdf/2308.07633.pdf
如下图1所示,本文提出的分类法为理解 LLM 的模型压缩方法提供了一个完整的结构化框架。这一探索包括对已有成熟技术的透彻剖析,包括但不限于剪枝、知识蒸馏、量化和低秩因子分解。此外,本文揭示了当前的挑战,并展望了这一发展领域未来潜在的研究轨迹。
研究者还倡导社区合作,为 LLM 建立一个具有生态意识、包罗万象、可持续的未来铺平道路。值得注意的是,本文是专门针对 LLM 的模型压缩领域的首篇综述。
方法论
剪枝
剪枝是一种强大的技术,通过删除不必要的或冗余组件来减少模型的大小或复杂性。众所周知,有许多冗余参数对模型性能几乎没有影响,因此在直接剪掉这些冗余参数后,模型性能不会收到太多影响。同时,剪枝可以在模型存储、内存效率和计算效率等方面更加友好。
剪枝可以分为非结构化剪枝和结构化剪枝,二者的主要区别在于剪枝目标和由此产生的网络结构。结构化剪枝剪掉基于特定规则的连接或分层结构,同时保留整体网络结构。非结构化剪枝针对单个参数,会导致不规则的稀疏结构。最近的研究工作致力于将 LLM 与剪枝技术相结合,旨在解决与 LLM 相关的大规模和计算成本。
知识蒸馏
知识蒸馏(KD)是一种实用的机器学习技术,旨在提高模型性能和泛化能力。该技术将知识从被称为教师模型的复杂模型转移到被称为学生模型的更简单模型。KD 背后的核心思想是从教师模型的全面知识中转化出更精简、更有效的代表。本文概述了使用 LLM 作为教师模型的蒸馏方法。
研究者根据这些方法是否侧重于将 LLM 的涌现能力(EA)蒸馏到小模型(SLM)进行分类。因此,这些方法被分为两类:标准 KD 和基于 EA 的 KD。对于视觉表示任务,吓图2提供了 LLM 知识蒸馏的简要分类。
下图3为基于 EA 的蒸馏概览。
量化
在模型压缩领域,量化已成为一种被广泛接受的技术,以缓解深度学习模型的存储和计算开销。虽然传统上使用浮点数表示权重,但量化将它们转换为整数或其他离散形式。这种转换大大降低了存储需求和计算复杂性。虽然会出现一些固有的精度损失,但精巧的量化技术可以在精度下降最小的情况下实现实质性模型压缩。
量化可以分为三种主要方法:量化感知训练(QAT)、量化感知微调(QAF)以及训练后量化(PTQ)。这些方法的主要区别在于何时应用量化来压缩模型。QAT 在模型的训练过程中采用量化,QAF 在预训练模型的微调阶段应用量化,PTQ 在模型完成训练后对其进行量化。
最近的研究致力于利用量化来压缩 LLM,产生了惊人的结果。这些工作主要可以分为上述三种方法:量化感知训练、量化感知微调和训练后量化。此外,下表1是应用于 LLM 的量化方法的汇总。该表根据 LLM 权重中的位数(精度)将这些工作分为8位量化和低位量化。
低秩分解
低秩分解是一种模型压缩技术,旨在通过将给定的权重矩阵分解为两个或更多具有明显较低维度的较小矩阵来近似给定的矩阵。低秩分解背后的核心思想是将大权重矩阵 W 分解为两个矩阵 U 和 V,使得 W ≈ UV,其中 U 是 m×k 矩阵,V 是 k×n 矩阵,k 比 m 和 n 小得多。U 和 V 的乘积近似于原始权重矩阵,参数数量和计算开销大幅减少。
在 LLM 研究领域,低秩分解被广泛采用,以有效地微调 LLM,例如 LORA 及其变体。本文专注于这些使用低秩分解来压缩 LLM 的工作。在 LLM 的模型压缩领域,研究者经常将多种技术与低秩分解相结合,包括剪枝、量化等,例如 LoRAPrune 和 ZeroQuantFP,在保持性能的同时实现更有效的压缩。
随着该领域研究的继续,在应用低秩分解来压缩 LLM 方面可能会有进一步发展,但仍然需要进行探索和实验,以充分利用 LLM 的潜力。
度量和基准
度量
LLM 的推理效率可以使用各种指标来衡量。这些指标考虑了性能的不同方面,通常与全面评估 LLM 的准确性和零样本学习能力一起呈现。
这些指标包括如下:
参数规模
模型规模
压缩比
推理时间
浮点运算(FLOP)
基准
基准旨在与未压缩的 LLM 相比,衡量压缩 LLM 的有效性、效率和准确性。这些基准通常由不同的任务和数据集组成,涵盖了一系列自然语言处理挑战。常用基准包括但不限于 HULK 和 ELUE。
最后研究者认为未来应在以下几个方面进一步探索,包括
专业的基准测试
性能规模的权衡
动态 LLM 压缩
可解释性
标签:
随着LLM的突破性工作逐渐放缓,对于如何让更多人使用LLM成为时下热门的
2023-08-27六连败!深圳队最后时刻遭山东泰山逆转,鲁能,深圳队,山东泰山,沧州雄狮
2023-08-27上周,肉鸽游戏公司的新作《吸血鬼幸存者》在Switch平台上线。仅仅几天
2023-08-27舜网国内频道发布国内最新鲜的新闻,国内热点事件和民生事件。
2023-08-27今年海淀区有8万余名大学生和2万余名高中生接受军训,目前,海淀区人武
2023-08-27分享手机里的美景 广州摄影 广州头条 平凡摄影 小红书视频号 广州亲
2023-08-278月25日,臻镭科技(688270)融资买入324 85万元,融资偿还372 23万元
2023-08-27青岛新闻网8月25日讯(记者任俊峰通讯员刘晓燕)8月24日,由青岛市文明
2023-08-271、E25110109动漫特辑 嘉宾:朴宝英 胜利:刘在石、池石镇、金钟
2023-08-27据船长了解,这是由王鑫执导,李宁、王婉中等实力演员担主演的怪兽题材
2023-08-27生肖兔的人温柔且沉稳,极其富有同情心,横财如雨,特别有进取心,很容
2023-08-27阅读提示今年7月,住建部等多部门印发通知,在全国106个社区开展完整社
2023-08-278月26日14时左右,宁夏银川金凤区宝湖中路与正源南街交叉口一施工场地
2023-08-27宣布自营快递业务两个月,菜鸟集团旗下菜鸟速递正忙着“招兵买马”。
2023-08-278月24日,隆回县虎形山瑶族乡,花瑶同胞在“讨僚皈”民俗风情节上高唱
2023-08-27新华社北京8月26日电(记者陈旭任超庞元元)废旧锂电经济化再利用、新型
2023-08-27逃跑者可能会被族人告发,因为在执行株连九族的时候,皇帝有时可能会仁
2023-08-27纽约8月24日消息:周四芝加哥商品交易所(COMEX)的铜期货下跌约1%,这也
2023-08-270471房产来为大家解答以上的问题。花呗怎么使用消费,花呗怎么使用这个
2023-08-27国家体育总局冬季运动管理中心党委书记、主任倪会忠涉嫌严重违纪违法,
2023-08-277月底8月初的持续强降雨引发汛情,京津冀和东北地区受灾。现在,灾后重
2023-08-27格隆汇8月25日丨新金路(000510 SZ)公布2023年半年度报告,报告期营业收
2023-08-27隆达股份公布2023年半年度报告,报告期实现营业收入5 92亿元,同比增长
2023-08-27每经AI快讯,海宁皮城(SZ002344,收盘价:4 79元)8月24日晚间发布半
2023-08-27Win11是目前最新的操作系统,在这系统中有很多模式和功能许多用户都不
2023-08-27证券时报e公司讯,据运达股份消息,近日,个别自媒体账号和网络平台未
2023-08-27新湖南客户端8月26日讯(通讯员张静)8月24日,湘西土家族苗族自治州卫
2023-08-27广东作为中国经济发展最为迅猛的地区之一,对人工智能专业的需求也日益
2023-08-27巴克莱将其对土耳其2023年底政策利率的预测调整为35%
2023-08-271、属虎的人逢鼠年:其年不利,本年犯天狗,灾祸时生,多逆少顺,其年
2023-08-278月25日,泓德优选成长混合最新单位净值为1 2389元,累计净值为1 7919
2023-08-27由新加坡导演陈哲艺执导,周冬雨、刘昊然、屈楚萧主演的电影《燃冬》于
2023-08-27央广网保定8月26日消息(见习记者王艺霖)8月25日,保定市举行“文明交
2023-08-272023年8月26日,国泰金福三个月定期开放混合(010446)发布公告,增聘
2023-08-271、皮革化学与工程 制浆造纸工程 应用化学 机械设计及理论
2023-08-27新生讲述与武大“百年之缘”:“一百年前,我的太爷爷在此求学”---湖
2023-08-27每经AI快讯,有投资者在投资者互动平台提问:董秘你好,截止6月25日,
2023-08-27证券时报e公司讯,丸美股份(603983)8月25日晚间发布半年报,公司营业收
2023-08-27今年,甘肃全省降水总体偏少、气温偏高,河西走廊和陇中多地降水较往年
2023-08-27潮新闻客户端拍友胡肖飞摄8月26日,兰溪市体育总会组织主办“迎亚运畅
2023-08-27从2016年G20杭州峰会开始,身着青绿、洋溢青春,代表西子湖畔城市形象
2023-08-27国家粮食和物资储备局日前专门印发通知,部署全系统防汛救灾和灾后恢复
2023-08-27大河网讯8月24日,2023年度新县见义勇为先进个人表彰奖励大会在新县公
2023-08-27青海日报融媒体8月23日讯(实习记者杨红霞)8月23日,西宁市大通回族土
2023-08-278月22日,在甲子光年主办的甲子引力X2023科技产业投资大会上,未来智能
2023-08-271、阳历十一月中旬,这个时节最好,漫山红叶。相信通过红叶谷什么时候
2023-08-27市场监管总局、教育部、公安部、国家卫生健康委近日印发通知,部署强化
2023-08-27仙坛股份(SZ002746,收盘价:8 39元)8月25日晚间发布半年度业绩报告
2023-08-27你在狮子座的心里有一定的地位,所以狮子座愿意为你花费更多的时间,因
2023-08-27,你们好,今天0471房产来聊聊一篇泽市定陶区半堤镇胡海村志愿服务队,
2023-08-27香江控股上半年净利润1 11亿元同比增248 59%,总资产,香江控股,公司股东
2023-08-27智通财经APP获悉,据港交所8月22日披露,马泷医疗管理股份有限公司(以
2023-08-26日料门店数量TOP50城市,年底数量会少吗?,日料,top50
2023-08-26最近经常有小伙伴私信询问航天专业硕士点有哪些专业北京航空航天大学航
2023-08-26世贸组织近日公布美诉中方针对美钢铝232关税措施的反制措施世贸争端案
2023-08-26,你们好,今天0471房产来聊聊一篇波远东化工集团有限公司,波远东化工
2023-08-26月初,中国财政部、国家税务总局公布10项支持小微企业和个体工商户的税
2023-08-262023中国桨板精英赛石嘴山站26日在星海湖龙腾广场开赛。中国桨板精英赛
2023-08-26iPhone15Pro和iPhone15ProMax可能会超越标准机型,因为它们将获得专用
2023-08-261、你好,6-15分钟为轻度早泄,2-6分钟为中度早泄。2、不足2分钟为重度
2023-08-2608月25日,智光电气被深股通减持万股,最新持股量为万股,占公司A股总
2023-08-26你们好,最近0471房产发现有诸多的对于端午节的由来,端午节的习俗这个
2023-08-26,你们好,今天0471房产来聊聊一篇治史葛,治史葛简述的文章,网友们对
2023-08-261、去泰达希尔下面的鲁瑟兰村然后一个码头就是去暴风城的船(船的风格
2023-08-26一文了解上海:2023届高校毕业生、离校2年内未就业高校毕业生、在上海
2023-08-26房地产服务板块涨2 78%珠江股份涨10 05%居首---中国经济网北京8月25日
2023-08-26俞敏洪想做线上山姆,东方甄选带货卖了100亿元,淘宝40万粉丝蹲守等首
2023-08-26念念手帐怎么保存笔记操作方法介绍,
2023-08-268月24日,日本启动福岛第一核电站核污水排海,核污水经由1公里的海底隧
2023-08-26近日,以“‘葡’惠三农‘萄’满天下”为主题的惠美乡村扶农助农葡萄推
2023-08-26格隆汇8月25日丨兴胜创建(00896 HK)公告,8月25日耗资12 7万港元回购11
2023-08-26飞利富拟向控股子公司祺纪公司增资1200万持股80%2023 8 2419:45:21挖贝
2023-08-26上海杨浦警方侦破一起以“刷脸支付”为名实施传销犯罪案(副题)“我们
2023-08-26金融界8月24日消息,交通运输部等部门发布关于加快推进多式联运“一单
2023-08-26现在这个时代,虽说互联网行业没有之前那么火爆了,但是它仍然是一个充
2023-08-26什么是分销模式?可能很多朋友都不是很了解吧。分销模式就是一种销售模
2023-08-26长久以来传统的正面插线主板因为繁多的接线让机箱内走线杂乱,不仅影响
2023-08-26今天(8月24日),我国西南地区仍有较强降雨,华北、华南降雨有所减弱
2023-08-26停水公告尊敬的用水户:因义南水厂管道取水工程施工需要,计划于2023年
2023-08-26DoNews8月24日消息,24日晚间,亿纬锂能(300014)披露2023年半年报,公
2023-08-26中国青年报客户端北京8月23日电(中青报·中青网记者李若一)今天,在
2023-08-261、1、共11天2、一、元旦,一天3、二、春节,三天(农历正月初一、初二
2023-08-26学习是最美的姿态,培训是最大的遇见,成长是最美的风景。新的开始,新
2023-08-2636氪获悉,山西汾酒公告称,公司上半年营收为190 11亿元,同比增长23 9
2023-08-26来为大家解答以上问题,电话灯箱图片,电话灯很多人还不知道,现在让我
2023-08-26与2022年同期相比,本集团期内的收益增加43 8%至人民币185 01亿元;亏
2023-08-26案件正在进一步侦办中。
2023-08-26第三届长三角体育节暨“杭垓杯”飞镖比赛,近日在浙江省湖州市安吉县和
2023-08-26券商板块再度走高,国盛金控等大涨10%,保险,湘财,养老金,国盛金控,社保
2023-08-2603:52这段时间,在浙江各地的图书馆、居民小区、广场等地,都响起同一
2023-08-262023年伦敦国际中国音乐节首场音乐会举行2023年伦敦国际中国音乐节首场
2023-08-26你是不是偶尔会听到这样的言论:孩子长时间光脚在地上玩会出现扁平足那
2023-08-26“2020年8月,阎良区成立新的社会阶层人士联谊会,按照‘1+8+N’的工作
2023-08-26下载一个“刷脸支付”软件,就能返利,充值成为会员,还能躺着赚钱,这
2023-08-26《影子诡局:被诅咒的海盗》是一款潜行策略游戏,加入一艘拥有鲜活灵魂
2023-08-26凯莱·澜风雅筑二手房还会升值吗?澄迈二手房好不好~凯莱·澜风雅筑度
2023-08-26每经AI快讯,华康医疗(SZ301235,收盘价:22 85元)8月22日晚间发布公
2023-08-268月23日晚,恩捷股份(002812)披露2023年中报,上半年公司实现营收55
2023-08-26*华尔街摆脱加息隐忧美股全线收涨*美国8月密歇根大学消费者信心指数逊
2023-08-261、试题答案:小题1:当下雨时,雨水冲开了土壤,晴天时埋在土中的放线
2023-08-26Copyright © 2015-2022 亚洲水产网版权所有 备案号:京ICP备2021034106号-51 联系邮箱:5 516 538 @qq.com