大模型界「摩尔定律」Densing Law 来了！盲目Scaling将过时！-喜好网-记录每日喜好的科技时尚娱乐生活

当前位置：首页 > 科技

文章来源：51CTO技术栈

图片来源：由无界AI生成

图片来源：由无界AI生成

Scaling Law会失效吗？

虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。但是，OpenAI的最近的发布也没有那么炸了，尤其是 o1 Pro 比满血版在编程能力上仅高出一分，似乎更让人相信了“墙”的存在。

是时候跳出Scaling Law了！

清华NLP实验室刘知远教授团队，提出的Densing Law（密度定律），给了我们一个全新的视角！

不同于Scaling Law，认为随着模型规模（如参数数量）、训练数据集大小等参数的增长，模型性能会按照一定的幂律进行可预测的提高。

大模型的密度定律的表达，与摩尔定律相似，重点讨论了能力如何随着时间而增强。

简而言之：大模型能力密度约100天翻一倍！

什么是能力密度呢？

研究团队将其定义为模型的“有效参数量”与实际参数量的比值，是一种衡量 LLM（Large Language Model）训练质量的新指标。

举个论文中的例子：2024年2月1日发布的MiniCPM-1-2.4B，其性能可以与2023年9月27日发布的Mistral-7B相媲美甚至更优。换句话说，4个月后，只需要使用参数量为35%的LLM，即可获得大致相当的性能。

论文的第一作者说，用该定律推算，到明年年底，一个8B的小模型就可以实现GPT-4那么强悍的效果了。

此外，研究团队发现，AI时代的三大核心引擎同样遵守密度定律，电力、算力与智力（AI），都有各自的倍增周期。其中，电池能量密度倍增时间为10年，芯片电路密度的倍增时间则为18个月。

在论文的主要发现部分，研究团队还发现了5个重要的推论，让我们展开讲讲：

模型的推理开销随时间呈指数级下降

根据密度定律（Densing Law），每三个月后，我们就可以用参数减半的模型，达到与以前相当的性能效果。

因此，在实现相同任务性能的情况下，推理成本正以指数速度下降。

团队发现，从2023年1月到现在，GPT-3.5级别模型的推理成本已降低了266.7倍。

大模型能力密度呈加速增强趋势

团队比较了 ChatGPT 发布前后 LLM 密度的增长趋势，发现在这一节点后，LLM 密度的增长速度提高了 50%！

这个结论不意外——可以说这波AI热就是从ChatGPT发布掀起的。

无论我们怎么吐槽OpenAI的封闭生态，其对AI发展的巨大推动是不可磨灭的。

模型小型化揭示端侧智能巨大潜力

摩尔定律（Moore, 1965）指出，相同面积的芯片上集成的电路数量呈指数增长，这意味着计算能力也在指数增长。

而此次提出的密度定律（Densing Law）表明，LLM 的密度每 3.3 个月翻一番。

结合这两个因素，团队提出：在价格相同的芯片上可运行的 LLM 有效参数规模的增长速度，超过了 LLM 密度和芯片计算能力的增长速度。

这种双重增长的模式，就好像在电梯上跑步，让AI在不远的未来能在手机等端侧上丝滑运行。

无法通过模型压缩增强模型能力密度

剪枝和蒸馏没我们想象得那么有用！

在团队的研究中，通过比较模型与其压缩版本，发现广泛使用的剪枝和蒸馏方法通常会使压缩后的模型密度低于原始模型。

研究认为，应该继续寻找更高效的模型压缩算法，尤其应更加注重提升小模型的密度。

密度倍增周期决定模型存在“有效期”

一个残酷的事实，大模型也有有效期。

每过数月，就会有更加“实惠”的新模型出现，这就意味着模型必须要在有限期之内，获得足够的盈利才能收支平衡。

研究团队以API盈利方式估算，需要2个月内达成17亿用户访问！

看了这个数字，我们更理解大模型为何如此烧钱。

密度定律也提醒了AI圈，不要一味地追求Scaling。

更重要的是如何在模型性能与效率间取得平衡。

“盲目增加模型参数以追求性能提升可能会导致模型密度降低，从而引发不必要的能源消耗。例如，尽管 Llama-3.1-405B（Dubey 等，2024）在开源模型中实现了最先进的性能，但其所需的计算资源是其他模型的数百倍。”

因此，未来的议题应该从单纯的性能优化转向密度优化。大模型走出“应试”，不再执着于榜单上的数字，才能真正走入应用的旷野之中。

参考链接：
1.https://arxiv.org/abs/2412.04315
2.插图来源于研究课题组

大模型

本文链接：http://www.xihao.site/showinfo-1-62996.html大模型界「摩尔定律」Densing Law 来了！盲目Scaling将过时！

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com。天上从来不会掉馅饼，请大家时刻谨防诈骗

猜你喜欢

今年双11大变样，淘宝京东不卷了！

今年双11大变样，淘宝京东不卷了！

在被电商平台造出的第16个年头，双11的战线被进一步拉长。10月14日晚上8点，淘宝、天猫、京东等电商平台纷纷启动今年的双11活动，比去年提前了10天左右，比第一届双11前早了一个月

五环外接不住马拉松“泼天富贵”

五环外接不住马拉松“泼天富贵”

11月10日，这个寻常的周末，全国有十余场大大小小的马拉松比赛，而在更热闹的上个周末，2天时间，全国举办了30余场马拉松，其中便包括人称“国马”的2024北京马拉松。今年北京马拉松，可

年轻人的失眠症，正在被包装成“熬夜经济”

年轻人的失眠症，正在被包装成“熬夜经济”

最近一段时间，各大奶茶店纷纷开启24小时营业制，主流茶饮品牌包括喜茶、霸王茶姬、古茗、茶百道、蜜雪冰城、沪上阿姨都在其列。夜间消费在前两年各类夜市、地摊盛行的时候爆发

疑遭猎杀泰海域发现无头“美人鱼”：只因毫无科学依据的传说

疑遭猎杀泰海域发现无头“美人鱼”：只因毫无科学依据的传说

11月19日消息，据泰国媒体报道，本月17日，泰国普吉岛海域发现一具儒艮的腐尸，这种动物也是“美人鱼”原型。报道称，这具成年雄性儒艮于14日在一处码头附近被

超204万人预约华为Mate 70：纯血鸿蒙+麒麟芯自研完全体来了

超204万人预约华为Mate 70：纯血鸿蒙+麒麟芯自研完全体来了

11月19日消息，华为Mate品牌盛典将于11月26日14:30举行，届时，年度压轴旗舰——华为Mate 70系列将正式发布。目前，仅华为官网就有超204万人预约华

收到500万份垄断诉讼，谷歌要被拆分？

收到500万份垄断诉讼，谷歌要被拆分？

谷歌涉嫌垄断的诉讼案件，终于靴子落地了。8月，美国华盛顿的哥伦比亚特区联邦地区法院下达286页的谷歌垄断案判决书，裁定谷歌非法垄断在线搜索市场，违

LP周报丨珠海给去看展的投资人，送上了100亿大礼包

LP周报丨珠海给去看展的投资人，送上了100亿大礼包

最近创投圈最热闹的事，莫过于珠海航展了。自1996年，第一届中国国际航空航天博览会在珠海举办后，珠海航展已经走过了28年的历史。目前，这场展会已经成

灵初智能完成天使轮融资

灵初智能完成天使轮融资

近日，灵初智能完成天使轮融资，本轮融资由高瓴创投（GL Ventures）和蓝驰创投（Lanchi Ventures）领投。本轮融资完成后，灵初智能将继续推进基于强化学习算法

投中的播客栏目，叫“大北窑14F”

投中的播客栏目，叫“大北窑14F”

投中吐槽大会准备改名了。这是我和董师傅从8月就开始讨论的事情。这个时间点，距离《投中吐槽大会》这个播客栏目开始策划——也就是2023年2月，我准

哪个正常人能拒绝一只毛茸茸的「电子猫咪」？

哪个正常人能拒绝一只毛茸茸的「电子猫咪」？

猫咪应该想不到，有一天自己可能会被电子毛球抢走「工作」。通常，机器人是冷冰冰的存在，哪怕外形可爱，一层金属外壳多少让人望而却步。但如果不再是冰

“嫖娼门”王全安：前任个个赛西施，花800元睡站台女，终遭报应

“嫖娼门”王全安：前任个个赛西施，花800元睡站台女，终遭报应

文|卡夫卡的熊编辑|黄毅来了蒋雯丽，清纯可人；余男，性感火辣；孔琳，妩媚妖娆；张雨绮，炫酷拽姐。四位娱乐圈“颜值代

味道研究所 | 橘黄变棕红这口Q糯甜香深深烙印在你心间（味道研究所橘黄变棕红）

味道研究所 | 橘黄变棕红这口Q糯甜香深深烙印在你心间（味道研究所橘黄变棕红）

© |菜头遂昌乡村有着独特的风味，对食材的选择也格外讲究。地处山间的遂昌，拥有的美食实在难以一一列举，这里的番薯干则是遂昌零食界的“黄金条”，琥珀晶莹，香甜软糯

人民日报评代拍乱象, 代拍为何惹众怒？

人民日报评代拍乱象, 代拍为何惹众怒？

近期除了家暴一词被大家热议，代拍也是其中的一个热词之一。近日人民日报也评代拍的乱象，可能很多网友看到代拍一词，大家都以为是在网络上面的兼职，像帮淘宝卖家作假销量评

贾乃亮帮清购物车, 网友没胆安利给自家老板!

贾乃亮帮清购物车, 网友没胆安利给自家老板!

今天双十二，大家剁手了吗！小编是没有的，不过贾乃亮团队的福利真的是太好了吧，凌晨贾乃亮空降员工群，让员工在30秒内，将自己的购物车截图，自己给他们清空。贾乃亮的团队，还将贾

戈壁和江百丽结局，男方不爱女方，女生到最后一无所有

戈壁和江百丽结局，男方不爱女方，女生到最后一无所有

《暗恋橘生淮南》中江百丽和戈壁、陈墨涵都曾是一个高中的学生，江百丽是普通女孩，和陈墨涵关系还算不错的，陈墨涵表面上把江百丽当朋友，实际是把她当保姆，而江百丽是真心把

要回归了？李奈映透露丈夫元斌正在选剧本有望复出拍戏

要回归了？李奈映透露丈夫元斌正在选剧本有望复出拍戏

47岁韩国男星元斌，凭着帅气外表及逆龄脸蛋，掳获许多粉丝关注，因演出经典韩剧《蓝色生死恋》暴红后，瞬间成为大势演员，在韩国和亚洲其他国家红变半边天。但

中国电影出海专业书刊《走向世界：华语电影的跨国流通与市场策略》正式发布

中国电影出海专业书刊《走向世界：华语电影的跨国流通与市场策略》正式发布

　　在首届广州电影产业博览交易会上,中国电影出海专业书刊《走向世界:华语电影的跨国流通与市场策略》正式发布,该书由中国世界电影学会编著,广州市非虚构影像创新发展中

虞书欣林一新剧演情侣，《嘘，国王在冬眠》改编自哪部小说？

虞书欣林一新剧演情侣，《嘘，国王在冬眠》改编自哪部小说？

12月22日是冬至，在这天，虞书欣和林一合作的新剧官宣了，在新剧中他们演情侣，剧名叫《嘘，国王在冬眠》，那这部剧是原创还是改编自哪部小说呢？一起来了解一下吧。嘘国王在冬眠官

我们都在等待，等待钟声响起的那一刻。那是我生命最后的一刻，那也是最好的时刻

我们都在等待，等待钟声响起的那一刻。那是我生命最后的一刻，那也是最好的时刻

　　一段民族不可遗忘的历史，一个隐蔽在硝烟之下无声的计划，一群甘愿为此付出生命的战士和无数个等待钟声响起迎来光明的日夜。等待，等待钟声响起的那一刻，那是所有伪装都可被

《最后生还者》新季明年春首播

《最后生还者》新季明年春首播

HBO及HBO Max首席执行官在洛杉矶举办的节目阵容展示活动中透露，备受期待的《最后生还者》第二季将于2025年春播出，《和平使者》第二季定于2025年8月首播

木内ラムネ作品《月のお気に召すまま》在别册玛格丽特完結

木内ラムネ作品《月のお気に召すまま》在别册玛格丽特完結

木内ラムネ的人气作品《月のお気に召すまま》在11月13日发售的别册玛格丽特12月号上迎来完結。这部自2018年开始连载的短篇爱情喜剧，讲述了有点

《彩虹六号：围攻》“COLLISION POINT行动”12月3日推出

《彩虹六号：围攻》“COLLISION POINT行动”12月3日推出

中国，上海– 2024年11月18日 – 今天，育碧揭晓了《彩虹六号：围攻》第9年最后一个赛季“COLLISION POINT行动”。本赛季将在诸多重大更新内容的推出中步入高潮，包括玩家保护及

PS5 Pro在美国的首发销量与PS4 Pro相近

PS5 Pro在美国的首发销量与PS4 Pro相近

PS5 Pro 于本月早些时候发行，虽然这款主机在发行前几周因其价格（以及它是否有存在的必要）引发了广泛的反响，但这似乎并没有影响其最初的销量。 Circana 分析师马特·皮斯卡

互动影游《新世界：暗影成双》Steam页面开放发行日期待定

互动影游《新世界：暗影成双》Steam页面开放发行日期待定

今日（11月16日），双人合作类互动影游《新世界：暗影成双》Steam页面开放，发行日期待定，感兴趣的玩家可以点击此处进入商店页面。游戏介绍：这是一款双人合作类的互动影游。19

《星空》DLC差评托德后悔：不该太早更新地面载具

《星空》DLC差评托德后悔：不该太早更新地面载具

《星空：破碎空间》DLC 发布后，玩家给出了大量差评。游戏在 Steam 上，DLC 的好评率仅为 30.68%（多半差评）；游戏本体的好评率也仅为 56.76%（褒贬不一）。据 Xbox 老板菲尔·斯宾塞透露

咸鱼之王兑换码2024,咸鱼之王礼包码100连抽兑换码最新分享

咸鱼之王兑换码2024,咸鱼之王礼包码100连抽兑换码最新分享

咸鱼之王是一款非常魔性的放置挂机手游，在抖音和微信上非常火爆，想要开局拥有更强的战斗力和更多强大的英雄那么可以使用咸鱼之王兑换码来获取你想要的物品，本站为大家带来了20

卧龙苍天陨落前期快速获取情谊酒杯的技巧分享

卧龙苍天陨落前期快速获取情谊酒杯的技巧分享

情谊酒杯是卧龙苍天陨落游戏里面的特殊道具，将它赠送给武将可以快速提升自己跟武将的好感度，因此玩家在游戏中往往需要大量的情谊酒杯。为此小编今天给大家分享一下卧龙苍天陨

原子之心剧院死者位置_剧院全部死者所在位置分享

原子之心剧院死者位置_剧院全部死者所在位置分享

原子之心的剧院区域中一共存在7个死者，想要达成招魂问卜奖杯的玩家就必须找到所有死者并进行对话。为了方便大家第一时间找到所有的死者，今天小编给大家分享一下原子之心剧院

硬件情报站第156期：AMD锐龙9800X3D黄牛价翻倍网友14900K送保被拒

硬件情报站第156期：AMD锐龙9800X3D黄牛价翻倍网友14900K送保被拒

AMD四款RX 8000M笔记本电脑GPU曝光Intel二代锐炫显卡发布在即AMD锐龙7 9800X3D黄牛价翻倍消息称AMD Zen 6锐龙CPU

饥荒金色腰带有什么用?饥荒金色腰带用途详细介绍

饥荒金色腰带有什么用?饥荒金色腰带用途详细介绍

饥荒金色腰带有什么用？金色腰带是饥荒游戏里面的一个特殊道具，有一些玩家在获得金色腰带后，不知道应该如何使用它。为此小编今天给大家分享一下饥荒金色腰带用途详细介绍，有兴趣

美术课“踢”球、数学“解”运动：广州举行全科阅读与体育健康教研活动

美术课“踢”球、数学“解”运动：广州举行全科阅读与体育健康教研活动

近日，在广州市庆丰实验学校的美术教室里，一场别开生面的艺术创作课正在进行。伴随着激昂的世界杯主题曲，数十名一年级学生正全神贯注地伏在制作台前，小手

高考倒计时，封存烦恼，轻松上阵 | 2025给“荔”高考

高考倒计时，封存烦恼，轻松上阵 | 2025给“荔”高考

马上就要高考了，如何让自己轻松上阵？深圳市新安中学（集团）心理健康与生涯教育指导中心主要负责人刘娟给考生们“六个”心理锦囊，请收好！第一，封存烦恼，启动“

中大本科专业+3！双学位项目+10！涉数字经济、柔性电子、智慧农业等

中大本科专业+3！双学位项目+10！涉数字经济、柔性电子、智慧农业等

6月6日，记者从中山大学获悉，该校于2025年获批增设3个普通高等学校本科专业，设立10个双学士学位复合型人才培养项目。其中，数字经济专业依托岭南学院，面向

共建教育合作桥梁，中欧高等教育科技与艺术论坛在布鲁塞尔举行

共建教育合作桥梁，中欧高等教育科技与艺术论坛在布鲁塞尔举行

在庆祝中欧建交五十周年之际，6月5日，香港科技大学（广州）与布鲁塞尔自由大学联合主办的中欧高等教育科技与艺术论坛在比利时布鲁塞尔举行。来自中国、比利

【视频】“回去睡上一觉先！” 广州一考点同学：作文题不难

【视频】“回去睡上一觉先！” 广州一考点同学：作文题不难

“回去睡上一觉先！”6月7日，高考语文考试结束后，广州市第八十六中学考场的考生自信走出校门。一名同学表示作文题不难，比平时模考简单，中午先回家睡觉休息

【视频】没有欢呼雀跃，只有满满不舍考生深情告白母校 “我不想离开广州二中”

【视频】没有欢呼雀跃，只有满满不舍考生深情告白母校 “我不想离开广州二中”

6月9日，高考结束后，广州市第二中学考点外，几位同学深深地向母校告白，高考结束，没有太多的欢呼雀跃，更多的是对母校深深不舍与眷恋。文、视频|记者秦小杰

小孩哥雨天卖桃感动全网,邻摊摊主：懂事得让人心疼

小孩哥雨天卖桃感动全网,邻摊摊主：懂事得让人心疼

近日，一段小男孩卖桃的视频在网上热传，这名男孩言谈举止中透露着成熟与担当，视频中男孩在雨中独自撑伞卖桃，熟练地用杆秤称重、热情地请顾客吃桃子……不

国际中文教师教育虚拟教研室在华南师大揭牌

国际中文教师教育虚拟教研室在华南师大揭牌

日前，“2025年广东省国际中文教育协作机制建设会议暨国际中文教师教育虚拟教研室揭牌仪式”在华南师范大学举行。本次会议以“人工智能新时代下国际中

2025年公安院校公安专业在粤招生2131人

2025年公安院校公安专业在粤招生2131人

日前，广东省公安厅政治部发布《广东省2025年公安院校公安专业报考须知》。2025年公安院校公安专业面向广东省生源提前批本科（公安类专业）招生总计划为21

探索“中文+”教育协同发展，专家学者共同研讨

探索“中文+”教育协同发展，专家学者共同研讨

日前，广东省2025年国际中文教育协作机制建设会议之分论坛二“广东省‘中文+专业/职业教育’多元主体协作机制探索与推进”研讨会在华南师范大学举办。