腾讯吐露最新大模子磨炼措施,可节约50%算力老本
时间:2025-03-17 00:31:32 出处:知识阅读(143)
21世纪经济报道记者白杨 北京报道
随着大模子时期到来,腾讯吐露模子参数呈指数级削减 ,最新已经抵达万亿级别。大模与此同时 ,磨炼大模子也逐渐从反对于繁多模态 、措施繁多使命睁开为反对于多种模态下的可节多种使命。
在这种趋向下,约算大模子磨炼所需算力重大,力老远超单个芯片的腾讯吐露处置速率,而多卡扩散式磨炼通讯斲丧重大。最新若何后退硬件资源运用率,大模成为影响国产大模子技术睁开以及适用性的磨炼紧张条件 。
在此布景下,措施腾讯于11月23日宣告,可节腾讯混元大模子眼前的约算自研机械学习框架Angel再次降级,可将大模子磨炼功能提升至主流开源框架的2.6倍,千亿级大模子磨炼可节约50%算力老本。
Angel能耐提升眼前,是基于磨炼框架以及推理框架的迭代。据悉 ,面向大模子磨炼 ,腾讯自研了机械学习磨炼框架AngelPTM ,可针对于预磨炼 、模子精调以及强化学习等全流程妨碍减速以及优化,可能以更少的资源以及更快的速率磨炼更大的模子。
而为了处置推理老本的不断回升,腾讯自研的大模子推理框架AngelHCF经由扩展并行能耐、接管多种Attention优化策略等方式对于功能妨碍了提升 。同时,框架还适配了多种缩短算法 ,之后退吞吐能耐,从而实现更快的推理功能以及更低的老本。
实测数据展现 ,相较于业界主流框架,AngelHCF的推理速率后退了1.3倍。在腾讯混元大模子文生图的运用中 ,推理耗时从原有的10秒延迟至3-4秒。
此外 ,降级后的Angel还提供了从模子研发到运用落地的一站式平台 ,搜罗数据处置、精调 、模子评估、一键部署以及揭示词调下等效率 ,让大模子的“开箱即用”成为可能 。
据介绍,在运用开拓层面,腾讯外部已经有逾越300项营业以及运用途景接入腾讯混元大模子内测,比照上个月数目翻了一倍。
(作者:白杨 编纂 :骆一帆)
猜你喜欢
- 全场8人轮换,6人得分上双!打成这样的热火,最后还是输给老冤家狂轰35+15+12!全联盟第一,NBA最强超巨诞生,MVP总冠军全都要
- 史诗级!阿森纳决定火速签约8000万中锋!英国脚+中场大将离队
- 马宁等6名中国国际级裁判获选派执法C罗亚冠比赛,为亚洲杯练兵张靓颖:被骗财骗色15年,为其打乳钉,最后支付了6个亿的分手费
- 5换2!克莱离队妄想曝光,库里或者喜迎1.7亿万能冠军锋线争冠
- 森林狼成联盟第一秘诀是啥?有球星更要有防守男性50岁之后眉毛突然变长,说明了什么?医生:多数人被蒙在鼓里
- 华南理工大学学者初次试验发现磁霍普役夫
- 你的猛龙 独一无二 哈弗猛龙广州车展闪耀登场他们竟然是父子关系!这几对明星父子让你大开眼界,都是实力派!
- 原创 杜兰特拒绝轮休,理由让球迷心疼,沃格尔直言太阳后续会有交易
- CBA最新积分榜:辽宁第一领跑,广厦三连胜紧追,四川14败