炒汇

你的位置:领航优配 > 炒汇 > 蚂围聚团AI紧要冲破:使用国产AI芯片历练大模子 老本可进一步禁止

蚂围聚团AI紧要冲破:使用国产AI芯片历练大模子 老本可进一步禁止

发布日期:2025-04-17 10:01    点击次数:117
蚂围聚团使用国产AI芯片历练大模子,老本可进一步禁止。 近日,蚂围聚团Ling团队发表了一篇技能遵守论文。论文自满,蚂围聚团推出了两款不同范畴的MoE诳言语模子——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数范畴为168亿(激活参数27.5亿),Plus基座模子参数范畴高达2900亿(激活参数288亿),两者性能均达到行业跳动水平。 除了自研性能跳动的大模子之外,该技能论文最大的冲破在于提议了一系列篡改法子,以升迁资源受限环境下AI开发的遵守与可及性。实验标明,...

  蚂围聚团使用国产AI芯片历练大模子,老本可进一步禁止。

  近日,蚂围聚团Ling团队发表了一篇技能遵守论文。论文自满,蚂围聚团推出了两款不同范畴的MoE诳言语模子——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数范畴为168亿(激活参数27.5亿),Plus基座模子参数范畴高达2900亿(激活参数288亿),两者性能均达到行业跳动水平。

  除了自研性能跳动的大模子之外,该技能论文最大的冲破在于提议了一系列篡改法子,以升迁资源受限环境下AI开发的遵守与可及性。实验标明,其3000亿参数的MoE(羼杂群众)大模子可在使用国产GPU的低性能征战上完成高效历练,性能与十足使用英伟达芯片、同范畴的稠密模子及MoE模子相当。

  在低性能硬件上高效历练的自研大模子

  现在,蚂围聚团Ling团队的技能遵守论文《每一个FLOP齐至关热切:无需高档GPU即可延伸3000亿参数羼杂群众LING大模子》已发表在预印版Arxiv平台上。

  据技能遵守论文,天然DeepSeek、阿里通义千问、MiniMax等系列的MoE大模子在特定任务中展现出突出性能,然则MoE模子的历练时常依赖高性能贪图资源(如英伟达H100/H800等先进GPU),腾贵老本制约了在资源受限环境中的普及应用。同期,连年来英伟达高性能芯片抓续枯竭,比较之下,低性能加速器供应更鼓胀且单机老本更低。这种各别突显了构建跨异构贪图单位与散布式集群无缝切换技能框架的必要性。

  因此,Ling团队设定的倡导是“不使用高档GPU”来延伸模子,并通过提议篡改性的历练政策,旨在冲破资源与预算限度结束高效诳言语模子历练,从而鞭策AI技能向普惠化标的发展。

  具体而言,团队提议的篡改政策包括:1)架构与历练政策校正:动态参数分派与羼杂精度出动技能;2)历练特别处理机制升级:自符合容错收复系统镌汰中断反馈时代;3)模子评估历程优化:自动化评测框架压缩考据周期超50%;4)器具调用才调冲破:基于学问图谱的请示微调升迁复杂任务执行精度。

  据技能论文,Ling团队在五种不同的硬件成立上对9万亿个token进行Ling-Plus的预历练,其中使用高性能硬件成立历练1万亿token的预历练老本约为635万元东说念主民币,但期骗蚂蚁的优化法子后,使用低规格硬件的历练老本将降至508万元摆布,检朴了近20%,最终结束与阿里通义Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat相当的性能。

  此前,DeepSeek通过一系列算法篡改及工程优化,使用性能较低的英伟达H800历练出了性能与顶尖模子相当的V3与R1,为大模子的历练开辟了新的说念路,让更多的企业和询查机构看到了禁止老本、提高遵守的可能性。若是蚂围聚团的技能遵守获得考据及执行,意味着国产大模子约略寻找老本更低、遵守更高的国产芯片或其他替代有谋略,以进一步禁止对英伟达芯片的依赖。

  蚂蚁抓续加码AI应用与东说念主形机器东说念主

  记者了解到,领航优配百灵大模子算作蚂围聚团自研的大模子,重心布局在活命工作、金融工作、医疗健康等场景的应用。旧年5月,蚂蚁在怒放日上对外展示了多个AI篡改应用居品,并初度公布了AI应用矩阵。蚂围聚团CTO何征宇领悟,基于蚂蚁百灵大模子的三个应用是蚂蚁当下重心破局标的:活命管家、就医助理及金融助手。

  3月21日,蚂蚁告示AI医疗领域的最新弘扬:发布面向医疗机构、医师、用户三端的AI居品体系升级,其中,面向医疗机构,咱们聚积华为医疗卫生军团、阿里云、苹果等推出“蚂蚁医疗大模子一体机”全栈式处分有谋略;面向医师,发布AI医师助手系列器具;同期,面向用户的健康应用“AI健康管家”也推出智能念念考、健康自测等十余项新功能。

  除了AI之外,蚂蚁近期在东说念主形机器东说念主领域也动作频频。本年2月,某招聘平台信息自满,蚂围聚团怒放招聘具身智能东说念主形机器东说念主系统和应用等岗亭,年薪高达百万元。而早在旧年12月,蚂围聚团就注册树立了上海蚂蚁灵波科技有限公司,聚焦具身智能技能和居品研发。

  据浦东发布音问,3月11日,上海蚂蚁灵波科技有限公司在上海浦东举行揭牌典礼。据先容,蚂蚁灵波科技是蚂围聚团拓展具身智能和机器东说念主业务的主要载体,奋勉在家庭、养老、医疗健康等领域打造行业跳动的机器东说念主居品,此番落地将与浦东联袂共进,在往日产业新赛说念上互相促进、共谋发展,助力浦东加速技能引颈、行业积贮、产业升级措施,打造以东说念主形机器东说念主为引颈的具身智能篡改高地和具有行业影响力的篡改产业生态。

  具身智能东说念主形机器东说念主算作新兴领域,具有广泛的市集远景和强大的交易后劲。蚂围聚团可能但愿通过布局该领域,探索新的增长点,并鞭策东说念主机交互的新体验。此外,具身智能东说念主形机器东说念主技能还不错与蚂围聚团现存的金融科技业务产生协同效应,共同鞭策技能篡改和业务升级。

  业内东说念主士分析称,具身智能东说念主形机器东说念主为新兴领域,市集远景广泛。蚂围聚团布局该领域,有助于探索新的增长点,并基于本人在东说念主工智能、大数据、云贪图等方面的技能上风和已有业务布局,加速东说念主形机器东说念主的研发和在规划业务场景中的应用。



上一篇:泉果基金孙伟:科技鼎新冲突有望推动下一波耗尽高贵
下一篇:“财报的雷”击中大白马股招行 原因在分成?机构不雅点也有不合

栏目分类

TOP