澎湃Logo
下载客户端

登录

  • +1

外滩大会|蚂蚁集团公布自研金融大模型:算力集群达万卡规模

澎湃新闻记者 邵文
2023-09-08 17:50
来源:澎湃新闻
未来2% >
字号

·蚂蚁金融大模型基于蚂蚁自研基础大模型,针对金融产业定制,底层算力集群达到万卡规模。目前,蚂蚁金融大模型已在蚂蚁集团的财富、保险平台上全面测试。

蚂蚁集团在2023 Inclusion·外滩大会上发布金融大模型。

9月8日,蚂蚁集团在上海举办的2023 Inclusion·外滩大会上发布金融大模型。澎湃科技(www.thepaper.cn)了解到,这款大模型基于蚂蚁自研基础大模型,针对金融产业定制,底层算力集群达到万卡规模。目前,蚂蚁金融大模型已在蚂蚁集团的财富、保险平台上全面测试。

蚂蚁集团介绍称,蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练利用率(MFU)为40%,集群有效训练时长(在分布式计算环境中进行机器学习模型训练的时间)占比90%以上,RLHF(基于人类反馈的强化学习)在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍。根据SemiAnalysis此前揭秘GPT-4的文章,OpenAI在GPT-4的训练中使用了约25000个英伟达A100 GPU(图形处理器),训练了90到100天,利用率(MFU)约为32%至36%。

“通用大模型无法在专业严谨的领域直接商用,特别是金融服务对错误的容忍度很低,金融大模型要确保领域知识和专业逻辑的严谨性,才能真正落地带来产业价值。知识力、专业力、语言力以及安全力,保障四大能力是前提条件,也是金融大模型要解的产业真命题。”蚂蚁集团副总裁、金融大模型负责人王晓航介绍,基于金融场景中的大量实践,蚂蚁金融大模型形成了“大模型+知识+服务”驱动的架构,这套架构已经在蚂蚁内部金融智能化场景上内测。

王晓航表示,蚂蚁金融大模型在万亿量级Token的通用语料基础上,注入千亿量级Token(文本中的最小单位,一个单词或一个标点符号)金融知识,并从300+真实产业场景中提取了共60万+高质量指令数据,形成了金融专属任务性能优化的数据资产。

据介绍,8月底,蚂蚁金融大模型已通过证券从业资格、保险从业资格、执业医师资格、执业药师资格等专业试题测试。

当天,蚂蚁集团发布了基于金融大模型能力的两款产品:智能金融助理“支小宝2.0”,服务金融产业专家的智能业务助手“支小助”。据透露,支小宝2.0版本已在内测,将在完成相关备案工作后上线。

    责任编辑:郑洁
    校对:张艳
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈