澎湃Logo
下载客户端

登录

  • +1

元宇宙聊天室|大模型应用不完美,但它正朝完美迈出第一步

澎湃新闻记者 宦艳红
2024-07-11 14:40
来源:澎湃新闻
未来2% >
字号

2024年世界人工智能大会刚刚落幕,今年的大会和去年一样,仍然是大模型唱主角,但和去年不一样的是,今年的大会除了聊大模型技术,大家在聊的更多是应用,如何将大模型技术落地到各行各业,实现其应用价值。大会期间,澎湃科技邀请了达晨财智业务合伙人 张英杰和星环科技联合创始人、副总裁朱珺辰,做客“元宇宙聊天室”,聊了聊当下大模型从技术到应用的发展情况。两位都表示,和去年相比,大家正在从对大模型高期待中回归冷静,但各行各业也开始积极拥抱这项技术,虽然这项技术还不完美,有包括“幻觉”等各种应用障碍存在,但放眼未来,伴随着不断的尝试和迭代,终将开启一个新的AI时代。

以下为直播对话摘要。

高期待的泡沫正在幻灭

澎湃科技:首先想问问各位对于过去一年大模型发展变化的感受,去年世界人工智能大会时感觉大家都很兴奋。

朱珺辰:所有新技术的发展都会经历一个过程:刚出来时,大家对它期待很高,以为它是一个万能的东西,期待值会快速膨胀;过了一段时间,大家接触多了会发现这个技术好像存在很多局限性,并不似想象中那样完美,这时大家就会进入泡沫的幻灭期;但技术是持续迭代和发展的,当它逐渐成熟,能够被应用到一些典型场景后,大家对它的信心又被重建起来。

大模型也不例外,可能去年大家对这个技术有很高的期待,现在发现它和预期存在很大差距,现在大家的期待值正从最高点往下坠落,在这个阶段可能会有一些焦虑。但从技术发展趋势的角度看,我们还是坚信大模型会对整个人类社会的生活和生产有很大的影响,它很可能会引发第四次工业革命。

张英杰:对于技术的判断,我的观点和朱总是一样的,大家对于技术的判断经常存在“短期高估、长期低谷”的现象。站在投资人的角度,我对大模型的感觉总体上还是挺兴奋的。

大模型出来之前,新能源、硬科技是我们的主赛道,但之后大家有些不知道接下来该投什么。大模型出来之后,我们有了明确的目标,还是很幸福的。现在基本所有的投资机构都“all in”在这波AI行情上,积极布局。

我们现在的压力是要不停学习一个新行业的知识,去做投资判断。投资人面临的问题是创业的供给其实并没有想象的那么多。大模型的生态包括应用方面的创业,今年可能是一个起点,相信从明年会有更多垂直行业的投资标的出现。

当然,投资标的少,也和这个行业的创业门槛高有关系,在这个阶段要出来做大模型创业,其实还是很难的,人才、算力都会有挑战。

估值高除了想象空间,还和模型创业人力、算力密度成本高有关系

澎湃科技:MiniMax的创始人闫俊杰昨天在接受媒体采访时说,未来五年全球可能只有五家大模型,两位对于这个观点怎么看?

朱珺辰:我觉得现在还不能下这么绝对的论断。就基座大模型而言,未来有没有可能因为底层架构的革新或参数达到一定量级后大力出奇迹,使得模型的能力得到提升,还不确定。目前大模型的能力确实使得它在应用时受限,就行业大模型来说,我觉得还需要大家不断地在产业中尝试。

张英杰:我们在做大模型投资其实也会讨论到底以后模型是会收敛还是会发散,到底未来生态是什么样子?大家对此观点也都各不相同。

我自己比较在意的点是:

第一大模型带来的是生产力的整体提升,无论是基座模型还是行业模型,发展以后会使得市场的蛋糕变得更大,这肯定是好事,这也是大家看重这个行业的一个重要原因。

第二,AGI(通用人工智能)给大家带来了很多想象空间,这也是大模型企业融资火爆的原因。我觉得现在无论是面向C端还是B端的模型,都是有机会的。即便大厂也在做,但只要蛋糕足够大,技术壁垒足够高,创业企业仍然有机会。

澎湃科技:现在很多模型创业公司的估值达到了百亿人民币了,是不是太高了?

张英杰:主要是AGI的想象空间足够大,大家瞄准都是未来上千亿甚至上万亿的规模去看的,站在这个角度,我觉得跟现在这个阶段的百亿估值也是匹配的。

但估值高确实也和模型创业公司人力、算力密度成本高有关系,目前很多模型公司的现金流储备以及人才储备,确实颠覆了我们这个行业过往的认知,短期大家还是要投入研发。

大多数模型没法做到开箱即用

澎湃科技:星环科技以前的业务一直是做大数据平台的,从什么时候开始做大模型?

朱珺辰:星环科技之前一直是做大数据平台和数据库业务的,此前已经积累了大概一千四百家国内大中型客户。大模型技术出来后,我们是想用这个新技术进一步提升客户数据的应用价值。早期希望基于开源大模型做二次预训练,但最后发现这条路走不通。打个比方,训练模型类似培养孩子,你要让一个已经完成了整个中学的教育的孩子接受另外一种价值体系其实是很难的,开源模型越用到后面会发现制约性越高,所以我们又从0到1预训练我们自己的基座大模型。

虽然大模型确实有很强的泛化能力,但对于企业用户来说,大部分情况下都很难拿来一个模型立马能用。客户很多需求是个性化的,如何把新的知识喂给模型,让模型高效地去适应一个新的任务,里面是有很多“know how”的门槛在的。

澎湃科技:哪些行业会先用大模型?

张英杰:如果从商业落地的角度来看,还是金融、政务、能源相对比较多。主要是面向消费端的产品,短期很难通过收费来变现。

但从技术的角度来讲,大模型现在其实已经渗透到各行各业了,我们看到一些外卖平台通过大模型技术提高了效率,节省了很多成本,这些都正在发生,只不过它还没有形成产业集群,从商业的角度看还处于比较早期的阶段。

此外,现在使用大模型的门槛其实是越来越低了,除了开源模型,大模型厂商也在降价,也有很多模型厂商在做解决方案,就像以前云厂商帮企业上云一样,其实整个产业链现在都是一个欣欣向荣的状态。

朱珺辰:虽然目前还没有一个日活千万级的大模型应用,但我觉得当大模型技术和一些硬件结合后,会产生很多新的产业,譬如人形机器人就是一个很好的例子,当大模型和机器人结合,那未来机器人可能和现在的汽车一样普及。

澎湃科技:大模型确实会改变现在的一些商业模式吗?

张英杰:我觉得大模型未来肯定会产生非常多的新产业,发掘新的需求,投资人也是基于这个大的判断,才会积极下场。而且我们认为未来大模型在不同的行业都会有新的商业模式,包括面向企业端和消费端的各种应用,未来可能还会有我们现在还没想到的新东西出现。有些产品在第一次、第二次、第三次出现的时候不成功,也许第六、第七个产品出现时成功了。

算力仍然是应用最大的瓶颈

澎湃科技:刚才谈到金融、法律行业的应用,但这些行业其实都是很严谨,容错率很低的行业,但现在的大模型还存在幻觉问题,怎么解决这个矛盾?

朱珺辰:确实,大模型在企业端落地一个很重要的痛点就是幻觉问题。对于很多容错率很低的客户来说,你可以不回答,但你不能回答错误或不准确。这个问题的解决涉及到语料、应用场景等多个因素。

针对语料,我们现在提供了一个开发工具,让用户能够便捷地上传企业内部的非结构化数据,让大模型的回答有据可依,方便用户去判断这个回答是否准确。企业内部的数据其实是很重要的资产,一定程度上能够弥补大模型专业能力不足的问题。

在应用场景的选择上,我们要考虑帮助客户在企业内部建立对于新技术的信心,在所应用的场景上要确实能达到一定的效果。

就算力而言,目前推理的算力供给相对充足,我们是希望通过技术方法降低用于训练的算力需求,包括对大模型进行一些裁剪、优化。

这些是我们现在正在做的,但解决“幻觉问题”需要一个过程。

张英杰:我其实看到一个相对乐观的点,就是现在大模型这波新的技术和产品,导入的速度和渗透率已经远超过以往任何一个新的技术,不管是以前的云业务还是数字化转型方案,以前要让大客户接受一个新的产品或技术,至少需要两三年的周期,需要跟对方的技术部门对接,做POC测试(Proof of Concept,即概念验证),可能要跟客户的各个业务部门合作,周期很长。但这波技术自引爆后,从国家政策层面到细分行业,都在倒逼客户积极拥抱这个新技术和产品,缩短了“从0到1”的过程。

虽然现在这项技术并不完美,但如果下游客户愿意跟你一起承担风险打磨产品,那对整个行业的发展来说都是一种促进作用。

澎湃科技:数据、算力和人才,哪个更难解决?

朱珺辰:从我的角度来讲,可能算力会更难一点。

张英杰:说实话,就数据来说,国内的基础其实是比国外强的,毕竟有那么多人口基数,各行各业的积累。

算力和人才相比,短期来说算力可能更困难,虽然人才其实也面临短缺。我们投资了很多清华系或中科院系的科创企业,背后的一个原因就是它们背后有很强的人才密度支持。

短期内,哪家创业公司可以招到更多的年轻人才,也是一个核心竞争力。创业公司融资的一个用途,也是用于网罗人才。

 

    责任编辑:沈关哲
    校对:张艳
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈