- +1
智库百人会 | 蓝云:关于AI的三个层面思考、八句真话
编者按:3月23日下午,由马洪基金会主办的“智库百人会春茗会”在银湖CDI大厦举办。以下广东省互联网+大数据发展研究中心主任,北江区块链人工智能研究院院长、教授蓝云现场发言内容整理以飨读者。
各位智者、贤友,我专门从广州过来,我为什么要来?因为现在很多城市都号称在打造智慧型的城市,但是可能真正的“智”的含量不高。我们深圳有智者交流平台,所以我跟秘书处的同志讲,我一定要来。今天围绕着人工智能AI,我主要围绕三个层面讲八句话,人类的未来、国际博弈及国家民族的未来、每个机构及每个个体的未来。我将结合国家的“新质生产力”战略部署、广东的“打造AI第一省”工作计划,简要讲解。
(一)AI相当于30年前的互联网
AI是什么?AI是当下最具颠覆性、最全面、最深入、最具影响力的技术变革,没有之一。一定有一天,AI就像电、像蒸汽机、像互联网一样,将会改变所有人的生活。中国是1994年4月全面接入国际互联网的,之后发生了什么、互联网改变了我们什么,大家心知肚明。现在的AI,就是1994年、1995时的互联网。1995年10月的北京深秋,在“中国硅谷”北京海淀中关村,突然矗立起了一块视觉反差强烈的巨大广告牌,上面写着:“中国人离信息高速公路还有多远?向北1500米”。那么现在中国人离AI有多远?我的答案是:50厘米。也就是你的手指与你手机的距离。这是第一句话。
(二)“人类的群星闪耀时”
最近AI发生了一件什么事情?开源。往常大家都把大模型、参数、算法当做宝贝,保险柜里头起码要10把锁、20把锁锁起来。但是有一些“反人类的行为”,2024年3月17日马斯克开源3140亿参数的Grok大模型。请注意,马斯克旗下公司很多,他是Open AIAI公司的第一批投资股东,后来他和奥特曼分道扬镳了。开源是一种软件开发和发布的模式,它指的是软件的源代码可以被任何人免费获取、修改和使用,而不受版权或专利的限制。硅谷巨头的开源将带来多种的外部性影响,正负的影响,近期全球多个区域新注册的AI公司井喷,其中的道理大家都明白。
实事求是地说,马斯克作为企业家、创业家、发明家、慈善家和未来主义者,这个人很有个性,也干了也一些不太好的事情,但是他至少有这么几件事情很值得地球人类骄傲:开源特斯拉技术、开源SpaceX星链卫星互联网项目代码、开源Neuralink脑机接口项目的部分代码、探索火星等,还有这一次Grok大模型开源。很多时候我都会想起茨威格那本书,《人类的群星闪耀时》。这是第二句话。
(三)AI创新,关键在高端人才
第三句话,最近大半年来,很多朋友都在问我:蓝云你现在也是大数据专家了,你说一说ChatGPT为什么不能诞生在我们中国,一定要说出真实的原因。我说你不要着急,你先看看ChatGPT是谁搞出来的,三个关键的人物,三个男人。第一个是Altman(奥特曼),1985年出生,犹太裔;第二个是马斯克,第一批的投资方,就是奥特曼的金主,刚开始大家认为说这个事情干不了,但是马斯克毅然投了,马斯克是1971年出生在南非;AI数据处理需要GPU、芯片,第三个男人就是黄仁勋,1963年出生在中国台湾,9岁去了美国,后来创办了英伟达。这三个人,看看这三个人的国籍跟区域等特点,照国内一些专家的观点是美国虽然整体上在没落,但是它确实还在“聚天下英才而用之”,就这一点其他各个国家、区域目前都无法比拟,这就是我对这个问题很简要的回答。
这个问题,引申出两个思考。第一,中央领导对高端人才的重要性看得非常清楚,已经出台了多项战略聚拢英才,颜宁院士在深圳开创医学科学院就是一件值得祝贺的事情。第二,经历新冠疫情,美国爆发出了ChatGPT,上一次经历2008全球金融危机后,美国爆发了比特币、区块链。为什么每一次重大社会或经济危机后,美国会有一次重大科技创新?对于这个问题,我还没有完全想清楚,欢迎大家赐教。
(四)大模型的核心是基于概率的数理统计
第四句话,ChatGPT这么牛,到底是什么样的技术原理?这有点复杂,我用一两分钟简单的科普一下,GPT(Generative Pre-Trained)就是一套生成式预训练系统,它的数据库、模型都是已经生成好的,训练好的,训练有素的大模型,大数据库的系统。它模仿的是人的生物神经网络,就是这种输入、输出,中间大脑的结构过程你是不知道的。比如,门口来了一只“猫”,我们人凭什么认定它是猫?我们小的时候认猫是怎么认的?经过无数次的失败的训练,大人、老师、身边的朋友,反正我也不知道我怎么判断它是猫,我只知道那就是猫,就是这种无数次的训练,对了就奖励你,不对的话“啪”一个巴掌惩罚,大模型就是通过模仿人类深度的神经网络,里头的线条很长,非常长,横的倒过来就成了“深度”了。这是它模仿的生物的神经网络,“人工智能”这个概念1956年诞生,但中间走了很多弯路,后来发现学习神经网络这条路能走通了,中间很多曲曲折折。
现在AI也会写文章,写文章背后是什么?基于概率学的数学算法。比如说“中国的首都”,下文接什么?它会通过上下文进行判断,多个选项中“很美丽、在北方、有天安门、是北京”,通过上下文进行判断,分析说哪个概率高,就把它蹦出来。我们以现场的李罗力理事长为例,上文是“大家今天见到的理事长”,下文有多个选项“很帅、在听报告、在主持、笑了”,这里头每个东西、每个选项它怎么蹦出来?根据上下文。看你的那种语境,还有你的模型结果,综合其他的要素。这里头都是大数据的分析,每个都是基于概率写的。词语接龙而已,因为它速度快,你认为它在写文章,其实它在词语接龙。
很多人说大模型到底“大”在哪里?一个小事例。马车多少个零件?几十个。汽车多少个零件?几万个。航天飞机多少个零件?250万个。刚刚我们讲过,Grok 大模型3000多亿的参数,GPT3.5是2000多亿个参数。大家就能知道它里头大模型的这种复杂度,以及它背后牵扯到的算法、模型,也知道说很多东西为什么只有美国科技巨头、科技狂人才搞得出来。
(五)基辛格博士、倪光南院士的思考
AI已经把全世界搞得大乱了,基本上每个人都在谈论这个事情,我们很熟知的中国人的老朋友基辛格博士。他的最后的遗作,讲的就是《人工智能时代与人类的未来》,这本书400多页,有点长,书的核心意思就是一句话:就是人类还没有完全准备好,AI已经来了。政治没有准备好,外交没有准备好,技术没有准备好,伦理也没有准备好,法律也没有准备好,社会环境也没有准备好,家庭也没准备好……AI已经来了。老爷子讲的就是这个意思。
全球很多有识之士呼吁对人工智能(AI)进行紧急监管,将其当作“与瘟疫和核武器一样的全球优先事项”,以避免人工智能“带来灭绝风险”它。现在欧盟已经出台了管控AI的全球首部法律。这个问题2018年的时候我在广州南沙请教过倪光南院士。倪院士跟我讲AI可以代替普通人的工作,但是天才很难代替,“尤其是类似爱因斯坦的天才,AI很难代替”。倪院士站得高,望得远,我们都很尊敬他。
Sora生成的与自然界迥异的图片。图左来自互联网,四脚蚂蚁。图右由蓝云独家提供,后脑勺在前的男子。(摘自蓝云课件)
(六)Sora能不能模拟全世界?
第六,Sora能不能能模拟全世界,能不能搞平行时空?奥特曼的OpenAI公司有三大产品,除了对话大模型ChatGPT、绘图大模型DALL·E,另一个就是后来推出文生视频大模型Sora。对于号称“世界模拟器”的Sora,业界有一些不同的观点,基于大模型它会产生一些认知的悖论、可能基于系统先天缺陷的悖论。大家看一下这张图,蚂蚁有多少条腿,都知道是六条腿,但是Sora生成的蚂蚁是四条腿。另外一张,这是我独家生成的图片,后脑勺在前的男子,这就是Sora做出来的。所以Sora能不能模拟世界,其实是一个有待深入讨论、有疑义的话题。图灵奖得主杨立昆(Yann LeCun)对Sora的局限性,有深入分析,大家可以找来看看。需要说明的是,AI还在快速迭代中。
(七)中美大模型之间的博弈问题
第七句话,是中美大模型之间的博弈问题,这种差距会不会拉的越来越远?有段时间我比较悲观,但是有一天我明白了,美国科技的井喷,它有两三年的快速成长期,这两三年快速成长期你是干不了什么事的,你只能跟着,但是它不可能年年都有快速井喷期,它会经历一段时间的酝酿平整期,后续10、20年是我们中国大量的机会。这张图“LY-AI曲线”我跟大家报告一下,是我原创的,也是为了今天的活动,有一天洗澡的时候我想出来的,在“3+20”时间周期里面有中国产业的大把机会,这就是中国的机会。包括互联网也是这样的,互联网也是美国人发明的,中国后来快速应用,但是我们应用得比别人好,应用出了特色,应用出了风格,应用出了中华的魅力。
(八)大模型的垂直化、行业应用,“小模型”
最后一句话。对于现在党政机构,我劝他们都不要搞大模型,大模型都是死路一条,没法跟美国硅谷巨头直接竞争。要干什么?要干“小模型”。我带来两个案例,广州有个区用AI来写公文,党政的公文,这种大模型是干不了的,为什么?因为大模型没有语料去喂它,去训练它的模型,这是党政部门的优势,因为党政的公文系统不可能向ChatGPT开放,那你要怎么干?我自己搞个大模型,自己训练,模型部署在自己的服务器,自己来用。另外,广州市越秀区有一个AI社交的机器人也是部署在自己的小模型上,这是全省第一个AI私聊政务机器人,精准服务市民,获得了第二届“粤有数”数字化治理优秀案例奖。
面对AI潮流,对于个人来说是怎么办?早点学,主动学,快点学,全面学,翻译成互联网话语就是:早死早投胎,早学早解放。对于当下的小朋友教育,大家不用过度担心,只要身体好、心理素质好、有创新能力,其他不用太多担心,有AI、脑机接口等给我们服务。
我就讲这些,谢谢大家。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司