- +1
蓝象智联创始人徐敏:隐私计算,数据要素价值流通的利器
2021年,国家陆续出台《中华人民共和国数据安全法》《个人信息保护法》,监管重拳已然落地,企业将面临全面的合规风险,围绕数据的暗战亦走向终局,叠加互联网红利逐步消退,更是使一众企业陷入了增长瓶颈。
据Gartner预测,2023年底之前全球80%以上的公司将面临至少一项以隐私为重点的数据保护法规。在此背景下,隐私计算作为能实现“数据可用不可见”的新兴技术体系,价值得以体现,并快速走入商业化场景。
据艾瑞咨询《中国隐私计算行业研究报告》显示,2016年至2022年第一季度,中国隐私计算行业共计发生55起融资事件,累计融资金额超30亿元人民币。今年2月,来自杭州的隐私计算公司蓝象智联也宣布完成了近2亿元A轮融资,足以证明隐私计算赛道仍旧延续着去年的火热行情。
虽然行业现阶段尚处于大规模商业化落地早期,底层商业逻辑也还没有明确跑通,但随着政策红利逐步释放,2022年隐私计算赛道内的竞争或将更加激烈。对此,数据猿采访到了前阿里云副总裁、前阿里金融云创始人兼总经理、蓝象智联创始人兼CEO徐敏,听他讲述隐私计算的价值意义与行业未来走向。
蓝象智联是一家隐私科技与数据要素生态服务商,致力于促进数据价值流通,释放数据要素生产力。公司基于丰富的行业背景和数据应用经验,帮助金融、运营商、政府、互联网平台等行业客户更好地使用数据要素,提升商业价值。其拥有业内顶级资深团队,半数团队成员来自阿里巴巴和蚂蚁金服。
隐私计算——实现数据价值流通
在徐敏看来,隐私计算实际上是“数据价值流通”理念的体现。“隐私计算实现思路众多,如多方安全计算及联邦建模,但关键前提都一致:原始数据不脱离数据提供方的控制范围。真正流通的只是数据背后的价值。”徐敏解释道。
据《中国金融科技发展报告(2021)》指出,当前金融数据融合趋势日盛,安全保护呼声渐涨,作为有效解决计算过程中数据隐私保护问题的技术手段之一,隐私计算日趋成为金融科技创新的重要基石。
过去,大数据征信崛起,暴露出了传统金融机构掌握数据的薄弱面。银行目前经验往往只能遵循“二八法则”,因缺乏数据,难以验证多数客户风险,只能通过20%的客户实现80%的收入;面对占比80%的海量客户“心有余而数不足”,恰恰反映出金融领域的一大难题,即“数据孤岛”问题。
“虽然金融机构能够构建起自己的多维度数据处理能力,但如何安全合规地获取和使用机构内外部数据,进而促进业务发展要求,这里还有很多优化点。而我们进入隐私计算行业的初衷,正是希望通过科技提升传统金融机构的数据能力。如果说前几年在阿里云期间的主要任务是让金融机构具备互联网平台一样的业务爆发力,接下来几年在蓝象智联的主要任务是让更多金融机构具备像互联网平台一样应用数据的能力。”徐敏谈道。
而随着技术迭代发展,传统金融机构逐渐认识到自身同互联网企业的差距,部分金融机构聘请来自互联网行业的资深运营人员,试图复制互联网企业的运营能力,但最终却反响平平。
对此,徐敏指出:“传统金融机构,自身的数据基础其实还是比较薄弱的,没办法有效支撑相关运营活动,普遍需要外部数据来补充,讲究内外部、跨机构的数据互联互通与相互碰撞。这就像两个武林高手过招,不管谁的招数多厉害,最后获胜的往往是内功更好的,数据就是运营的‘内功’。”
但正所谓知易行难,隐私计算在商用实践中,经常需要两方以上的参与者展开联合计算,因此多方协同特性十分明显。在此过程中,许多隐私计算企业普遍会采用有中心节点的多方向计算方案,将两端数据同态加密后置于中心节点计算。
徐敏告诉数据猿,上述方案在商业应用层面存在限制,特别是在大型金融、运营商或者政企客户之间,很难找到大家都信任的第三方中心点。“传统模式下,数据必须出域才能完成建模,尤其是样本数据,且模型无法被保护,这使金融机构的智能化应用举步维艰。即便在数据提供方处展开计算可以使数据不出域,但这却会在一定程度上暴露调用方的计算规则与模型,这对很多规则敏感性企业来说存在很大风险,例如银行的风控模型如果暴露了也就意味着失效。”
相比之下,蓝象智联基于联邦学习建模,在运营商与金融机构两端部署边缘计算节点,除去了不受信的第三方节点,使两端同时完成加密计算与通讯过程,通过点对点直连,在保护用户隐私的情况下,从根本上避免数据泄露风险,让外部数据的价值得以显现。同时,蓝象智联在充分理解金融行业的实际场景需求的基础上,在产品层面不断推陈出新,开发了很多实用功能,例如支持模型部署在业务方侧,在模型预测中同时保护数据方的数据和业务方的敏感模型。
GAIA——金融级隐私计算产品
艾瑞咨询调研显示,预计2022年展开隐私计算投入的金融机构数量约是2021年的2倍或2倍以上。隐私计算需求侧井喷,显然吸引了诸多玩家涌入赛道,使得行业愈发拥挤。
面对市面上不断涌出的各种产品,徐敏大致将其分为三类等级:第一类是实验室级产品,即具备初步功能的原型产品,但无法适配企业业务的多样性复杂环境和性能要求;第二类是企业级产品,该类别用途广泛,能覆盖多个行业;而第三类就是金融级产品。
金融行业IT水平整体较高,数字化程度亦领先众行业,对于隐私计算产品的要求自然更为严苛。“金融机构既追求高可用性、高性能,亦对产品安全性、可管理性等方面要求颇高,例如,在目前蓝象智联技术介入的业务场景中,金融机构往往需要在一两百毫秒内获取结果,即便在多样性复杂的跨机构的网络条件下、或者在多家机构组成的复杂数据网情况下,也必须要保持这样的性能要求,这对于隐私计算服务方而言无疑是极大的考验。”徐敏介绍道。
而旨在赋能金融行业的蓝象智联,正是顺应了金融级产品的苛刻应用要求,推出了专注于隐私计算技术在金融领域应用的GAIA。据悉,蓝象智联GAIA产品系列主要包含四大板块。
一站式联邦学习建模平台GAIA·Cube,支持从资产发现、隐私求交、特征工程、模型训练到模型安全部署的全流程的可视化交互式多方安全计算AI研发能力。
多方安全计算平台GAIA·Edge,以多方安全计算技术为基础,通过整合大数据和区块链等技术而升级的新一代去中心化的基础安全数据共享平台,并提供可信数据资产交换、行业模型预测、分布式多方安全隐私数据智能应用产品和解决方案。
隐私计算联盟共享平台GAIA·Edge-X,则是通过多方安全计算技术实现核心数据不出库的情况下数据的实时共享,提供数据资产全生命周期管理、多模式组网、数据资产交易与计量计费、实时隐私计算与查询服务为一体的数据安全共享平台。
GAIA数据要素流通平台,以数据要素市场平台,数据要素支撑平台,隐私计算能力平台等三大系统构建数据要素流通平台,在底层技术架构上通过融合密码学与AI大数据技术,实现“域外流转可控,密文上可计算,数据可确权,隐私可审计,计算可计量”。
据徐敏介绍,与有些基于开源产品发展起来的隐私计算产品不同,GAIA则是完全采用自主研发的整体技术,包括自研的底层算法库,在实现高性能、高安全等企业应用要求的同时,更能针对特定场景定向提升、优化。
据悉,蓝象智联隐私计算平台GAIA已分别被广泛应用在特别关注名单共享场景、反欺诈联盟平台场景。以反欺诈联盟平台场景为例,蓝象智联与监管机构合作,引入中国移动、中国电信、中国联通和公安有关部门的能力和数据,通过多方安全计算和联邦学习两大技术支撑,并与“断卡”(银行卡和手机卡)行动高效协同,有效构建了当地反欺诈屏障。
此外,作为金融级隐私计算产品,GAIA具备完善的安全体系,其安全计算引擎结合密码学、密钥管理、MPC协议、安全算子的架构分层;且自带密钥管理系统(KMS),用于托管密钥和证书的全生命周期管理。
前文提到,数据运营需同客户业务紧密结合,而对金融类产品而言,营销往往是一大难题。在寻找公域流量拉新、获客的过程中,批核风控环节通常会拦截50~90%的进件流量,导致金融产品的获客成本水涨船高。
对此,徐敏指出,通过GAIA平台连接三大运营商和头条等投放渠道,金融机构能够实现跨域的高响应及低风险客户的精准识别,并在流量端前置完成客群的筛选,进而提高全流程的获客效率。
基于此番隐私计算能力,去年年底,蓝象智联同中国工商银行、中国银联合作,通过多方数据安全共享、联合建模,促进工行与银联数据价值的流通利用,打破信息互通壁垒,有效平衡了数据隐私保护与价值挖掘。得益于此,该项目也成功入选了2021大数据“星河”标杆案例,进一步凸显出了蓝象智联的技术能力。
“隐私计算+”——行业进化的理想形态
新兴技术的发展总是充满着机遇与挑战,隐私计算亦是如此。根据艾瑞咨询《隐私计算发展周期洞察矩阵》显示,当前的隐私计算行业仍处于技术萌芽期,随着技术期望的不断升高,市场愈发肯定隐私计算的技术价值,资本热度也在持续升温。
而据中国信通院的统计显示,2018年、2019年国内几乎没有隐私计算应用进入部署阶段,但2020年进入部署阶段的隐私计算产品比例升至38%,2021年则继续抬高至48%,可见各类玩家正在纷纷入局,赛道内部竞争亦不断加剧。
值得注意的是,艾瑞预测称,行业头部企业积极展开平台建设将成为隐私计算赛道下一趋势,而紧随其后,行业中尾部企业亦将展开平台建设投入。言语之间,似乎透露出赛道的“平台化”浪潮。
对此,徐敏告诉数据猿,平台化可能是一个结果,而不应该当作一个目标。蓝象智联当下所有的工作都在围绕客户价值和商业目标,在底层技术或数据运营层不断加砖添瓦,累积能力,从而提升隐私计算行业的整体价值。至于说最后的商业形态是否是平台、或者各方在平台中是什么定位,是逐步进化出来的。
在他看来,未来,隐私计算将成为数字经济的底层基础设施,为各行各业搭建坚实的数据应用基础。基于此,如何通过隐私计算所赋予的数据连通能力创造新的产业变革,才是隐私计算赛道的机会所在。
“隐私计算本质上不能称之为行业,而应看作一种基础技术,这好比当下互联网已不再是单独一个行业的名称,只有互联网金融、互联网电商等,‘互联网+赛道’成为了行业。因此,如果有一天隐私计算赛道消失,‘隐私计算+赛道’涌现繁荣时,隐私计算行业才能真正步入理想形态。”徐敏解释道。
而在此背景下,隐私计算行业已然开始分化,目前隐私计算的市场参与者类型众多,不同厂商的能力优势、技术路径、发展策略也存在差异。蓝象智联创始人兼董事长童玲表示,蓝象自身定位为各行各业数字化转型与数字经济的促进者,以务实作为自身的发展路径。
以开源为例,徐敏对此流露出了谨慎的态度:“如果当下的体量、能力还达不到运营开源社区的水平,那就很难达到开源所期待的目标。”从中可见,相比“为开源而开源”,蓝象智联更愿意聚焦于打磨产品本身,将开源看作“水到渠成”的事情。
而秉持着此番务实的业务逻辑,截止目前,蓝象智联已与中国移动、中国电信、中国联通三大运营商达成合作,在技术、数据运营及客户资源方面提供全方位配合与支持;并同中国工商银行和中国银联合作,为普惠金融服务的拓展提供更多的有效数据基础,有效平衡了数据隐私保护与价值挖掘,协助工行把小微金融服务普惠至千家万户。此外,也已经或正在与交通银行、兴业银行、上海银行、南京银行、杭州银行、新网银行、国泰君安等几十家金融或其他行业客户形成合作,基于隐私计算技术,提高数据的能力提升机构的营销和风控方面的能力。
展望未来,徐敏认为未来两年内,随着隐私计算的发展,行业中会出现四个方面的变化:首先,基于隐私计算的数据流通会成为主流;第二,基于隐私计算和数据流通的商业应用会更加繁荣;第三,数据基础设施与隐私计算技术深入融合;第四,企业数据合规要求更高。蓝象智联也正在基于行业即将发生的变化积极地“自我进化”——蓝象智联的自我定位“隐私科技和数据要素生态服务商”,似乎正在昭示着蓝象智联的自我进化之路。
法国思想家米歇尔·德·蒙田曾说过:“倘若旅人没有确定航行的目的港,那么任何风向都不会是顺风。”而以“促进数据价值流通 释放数据要素生产力”为使命的蓝象智联似乎也带着此番理念,通过联动产品技术、数据运营与业务运营,推动着数据要素市场健康稳定高速发展,让数据要素在金融等行业发挥更大价值,为社会带来更多美好的变化。
文:威化化 / 数据猿
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司