- +1
用户数突破2亿,快看漫画也要做个性化推荐
智能分发在漫画领域需要用吗?又到底该怎么用?对于快看又意味着什么?在一年多的反复实验里,李润超和团队试图解答这些问题。
作者 | 张一童
采访 | 张一童 黎佳瑜
设计 | 范晓雯
李润超和团队的实验已经进行了一年多。
2017年,抖音的巨大成功让算法分发在短视频上再次得到验证。这背后远不止技术的进步。产品场景融合,海量内容出现,催生了用户使用习惯的改变,也对平台的内容分发效率和精细程度提出了更高要求。
尽管当时还未在长内容领域得到应用,但李润超认为算法分发将会是未来的必然趋势之一。与此同时,伴随着AI技术的不断成熟,他也试图为漫画平台找到新的技术发展方向。
身为快看漫画CTO的李润超目前带领着一个超过200人的研发团队。从产品框架的最初搭建到新功能的不断叠加,甚至包括内容生产端效率的提高,研发团队持续为快看提供着技术支持,并不断探索新技术与漫画行业的契合点。
快看漫画技术合伙人兼CTO李润超
2017年底,快看正式成立独立团队。这个不到10人的精锐小组由李润超亲自带队,开始围绕算法推荐展开实验。这不是一件容易的事,或者说是极为困难的。尽管算法分发已经在资讯和短视频领域被熟练应用,但长内容有着迥然不同的特性,也几乎没有公司拥有可供参考的经验机制。甚至,快看在短内容的分发上都是缺乏经验的。
长达一年多的反复实验和不断修正下,快看逐渐探索出一套基于漫画内容特性和平台用户属性的标签体系,并以此为基础,在多个场景进行内容的个性化推荐。新的算法推荐机制已经对内容分发产生了较为明显的加持。李润超表示,个性化推荐的点击转化率提升了150%,部分提升了300%。
李润超在两年前的判断同样得到了验证。流量红利消失,内容数量过载,“大分发”时代正在加速到来。免费阅读重启了网文平台停滞已久的移动互联网改造,爱奇艺试图探索长短内容结合的信息流推荐,在以智能音箱为代表的硬件场景中,算法分发的应用可能更加底层。
对于快看而言,压力还来源于资本市场对动漫行业整体价值的重估,它必须突破内容公司的限制,在更多维度证明其作为独立平台的价值。
一个新的节点已经出现。就在今天,快看宣布总用户数突破2亿,月活超过4000万。快看有可能也有必要对用户进行更高效的运营和价值转化,算法分发正是其中最重要的切入点之一。今年4月的一场面向合作伙伴的小型酒会上,陈安妮表示算法分发将成为快看2019年的重要方向,并将基于此上线新版本。
“我们已经完成了测试,看到了效果。”李润超表示快看在长内容算法分发上已经进入实际应用阶段,“这也是大势所趋,谁不做谁落后,是重中之重。”
01 | 漫画怎么做算法分发
算法推荐在底层逻辑上是相通的。通过标签系统的拆解,帮助AI理解复杂内容和用户具体偏好,再实现二者精准匹配。在信息含量较为简单的资讯和短视频领域,算法推荐已经被成熟应用。
但漫画有其特殊性。从内容数量来说,和拥有海量内容的资讯和短视频相比,有着更高创作门槛和内容要求的漫画在总数量和更新频率上都十分有限。在快看面向全网的数据统计中,目前全网的漫画总量在20万部左右,而快看平台上的漫画则仅有3000多部。
这也带来了用户维度的不同。短内容分发的本质是对海量内容的快速筛选,但漫画没有足够体量的内容实现源源不断的供给。与此同时,在阅读场景上,长内容的阅读是长时间和沉浸式的,甚至带有连贯性。这种特性也意味着用户对单个内容的选择成本是更高的,对推荐精准度的要求也相应提高。
李润超更愿意用“劝荐”来描述这个过程,不是“源源不断地给”,而是“找到用户此时此刻最想看到的内容”。
“过去一年的大部分精力都在摸索这件事。”李润超对《三声》说。
首先是一个基于漫画内容形式和特点的标签体系的建立。短内容的量级大,每个内容的信息含量单一,这使得短内容的标签体系往往是越多越好,“尽可能最大程度去挖掘涉及到的点”。
这点并不适用于漫画标签。“漫画内容比较稀少,标签不是越多越好,而是要越准越好,同时要有不同的视角。”李润超说。内容的复杂性意味着标签的挖掘不能完全依赖于机器,而是需要大量专业内容编辑的加入。
“用哪些维度去刻画一部作品,每部作品要打哪些标签,都需要依赖最专业的人。”过去一年,快看的内容运营部门和李润超的团队保持着紧密的合作,深度参与到标签体系的制定中。创始人陈安妮是漫画作者出身,这让快看有着浓厚的内容基因,并以擅于持续发掘推出爆款闻名。尽管算法分发更多基于技术运用,但快看的核心内容壁垒依然在标签体系的制定中得到了延续。
目前,快看已经形成了一个拥有几十上百个维度的专业化标签体系。这个体系的核心标签由专业内容团队完成。此外,通过面向全网搜集作品数据,以及识别弹幕、评论等用户内容生态,快看对已有词库进行着持续更新和补充。“我们希望最后能做到,拿出一个作品的标签我就能猜出它大概是一个什么样的作品。”
对精准度的要求不仅仅是向用户成功推荐了3000部作品中的一部。对于需要长时间、连贯性阅读的漫画而言,还包括精准匹配不同场景下的具体阅读需求。“在不同的时间,用户是想看一部新作品,还是想继续追更,还是想回顾已经看过的。”
“这需要对内容有深刻理解。”李润超说,基于这种理解对内容进行进一步的拆分和细化,进一步提高算法推荐的精准度。比如,对不同的作品封面、章节、甚至是文案再次标注,提供更多推荐维度。此外,每隔一段时间,快看还会对作品进行整体性的标签更新,“不一定是具体的按每一话,但是我们会有更新机制兼顾到作品的变化趋势。”
过去一年,在首页智能排序、发现页面、猜你喜欢和小规模上线的独立产品等多个使用场景下,围绕800至1000部的作品池,快看不断进行个性化推荐的灰度测试。李润超表示,快看已经拥有一个成熟的AB实验平台,能够保证实验过程中流量的均匀分配和随时切换,并能通过多个指标检验实验效果。
“快看平台上已经有大量的综合性功能,我们的指标不仅涵盖了阅读领域的点击转化率、人均阅读次数等,在社区、商业化上也有不同的指标,我们会更关注实验对全局的影响是不是正向的。实验平台同时也关注局部指标,比如按钮颜色的优化会带来哪些改变。”李润超说。
新的算法推荐机制已经“做出效果”,并将在今年离开实验层面,面向全平台用户进入应用阶段。
02 | 塑造独立平台价值
在资讯和短视频平台,算法分发的商业意义在于通过对流量的再分类和精细化运作,创造了更多广告分发场景。
但这并不完全适用于总内容体量有限的漫画平台。李润超表示,在漫画领域,算法分发的应用更多的价值在于让更多用户能够在漫画平台找到自己喜欢的作品。
“大家对快看的固有印象是以女性用户为主,包括我们的主要推荐作品也都是女性向的。”李润超说,“但实际上,快看上也有很多面向男性的,面向更高年龄群体的作品。”快看用户的性别比例也在变化,男性已经占到近四成。
过去,对这种作品的发掘只能依靠用户自己,但去年开始,这些用户可以轻易地找到自己更喜欢的作品。
从作品角度出发,这意味着IP可以更快聚集起一批具有更高粘性的精准用户,缩短变现周期,更快实现商业价值。
与此同时,快看的总用户量已经突破2亿,这个数字几乎已经涵盖了以女性和一二线城市青少年为主的核心漫画受众。李润超认为,下一阶段,更高效的分发将会进一步拉高用户数量天花板,成为快看用户增长的新动力。尽管实际带来的广告收益是有限的,但是对总用户量的拉动也将间接带动平台整体广告收入。
2亿之后,快看的压力不仅仅来自整体流量封顶下的继续拉新。漫画行业的创作特点和大多数从业者的创作者背景意味着在行业和平台发展的初期,大量的资源和精力被用于内容的打造,核心的商业变现逻辑也围绕IP展开。
开发周期长、成功率有限且难以控制,IP的商业特性让资本和市场重估整个动漫行业,甚至是网络内容行业的价值。2018年,更多漫画平台正被整合到不同的文娱大体系中,成为IP孵化的具体环节。
PCG整合后,腾讯动漫的IP筛选和孵化功能被进一步明确;爱奇艺动漫被明确定义为IP源头之一;漫漫漫画被连尚文学收购,双方将就网文漫改展开更多合作。与此同时,更多平台正越过漫画平台对上游产能进行直接控制,比如阅文在不久前完成了对A4漫业的投资。
摆脱出版社和上游供应商身份,作为硕果仅存的独立漫画平台之一,内容之外,快看必须在用户留存、商业转化等更多方面证明其作为独立平台的价值。
2018年,在传统订阅之外,通过“彩蛋卡”等虚拟周片的上线,会员抢先看等新形式的推出,快看试图进一步带动用户付费,这其中也包括对AVG等轻量游戏的尝试。李润超表示,快看目前的付费率已经超越阅文,“我们的细节尝试非常多,去不断测试什么样的组合效率最高。”
在聚集超过2亿用户后,“社区”将成为新的重点。最早,快看的社区更接近于作者与粉丝的互动场景,在过去一年,包括同人、手账、配音等多个内容板块,快看着力强化用户间的联系,和社区的UGC内容属性。
技术将成为一切的底层。快看的研发团队计划在今年再翻一番,以推动在内容生产、分发和变现等多个维度效率的提高。
“内容生态是大方向,是前面的那个1,但是后面能加几个0,依靠的就是技术研发能力。如果不想沦为内容供给方,就一定要真正发挥互联网和技术产品的价值。”
以下为《三声》和快看漫画技术合伙人兼CTO李润超的部分对话整理:
三声:什么时候意识到我们需要做个性化推荐?
李润超:2017年。整个市场来看,用户的使用习惯已经发生变迁,移动互联网的产品思路也在转变。过去的产品思路是我帮用户分出各种各样的场景,教育用户在不同的场景做不同的操作。但是到了2017年,可以看到产品的场景融合,转向在一个场景下尽量满足用户的多元需求。这背后就是个性化推荐的不断推进,是行业变迁导致我们探索新的方向。另一方面是AI和人工智能在2017年已经相对成熟,漫画行业也要探索新的技术方向。
三声:长内容的智能分发和短内容有哪些区别?
李润超:从内容分发的视角来看,长内容的总量有限,没有短内容那么大的量级。资讯、短视频平台的体量是巨大的,往往在上百万,但漫画平台可能只有几千部。
从用户视角来说,短内容的消费是对内容的快速筛选,但长内容不是筛选,而是要找到此时此刻最想看的内容。此时此刻最想看的未必是新内容,也许是你一直在追的,这在体验上是很不同的。长内容的推荐不是推给你,更像是劝荐,不是源源不断的给,而是找到最合适的内容和方式,让你快速开始读。
三声:在具体标签和推荐制度的构建上会有哪些差异?
李润超:比如打标签,短内容由于量极大、内容单一,标签是希望越多越好,最大程度挖掘内容特征。但是长内容相对稀少,所以不是越多越好,而是要越准越好。同时,在视角上也是不同的,长内容的标签不能完全依赖于机器挖掘,而是需要大量人的参与。
和短内容相比,长内容的标签是更加专业化的。我们的标签体系依赖最专业的人去定义,我们需要从哪些维度刻画一部作品,每个纬度下面针对某个作品又应该打那些标签,这套专业标准定下来后,我们再给每个作品打标签。给作品打标签也同样需要找专业的,理解漫画的人。我们希望未来有一天,拿出一个作品的标签,仅仅凭借这80到100个标签,能够完整刻画一部作品。
三声:我们对于标签的制定和选择具体有哪些标准?
李润超:维度与维度之间有独立性,不覆盖,标签和标签之间有区分度,我们追求精准和完整的刻画作品,所以它的标签体系非常难做。产品研发规定了框架,但标签体系需要整个内容团队的参与。
长内容的标签有两层追求,一是我们希望标签多而精准,二是这些标签可能是很新的,我们需要发现一些新的标签不断补充。我们一直在做针对用户内容生产体系的识别,包括对评论、弹幕的识别等等,去做新词的挖掘。此外的话,在快看平台之外,我们也有外围的体系去做全网的数据整合,从中挑选标签。但是这些都是补充性和辅助性的体系,但我们主要还是以专业体系为主。
三声:以什么样的单位来打标签?标签更新节奏是什么样的?
李润超:每个作品上线之初会围绕整部作品打上标签,每一话更新过程中,我们也会提供新的机会去更新这套体系。这是一个动态的更新过程,包括我们还有一个机制,定期重新打一遍标签。作品的剧情走向很多可能是和开始的规划不是完全一致的,所以我们必须要有一个更新的机制,它不是按话打标签,而是兼顾到不同的变化趋势。
三声:怎么样提高算法对用户需求的深度理解?比如如何判断用户在不同的时间点到底想看什么样的内容?
李润超:这基于对平台特性和用户使用习惯的深度理解,过去一年很大的精力都在摸索这件事情。如果粗浅的看,被推选的作品池子可能只有几千部作品。但是如果你把这几千部作品细化拆分,比如配上100个不同的文案、10个不同的封面,每个封面和文案分别适合推给什么样的人,都是有标签的。这件事是可以越走越深的。就像我刚刚说的,更精准的描述是一种劝,关键是你怎么劝他。
三声:快看的内容团队一直擅长流量运营和爆款打造,应用算法分发后把流量分配权利交给技术,会不会有自废武功的感觉?
李润超:其实不会。个性化推荐的基础标签体制实际有我们整个编辑和运营团队的深度参与,在标签制定的过程中,包括内容的初期评价上,内容团队的经验和权重已经融入进去。每一次的推荐过程中,也会不断融入。只不过这种推荐更加个性化了,过去可能只是分了男版和女版,现在可能分出了更多的板块,在每个不同的板块我们都会推荐认为具有长期价值的作品。
三声:过去一年,快看如何进行算法分发实验?如何在有限的基础数据下达到比较好的推荐效果?
李润超:包括首页的智能排序、发现页面、还有面向小部分用户的独立版本,针对1000部左右的作品池,我们在四五个地方不断切入小流量测试。流量分配一般控制在5%到10%之间,如果效果不好,可能在10%的时候就停掉了。
快看有一套完整的AB测试平台,可以保证流量的快速切换和均匀分配。同时,作为一个拥有大量综合性功能的漫画平台,除了人均阅读次数、点击转化率等涵盖整个阅读领域的指标,还会参考社区和商业化多个方面的指标,对比每一个实验对全局的影响,保证它是绝对正向收益的。同时我们也会看局部指标,去优化不同的细节。比如按钮的颜色从红色变得蓝色,会不会影响点击效果。这些都保证了我们最终能做出效果。
三声:长内容的分发更依赖专业团队,走出实验进入应用层面,面向全平台作品和用户进行算法推荐,在平台体量不断增涨的情况下,怎样保证分发能力的持续匹配?
李润超:未来依然是要依赖于专业团队,只不过未必是我们内部的团队。事实上,不管长短公司,所有做个性化推荐的公司都有大量的人力投入在内容的审核审查上,因为机器的推荐一定是有瓶颈的,不可能真正做到对内容的深度理解。我们也研究过Netflix,他们也有专门的团队,是一群喜欢内容,懂内容的人,以兼职的形式完成。我们可能也会向这个方向发展,借助广大漫画爱好者的力量,但这件事的前提是你必须形成自己的标签体系。
三声:对于快看而言,智能分发在整体业务中的重要性是什么样的?
李润超:是非常重要的。我们的测试已经测完了,有了较为明显的效果。这也是大势所趋,是必须要做的,谁不做谁落后。当然也肯定不是我们全部的重点,不是说这一年只干这一件事就行了的,在产品研发上,我们还有很多重点。
三声:资本市场正在对IP和网络内容的价值进行重估,去年漫画平台也受到了比较大的影响,出现了一系列的整合和调整。下一个阶段,漫画平台怎样挣脱出版社模式和内容供应商身份,形成独立平台价值?
李润超:在早期,漫画平台对出版社模式的延续其实是出于上游产能的限制。因为这个行业的市场化程度没有那么好,所以需要编辑和作者的深度融合,帮助他们整体性地提高创作水平,这不是技术和产品能力决定的。
但在技术和产品研发上的投入一定是能够改变这个局面的一个重要方式。产品和技术最后驱动的是整个效率的提升,如果不在这一点上有所发挥,就和传统出版社没有任何区别。
内容供给、作者生态是大方向,是前面的那个1,但技术和产品能力决定了你后面能有几个0。快看是最早实现高清漫画的平台,通过数据收集分析反推策划、AI上色等方式也在探索技术手段对上游内容创作效率的提升。除了智能分发,去年也在不断探索平台的社区化和虚拟商品等新的变现方式。
对于漫画平台而言,今年的主要变化还是如何提高效率,不仅仅是分发效率,这个效率是多元的,只有真正能把效率做上去的企业,才能生存下来。
©三声原创内容 转载请联系授权
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司