- +1
钉钉魔法棒:提供AI创意,而非完整“作品”
作者:金旺
11月3日,钉钉官宣AI魔法棒功能正式上线。
作为阿里系接入大模型的一个重量级应用,钉钉AI魔法棒已经在钉钉聊天、文档、知识库、脑图、闪记、Teambition等17项产品、60+场景中开放测试。
我们近日就其中应用最多的聊天AI、文档AI进行了一系列应用测试,感受了一下阿里大模型具体在协同办公软件中的应用体验。
语意理解完整,有时也会“犯懒”
钉钉魔法棒是被直接作为一个功能模块嵌入到钉钉页面顶部,是实实在在以一个“魔法棒”的标识出现的,在正式上线后,钉钉魔法棒已经可以正常使用,不过,现在的钉钉AI魔法棒依然有明显的「邀请测试」标识。
由此可见,钉钉认为这一功能还需要继续进化。
作为通过大模型提供基础能力的产品,钉钉AI魔法棒首先是一个Chatbot。
在测试过程中,我们首先让它回答了哲学三问:你是谁?从哪里来?到哪里去?
面对这样一个看似简单的问题,钉钉魔法棒能够get到这三个问题的字面意思,并给出一个相对正确的标准答案。
进一步交流后,我们发现,钉钉魔法棒也有“犯懒”的时候,当你问它“钉钉这款软件怎么样”时,它会先给你一个简单的介绍,告诉你这是阿里旗下的企业协作平台,拥有打卡签到、审批、日志等一些功能。
但关于钉钉的更多功能介绍,则是会甩给你一份产品使用手册,让你自己查阅。
在一系列对话测试中,作为一个Chatbot,钉钉魔法棒已经有了不错的理解能力和应答能力,你可以让它帮你推荐几款好用的线上办公软件、也可以让它给你规划一个美国七日游的出行攻略,甚至可以让它就一些软件进行简单的功能对比。
优点是,钉钉魔法棒有问必答,而且大多数情况能够给出一些建议;缺点是,它目前给出的答案并不一定是最优解,也不一定会有多详细。
例如,钉钉魔法棒推荐的办公软件中,有一款软件是“航天易办公app”,我们并没有在安卓手机应用商城中找到这款软件,显然这款软件很难说是一款主流或好用的协作办公软件。
而在被问及“飞书是不是比钉钉更好用”时,钉钉魔法棒也会指出,“钉钉界面比飞书稍有繁琐,有一些广告和推销信息,如果用户注重简洁无广告,飞书确实更适合。”
作为测试版功能,钉钉也在生成的每个内容后增加了评价反馈极致,如果你对生成的内容不满意,可以直接给差评,并从“内容不匹配”、“内容不完整”、“表达不合逻辑”、“存在事实性误差”、“有敏感词或观点”五个选项中选出不满意的原因。
由于接入了通义万相,钉钉魔法棒也具备文生图功能,不过,这一功能在聊天AI功能中无法正常启用,需要手动切换到文档AI功能中再使用。
依然有幻觉,办公新助手
钉钉魔法棒的文档AI功能,有点像微软引入ChatGPT的word文档,可以提供一些文生文、文生图、文生表格等功能。
在文档AI中,当我们让钉钉魔法棒“为以大模型为主要讨论内容的年会做一个半天的活动策划”时,它会自动生成年会的各个环节设置,并就相应环节做出一两句话的简要介绍。
如果对生成的内容不满意,你可以通过“换一换”功能,让钉钉魔法棒根据这个需求重新生成一个策划。
根据半天活动需求,钉钉魔法棒原本生成了8个环节,而且生成的“主题演讲”和“主题论坛”环节上其实是重复的,除此以外,生成的其他内容与主题演讲内容加起来,已经远超出半天所能涵盖的内容。
因而,在文档AI中通过钉钉魔法棒生成的内容更多是为我们提供创意和思路,最终生成的内容在应用时还需要二次调整。
不过,为了测试钉钉魔法棒的AI能力,我们在此基础上也尝试让它“继续写”了三次,最终它给出了20个环节,但其中生成的部分环节多有重复,这也是当下生成式AI仍然存在的“幻觉”问题的体现。
除此以外,“文生文”功能中,还可以对生成的内容进行诸如润色内容、丰富内容、精简内容、改写语气等调整,这些功能对于学生写论文或员工做汇报,尤其是文案创作者在改文案时,甲方提出诸如改语气、丰富或精简内容明确需求时,会有一定帮助。
随后我们又让钉钉魔法棒“根据前面的大模型年会制作一张议程表格”(流程经调整),得到了如下图右侧的这张表格:
可以看到的,表格和流程并没有完全对齐,而且生成的是一整天的活动议程。
最后,我们还通过钉钉魔法棒为“大模型年会”生成了一张主题图片,从而完成了这次“大模型年会”的文案策划。
值得注意的是,钉钉为文档AI加入了一个特别的“排版美化”功能,通过这一功能,你可以直接为你的word文档套用钉钉事先制作好的几个模板,来对内容进行整体美化。
小结
整体测试下来,我们有以下几点感受:
1、钉钉魔法棒生成内容的逻辑性已经很不错,但对内容的理解能力,尤其是隐喻、比喻等更深层含义的理解能力依然需要继续优化;
2、AI大模型正在改变内容生产模式,新的内容生产模式中,我们更多需要考虑的是如何提供精准的提示词,让AI为你分担重复、繁琐的工作,例如拟一个年会流程、做一个简单的活动策划等;
3、现在AI生成的内容更多是为我们提供框架和灵感,还做不到一步到位,给你一个完整的作品,因而现在的AI更多是被定义为copilot。
对于大多数人来说,初次体验与AI合作会很吃力,不知道它的能力边界在哪里,也不知道如何让它为我们生成我们想要的内容,但AI终究是大势所趋,尽量将AI作为工具、融入工作中,是避免被AI代替最好的方式。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司