上次提到我离开阿里到快手,希望通过百亿级别短视频与文本,理解世界知识。目前团队的工作已经基本成熟, 跟大家在这里分享一下目前进展,也是团队投稿在机器之心的文章。
当前,越来越多的短视频用户不仅希望利用碎片化的时间来休闲娱乐,也开始希望能够在短视频平台中获取更多知识。2021年,快手泛知识内容播放量同比增长58.11%,平台全年有超过3300万场泛知识直播 [1]。为了更好地理解和组织泛知识视频,我们联合哈工大等提出业界首个多模态短视频百科——快知(Kuaipedia):通过多模态和知识图谱技术从海量短视频中挖掘大规模高质量的知识视频,并将其结构化,形成体系化的短视频百科知识库,为用户提供更好的知识获取体验,同时激发创作者创造优质知识内容,构建良性的知识分享生态。
我们从快手海量短视频中挖掘出亿级别知识类视频,并对其进行了结构化,构建了千万级词条和知识点视频百科体系。快知(Kuaipedia)的提出有助于学界推动AI通过多模态信息理解世界知识,且在产业界落地有较大想象空间。
“快知(Kuaipedia)”内部Demo
百科全书(Encyclopedia),可以追溯到古希腊和罗马,也是17-18世纪法国启蒙运动的一个杰出的成果。知识百科通常是指一个是概要介绍人类全部知识或某一特定领域或学科的工具书或纲要,在互联网急速发展的当下,网络百科成为知识新的载体,如维基百科、百度百科等。但这些百科通常以图文、表格为载体,比较难以表达一些需要生动演示的知识,比如教程(How-to)类知识。图一展示了使用图文讲述 “柴犬”-“怎么画” 这一知识的困境。而通过短视频,我们能够很好地对这些知识进行一个阐释和学习,具体视频见https://www.gifshow.com/fw/photo/3xhcmzgr9fq492m。
图文在how-to类知识上知识传递的困境,图文来自帧截图
随着内容行业和媒体形态的不断迭代,短视频已经越来越成为知识传播者的主要媒介,尤其是在一些技能和特长类的知识传播,天然就有它的一些优势。而在当下,尽管有公开的网络百科中有视频的内容,但通常是偏简介形式(如秒懂百科),没有将短视频最大程度的进行利用,因此短视频在知识百科中的表达能力被严重低估。比如当人们讲到“柴犬”,人们除了“简介” 以外,还关注“怎么挑”、“怎么梳毛”、“怎么纠正护食”等。因此我们认为将知识类的短视频结构化,构成结构化的短视频百科是一条理解世界知识、帮助人类以更高效率传播知识的有效途径。
参考国家标准 [2] ,我们将事实(What)、原理(Why)类知识归结为科普知识,技能(How)类归结为教程知识,在快手海量的视频中挖掘出高质的知识视频。此外,我们将短视频中抽取的知识主体以词条形式呈现(如柴犬),并抽取视频中讲解的该词条具体的知识点(如柴犬-挑选、柴犬-护食纠正等),最终构成了一个短视频的百科知识体系,如图二所示。
快知——多模态短视频百科概览
快知(Kuaipedia)的提出有以下几个贡献:
为了实现上述的短视频百科结构化,核心技术包括以下三个主要步骤,如图三所示。
快知构建技术链路
通过大量详实的人工评测,快知所挖掘的知识点与视频已具备较高的准确率和质量。更详细的算法和实验数据具体参见论文或者我们的Github主页(见文章开头)。
首先,“快知(Kuaipedia)”这样的多模态短视频百科体系,在学术界对于推动AI理解世界知识的技术发展有极大的潜力。一方面,快知突破图文和表格的局限,通过更丰富的知识点和短视频来描述某一个实体或者概念,这种方式能够推动多模态知识图谱技术的发展。另一方面,这些知识点和短视频有助于AI更好地理解世界知识,尤其是一些图文难表述的 How-to 类知识,这种多模态知识能够增强AI对世界的理解,对KG、NLP、CV等领域的下游应用都很有帮助。我们在CCKS实体链指的任务上,证明“快知”多模态知识的简单引入就能有效提升BERT在实体链接和在实体分类上的性能。
此外,“快知”在产业落地极具想象力,在短视频生态向“泛知识”拓展的过程中,现有的形式约束了其传播方式,快知通过结构化的内容,能提升平台的运营和分发效率,更好地满足用户的求知诉求。我们将该项技术首先在健康垂类进行了落地尝试,快手健康团队此前以病种为组织维度,纯人工挖掘了一批优质PUGC内容,但是存在疾病知识体系不完善、权威性知识视频量级小等痛点,难以高效率构建完整、大规模、结构化的疾病视频体系。利用“快知”的技术后,自动化地挖掘出了一批高质量、有快手特色的知识点和知识视频,丰富了疾病类内容,比纯人工构建提效几十倍。目前这批内容已经在快手App精选页上线:点击精选视频流中某个疾病类视频的「底部通栏」,唤起「快手健康」半屏页,用户可以消费该视频所属词条下的相关知识点和相关知识视频,如图四所示。
图四:快知在健康场景落地
除健康外,“快知”还覆蓋了教育、美食、三农、亲子、法律、科技、金融等众多领域的知识内容,有着较大的应用潜力。
面对泛知识类内容在短视频行业的发展前景,我们提出了“快知(Kuaipedia)”多模态短视频百科体系,从存量的海量短视频内容入手,通过多模态知识图谱构建技术挖掘出亿级别高质量的知识视频,并将知识内容结构化,构建业界首个大规模体系化的短视频百科知识库,其在学术界和产业界有较大的潜力和想象空间。
[1] 快手,2022快手泛知识内容生态报告.
[2] 国家标准委:知识管理框架,GB/T 23703.
“快知(Kuaipedia)“是一个很有意思也很有潜力的工作,我很庆幸能够在这个短视频蓬勃发展的时代能够做这么一个项目。后续我也会持续推动“快知”的开放,目前想看更多demo case可以直接联系我,如果对这块有好奇的同学多的话也可以考虑开个直播。对这个项目有兴趣且长期看好的朋友,欢迎star一下我们的Github主页,后续进展会更新在里面。
如何让机器理解世界知识,是一个非常大的课题,从我研究生期间与小伙伴们在港科研究大规模事件图谱ASER开始,都一直在思考。最近这一年我通过“快知”这个项目,看了上千个短视频,也有了一些新的思考,后续可能单独整合在一篇文章里讲述一下。
下一篇