摘要: 来自格罗宁根大学的一群研究人员宣布,他们建立了一个AI模型,该模型能够在电视情景喜剧和其他类型的内容中检测到视频片段中的讽刺。
荷兰大学研究人员开发出能识别讽刺的人工智能平台
荷兰的一支大学研究团队表示,他们已经开发出一种人工智能(AI)平台,可以识别讽刺,根据一份新报告。
《卫报》周四报道称,研究成果在加拿大渥太华举行的美国声学学会和加拿大声学协会会议上展示。在活动中,博士生高希远表示,研究团队使用了来自美国情景喜剧如《老友记》和《生活大爆炸》的视频片段以及其他文本和音频内容来训练一个神经网络。
他们的工作利用了一个名为多模态讽刺检测数据集(MUStARD)的数据库,该数据库由美国和新加坡的另一个研究团队注释,标记了给定内容中是否存在讽刺,作为构建他们自己的讽刺检测器的一部分。
研究人员表示,他们在数据上训练了他们的AI模型后,能够在研究人员未标记的对话中准确识别讽刺的情况达到了近75%的准确率。他们补充说,实验室后续使用合成数据的工作进一步提高了准确性水平,尽管这些研究结果尚未发表。
在用于训练AI模型的数据库中的内容中,有一幕来自《生活大爆炸》,谢尔顿观察他的朋友和室友莱纳德试图逃离一个上锁的房间的情景,以及一幕来自《老友记》,展示了钱德勒、乔伊、罗斯和瑞秋不情愿地组装家具。
格罗宁根大学语音技术实验室的研究员马特·科勒告诉媒体:“我们能够可靠地识别讽刺,我们渴望扩大这一能力。我们想看看我们能推动到什么程度。”
研究项目的另一名成员谢卡尔·纳亚克表示,团队的方法和发现可以帮助AI助手更容易地与人类讲话者互动,通过检测讲话者声音中的消极或敌意情绪。
高希远指出,将视觉线索纳入AI工具的训练数据中,可以使其更有能力检测通过面部表情如挑眉或嘲笑传达的讽刺。
格罗宁根大学研究团队对基于AI的讽刺检测的兴趣,以及编制讽刺注释MUStARD内容数据库的研究人员,都是近年来美国国防部进行的类似研究的延续。
五角大楼的国防高级研究计划局(DARPA)和来自中佛罗里达大学的研究人员利用DARPA的SocialSim计划开发了一种能够分类文本(如社交媒体帖子或短信)是否含有讽刺的AI模型。
DARPA在2021年写道:“该团队通过在社交网络平台和在线媒体的多个数据集上取得了最新成果,证明了他们方法的有效性。该模型能够成功预测讽刺,在主要的Twitter基准数据集上实现了几乎完美的讽刺检测分数,以及在其他四个重要数据集上取得了最新的成果。”
“准确检测文本中的讽刺只是开发这些模拟能力的一小部分,由于人类沟通中使用的语言技巧非常复杂和多样化。然而,知道何时使用讽刺对于教会模型人类沟通是什么样子,以及随后模拟未来的在线内容非常有价值。”