联系我们

自然语言处理

反应GIF为NLP中的情感识别提供了新的关键

mm

更新

 on

台湾的新研究正在提供一种新的方法自然语言处理(NLP)为了对社交媒体论坛和语言研究数据集进行情感分析 - 通过对文本公告发布发布的动画GIF进行分类和标记。

由台湾国家青花大学Boaz Shmueli领导的研究人员使用推特’S内置的反应数据库作为量化用户的情感状态的索引’响应,避免了协商多种语言响应的需要,挑战检测讽刺,或者从模糊或过度短暂的反应中识别核心情绪温度。

点击'GIF' button when composing a Twitter post offers a standard set of labeled animated GIFs that are easier for NLP to interpret than the potentially ambiguous use of plain-text language.

点击‘GIF’撰写Twitter后的按钮提供标准集标签的动画GIF,可能更容易解析为NLP‘identified’情绪比纯文本语言。

以这种方式表征使用反应GIF的使用‘一种新的标签,尚未在NLP情感数据集中使用’,并指出现有数据集使用尺寸模型情绪或情绪离散情绪模型既不是它都没有提供这种洞察力。

对用户帖子的动画GIF响应。随着现在在情感状态下编纂的Twitter提供的GIF,意图的模糊性就是在情绪分析方面消除。

对用户帖子的动画GIF响应。随着Twitter提供的GIF现已在情感状态下编纂,意图的模糊性就是换句话说。Source: //arxiv.org/pdf/2105.09967.pdf

研究人员发布了一个数据集包含GIF反应的30,000条讽刺推特。这种方法提供了NLP的区别’S来自其他目前的文献:一种区分的方法感知情感(情绪读者从文本中识别)诱发情感(一种感觉读者经历了对文本的反应)。

反应GIF作为还原指标

就对共享令人痛苦的情绪状态的帖子的支持响应而言,当在没有支持文本的情况下发布时,Apposite GIF是有用的减少和明确的意图(并且这些是学习集中的GIF反应的类型的类型)。

例如,诸如‘That’s brutal, man’, ‘That’s a shame’, 或者‘Awww’含有意图的潜在歧义,从一定的可能性‘clinical’而且没有受到讽刺的可能性;但发布了一个推特之一’s hundreds of ‘hug’-Category GIF让较少的解释空间留下:

钻入GIF反应的子均值

尽管如此,在任何单一类别的反应中,例如‘hug’,有许多其他的情绪或观点指标包含多种受影响状态的类型,包括响应者与原始海报之间关系的浪漫或家族假设的观点。

描绘Twitter中各种类型的关系's available 'hug'GIF类别。使用不同的类型,Tropes,性别描述和其他因素为这种情绪的GIF选择的潜在可解释性增加了粒度。

描绘Twitter中各种类型的关系’s available ‘hug’GIF类别。使用不同的类型,Tropes,性别描述和其他因素为这种情绪的GIF选择的潜在可解释性增加了粒度。

intervergif数据集是从Twitter上的每种可用反应类别中的前100个GIF导出,导致4300个动画图像的数据库。如果GIF出现在多个类别中,则GUI中放置较高的类别将加权更高。分配了多个类别中显示的图像反应相似之处因素 - 用于研究的指标。

然后使用分层聚类和平均联动发现亲和力。

增强反应GIF数据

通过将方法应用于30,000推文来生成并标记数据集。这‘丰富的情感信号‘反应类别允许研究人员使用额外的情感标签来增加数据集,基于正和负反应类别集群,并根据三个人的多数判决,使用专用反应的​​情感绘图模式添加情感标签样本推文上的评估员。

事先的工作来自雅虎和罗切斯特大学,这涉及GIF的注释,没有这一层引发文本,也没有任何反应类别,但纯粹是语义。

研究人员在四种方法中评估了数据集:罗伯塔, 这卷积神经网络(CNN)手套,逻辑回归分类器和一个简单的多数类分类器。每个类别的定罪重量非常清楚,结果很清楚,有批准,协议和诱惑最容易识别(以及最多代表),并且道歉最难以评估,也许这包括讽刺的可能性。

罗伯塔模型在所有三种评价方法中产生了最高测试的排名平均值,其包括情感反应预测,诱发的情绪预测和诱导的情感预测。

从反应GIF收集用户情感

研究人员观察到识别诱导的情感是基于NLP的情感和情感分析中最具挑战性的任务之一,并且使用反应GIF作为代理提供了稍后项目的可能性 ‘大量廉价,天然存在,高质量的情感标签’.

尽管集中在嵌入到Twitter用户体验中的GIF的非常特定的基因座,但该研究旨在概括到其他社交媒体平台以及即时消息平台,并且可能在情感识别和多式联运等扇区中使用情绪检测。

人气作为关键指数

这种方法似乎依赖于某一‘virality’对于每个GIF,例如当GIF实际上通过Twitter提供时’自己的机制。据推测,除了通过增加的流行度和采用作为MEME之外,新颖的用户生成的GIF无法进入这种生态结构。

反应GIF有复活指某东西的用途1987年’原始动画gif在过去十年中,在互联网v1预宽带时代的带宽猪(主要用于恼人的横幅广告)之后,在过去的十年中。