特征学习是深度学习中的用语 , 与机器学习中用于降维的特征工程不一样 , 是主动寻找隐藏特征 , 深度学习由多层网络构成 , 每一层学习一个特征 。 如CNN中通过卷积运算和池化方法构成的一层人工神经元集合中 , 通过前馈方法就能学习出图像、语言、文本的一个特征 。 基于深度学习方法获得特征都是完全自动实现的 。
多策略混合方法在获得特征的时候 , 利用情感词抽取、特征学习和特征工程三种方法中的一种或多种 。
Step 04
使用模型进行情感分类
基于情感词典与规则的方法 。 该方法主要依赖于情感词典的构建 , 是指利用情感词典获取文档中情感词的情感值 , 再通过加权计算确定文档的整体情感倾向 。 使用此方法时不考虑词语之间的联系 , 词语的情感值不会随着应用领域和上下文的变化而变化 , 因此需要针对特定领域建立相关的情感词典提高分类的准确率 。 情感词典是情感分析系统的基础知识库 , 是数字、文本与符号的集合 。 在缺乏大量训练数据集的情况下 , 基于词典与规则的方法相对能取得较好的分类结果且易于理解 , 但是网络用语不断涌现 , 情感词典需要不断更新扩展以提高分类的准确率 。
基于机器学习的方法 , 是以带有情感标签的数据训练出一个情感分类器 , 再利用分类器预测测试集中文本的情感倾向 , 常用的浅层机器学习分类算法有最大熵、朴素贝叶斯和支持向量机(SVM)等 。
与情感词典的方法相比 , 机器学习方法更简单 , 能取得更高的分类准确度 , 但是机器学习是一个监督学习方法 , 需要对数据集进行三类情感的类别标注 。 大规模高质量的数据标注耗费极高的人工成本 , 人为主观的数据标注结果准确和一致性也不易保证 , 而模型参数的训练完全依赖数据集类标的准确性 , 因此成本压力和大量数据过载情况下都会影响其可靠和可实现性 。
基于深度学习的方法 。 深度学习DL(DeepLearning)是指通过多层神经网络拟合训练样本分布的一种机器学习方法 , 它缓解了传统神经网络算法在训练多层神经网络时出现的局部最优问题 , 且其训练过程不依赖于样本标签信息 。
在情感分析的深度学习方法中 , 常常看到注意力机制 , 如CNN+注意力机制等 。 注意力机制是一种类似人脑的注意力分配机制 , 它对重要的区域投入更多的资源 , 以获取更多的细节 , 对无用的信息则进行抑制 , AI领域的从业者把这种机制引入到一些模型里 , 并取得了成功 。
与基于情感词典与机器学习的方法相比 , 深度学习有更强的表达能力和模型泛化能力 , 但是缺乏大规模的训练数据也是深度学习在情感分类中遇到的问题 。
多策略混合的方法 , 相较于单一模型 , 将领域新词或构建的主题情感词典与机器学习、深度学习模型相结合 , 可以提高情感倾向性分析的准确率 。 多策略混合的方法一般分析问题更为全面和深入 , 具有一定优势 , 但是多策略混合方法的模型复杂度与训练难度更高 , 比单一模型更难以实现 。
针对不同情感反应有效进行舆情处置
现阶段 , 舆情事件不同情感分布主要分为三种情形 , 分别有不同的处理方法 。一是敏感跟帖所占比重很高 , 说明负面观点比较多 , 涉事主体需尽快采取处置措施避免事态扩大 。二是正面跟帖比重高 , 则可以设法延长舆情周期 , 提升宣传效果 。三是中性跟帖比较多 , 涉事主体则需考虑在巩固中性情感底盘的同时 , 如何进一步“提正抑负” 。 对于以上三种状态提出了基本的应对策略 。 但是实际舆情应对工作中 , 处理起来更为复杂 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
