语音情感识别的PCA特征选择方法的研究开题报告

 2022-11-24 20:14:40

1. 研究目的与意义

随着人工智能技术的飞速发展,人们已经不仅仅满足于计算机能够播放多媒体信息,而更希望它能够拥有感知人们情感的能力。因此,针对语音情感计算的研究日益被人们所重视。

语音之所以能够表达情感,是因为其中包含能体现情感特征的参数。研究认为,某种特定的情感状态所引起的语音参数变化在不同的人之间是大致相同的,仅有微小差别。因而,情感的变化能够通过语音的特征参数来反映,研究从语音中提取这些情感参数就显得非常重要。通常认为情绪所引起的生理上的变化会对语音带来直接的影响,而与人的生理唤醒程度相关的特征参数(声学参数如音强,平均基音,语速等)能够更好地反映语音中的情感,如恐惧和生气所引起的生理颤动会带来相应的基频摆动;不高兴会导致声道的紧张从而引起语音信号频谱发生变化。另外,语音情感识别中采用的识别方法也会对结构产生影响。目前,关于情感信息处理的研究正处于不断深入之中,而其中语音信号中的情感信息处理的研究正越来越受到人们的重视,如美国,日本,欧洲,韩国等许多国家的一些研究单位都在进行情感语音处理研究工作。

2. 课题关键问题和重难点

1.如何进行全局统计特征提取?由于不同的全局统计特征的数值分布范围存在较大的差异,如何对全局统计特征进行归一化处理,使得它们能够大致分布在同一个区间内。

2.如何确定合理的主成分个数?如何根据主成分数目随累积方差贡献率变化的情况,选择合适的阈值,确定需要保留的主成分数目,最终确定变换后得到的特征子集。

3.如何确定特征子集?对于情感语音数据库,如何使得数据库得到针对各自数据库最终选择的特征子集。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

(1)关于语音情感识别的发展

从文献[1]可知:近年来,研究者们就语音情感识别做了大量研究。韩文静等从情感描述模型、情感语音数据库、特征提取和识别算法4个角度总结了2014年为止的语音情感识别的研究进展,并重点分析SVM、GMM等传统机器学习算法对离散情感的分类效果。随着深度学习技术逐步完善,在海量复杂数据建模上有很大优势,多用于解决数据分类。同时,部分研究者将其应用于语音特征的提取,取得了一定的成果。2018年,刘振焘等介绍了语音情感特征提取和降维的方法,其中,重点描述了基于 BN-DBN、CNN等深度学习方法的语音特征提取相关研究。

(2)关于语音情感识别的各类方法

在文献[2]为解决小样本下语音情感识别准确度低的问题,提出一种生成对抗网络模型下的小样本语音情感识别方法。使用生成器和判别器对抗训练学习样本特征,利用生成器生成高质量的模拟样本以扩充数据集.迁移判别器参数到情感识别网络,加快网络训练速度;连接长短时记忆网络(LSTM),进一步提取时序情感特征,提高情感识别率;选用德语语音库(EMODB)的535条语音样本进行训练、测试,其结果表明,与传统的语音情感识别方法、卷积神经网络(CNN)、CNNLSTM相比,该方法将语音情感识别率提高了4.54%-25.31%,验证了该方法的有效性。在文献[3]中采用了深度神经网络的语音情感识别方法。提出了一种结合CNN与LSTM的语音情感分类模型。使得在数据集上的测试表现出较强的识别功能,能够有效地识别出语音中的情感类型。在构建模型的同时,与传统的CNN,LSTM通过对精度和损失值进行对比,可以发现LCNN拥有更高的准确性。

在文献[4]为了构建高效的语音情感识别模型,提出一种利用浅层学习和深度学习优势的决策融合方法。浅层学习为传统的语音情感识别方法,即人工统计特征提取及识别;深度学习采用 PCANET网络实现特征提取过程,将携带情感信息的语谱图作为网络输入。将浅层学习特征和深度学习特征分别输入到SVM模型进行分类,并采用差异性投票机制实现决策层融合。实验结果表明,该方法的识别率在自己录制的库和柏林数据库上取得明显提高,与代表性的方法相比优势明显。在文献[5]中选取了EMR数据库和柏林情感语音数据库进行了PCA变换,将其进行变换域特征处理,训练和识别,通过识别率曲线确定识别率曲线的拐点,经过变换后的主成分个数m得出变换矩阵,计算原始特征权重,在原始特征按权重降序排列,通过取排序前m个变量的下标最终得到特征选择结果。将实验结果和使用原始特征集合的识别结果进行了比较,可得其对不同识别器性能差异不大。在文献[6]中提出了一种特征融合的方法,本文通过选取3个数据集上具有最好表现的声学特征:MFCC,基音频率,共振峰进行融合然后再与3种算法在3个数据集上进行情感识别,在与其单独的进行比较。第二个实验中随机选取3个特征进行融合并在3个数据集上进行情感识别,最后进行比较。从这实验中标明了该方法保留了不同特征优点,较好的实现了不同分类方式留下的稳定识别。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

设计方案:

采用PCA方法对原始特征进行降维,选择变换权重较大的特征构成最终选择的特征子集。以识别率为准则,考查不同累积方差贡献率对语音情感识别精度的影响。根据累积方差贡献率与主成分个数的关系,确定主成分数目和变化矩阵:根据主成分数目随累积方差贡献率变化的情况,确定1组主成分数目集合,以上一步确定的主成分数目集合为目标,对原始数据分别做PCA变化,得到1组变化后的特征集合和1组变换矩阵集合,根据训练和识别,得到1组识别率,然后描绘识别率曲线,确定识别率的饱和点,根据累积方差贡献率得到识别率最高点对应的主成分数目和变换矩阵,最后根据变换矩阵计算原始特征在变换时各自的权重,将权重按照降序排列,得到原始特征重要性的排列。

5. 工作计划

第1周:接受任务书,领会课题含义,按要求查找相关资料;

第2周:阅读相关资料,理解有关内容;

第3周:翻译相关英文资料,提出拟完成本课题的方案,写出相关开题报告一份;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。