情感语音转换技术研究取得新进展

11

科技日报呼和浩特8月23日电 (记者张景阳 通讯员胡红波)记者23日从内蒙古大学计算机学院获悉,该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作,在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”的最新研究成果。

据介绍,情感语音转换(VC)旨在将中性语音转换为情感声音,同时保留语言信息和说话者的身份。科研团队注意到,将情感特征与其他语音信息(例如内容、说话者身份等)解耦是实现高质量转换效果的关键。由于情感语音中声学特征的解耦更加复杂,面向中性语音的特征解耦一直无法得到很好的处理。

科研团队针对情感语音转换的声学特征解耦问题开展研究,提出了一种基于“源—滤波器”模型的情感语音转换系统,具体来说,是为了解决情感语音转换的特征解耦问题而提出一种新颖的基于“源—滤波器”模型的情感VC模型(简称SFEVC),以从音色和音调特征中准确过滤说话人独立的情感线索。SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成。所有编码器模块都采用信息瓶颈自动编码器。

为了进一步提高各种情绪的转化质量,研究团队还提出了基于二维VA(激活度—效价)空间的训练策略。实验结果表明,SFEVC模型以及VA训练策略的表现均优于所有基线系统,并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。 【编辑:叶攀】

北京66个新建公园十一前开放

天津出台“2.0升级版”政策推动天开高教科创园高质量发展

四川茂县黑虎镇副镇长周坤军在抢险救灾中因公牺牲

2025中国(瑞昌)国际羽毛球大师赛收官

全球最大“人造太阳”项目磁体支撑系统完成交付

西汉帝陵精品文物首次集结亮相

二十国集团阿富汗问题领导人特别峰会以视频方式举行

浙江来料加工花开汶川:从“在家待业”到“朝九晚五”

世界女排联赛中国队三连胜 年轻阵容依旧值得信任

云南发布四条博物馆主题研学游径

中国市场监管部门曝光五起侵犯商业秘密不正当竞争典型案例

(新春见闻)北京中轴线上的“洋面孔”

豫晋交界处发生森林火情 河南140户村民转移无伤亡

因澳疫情蔓延 新西兰暂停澳新“旅行泡泡”两个月

怎样看前4月金融数据变化(经济聚焦)

文章版权声明:除非注明,否则均为群微小程序原创文章,转载或复制请以超链接形式并注明出处。