研究中心博士生关亚东、宋文杰参加ICASSP国际会议

发布时间:2024-04-26浏览次数:10

2024年4月,研究中心博士生关亚东、宋文杰2人出席了在韩国首尔举行的本领域两大顶级会议之一ICASSP,通过海报展示与口头宣读的形式展示研究成果。

ICASSP(International Conference on Acoustics, Speech and Signal Processing)即国际声学、语音与信号处理会议,是IEEE(电气与电子工程师协会)主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,在国际上享有盛誉并具有广泛的学术影响力。2024年度 ICASSP会议主题是“信号处理技术:迈向真正智能的基石”,旨在促进信号处理和机器学习之间的创造性协同作用。

以下为本次录用的两篇论文,研究主题包括声学事件检测和呼吸音识别。

1. Contrastive Loss based Frame-wise Feature Disentanglement for Polyphonic Sound Event Detection

工作简介:重叠的声学事件在现实环境中无处不在,但现有的声音事件检测(SED)方法仍然难以对其进行有效检测。一个关键的原因是这些方法均采用单一耦合的帧特征来表示多种事件,这种特征层面的信息耦合影响了特征判别性。为解决该问题,本文提出了解耦特征学习框架来学习将耦合的帧特征进行分离,从而为各事件类别得到相应的特征表示。首先,采用类别相关的投影变换来学习各类别事件的帧级特征;其次,为了去除特征中无关信息的影响,提出帧对比损失以最大化同一类别的帧特征之间的互信息。实验结果证明了该方法的有效性。

2. Modeling Quasi-Periodic Dependency via Self-Supervised Pre-Training for Respiratory Sound Classification

工作简介:尽管自监督学习在呼吸音识别领域取得了显著的性能提升,现有方法通常是将通用自监督学习框架直接套用到呼吸音识别任务中,没有考虑到呼吸音是一种准周期性信号,会在连续的呼吸周期中表现出重复的模式,而这种准周期性是呼吸音区别于其他如环境噪声等非准周期性信号的一种重要属性。因此,为增强模型对呼吸音内部准周期性结构的刻画能力,本文提出了一种基于周期增强的呼吸音自监督学习方法。对于输入呼吸音,本文首先将其划分为若干呼吸音片段并提取片段级特征表示,计算稀疏自相关矩阵以对其周期依赖关系予以表征。考虑到样本内部的周期依赖关系在短时间内不会发生明显改变,本文从输入样本中随机截取两段呼吸音记录,计算相应稀疏自相关矩阵,定义周期一致损失,约束二者稀疏自相关矩阵一致,以此增强模型对样本内部准周期性结构的捕捉能力。实验结果表明,所提出方法在呼吸音识别任务上,相比于通用自监督学习框架取得了显著的性能提升。