近日,中国科学院合肥物质科学研究院健康所李海研究员团队基于健康人群样本,系统评估了言语声学特征在家用移动设备上的一致性,为推动远程语音评估的应用提供了重要的数据支持。相关研究成果发表在人类行为研究领域国际顶级期刊 Behavior Research Methods 上。
远程言语认知评估是一种新兴技术,可以通过互联网在居家环境或移动设备上分析语音以评估参与者的认知水平。此种方法便捷、简单、准确,有望应用于老年人认知评估或青少年心理健康测量等方面。为了得到可靠的评估结果,需要确保评估方法在不同设备或不同测量中具有较高的一致性(也称为可重复性)。目前尚缺乏针对远程场景中关于评估技术的跨设备和重复测量一致性的深入探讨。
为填补这一研究空白,研究团队选取了家庭环境中常见的四种消费级设备(包括录音笔、笔记本电脑、平板电脑和智能手机等),对言语声学特征的跨设备和重复测量一致性进行了详细分析。研究结果显示,频率相关特征(如基础频率和倒谱峰突出)在设备间和重复测量中具有较高的可靠性,因此更适合应用于远程评估场景。相较之下,音节分割类的复杂特征(如音节速率和规律性)的可靠性相对较低。
研究进一步强调,需要制定标准化的数据采集、分析方法来提高远程言语认知评估的可靠性,同时建议通过改进算法,提高消费级设备在测量复杂声学特征时的抗噪能力。这些发现为优化远程语音评估技术、促进其在各种评估场景中(如:老年人认知评估、青少年心理健康测量等)的应用提供了重要指导。
该论文的第一作者为健康所2022级硕士研究生胡子安和2020级博士研究生张政霖,通讯作者是李海研究员和杨立状副研究员。本研究得到了国家自然科学基金、安徽省自然科学基金和安徽省重点研发项目的支持。
文章链接:https://link.springer.com/article/10.3758/s13428-024-02584-0
远程评估场景中声学特征的跨设备一致性水平