跳转到主要内容

北卡罗莱纳州研究推进语音安全技术

大多数人都熟悉通过扫描一个人的手印或眼睛来识别身份的安全技术。现在,部分得益于北卡罗来纳州立大学(North Carolina State University)的一项研究,我们离通过测试声音来确认身份的实用技术更近了一步。

北卡罗来纳州立大学计算机科学教授罗伯特·罗德曼博士(Dr. Robert Rodman)是一篇有关该课题的新论文的合著者。“声音的声学参数受到声道形状的影响,而不同的人有不同的声道,”罗德曼解释说。“这项新研究将有助于提高语音认证的速度,同时不牺牲准确性。”

罗德曼解释说,语音认证在这个安全性和移动电子产品都得到加强的时代有很多应用。罗德曼说:“这种技术的潜在用户包括政府、金融、医疗保健和电信行业,应用范围从防止身份盗窃和诈骗到数据保护。”

目前的计算机模型用于比较声音轮廓,有效地评估说话者的身份,可能需要几秒钟或更多的时间来处理信息,这对于该技术获得广泛接受来说还是太长了。Rodman说:“为了让这项技术获得用户的青睐,需要在不增加错误率的情况下提高响应时间。”

为了解决这个问题,罗德曼和他的同事们修改了现有的计算机模型,以简化认证过程,使其更有效地运行。罗德曼说:“这是语音认证软件发展的一部分,它让我们离使这项技术成为实用、安全的工具更近了一步。”

该研究的合著者是北卡罗来纳州立大学的罗德曼;芬兰Joensuu大学的Rahim Saeidi, Tomi Kinnunen和Pasi Franti;以及伊朗教育、文化和研究学术中心的哈米德·礼萨·萨德格·穆罕默迪。

这项名为“联合帧和高斯选择的文本独立说话人验证”的研究将于3月14-19日在达拉斯举行的国际声学、语音和信号处理(ICASSP)会议上发表。这项研究部分由国际流动中心资助。

北卡罗来纳州立大学计算机科学系是该大学工程学院的一部分。

希普曼-

编辑:下面是演示摘要。

基于联合帧和高斯选择的文本独立说话人验证

作者:罗伯特·罗德曼,北卡罗来纳州立大学;Rahim Saeidi, Tomi Kinnunen和Pasi Franti, Joensuu大学;Hamid - Reza Sadegh Mohammadi,教育、文化和研究学术中心

提出了: 2010年3月14-19日,在达拉斯举行的声学、语音和信号处理国际会议上。

文摘:高斯选择是一种应用于GMM-UBM框架中加速分数计算的技术。我们最近介绍了一种新的高斯选择方法,称为排序GMM (SGMM)。SGMM利用通用背景模型均值向量的标量索引来实现对评分最高的高斯函数的快速搜索。在本文中,我们将该方法扩展为使用二维索引,从而实现了同时帧和高斯选择。我们在NIST 2002说话人识别评价语料库上的结果表明,1维和2维sgmm在帧抽取和时间跟踪方面都优于得分最高的高斯模型(高斯计算相对于GMM-UBM作为基线)。

留下一个响应

您的电子邮件地址将不会被公布。所有字段都是必需的。