首页
杂志网
当前位置:首页>>智能科学技术>声纹检验技术现状与发展评析>正文

声纹检验技术现状与发展评析

来源:杂志发表网时间:2020-01-03 所属栏目:智能科学技术

  

  摘要: 本文对声纹检验技术进行了简要介绍。从声纹和声纹检验的概念出发,梳理了声纹检验技术的发展脉络,介绍了声纹检验的内容,并对领域内的“录音真实性检验”和“语音识别”两个问题进行简单分析,以期引起相关学者的共鸣,共同为声纹检验的发展而努力。

  关键词: 语音; 声纹检验; 说话人识别

声纹检验技术现状与发展评析

  1 声纹与声纹检验

  声纹,原指通过声谱仪显示的作为诉讼证据的声音图谱,现指 作 为 诉 讼 证 据 的 声 音 特 征 的 集 合。在 国 际 上 称 其 “Voiceprint”,在我国刑事技术领域则比照指纹,形象的将其称为声纹。从另一方面来说,声音是由人的发声器官在大脑语言中枢的指挥下发出的,成年人的声纹同指纹、足迹等其他生物特征一样,具有人各不同的特定性和相对稳定性,故亦可将其归为人体痕迹的一种,称之为“声痕”。声纹检验,泛指有关声音的所有检验鉴定技术。具体包括语音真实性( 完整性) 检验、言语内容听辨、语音信号增强、降噪处理、语音人身分析、说话人鉴定等[1]。

  2 声纹检验的产生与发展

  未见其人,先闻其声。这是我国文学四大名著《红楼梦》里的一句描述,可见,用声音来判断人的身份这种做法古已有之。正常人成年之后,其声音便会长期稳定,基本不变,同其他生物特征一样具有相对稳定性和特定性,可以用以个体识别。语音鉴别技术的应用历史悠久,可以追溯到十五世纪,但现代声纹检验技术的发展则开始于声谱仪( 能够将声音转化为可视图像的仪器) 发明之后。虽利用声音来进行个体识别古已有之,但那多停留在个人主观听觉上的辨认,在注重客观证据的现代社会,个人主观感受在审判过程中很难作为证据,这使得声音这一生物特征很难在审判中发挥其应有的作用。

  2. 1 国际声纹检验的发展

  二战期间,为满足战争的需要,美国贝尔实验室( Alcatel - Lucent Bell Labs) 接受政府委托,在 L. G Kersta 的主持下率先展开了对声纹的研究,并有了早期的动态声波分析仪,即我们现在所称的声谱仪( 或称语图仪) 。20 世纪 50 年代后期,战后美国经济迅猛发展,通信技术进展迅速,电话这一现代通讯工具进入了寻常百姓家,给生活带来方便的同时,利用电话进行犯罪的案件也越来越多。此类案件不同于其他案件,缺少常规的犯罪现场,留给警方的线索也只有电话录音,这让美国警方大感头痛。而警方则转向求助于贝尔实验室,希望能提供说话人识别方面的支持,因此,战后搁置的声纹研究作为司法鉴定领域的一项专业技术重新登上了历史舞台。 1963 年,日本警察研究所开始研究声纹检验,并成功地利用声纹相关知识协助了幼童吉展被拐骗案的侦破。1966 年,Kersta 利用声谱仪成功地完成了一桩悬案的声纹检验。1976 年,美国国家科学院声谱委员会发表了《嗓音鉴别的理论与实践》报告,表明了“嗓音鉴别”的精度极高,误差仅为 1% ~ 2% ,可作为一项科学的成熟技术。随后世界各国相继展开了声纹检验的研究工作,并越来越多的将其作为证据在法庭上被采信。其中最著名的案件当属菲律宾前反对党领袖阿基诺被杀案[2]。

  2. 2 国内声纹检验的发展我国的声纹检验研究工作起步相对较晚,这是与我国社会生产力发展状况紧密相关的。建国初期,我国社会生产力水平相对低下,通信事业欠发达,通讯设备架设不完善,给犯罪分子加以利用的机会也相对较少。1978 年底,我国实施了改革开放,引进了大量先进技术,极大地解放了社会生产力。80 年代后期,社会生产力的解放带来了经济的腾飞,通讯事业随之蓬勃发展,而移动通信也乘着改革开放的浪潮迅速崛起。国民生活水平提高,各式各样的公用或私人电话迅速普及,这为生活带来便利的同时也给了犯罪分子以可乘之机。

  3 声纹检验的对象和内容

  3. 1 声纹检验的对象声纹检验针对的对象是指案件中发现的能够证明案件事实或与案件有关的一切音频资料( 包括各类录音设备或存储设备中存储的音频资料以及视频录像中的音频) 。自 1989 年起,我国就将“视听资料”作为证据写入《中华人民共和国刑事诉讼法》,这从法律上规定了声纹检验的客体 - - 音频资料( 属视听资料的一种) 作为证据的合法性。

  3. 2 声纹检验的内容在视听资料作为证据使用有争议时,当进行鉴定。侦查过程中缺少线索,只有有限的音频资料时 ,应进行鉴定以获取线索。声纹检验在侦察和诉讼阶段均扮演着重要的角色,那么声纹检验包含哪些内容呢?

  3. 2. 1 录音真实性( 完整性) 鉴定录音的真实性( 完整性) 鉴定,又称录音资料剪辑鉴定,指通过听觉感知、声谱分析、元数据分析、数字信号分析等技术手段,对录音资料的原始性、连续性和完整性所进行的科学判断,以确定其是否经过后期加工处理。

  3. 2. 2 降噪和语音增强降噪分为可视降噪和自适应降噪。可视降噪是指选择噪声谱,对检材部分或全部进行降噪处理。自适应降噪是指选择适当的自适应参数,对检材内的噪声在频域和时域进行降噪处理。语音增强是指使用语音增强技术,对检材语音过弱的部分或全部进行语音增强处理,提高信噪比。

  4 声纹检验现今面临的问题

  4. 1 录音真实性检验声纹检验发展初期,音频的载体多是模拟信号的磁带,想对这样的音频文件做修改,必须对磁带动手,难免会在磁带上留下修补痕迹,篡改人的水平不同,痕迹的明显程度不同,即使利用空磁带对修改后的磁带进行翻录,也会在新的磁带上记录下非正常的脉冲条纹( 多为多次按压“暂停/播放”按钮所致) 。但随着数码时代的到来,各种便携的数码设备都具有了录音功能,现在案件中遇到的音频资料多为数字化的资料。网络上也有各种各样的音频编辑工具 ( 如: CoolEdit、Adobe Audition、 WaveCN……) ,而且有免费的使用教程,对于别有用心的人来说,大大降低了犯罪成本。利用这些编辑软件犯罪分子可以很容易的对录音内容进行删减或添加,经过软件的优化处理,一般侦查人员很难分辨出涉案录音的真实与否。录音真实性检验是声纹检验中十分重要的一环,因为一份音频资料能否作为证据在诉讼中使用,最重要的是该音频资料应为真实有效且未经修改的。同时,录音真实性检验又是法庭科学中的一项技术难题,尤其是数字录音。对于数字录音文件来说,首要的一项检验就是录音参数检验。数字录音文件是由与之对应的数字录音设备所录制的,因此,录音文件的各项参数特征必然与该设备相符。更有“amr 编码检验”、“波形图检验”、“电网频率检验”、“频谱检验”等多种不同的方法,针对不同类型的录音进行真实性检验。在录音真实性检验中,“重翻录”录音材料的检验更是难上加难,但重翻录操作不仅能做到伪造录音场景,还能攻击基于语音特征的安全系统,因而针对重翻录录音材料检验的研究极有必有。目前有研究人员从数据统计分析的角度,利用幅度共生向量特征来对重翻录语音和原始语音进行分析。虽然有了成果,但其实用性,以及在实战中的准确率有待考量,需要进一步优化与实践[4 - 6]。

  4. 2 语音识别语音识别技术起始于 20 世纪 50 年代,经过半个世纪的发展,在 20 世纪末,语音识别系统走向了实用化,各种模型和算法极大地提高了识别准确率[7]。在声纹检验的前期准备工作中,需要对检材、样本语音进行转写,对检材、样本语音中的相同词进行标注,人工进行往往会消耗大量时间,降低效率。加入语音识别系统后,可对检材、样本进行自动的转写和标注,但目前的系统在识别方面精度并不高,无法达到检验需要的标准,仍需人工进行核对。目前有不少的研究人员在更新算法、优化程序代码,甚至在尝试着加入机器学习与神经网络深度学习,以期提高语音识别的准确率。

  5 结语

  声纹检验技术在我国起步较晚,但在几代人的努力下,迎头赶上,取得了不俗的成果,为以后的发展奠定了坚实的基础。随着科技的进步,社会的发展,各种专业知识的学习成本在信息化时代都越来越低,犯罪分子的作案手段因而越来越先进,为了在这正与邪的对抗中不落下风,我们应以开放的心态,以兼容并包之势,吸收各个领域的前沿知识,先进技术,将其应用于声纹检验中来,在前辈的基础之上,进行创新,探索更广阔的的发展空间。

  参考文献

  [1]王英利. 声纹检验技术[M]. 北京: 群众出版社,2013: 1 - 8.

  [2]岳俊发. 言语识别与鉴定[M]. 北京: 中国人民公安大学出版社,2007: 220.

  《声纹检验技术现状与发展评析》来源:《山东化工》,作者:刘世杰,王 虹。

点此咨询学术顾问 快人一步得到答案

SCI期刊问答

回到顶部