Resemble AI 创建合成音频水印来标记 deepfake 语音
Resemble AI 是一家创建合成语音和语音克隆的初创公司,它创建了一个“音频水印”,在保持音质的同时标记 AI 生成的语音。 PerTh(感知阈值水印)将 Resemble 的合成引擎的声音特征嵌入到录音中,标记其 AI 来源,尽管未来会进行音频操作。 它非常微妙,没有人能听到。
音频水印
对于安全性高的文档,可以使用视觉水印将一幅图像隐藏在另一幅图像中。 没有扫描仪是看不见的。 音频水印的工作原理相同,但它们是一种非常微妙的声音,人们不会注意到。 但是,计算机可以对其进行解码。 Resemble 的音频 AI 已被用于在不影响其真实性的情况下改进珀斯。
Resemble 已经想出了如何在语音中隐藏它的识别音调。 Resemble 是一项专注于人们谈话的服务,因此音频水印更有可能在编辑后保留下来。 相似利用了这样一个事实,即人类更有可能专注于某些频率,而更大声的声音往往会掩盖更安静的噪音。 这种组合保护或掩蔽音频水印不被人类注意到。 Resemble 的机器学习模型可以识别在哪里嵌入安静的声音标签,创建合适的声音并将其放置。 下图显示了水印是如何隐藏在普通视图中的,或者在这种情况下是声音。
来源和详细信息:
Resemble AI Creates Synthetic Audio Watermark to Tag Deepfake Speech