你的手机,不仅仅是和世界沟通的桥梁,也是一个窃听器。不是说你开了免提,或者中了病毒那种老套路,而是在完全正常使用的情况下,你的手机可能会悄悄地出卖你说的每一句话。这听起来是不是有点像科幻电影里的情节呢?但今天我要说的是,这正在变成现实。
就在前几天,宾州州立大学的研究团队发表了一篇论文,他们做了一个实验,证明了他们可以从三米以外的地方,窃听你的手机通话。他们用的并不是什么黑科技,而是我们日常生活中随处可见的毫米波雷达,你说这事儿是不是特别离谱?我们总觉得只要不乱点链接,下载不明软件,就会安全。但这个研究告诉我们,哪怕你只是正常接听电话,你的隐私就很容易暴露在别人的耳朵里了。
你可能要问了,这是怎么做到的呢?难道雷达能直接透视手机看到里面的东西吗?当然不是。这背后的原理其实特别简单,但又非常巧妙。我们都知道,当我们打电话的时候,声音是通过手机的听筒发出来的,听筒会振动。这个振动的幅度虽然微弱,但它会传导到手机机身上。手机就像一个微型的鼓面,随着你通话声音的起伏而产生细微的振动。而这个研究团队做的,就是用毫米波雷达去捕捉这些肉眼根本看不见的振动。
毫米波雷达是什么东西呢?它并不是什么新鲜玩意儿。现在很多高档车辆,尤其是那些有自动驾驶功能的车型,里面都有毫米波雷达。它是靠发射和接收毫米波来探测周围的环境,精度非常高。5G 无线网络里面也用到了类似的技术。这个研究团队就是利用毫米波雷达的这个特性,把它对准了正在通话的手机。当手机振动时,手机表面会反弹回来的毫米波讯号就会发生细微的变化。研究人员就是通过分析这些变化,得到了一个包含了对话信息的雷达讯号。
但这只是第一步。这个雷达讯号不是人能听懂的语言,就像一团杂乱无章的电波。要把它变成我们能听懂的文字,就需要一个强大的大脑。这时候,人工智能就登场了。研究团队用了一个叫做 Whisper 的 AI 模型,这是 OpenAI 推出的一个开源语音辨识模型,我也在电脑上安装了。它的厉害之处在于,它能把语音转成文字,准确率非常高。
但问题是,Whisper 是用来处理清晰的语音的,雷达捕捉到的讯号可不像是我们平时录音那么清楚。它里面充满了各种杂音、各种干扰。所以研究团队又进行了一步非常关键的改造。他们用一种叫做 Low-rank adaptation 的技术,对 Whisper 模型进行了微调。这就像是给一个顶尖的厨师教一些新的烹饪技巧,但不是让他从头学起,而是只教他一些关键的窍门。这样一来,这个模型就学会了怎么从那些充满杂音的雷达讯号里,识别出有用的语音信息。他们把雷达收集到的讯号喂给这个改造过的 AI 模型,结果让人大吃一惊。他们竟然能把对话内容转录出来,准确率高达 60%。
你可能会觉得 60% 的准确率好像也不高啊,还有 40% 是错的呢。但你要知道,这可是在没有任何接触的情况下,仅仅通过远距离的振动和雷达讯号就能识别,而且这个 60% 的准确率,也不是说只能读懂 60% 的句子,而是说 60% 的词语能被正确识别。这就像是读唇语。读唇语的人能看懂的单词可能只有 30% 到 40%,但他们能结合语境,大概猜出对方在说什么。而 60% 的准确率,已经足够让一个窃听者掌握大部分的对话内容了。如果再结合一些上下文的猜测,比如说你正在和同事讨论项目,他提到「项目」这个词,那么 AI 模型即使只识别出几个字,也能猜到你可能在谈论什么。这个窃听的威胁性就完全不同了。
更可怕的是,这项技术还有很大的提升空间。如果未来雷达技术更精密、AI 模型更强大,准确率达到 90%、甚至更高呢?那我们还有隐私可言吗?
所以这篇论文的意义在哪里?研究人员说,他们做这个研究不是为了教坏人怎么去窃听,而是为了提醒我们公众,这种潜在的风险是真实存在的。他们希望通过揭示这种可能性,促使我们去思考如何保护自己的隐私。
我觉得它的意义是,它告诉我们,我们的隐私边界正在被重新定义。以前我们担心的是手机病毒、电脑木马,或者是网路骇客。而现在我们可能要开始担心,即使是物理世界里,我们的声音也会以一种意想不到的方式泄露出去。我们的声音在物理世界里产生了振动,振动被转化成电磁波,电磁波又被 AI 模型转化成文字。这中间的每一个环节,都有可能成为我们隐私泄露的渠道,如果被别有用心的人收集,他们就可能变成用来对付我们的武器,这个世界真是越来越危险了,也许未来会出现防窃听的手机制造技术,比如给听筒加装减震材料,或者是能主动抵消振动的技术。也许会出现防窃听的手机壳,开创一个新的市场蓝海。