所以,能动手就别吵吵了
2019年09月17日 由 sunlei 发表
1002073
0
当有人通过语音数据拼凑出了你的全部生活,你会不会觉得毛骨悚然?
如今,能与人进行互动的智能音箱走进了越来越多的家庭。某精灵、某爱、某度在家以及国外的亚马逊、谷歌、苹果诸多智能音箱品牌都参与其中。但与智能音箱对话,甚至被智能音箱听到的对话,都有泄露出去的可能。
智能音箱“窃听事件”
第一起广为人知的智能音箱“窃听事件”发生在美国俄勒冈州。
去年5月,一位男士接到一位下属的电话:“马上拔掉你的Echo设备插头,你被黑客攻击了!”
Echo是亚马逊推出的智能音箱,搭载其语音助手Alexa。
这位男士家中拥有四台亚马逊智能音箱。当天早些时候,这位男士的下属接到一份录音文档,随手打开后却惊奇的发现,该录音的内容居然是自己上司的家庭私密谈话,随后立即打电话通知了他的上司。而这位男士听到提醒之后,立即拔掉了家中所有Echo设备电源,并迅速拨打亚马逊客服电话寻求解释。
对于此事故,亚马逊当时给出的回复是Echo设备“误操作”导致的。也就是说,Echo设备在运行时,将一段对话的内容误解为指令,以为用户是希望将此前的语音内容发送给通讯录中的某个人,这才导致了智能音箱“隐私泄露”事件的发生。
截至2018年上半年,Echo在美累计出货约3500万台,其市占率达到70%,远超其它品牌。
尽管亚马逊对以上事故已致歉,却未能掩盖一个在舆论中逐渐成型的猜测:作为一款新兴设备,智能音箱的“窃听”或许不仅是隐患、而且真实存在。“它听到唤醒词就可以启动工作,那是否意味着,智能音箱正在随时随地听取我们的谈话?
近日,智能设备相关的更多“窃听”事故正在被曝出。今年7月,据国外媒体报道,苹果的一名承包商称,为了提升Siri的产品能力,苹果会雇佣外部承包商审听录音,其中包括了Siri在意外被激活时收录的私密对话,例如医疗信息、毒品交易和其它信息。同月,有消息传出,谷歌智能助手会将录下的声音文件提供给公司员工,甚至世界各地的谷歌第三方承包商也能定期听取这些谈话内容。
对于智能音箱及内置于各设备中的语音助手的疑虑正在蔓延,不仅是“窃听”,智能音箱偶尔出现的自启动现象也刺激了一部分用户。从去年起,先后有用户表示,Echo在未被唤醒时,却出现了“呵呵”的笑声,令人毛骨悚然。
于今年年初举办的中国人工智能学会“人工智能与安全专委会” 成立大会上,360集团董事长兼CEO周鸿祎表示,智能音箱可能变身为窃听器。
周鸿祎称,360与浙大合作发现了一种“海豚音攻击”,该攻击人耳无法听见,但通过超声波信号可以劫持智能设备的语音控制系统,再利用麦克风的硬件漏洞,就可以悄悄开启语音助手,把智能音箱变成窃听器。
除了智能音箱,“海豚音攻击”还可用于攻击多种拥有语音助手的智能设备,包括智能手机、智能手表、智能汽车等。
人们对智能音箱这款新产品的疑惑越来越多。从“它在监听我吗”延伸至:它休眠时会收声吗?收声之后,是否会存储和传输这些对话?这些声音真的会被人听到吗?以及,它会被黑客攻击,变成一个“窃听器”吗?
是真相还是谣传?
很多购买智能音箱的消费者,在购买之前多少也会了解一下监听问题,但有趣的是,他们最终还是决定购买音箱。
据多位熟悉智能音箱的从业者介绍,智能音箱的识别工作分为“本地”和“云端”两种情况,在智能音箱处于未唤醒状态时,为本地工作状态,虽然会收录外界声音,但不会对这些声音进行存储与语义识别。唤醒前相当于在做声波识别的工作,(智能音箱)将收录的声音与唤醒词做对比,声波相符时,才会自动打开。
多位专家否认了“偷偷监听”的传言,据了解,市场主流的多款国产智能音箱无一存在主观故意监听的情况。毕竟这是一件成本很高的事情。我们来算了一笔账:假设一家企业累计售出100万台音箱,有20万日活,如果企业要启动这些音箱做24小时监听,就算每秒钟产生100k数据,乘以20万的话,累计起来传输带宽、存储和计算的花费相当惊人。
更关键的是,在当前的技术处理能力下,企业尚不能将这些庞大而又碎片化的录音转化为有商业价值的有效信息。在张思成看来,就算不考虑道德层面,只看商业利益,企业也没有动机去做主观的信息收集。
与“窃听”传言较为相符的内容是“唤醒词”之后的智能音箱工作模式。音箱被唤醒后,将进入云端工作状态,将收取的声音传输至云端服务器,完成语音语义识别和反馈工作。目前智能音箱内置的运算能力,无法支撑AI类的语音语义计算,更无法在本地实现识别能力的提升。
据多位从业者介绍,目前智能音箱行业内较理想的“误唤醒率”约为每48小时2次,更糟糕的情况则达到每24小时2-3次,这无疑意味着误操作下较高的所谓“窃听”频率。
今年4月,据相关调查报道显示,亚马逊在全球有数千名工作人员负责人工听取和检查用户与Alexa的对话,并对这些录音进行标注、检查、反馈,以降低误操作,帮助Alexa更好地响应指令。位于罗马里亚的两名亚马逊员工提到,他们一天需要工作9小时,解析音频多达1000条。
这在行业中其实不是秘密,不仅是国外品牌,在国内几家主流智能音箱品牌中,均有“人工审听”环节。为尽量保护用户隐私,录音在被人工听取前会进行数据脱敏、打散,尽管员工会听到录音对话,甚至涉及私密事务,但并不能识别用户的具体身份。在云端过程中,音频文件本身不会跟用户账号信息、设备信息相对应,主要是为了优化指令。智能音箱所录取的语料不会被永久存储,在完成识别后,音频文件会被删除。
不仅是音箱存在类似问题,智能家居近年来非常火爆,融入了我们生活中的方方面面,例如空调、电视、智能门锁、报警器等都用无线网络连接起来然后进行控制,这就是似乎很让人享受的物联网。但也会成为黑客的另类入口。
实际上,我们的隐私无所遁形
无疑,智能音箱和其它语音助手类产品,尚且不是一个成熟品类。
这使此类产品存在诸多漏洞,例如误唤醒,再例如“黑客攻击”。去年8月,在美国拉斯维加斯举行的全球黑客大会Defcon大会上,腾讯安全团队仅用26秒便成功破解了亚马逊的Echo,远程控制指定设备,使该设备在未唤醒、不提示的静默状态下自动录音,并将录音文件通过网络发送给远程服务器。
“当2300台音箱中,有1台智能音箱被物理攻击,其他的智能音箱都可以通过局域网内的非接触式攻击被黑客置入后门,成为黑客的远程窃听器。”在破解时间后不久,腾讯安全专家伍惠宇在一场演讲中表示。当然,在腾讯将这些漏洞提交后,亚马逊已经完成了这部分的修复和更新。
在另一层面上,正是兴起时间短、成熟度低,迄今为止,智能音箱尚未形成任何黑灰产业链。录音语料在企业被赋予相当严格的保密级别。
目前在国内市场上并未出现任何一家企业将语料转卖的情况,没有智能音箱成功窃听的案例,同样,智能音箱还不会利用收听到的语料,为每一位用户形成全景画像。说到底,现在智能音箱不够“智能”,提取有效信息成本太高,并且在未来3到5年内,都不用担心音箱带来的隐私问题。
但他也和其他从业者一样,并不否认以上种种“尚未发生”的情况,会在技术更为成熟的未来均有“发生”的可能。
但是在物联网、AI时代,我们是没有隐私、无所遁形的。即便没有智能音箱,通过手机和电脑,每个人的信息、喜好、习惯等种种信息,早已被各家公司所掌握,本质上,这并无不同。
除非在计算能力更为强大的未来,全部智能产品均在本地运算,全部断网,只有偶尔更新系统时联网。但对普通人而言,这种高技术难度、低商业价值的设想过于遥远,也过于不切实际。
面对这些焦虑,一些人选择了远离智能音箱。一位技术人员称,其已经将家中智能音箱彻底断电,亦不再有购买其它智能家居的计划。
不过,有些人也抱有更乐观的态度,他们认为“智能音箱正处于野蛮生长的初级阶段,扩展到整个智能家居,都会经历这些初级阶段,这时的隐私保护,只能依赖于厂家自律,当这些产品彻底普及之后,一定会有更高级别的隐私规范出现,统一行业、限制权限,并作为强制标准来执行。”