首页 > 科技 > 智能家电 > 为什么和Siri、Alexa对话这么费劲?语音优先技术前景怎样?

为什么和Siri、Alexa对话这么费劲?语音优先技术前景怎样?


原文来自Wall Street Journal,作者Wilson Rothman

原文链接:https://www.wsj.com/articles/why-you-cant-have-a-decent-conversation-with-your-voice-assistant-yet-11576418400


我:“Alexa,微波加热燕麦片。”

Alexa:“好,设置什么温度?”

我:“我不知道。”

Alexa:“我,我也不知道。”

我正在试用Amazon推出的新款烤箱,对Alexa说出语音指令即可完成操作。

尽管从各方面来说简易便捷,令人印象深刻,但它充分说明了我们在尝试声控一切时会遇到的许多问题。有人知道自己加热燕麦片的温度吗?还是您今天才知道微波炉还可以设置温度?

烤箱有很多功能,比如对流烤箱、空气炸锅,但是当我说“烹饪三文鱼”时,Alexa问:“多少?”我回答一磅,然而我得知只能做“0.063至0.37磅的三文鱼”。虽然我可以声控打开烤箱,但却不能声控关闭。烤箱本身不会讲话,需要使用Alexa辅助交流。


图注:Amazon智能烤箱。


Amazon表示,许多问题已在后台更新中得到解决,但是语音助手达到几可乱真的地步尚有待时日。这就像是出行前练习外语一样:先死记硬背些日常表达,用完之后就加大嗓门,比手画脚。

我已经用Wi-Fi操控取代了许多电灯开关,许多灯泡也已接入网络。我在许多房间中都装了语音控制系统(包括浴室),圣诞树彩灯也连上了智能插头。我的家人会向Alexa大喊,基本操作她都能完成。但我们用的指令非常直截了当:播放这首歌、关闭这些灯、设置计时器或闹钟。

我们与Apple的Siri或Google厨房助手Nest Hub Max的沟通也很相似。

“当您手头有其他事的时候,语音是最佳选择,它能够快速提供帮助。”语音优先(voice first)软件开发商Witlingo首席执行官、前Alexa产品负责人艾哈迈德·布兹德(Ahmed Bouzid)在一份电子邮件中解释道。最好的互动应该比原来节省精力,而不是大费周章。

对于Amazon的智能烤箱,布兹德提出了质疑:如果您正在做饭,烤箱肯定不会离得很远,做饭时也不会一心多用,因此最好还是自己按下按钮。

保持简单

根据2019年的一项调查,人们向智能声控语音助手发出的大多数命令往往简单且易记


数据来源:Futuresource Consulting Ltd.。


Amazon智能家居副总裁丹尼尔·劳斯(Daniel Rausch)提出反对意见,烤箱功能众多,其他形式难以覆盖这么多功能:“如果您试图绘制一张所有功能的图表,并希望给每个功能分配一个按钮,您可能需要一个路边广告牌大小的面板。”

所以这是否就是语音助手存在的意义,取代开关和搜索框?语音助手不断添加新功能,有一些功能大有助益。语音控制已经可以实现很多功能,但是由于多种因素的综合考虑,比如隐私,语音控制的发展仍在原地踏步。

有问有答

例行程序(routines)是一种将单独命令组合的方法。一个简单的语音命令例如“我回来了”就可以关闭提示、开灯、调节恒温器以及播放柔和的爵士乐。

从理论上讲这很酷,但事实上,这很烦人,因为要进行设置,必须坐在那里,思考想要一次性发生的所有事情,以及如何实现。

现在,控制这些界面的App还会提供建议。这些建议通常以您的操作为基础。Shortcuts就是个典型的例子,虽然功能尚有待加强,但是打开它并点击“Gallery”就可以查看App中可以使用的简便程序了。我以前会设置三个闹钟:起床、校车接送和地铁。

现在,我只需要说“晨钟”,然后三个闹钟就都设置好了。但是例行程序只能解决按键太多的问题。开发人员正在致力于使这些界面更具互动性,从而允许后续的对话。也许您会说:“打开廊灯”,廊灯打开了,然后您的语音助手可能会建议:“您是否也要打开露台灯?”因为这样做很合理。

尽管Amazon和Google都建议采取行动,但Amazon的“直觉”则更进一步:当您请求打开廊灯时,它可能会说:“您还希望我播放柔和的爵士乐吗?”问题将基于您(可能是无意识)的行为:通常,打开廊灯时,还会选择播放舒缓的爵士乐。


图注:在智能手机上看到一个新的App图标,但实际上您看不到语音助手和家庭声控助手(例如Google的Home Mini)到底做了哪些更新。


Amazon和Google都可以暂时不设置唤醒词。通过在Alexa App中启用“Follow-Up”和在Google Home App中启用“Continued Conversation”唤醒助手,然后继续提出问题而无需重复唤醒词。它还保留了一些上下文:“ Alexa,圣诞节是几号?”然后您可以问:“复活节呢?”

苹果的Siri会在不同的语境下执行此操作。AirPods Pro现在具有朗读讯息的功能,可以阅读消息并允许以对话方式回复。Walmart iOS版的杂货配送App将Siri和您的购物记录紧密联系,您只需语音便可轻松挑选商品,无需记住关键短语。

个性化和隐私

人与无实体的声音之间真正需要的是更紧密的联系。个性化意味着识别谁在说话并记住他们的偏好。但这需要数据收集,最近我们对此有了更多的认识。

咨询公司Futuresource Consulting首席分析师西蒙·弗莱斯特(Simon Forrest)先生表示,“隐私是消费者的首要考虑因素。像Apple这样的公司在改进隐私方面已经做了很多。例如将信息保存在设备上,可以实现通过语音识别播放特定的电影。

Alexa可选择清除独立智能家居设备的历史记录。Google也表示允许用户查看和删除历史记录。


图注:Amazon和Google出售配备屏幕的语音控制设备(例如Google的Nest Hub Max)。

“我们正在全面思考如何在拥有尽可能少的数据的前提下,仍能为用户改善产品。”Google助手产品高级总监莉莲·林肯(Lilian Rincon)表示。目前,出于质量原因,Google助手所做的大部分工作都需要云服务,她说,但是,“我们希望在设备上增加更多功能。”

Google的Pixel 4手机就是一个很好的例子。它可以仅仅使用电话本身将语音实时转录为文本。iPhone 11可以在没有云服务的情况下做更多的事,例如播放Siri的新声音,甚至旧版的iPhone也可以使用设备观察用户行为并根据其建议操作。

发现我

那么,为什么在所有这些进程中,我们大多依然只是设置计时器和要求播放音乐?与您喜欢的App新图标不同,您无法真正看到语音助手的新功能。Alexa、Google Home和Siri Shortcuts 提供了大量建议,Amazon和Google配备屏幕的声音控制设备也是如此,但这还不足以教会人们如何使用。

“我们现在面临的最大问题就是如何促进用户发现并探索我们的产品,尤其是对于语音控制器来说,让您知道它可以做什么。”林肯女士说。

Amazon的劳斯也用杰夫·贝佐斯(Jeff Bezos)的一句名言承认了这一点:“Amazon的新生,绝对是因为Alexa和AI。”

那么之后的发展会如何呢?Futuresource的弗莱斯特说,即使是语音优先的界面,也可能包含手势控制和触觉反馈等技术,例如在手腕上轻按Apple Watch。他认为“Hearables”(又名超级智能AirPods)可能是语音优先的产品。

现在,我得想办法让这个智能烤箱烹饪超过0.37磅的三文鱼。


“久谦咨询”即将移步新账号“栈外”!欢迎各位读者阅读及关注。

https://www.toutiao.com/c/user/2950743902919048/#mid=1653230945559565


本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/252893.html