您当前的位置:中国科学网>资讯>正文

天猫精灵 X1 评测:智能音箱的体验门槛,前所未有的低

放大字体  缩小字体 时间:2017-09-09 18:52:18 来源:新浪科技 作者:言承旭

相比于智能手机作为移动互联网时代的绝佳载体,哪一样产品做为人工智能的载体触达消费者是每一家涉及人工智能厂商需要考虑的事情,就连几乎和普通消费者不直接打交道的 IBM 也在给旗下的 Watson 打广告了。

(腾讯视频)

在手机之外,国外科技巨头作为人工智能表现形式的语音助手都在纷纷寻找硬件载体,相比于苹果 Google 和微软的 Siri、Google Assistant(Google Now)以及 Cortana 首先在智能手机上露面,在语音助手上没有先发优势并且还在智能手机战场上打了大败仗的亚马逊借道智能音箱 Echo 成功扭曲现实,让所有科技巨头都知道,人工智能和语音助手不是放在智能手机上给消费者尴尬地讲笑话的,而且更应该以一个工具存在。

为什么是智能音箱?

在人工智能走向消费者这件事上,有用,比有趣更重要。在语音助手载体这个选择上,端坐在室内的智能音箱,要比总是拿出来示人的手机更为自然和隐秘。

(Google Home)

正是如此,太平洋东岸的科技企业们纷纷又做起了智能音箱产品,Google 把 Google Home 音箱作为这两年 Google I/O 大会的重点,苹果则把 HomePod 当作今年 WWDC 上的 One More Thing。

反观国内,来自硅谷的科技潮流跨过太平洋需要一段时间,不少反应敏捷的创业团队已经做出了不少类似的产品,不过最终从市场反响来看,还没有哪一家能够跨过科技发烧友大规模地到达吃瓜消费者端。

这个时候人们纷纷把目光投向了小米,小米说好,于是拿出了带人工智能助手的小米电视。不过这个人工智能的门槛就高到三千元档了,用户还得有个客厅。于是人们又把目光投向 BAT,BAT 也说好,于是百度拿出了无人驾驶汽车还找来了陆奇,腾讯拿出“智能云”说这是开放的大家拿去用吧,阿里巴巴则拿出了一款面向消费者的智能音箱,价格 499 元。

显然,阿里巴巴推出人工智能产品不是一时兴起,在此之前,马云在首届技术大会上宣布启动 NASA 计划,这个和美国国家航空航天局同名的计划意在从机器学习、芯片、IoT(物联网)、操作系统、生物识别这些技术入手,实现“在未来 20 年构建世界第五大经济体,服务全球 20 亿消费者,创造 1 亿就业机会,帮助 1000 万家企业盈利,就像美国航空航天局 NASA 驱动人类科技和生活的极大进步,阿里构建的新经济体也要建立在新的技术之上”的愿景。

淘宝和天猫背后的电商业务是阿里目前的主要业务,高速增长的阿里云业务还有新零售大文娱等等构成阿里的侧翼和潜在增长极可缓解马云对未来 10 年的焦虑,至于更新的 NASA 计划,就是阿里和马云为未来 20 年考虑的。即便是在考虑 20 年后,不过这并不意味着 BAT 现在就可以慢慢磨时间,尤其在人工智能专家资源极其稀缺的状态下,谁起步慢,谁不重视人才的价值,谁不主动触及消费者,谁就可能在几年后欲哭无泪。

(亚马逊 Echo)

而像是亚马逊这样执行力和号召力强大又找到了正确路子的科技企业,是人工智能领域后发先至的典型,证明了这条赛道你追我赶的状况。

从 2014 年开始慢慢起步的阿里人工智能如今已经有了不少的落地产品,包括前不久能够取代保险行业中定损员核心工作的“定损宝”,不过落地到硬件上,天猫精灵 X1 还是阿里人工智能的第一次。

外观:低调不惹眼

苹果的 HomePod 是在先前的 Mac Pro 上套了一层网袜,Google 的 Google Home 则是肚子圆圆的一个小胖墩,若说设计风格,天猫精灵 X1 其实和亚马逊 Echo 类似,更规则的圆柱形和哑黑色泽并不惹眼,既不性感也不算可爱。

(苹果 HomePod)

不过作为一款不需要时隐匿,需要时现形的带语音助手的智能音箱类产品,浑身布满跑马灯,外形棱角分明,颜色赤橙黄绿青蓝紫的炫酷音箱并不是它的定位。

也正是如此,就连天猫精灵的灯光效果都是经过特别设计的,环状灯光带藏在机身靠近底部的位置,这样是为了利用底部的光线物理反射,避免灯光直射人眼,达到有指示作用但又不打扰人的目的。

除了黑色款之外,天猫精灵 X1 还有白色款,两款基本色大概也印证了那句话:当你不知道穿什么的时候,选黑色(白色)就对了。

虽然在键盘和鼠标上我还挺喜欢各种灯光效果,但是我也不得不承认,家居电器最好还是不要又光污染,样子最好低调安静。

为了达到安静的效果,天猫精灵 X1 不光在灯效上做了重新设计,机身材质也呼应了这种需求:上下两层分别用到了类肤触感塑料和网布,这两种材质均不反光。就连那个天猫的 Logo,也是需要近看才能看到。这样印证了另外的一句话:如果不知道既要用塑料又要避免廉价感的话,做成哑光然后类肤触感是个不错的选择。

作为一款用语音操控的智能音箱,如果有太多手动操作的按钮显然就是产品设计的失败。

我们从视觉上仅仅能够看到一个物理按钮,即麦克风的开关,在这个有键程的按钮左右,分别是音箱的音量触控加减键,当然,在激活麦克风连上网后,我们也可以通过语音来操控音量的加减。

说到天猫精灵 X1 的设计,不由得想起早前阿里旗下另外一款以天猫命名的硬件:天猫魔盒,相比于天猫魔盒的可爱风,这一次天猫精灵 X1 的设计师真的是相当克制。

(当年天猫魔盒的灯光有点儿扰民)

当然,也吸取了一点点的教训。比如如何处理灯光。

谈体验之前先谈现状

不同于 iOS 和 Android 的触屏图形交互界面,带语音助手的智能音箱带来的,是全新的交互方式。也正是人工智能和语音交互的发展,语音交互设计师(Voice Interaction Designer)在硅谷成了抢手的香饽饽。他们不用 Photoshop、Sketch 做界面,也不用 Principle、framer 做原型。一个新的技术时代,催生了一种新的设计岗位。

因此,我们在谈论天猫精灵 X1 的时候,也需要换一个思路,它不是类似于 PC 或者智能手机的产品,而是处在人工智能往消费者端落地初期,并且采用语音交互的产品。

当它做各种份内的事情的时候,天猫精灵 X1 有一种你是钢铁侠操控 Javis 的感觉,但正如我们总会觉得 Siri 总是答非所问形同智障的时候,智能音箱在语音交互上的成功率要低于你和手机的交互成功率。现在 iOS 和 Android 旗舰机早已经告别不响应和卡顿了,但智能音箱在语音操控上的成功率往往要低于 95%。

没有图形界面,交互成功率低于智能手机,Google 用户体验设计师 Riceman 给人工智能产品几个 Tips:

你为不够智能的“人工智能”随时准备好“擦屁股”了吗?用户的使用门槛够低吗?正向的反馈够及时吗?机器学习的错误率足够低吗?用户更满意、更信任你的产品了吗?

所谓“擦屁股”,就像是 Android 或者 iOS 里面的 Home 键一样,让用户知道有一个误操作不要紧,有一个从零开始的地方。

我们使用智能语音产品,是指望它变身钢铁盔甲飞天遁地保护世界吗?显然不是,我们只是用它来问下天气,听下新闻,放下音乐,控制个台灯和空调,最好还能充个话费买个卫生纸。

长此以往,智能音箱更了解用户,用户也更信任依赖这个人工智能产品,形成正向的反馈。

另外,如果以未来的眼光审视语音交互的话,我们会发现,这个领域的发展潜力相当之大。图形交互界面中,发展了这么几十年,苹果都从 2D 深入到了 3D Touch,而语音交互其实还是萌芽状态。

不久前在社交网络上特别火爆的《8 分音符酱》就证明了在游戏中语音操控的趣味性(神经病性),而《塞尔达传说:荒野之息》的好评如潮也说明了游戏世界的开放性是多么重要,然而键盘手柄,乃至触屏的操控方式其实一点儿也不开放,反而是语音交互存在的可能性更大。

语音助手新体验

在天猫精灵 X1 发布会的总结文章中,我们已经知道阿里巴巴想要天猫精灵 X1 主打的是“个人小秘书、家电管家和幼儿小老师” 三大块的功能,但实际上,如同现在的智能手机能打电话发短信听音乐看视频购物办公几乎快要无所不能一样,作为一款智能音箱其实跟智能手机有些像,它能够做的事情有很多,一场发布会或者一篇文章并不能穷尽说明。

作为一款对于大多数人都还算陌生的设备来说,刚开始用的时候,天猫精灵 X1 还是得需要一下智能手机的帮助,用来给设备联网和度过新手期。在进入天猫精灵手机端的 app 之后,就是给设备配网的过程,整个过程并不麻烦,需要说明的是,天猫精灵 X1 不支持 5G WiFi,所以这款设备不太适合网络较拥堵的办公室环境,而更适合联网设备不多的家庭环境。

配网完了就可以观看新手视频,这个视频会帮助用户了解一些天猫精灵以及它的基本用法。之后就是关键的注册声纹步骤,简单来讲就是按照天猫精灵 X1 的提醒说话报数,让设备了解用户的生物识别特征。注册声纹的目的是为了让设备知道当前说话的是谁,在和用户相处久了,天猫精灵 X1 就能知道当前用户的一些喜好,提供更有针对性的服务。声纹另外一个关键性的作用是购物,这个环节中,声纹的作用就跟指纹类似,通过生物识别验证天猫精灵 X1 才会完成支付。

在完成配网,新手指导和注册声纹之后,手机的作用就不大了,智能音箱就可以独立使用了,而此时手机更多的像是一个消息记录器。不过也好在有这个消息记录器,我才知道我和天猫精灵 X1 说了什么,也好在视觉上呈现我和天猫精灵的对话过程。

当我们面对语音助手的时候,仿佛条件反射一样会去问它天气和要它讲笑话。事实上问天气的话,现在几乎没有语音助手不会做了。至于讲笑话,由于语音助手还不怎么学会人类的语调,所以一般来说,都有点儿尴尬。因此,这两部分先略去。我们先来看跟阿里挂钩最密切的购物环节。

在注册了声纹之后,我就开始让天猫精灵帮我充话费了,整个对话还是比较自然的,就跟老板和秘书对话一样(当然我没秘书,全靠脑补):

帮我充 100 块话费。请告诉您要充值的手机号码?152@#¥%&*28好的,为 152@#¥%&*28 充值 100 元,是否支付?是。好了。

整个对话过程非常地自然流畅,如果是买卫生纸或者可乐牛奶等等超市产品,绑定了淘宝账户的天猫精灵 X1 也很方便,都是基于上下文语义理解进行的购物。在购物下单之外,我们也可以问天猫精灵东西到哪儿了查询下物流的信息。

不过目前这个购物范围还仅限于天猫超市,毕竟 B2C 模式保障更多一些,未来可能也会开放淘宝购物,不过留给阿里人工智能实验室的难题是如何在语音设备上货比三家。

在北京办公室我和天猫精灵 X1 对话的时候,多年没有女朋友关怀的常岩编辑说了一句发布肺腑的话:

我 X,这是我听过最好听的语音助手声音了。

某种程度上来说,语音助手的声音就跟手机界面的美观程度一样重要,这一点,天猫精灵 X1 算是做得非常好的,它没有那种非常强烈的机器人感。

尤其是在念诗歌的时候,颇有些抑扬顿挫的意思,而不是平铺直叙。当然,这个好是相对的,毕竟它还是个机器设备,某些时候天猫精灵 X1 的断句语调还是不如真人那样自然。具体的表现,看爱范儿的评测视频就知道了。

听歌是一个高频刚需,天猫精灵 X1 配有一个 5W 的全频扬声器,在它相对小的体积和 499 元的价位上,这个扬声器的音量和音质算是值回票价了,虽说音箱耳机产品是“万元以下听个响”,但天猫精灵 X1 可以说是起码是摆脱了音质的廉价和毛刺感。

在和天猫精灵 X1 对话的过程中,我们也发现了这款设备的一些小彩蛋以及小错误。

小彩蛋是我们可以让天猫精灵抛个硬币,然后就会听到硬币抛出落地旋转跳跃慢慢停歇的声音,最后天猫精灵 X1 会随机报出“正”或者“反”,用来帮助选择困难症做决定。比如想睡懒觉不想上班的时候,是用生病了为理由请假,还是女朋友生病了要照顾为理由请假。

另一个小彩蛋就是天猫精灵 X1 还内置了一些小游戏,比如猜数字。

当然,它也有一些小错误出现,比如我问它狮子座什么性格的时候,它给我回答的是狮子座的今日运势(表示并不信)。

除了购物查询念诗定闹钟查天气放音乐之外,天猫精灵 X1 目前能做的事情还有很多:倒计时,找手机,听有声读物,学英语,控制智能家居等等等。

一言以蔽之,这是一款类似于智能手机的产品,至于阿里巴巴官方和第三方开发者,以及硬件厂商想要在这个产品和平台上拓展出什么新的东西,还要看以后。现在来看,天猫精灵能够完成的事情已经有不少,可以让我们不必事事都要掏出手机。

当然,作为一款新产品,我也发现了它需要注意的一部分事项:对网速要求有点儿高,网速不佳网络拥堵它的反应也会变慢;说话吐字需要清楚一些,不然声纹识别通不过话费充值失败;句子结构尽量简单,不要说一大段话,它最后可能理解不了…

说完天猫精灵 X1 的体验,我们借这款产品再来回答 Google 用户体验设计师 Riceman 给人工智能产品几个 Tips:

你为不够智能的“人工智能”随时准备好“擦屁股”了吗?(有的,用户可以随时喊“退出”和“天猫精灵”重新开始命令。)用户的使用门槛够低吗?正向的反馈够及时吗?(使用门槛不高,不过很多功能需要探索和学习,反馈还算及时。)机器学习的错误率足够低吗?用户更满意、更信任你的产品了吗?(错误率会比使用手机高一些,有时候会理解错误,或者给出错误答案。在与机器磨合后,会把手机的部分功能转移到天猫精灵 X 1 上。)手机少玩,UI 再见?

在使用天猫精灵 X1 之前,我发现了一个不大不小的问题:我的手机依赖症有些严重了。当手机在身边的时候,想看个天气,会拿起手机解锁进入天气页面,看完我却并没有锁屏而是不由自主地刷刷朋友圈刷刷微博。甚至有时候没有任何手机需求的时候,我也会解锁手机看它屏幕亮起,然后锁屏放进口袋。

尤其是在周末的时候,这本该是我静下心来看书看电影的时间,不过由于智能手机的存在,我的注意力变得非常分散,很难长时间专注于一件时间,比如看完半本书,或者看一部节奏不快的电影。

本质上,手机是一个工具,但手机的黏性让不少人变成了手机的提线木偶。

当我意识到这个问题到了影响工作和生活的时候,就开始下决心尽量远离手机,限制自己打开手机的次数。

智能音箱的产品特点,就是用完即走,至少现阶段来说,还没有看到有说沉迷于玩音箱无法自拔的。语音产品的另一个特点,就是一定程度上容许多任务操作,毕竟操控智能音箱不需要动手动眼。

因此,当我想查天气定闹钟确认个信息的时候,就可以直接找天猫精灵 X1,而不是拿起手机又不知不觉地玩下去。这个时候,天猫精灵 X1 就是个合格的工具,一方面满足小需求,另一方面又达到了我个人控制手机使用次数的目的。

智能手机和移动互联网让人们的时间被切割得越来越分散,碎片化越来越严重。作为一定程度上的替代品,天猫精灵 X1 虽然也是切割了时间,不过这一刀就是一刀,也更加无痛,不像手机那样一刀之后又是连招抢夺注意力。

如果是为了有用考虑,天猫精灵在内容方面做得还算可用,无论是年轻人需要的英语学习素材,还是为人父母需要的唱儿歌讲故事,还有中老年人喜欢的相声评书都有。包括智能家居控制,充话费买卫生纸牛奶查询淘宝物流,乃至扔硬币倒计时等等小彩蛋功能,都还完成得不错,并且作为一款智能音箱产品,它后端的服务还可以升级学习,变得更为强大。

作为参照的亚马逊 Echo 智能音箱产品,它刚开始面世的时候音质一般智能不足,但是亚马逊不断地让它学习 skills 终成标杆。以至于很多人开始讨论未来的 UI 方向,有些结论是,未来的 UI 就是没有 UI。Osmo 的首席设计师 托尼 · 奥布(Tony Aube)认为,人工智能技术的出现,以及动作识别芯片和脑机接口也将让计算机交互走向无用户界面化。

当然,这种变革还在早期,不过我们已经可以看到,大疆新出的消费级无人机 Spark 已经支持手势操作,鼓捣出 PayPal 和 SpaceX,还带领特斯拉成为电动汽车龙头的 Musk 也开始研究脑机接口了,更不要说最近如雨后春笋般冒起的智能音箱产品。

如天猫精灵 X1 这样的产品引起我思考的原因正是智能手机已经盛极,新产品还在萌芽的时候,智能音箱很可能是技术历史转折中的节点 :看看我们和智能手机的关系,是不是太密切了?未来的交互是不是还在艰难地萌芽当中

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!