cnBeta 评测室收到了阿里寄来的“天猫精灵 X1”智能音箱,这是阿里巴巴人工智能实验室的首款智能语音终端设备,能够理解中文普通话语音指令,实现音乐播放,智能家居控制等功能。以下是我们一份非常简洁的使用评价,只有10个要点:
1. “天猫精灵X1”基本上是一台小电脑,采用联发科的处理器和专门的声音运算芯片。虽然我觉得阿里旗下所有产品应该统一品牌,但可能是因为部门差异,AI系统命名为AliGenie,而不是从属于阿里已有的操作系统品牌YunOS。在成功激活后,你和音箱之间的每个对话都会被记录到手机客户端里。
2. 开始第一次配置,系统预置音是较为甜美的女声,和后面的合成音差别很大。其实可以人为地把预置声音也改为合成音,减少不协调感。另外,引导录像的男声把我吓了一跳,是字正腔圆的播音腔,这样会让人以为只能用这么标准的话才能让精灵听懂。应该考虑改用普通人来演示。
3. 唤醒词“天猫精灵”(第一次配置时说“你好天猫”)不够友好,因为每次说一句话都必须念唤醒词,还不能太含糊,这跟无缝与人交互的感觉就很不协调了。相比之下“Alexa”和“若琪”都在默认唤醒词上做了一定的功夫;而最佳策略绝对是自定义唤醒词,我就知道有人把Echo音箱命名为“傻*”然后每天欢快的喊“嘿,傻*,给我开窗帘”这样。
4. 我们处于一个比较空旷的办公室,多人说话会很嘈杂和有回声,此时天猫精灵的识别效果很差,经常听不见或者慢半拍。慢半拍的表现是我们喊“天猫精灵”之后的下一句话说到一半,它先是“我在,你说”,然后马上默认你没说话,停止响应。拾音技术阿里选择采用第三方思必驰的技术,但6个麦克风仍不能使其效果达到完美。
根据官方介绍,天猫精灵的使用场景定位为“家庭”,大多数的功能也是围绕家庭用户来进行开发和设计的。由于提高降噪能力的同时,成本也会随之上涨,经过大量实验后这款产品的环境噪音适应程度设定为符合普遍家庭噪音情况的75dB。如果在低噪音、低回音、小面积的家庭场景下,产品的识别效果更好,同时保证了产品成本不高于绝大多数消费者的购买力。
5. 在线购物有很多问题。首先是推荐,因为不支持上下文,很难在说出商品名后,紧接着再让它继续推荐下面的,就等于它只能推荐搜索结果页上第一个结果。很显然,这对其他的商品和我们继续采购的意愿不公平。其次,设置声纹之后,它依然不能顺畅支付,我们的每一次尝试都只是成功加入购物车,而没有前进到支付环节。
官方工程师解释称,我们可以用正确的命令来挑选商品。直接说出品类后系统进行推荐,如果不喜欢可以说“换一个”,这里支持多轮对话;也可以直接说出你想要的商品名称,比如“我要一箱特仑苏”,那么系统会直接推荐这个商品。
而没有立刻下单是因为我们恰好选择的都是不包邮的商品,所以还是必须用户确认,以免发生“误下单”的情况。如果你不在乎邮费,也可以说“我要直接购买”来下单。官方随后会将购买功能的文案修改为“商品不包邮,直接购买还是加入购物车”。
6. 很多它不理解或没听懂的内容,都默认去找了它理解的跟关键字近似的歌曲。而让它闭嘴是个技术活……说句自然点的“关掉这首歌”,它返回“为你开通了单曲循环”。最后只好“静音”,回答“好的,我闭嘴了。”
7. 教唐诗是“天猫精灵X1”的一个演示功能,但输出结果是语音合成的,音调和语速对小孩子其实不太友好。网上有很多现成的朗读版,我觉得可以拿来用。其他资源来自喜马拉雅、优酷或虾米,但可能匹配的还不够好,特别是并非所有优酷土豆视频的伴音都可以播放,也不能听到优酷直播。相比广播电台,其实我更希望听到电视伴音或者听一部肥皂剧。
8. 可以正确识别打车功能,但不能用,估计固件升级后就可以接入滴滴。此外,周边商户推荐的功能也没有开通,我觉得比较好的实现办法是配合手机客户端实现GPS定位,而且接入口碑的结果。
9. 我很想用这个音箱听今天的头条新闻,但效果很差,想要听下来自大大的正能量新闻,这个命令都无法识别,看来还需要加大力量整合UC头条内容。
关于内容丰富性的问题,相信后续版本中会一并解决和提升。
10. 由于手头没有参与阿里智能阵营的设备,无法测试智能家居功能。估计以后跟京东智能、微信智能、米家的整合将相当艰难,大大限制智能家居功能的应用。
结论:
即使是亚马逊Echo也没有做到100%像一个真人一样与人互动,所以也不应该对天猫精灵X1抱有这样的期待。但是如果把它当成一个有一定交互能力的音箱,那还是非常有得玩的。其实,它的一个潜在目标用户是老年人——在前几年的智能相框,智能摄像头等等“老人玩具”逐渐被父母认定为不好玩而吃灰以后,直接和AI一问一答的趣味性要大得多,它有望成为调节老人生活的一个好帮手。
只不过,作为一个音箱,它似乎并不太注重堆砌“本职工作”——音质方面的指标,同时,前面说的拾音不好的问题也很难通过软件升级补足。所以希望它在将来的固件升级中能把软件进化得更好。同时,提高软实力的一个好办法是将AliGenie授权给第三方音箱生产商(类似百度正在做的),还可以像亚马逊一样开放PC网页版或者植入手机客户端,供大众体验的同时来收集更多的语音语料和其他大数据。