返回

谷歌三大法宝:知识图谱、语音搜索和Google Now

时间:2015-1-19  编辑:邢台网络公司

谈到期望提升,可能“知识图谱”最显眼的错误是谷歌在2010年夏天收购Metaweb时提到的两个问题。4年后,其搜索引擎仍然未能对“美国西岸学费低于3万美元的大学”或“至少夺得过一个奥斯卡奖项的40岁以上艺人”等问题提供一站式答案。
语音输入
在意识到移动技术将变得无处不在后,谷歌决定对搜索业务进行一项细微但意义重大的调整。该公司不再将搜索词条视为向计算机系统提交的指令,而是把所有输入的内容都当成是对话。“很显然,一旦你拥有这种类型的设备(他举起手机做例证),语音输入将变得非常重要,”本·戈麦斯说,“同样非常明确的是,用户说话比打字更自然。”
这种调整不仅涉及改变搜索引擎处理词条的方式。它意味着改变我们。我们现在可以将搜索框——不管在PC或在移动端上——视为可以进行对话的对象。塔玛尔·耶霍舒亚(Tamar Yehoshua) 表示:“在谷歌出现前,人们并没有词条的概念,我们花了多年时间教会大家使用词条。不过,如果你以平常的方式进行交流,不必进行很认真的思考,这样不是更轻松吗?这会是非常美好的情景。”
进行这种变革需要2个方面。首先,谷歌的搜索引擎必须加强,从而更仔细地倾听,对输入的语音内容进行分析。之后谷歌必须确保当用户向手机发出语音指示——或者在搜索框通过文字进行交流,其系统会理解用户在说什么。
的确,谷歌已经在语音识别方面进行了一段时间的努力。“在很多年前,我们当然知道这些基础部分——语音、自然语言处理——将具有重要意义,”耶霍舒亚说。“我们知道那些都是投资,都是科技界未曾解决的问题,我们需要花多年时间才能收获成果。”在20世纪初的几年里,谷歌有一项服务名为Google 411,所做的事情跟用户拨打(付费)电话号码查询系统时电话公司所做的事情一样。谷歌使用那数百万的免费电话来学会如何正确地解译不同语言和口音的语音。这一点非常有用,不过在其他一些地方,谷歌并没有获得分析语音输入所需的大约2500个短语样本。因此,该公司开始派遣小型团队到多个不同的地区,并在此之前在谷歌网络发布消息称该公司希望收集语音样本。在印度尼西亚进行的努力具有代表意义。谷歌语音专家林奈·哈(Linne Ha)说:“在第二天,有900人现身。”谷歌进行这些研究的时候,会选择在与该地区相匹配的现场条件进行收集:如在香港的街道和巴黎的地铁路里记录物体。
这些努力获得了回报——谷歌搜索支持159种语言,语音搜素(Voice Search)现在支持其中58种语言。谷歌声称该应用的“错词率”已经降低至8%。
戈麦斯自豪地指出谷歌发展过程中的一个里程碑:他现在亲自进行语音展示。“我的口音非常不标准,”这位印度裔工程师说。“我的元音发音是美国的,不过我不发R的的音。”在这个语音项目前,戈麦斯从未亲自去证明谷歌在语音识别方面的努力:相反,该公司使用一位内部的专家,他具有纯正的美国口音,能够与机器和谐共处。现在,戈麦斯已经与这位专家失去联系。“他不再是对这份工作非常重要,”他说。“我可以亲自进行展示。让我坐在记者面前,亲自进行语音输入,我对此毫不畏惧。”
谷歌还必须考虑电话向用户回应的方式。应该像Siri那样的拟人化形象,还是使用明显的机器人语调从而让用户意识到自己在跟系统对话?谷歌选择了后者。该公司搜索设计主管琼·威利表示,为了成功实现与一个有意识个体对话这种错觉,他们必须达到皮克斯(Pixar)般故事自动叙述能力。“我认为从具有个性的计算机到人类与之自然交流还有很长的路要走。”
<<<5>>>
回顶部
分享到: