详解谷歌搜索三大法宝
作者:网络转载 发布时间:[ 2015/1/19 9:49:32 ] 推荐标签:谷歌 搜索引擎
这些努力获得了回报——谷歌搜索支持159种语言,语音搜素(Voice Search)现在支持其中58种语言。谷歌声称该应用的“错词率”已经降低至8%。
戈麦斯自豪地指出谷歌发展过程中的一个里程碑:他现在亲自进行语音展示。“我的口音非常不标准,”这位印度裔工程师说。“我的元音发音是美国的,不过我不发R的的音。”在这个语音项目前,戈麦斯从未亲自去证明谷歌在语音识别方面的努力:相反,该公司使用一位内部的专家,他具有纯正的美国口音,能够与机器和谐共处。现在,戈麦斯已经与这位专家失去联系。“他不再是对这份工作非常重要,”他说。“我可以亲自进行展示。让我坐在记者面前,亲自进行语音输入,我对此毫不畏惧。”
谷歌还必须考虑电话向用户回应的方式。应该像Siri那样的拟人化形象,还是使用明显的机器人语调从而让用户意识到自己在跟系统对话?谷歌选择了后者。该公司搜索设计主管琼·威利表示,为了成功实现与一个有意识个体对话这种错觉,他们必须达到皮克斯(Pixar)般故事自动叙述能力。“我认为从具有个性的计算机到人类与之自然交流还有很长的路要走。”
不过科技迅速发展,已经足以让谷歌(当然,也包括其他一些公司)达到研究人员数十年来所幻想的语音互动级别。“我认为三或四样东西推动实现了这种可能性,”戈麦斯说。“显然,计算机变得更快且运算能力变得更强。硬件——麦克风——也变得更好。软件算法方面也有进步。不过大的变化是我们理解语言的能力。”
费尔南多·佩雷拉(Fernando Pereira)是搜索部门的“杰出搜索科学家”(Distinguished Research Scientist),过去30年他一直从事自然语言处理(NLP)工作。他表示,这几年来,谷歌变得非常善于找出如何接收搜索词条以及将词条与网络及其他其他信息库上的文件配对。他说:“当你进行搜索的时候,很有可能你在词条中使用的词语会出现在部分搜索结果中。”不过将“知识图谱”这样的数据库增加到搜索引擎中会带来新的挑战和机遇。他指出:“要预期所使用的语言是否与数据库所设计的方式配对变得更具难度。”
一方面,这并不容易。当谷歌收到像“巨人队在哪里打比赛?”这样的词条,它必须知道很多东西:该词条涉及体育,球队所比赛的场馆等。它还必须作出选择——这是棒球联盟的巨人队还是橄榄球队?用户希望知道的是该球队通常在哪里打比赛,如主场,还是该球队下周的比赛在哪里进行?谷歌使用词条中的信号以及用户此前的习惯来确定答案。佩雷拉说:“所有这些思考,所有的推理,都是在几年前不能做到的。”
一旦这些障碍被去清除,谷歌的NLP系统可以凭借“知识图谱”而实现进一步提升。“我们开始理解世界上的事物,”戈麦斯说。这让谷歌能够正确地猜测用户在询问什么,甚至即使词条的拼写存在错误或者语言输入不太正确。戈麦斯指出,例如有人向手机说“大卫·卡梅伦(David Cameron)”,系统已经知道这两个词通常是配对在一起的,而且还是男性——因而可以使用替代词“他”。即使麦克风没有太听清楚后面说到的姓,“知识图谱”也可以想到指的是英国首相。
谷歌懂得的东西越多,对用户越了解。
Google Now
在2004年,我问拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)对于搜索的长期展望。佩奇表示,搜索将融入到人们的大脑中。“当你考虑某些东西并且对其了解不是太多,你会自动获得信息。”布林指出,关键点是,“你可以让与你进行交流的设备或者让关注周边事物的计算机,提出有用的信息。”
在2010年,两位在Android部门工作的工程师巴利斯·古尔特金(Baris Gultekin)和安德鲁·基尔斯姆(Andrew Kirsme)着手一项与上述展望非常相符的课外项目,从而创办了Google Now。
根据古尔特金(去年从Google Now调任至该公司其他项目),这款产品恪守他们初的宣传文件。“核心的声明是,现在大家的手机并不智能,不过它们可以变得智能,”他说。“如果我们可以将这些具有各种功能、强劲和连接互联网的设备的能力与谷歌的能力合并在一起,那会怎么样?”
换言之,Google Now可以回答那些你没有主动提出来的词条。这意味着将多个领域的信息合并起来,解决某些重要的事情。古尔特金表示,开始创造一个系统来这样做是令人恐惧的,不过他和他的合作伙伴开始分解在计算领域内可以如何实现这个目标。即使某些类似具有限制性的东西也要求系统具有实质性的知识:家和办公室的地理位置、佳路线、交通信息等。如果Google Maps知道如何在路网中导航,肯定会有帮助作用——但这恰恰是关键的地方。谷歌会使用其全部能力去放大这种搜索工具。很快,他们拥有了一款的应用程序来帮助通勤者。“不过我们不希望它只是作为一款通勤应用,”古尔特金表示。“我们希望它成为一位主动的助手,可以处理很多事情。”因此他们在2012年7月推出了Google Now,主要关注几个领域:通勤、航班、体育比赛、附近的场所、出游、公共交通运输以及天气。现在,它已经覆盖超过70个领域,并且正迅速增加。古尔特金说:“我的远大目标是,Google Now向用户提供大部分所需的信息,而其他东西都只成为备用品。”
Google Now的有效性取决于将对世界的了解(所有这些都是谷歌搜索以及“知识图谱”能够提供的)与个人信息深度融合。这正是为什么有人可能指出,这个搜索的细分部门可视为是谷歌的替代品:每一次Google Now及时提供信息卡,都会利用大量谷歌服务。一张普通的信息卡会将来自个人电子邮件、日程表和通讯录的信息与公交线路安排、交通信息及天气进行整合。
很多时候,只有在Google Now行动后,人们才会准确知道它干些什么。例如,当你停好车后,Google Now会记录你停车并记住你停车的位置——以防你忘记了。如果你的电子邮件告诉Google Now你在找房子,该项服务可能会向你推送你希望居住地区的待租售房屋的照片。
随着Google Now进化,它从一个课外项目发展为一项全职服务。不过其大的助推器可能出现在2011年,当时苹果推出了Siri,这在谷歌总部引起了一些担忧情绪,也为这个以语音为方向的项目吸引了更多资源。它成为搜索部门的一个正式组成部分,尽管该团队实际上受命于搜索和Android两个部门。古尔特金表示:“搜索和Google Now都值得赞美。我们希望在用户搜索之前为其提供信息,不过在很多情况里,我们不知道你的水管爆裂了,你需要水管工。”
(当然,在未来,通过谷歌旗下智能家居企业Nest,谷歌将知道你家的水管何时破裂,或者你家是否着火了。古尔特金表示,整合Nest“可能会在将来,但不是现在”。)
与传统版本的搜索不同的是,Google Now搜索只有在你全部采用谷歌产品的情况下才能起到效果。耶霍舒亚表示:“拉里(佩奇)曾说过,搜索应该理解你的意图并提供你所需的信息。这是一个谷歌生态系统,如果你在手机端和PC上注册登陆后,我们可以予以利用。如果你想要获得航班信息并追踪你的包裹以及任何来自Gmail的信息,我们都会带给你。如果你没有使用Gmail,你不会得到信息——不过你还是可以利用我们的语音服务并获得答案。”
没有其他解决办法——如果你想要使用Google Now但Gmail不是你默认的邮箱,你不会得到Google Now甚至谷歌搜索的全部价值。“如果我们可以将这些信息分享给所有人,这会是非常美好的事情。我不认为这会在明天出现。当然,苹果也会给我们带来压力。”
谷歌非常刻意地不将Google Now作为一款独立的产品。相反,该公司将其视为搜索应用的一部分。该应用并不是以搜索作为名称,而是冠名“谷歌”。这种命名法不仅显示搜索非常密切地与谷歌联系在以前,还显示Googe Now对该公司非常重要。
尽管如此,Googe Now部件仍是可选部件。所有人使用的时候都会考虑隐私警告;该产品看起来无所不知,但也从侧面提醒我们这家巨头对我们是多么了解。随着谷歌对个人信息的掌控引发更多麻烦,特别是在欧洲,当地政府正推动加强监管并实施罚款,甚至威胁将其分拆,该公司希望服务大众的雄心壮志可能会被隐私担忧所挫败。即使对于那些信任谷歌的人士而言,斯诺登事件证明政府可以很轻松地访问我们的信息。如果Google Now知道你把车停在哪里,当地的情报部门也是如此,对吧?
辛格哈尔认为,搜索的第一个时代是以人们想象在他们与某些遥远机器之间进行互动为标志的。现在这个新时代清除了这个障碍。我们预期电话会明白我们的意思。我们预期搜索也同样精通于提供涉及我们个人信息的答案,因为它正在发掘来自网页、文件和公共数据库的信息。
“我认为搜索是所有计算的界面,”辛格哈尔说。“当设备消失或者变小,你将如何与它们互动?因为在大部分时间里,你需要采取行动——可能简单如播放音乐,或复杂如写便签来提醒自己经过附近杂货店时买牛奶。或者你想知道妻子的航班是否准点?或者奥巴马有多高?”
人们可能认为这是理所当然的——他们甚至可能抱怨说谷歌搜索不再像以前那样了。不过辛格哈尔认为,搜索已经跨越了一个他在过去几十年所对付的障碍。辛格哈尔说:“20年来,我作为研究员未能做到这一点”,他指的是他的团队为谷歌搜索实现的成。他承认,有很多问题还有待解决。不过在描述词条后面的科学时,他充满了自豪感。当有人提出“天空为什么是蓝色”这样简单的问题时,谷歌能够成功地进行回应。
相关推荐
更新发布
常用的选择回归测试的方式有哪些?
2022/6/14 16:14:27测试流程中需要重点把关几个过程?
2021/10/18 15:37:44性能测试的七种方法
2021/9/17 15:19:29全链路压测优化思路
2021/9/14 15:42:25性能测试流程浅谈
2021/5/28 17:25:47常见的APP性能测试指标
2021/5/8 17:01:11系统性能测试及调优前期准备
2021/4/15 14:41:29国内比较好用的5款测试管理工具
2021/3/25 17:23:31