详解谷歌搜索三大法宝

作者：网络转载发布时间：[ 2015/1/19 9:49:32 ] 推荐标签：谷歌搜索引擎

　　统治地位
　　谷歌现在面临的威胁并不是由强劲对手所组建的封闭网络，而是搜索现在似乎已经从网络迁移至各款应用程序（向移动端转移也代表了谷歌的搜索广告收入受到挑战）。谷歌认为这种应用内部信息的崛起是可以被其征服的——毕竟，移动开发者也希望自己的信息能够被世人了解。自从2013年秋天以来，谷歌启动了一个名为App Indexing的项目，希望将移动应用程序内的数据集中到其总索引。不过应用索引目前并不包括iOS应用，这是一个比较大的问题。App Indexing产品经理劳伦斯·张（Lawrence Chang）表示：“仍然有一条很长的路要走。不过我们已经打造了基础性的结构单元。”
　　不过现在，网络应用世界的挑战并没有影响谷歌在搜索领域的统治地位。数据仍然大得令人惊讶。谷歌每天接受超过30亿条搜索词条。在美国，三分之二的搜索使用谷歌——在全球范围内，该公司仍然享受类似的统治地位（近市场份额降低主要不是因为搜索质量问题，而是雅虎与火狐达成协议，取代谷歌成为该浏览器的默认搜索引擎）。甚至更为令人印象深刻的是，谷歌处理超过80%移动搜索。2013年谷歌遭遇持续5分钟的宕机事件，网络流量减少40%。
　　没有任何一家搜索领域竞争对手能达到谷歌的基础设施、人才储备或者经验。没多少企业能有谷歌的雄心壮志。因此尽管有关谷歌的新闻报道出现了监管问题、谷歌眼镜的幸运与不幸以及YouTube的青少年超级，搜索一直进行着稳定且高强度的革新。
　　从某些方面看，这些革新只是延续谷歌自初以来对搜索所进行的变革。在微观基础上，谷歌对其算法进行了一些细微调整，在每周一次的搜索质量发布会上对其大加称赞。之后，每2年或3年，其排名系统会出现重大更新，从而在那些与关键字高度相关的企业之间产生赢家和输家。近一次是在2013年，推出代号为Hummingbird的算法。过去10年，本·戈麦斯(Ben Gomes)一直在搜索部门担任辛格哈尔的副手，他指出谷歌在过去3年对搜索排名进行的调整超过了此前13年。
　　从各个方面看，大的挑战一直在于针对从PC向便携设备转移的趋势进行调整。正如很多互联网企业一样，谷歌搜索采用一种以移动为中心的办法。谷歌搜索的主设计师琼·威利(Jon Wiley)表示：“移动端对我们如何考虑设计产生巨大影响。”在执掌搜索设计领导职位后，他首先做的一样事情是将移动和PC团队整合在一起。初，这个想法是将大量努力投入到手机端——现在，他表示，完全是关于将搜索视为一种多设备的体验。
　　知识图谱
　　重大变革当中，哪项为意义重大的？谷歌搜索团队对此毫不掩饰。搜索业务负责人辛格尔明确表示：“当然是知识图谱（Knowledge Graph），只要你开始进行打造，能慢慢了解现实世界。第二是语音输入——因为我不能在这里打字，”他一边说着，一边向手腕上的三星智能手表打手势。“我们还意识到，除了预测外还需要一些科学，这样的话人们不必总是提出问题，因此我们开发了Google Now。”
　　知识图谱将全世界的知识打造成一个广大的数据库。语音搜索将语音带到搜索。Google Now在用户提问之前告知答案。所有这三项都与谷歌对移动端的关注密切相关。这些组成部分——以及它们运作的方式——已经在过去三年帮助对谷歌搜索进行改造：从一个“10个蓝色链接”的投递系统到某些几乎超自然的东西——这个系统的行为并不像计算机，而是一个智能的知识储备库，能够聪明地解译和满足你的信息需求。在你还没有开始予以寻找的时候，它已经完成一切。
　　谷歌在2010年收购一家名为MetaWeb的公司，该消息并没有引起太多关注。但事实证明这笔并购成为了谷歌搜索史上一项意义重大的变革的关键。
　　MetaWeb在2005年由丹尼·希利斯（Danny Hillis）创办，他是一位知名的计算机科学家和企业家。在经营他的公司Applied Minds时，希利斯构想了大量创造性项目，不过他认为MetaWeb项目非常意义重大，因而将其剥离出来成为一家独立公司。MetaWeb公司在2007年成立，是所谓的Semantic Web的首批重大利用成果之一。Semantic Web实际上是一种处理多数据库的办法，经整合后数据库中的信息可被轻松阅读。希利斯说：“我们尝试创造一个全球性的数据库，包含全世界的信息。”由于Metaweb可以扫描互联网来回答问题，因而被广泛视为是谷歌的竞争对手。不过在经过几年的经营以及超过5000万美元融资后，希利斯意识到只有加入一家规模更大的公司——即谷歌——这个想法才能开花结果。
　　当时，谷歌已经在向用户提问提供一些直接的回答：如果你输入“奥巴马生日”，它会在搜索结果的顶部显示“1961年8月14日”。不过，正如谷歌在2010年7月一篇宣布收购Metaweb的博客文章上解释说，谷歌的搜索引擎未能回答像“美国西岸学费低于3万美元的大学”或“至少夺得过一个奥斯卡奖项的40岁以上艺人”这样的问题。该篇博客承诺Metaweb将帮助谷歌提供这些答案。
　　产品经理艾米丽·莫斯利（Emily Moxley）从2011年开始参与到Metaweb项目，她表示：“谷歌收购Metaweb的时候，知道‘物’的概念将成为搜索一个非常重要的部分。我们认为这是快速呈现一些简要事实以及人们所关注事物的有关信息的良好途径。”
　　在2012年5月，谷歌推出了这些Metaweb材料，将其称为“知识图谱”（Knowledge Graph）。该项目从1200万实体发展至5亿。该产品可以在自认为合适的时候对搜索结果提供补充性的答案：多项有关所搜索主题的关键事实，其位置位于平常的搜索排名的右侧。这看起来有点“手气不错”（I’m feeling lucky）的感觉。
　　在介绍谷歌如何考虑哪些词条应该获得知识图谱结果时，莫斯利引用了弗吉尼亚州里奇蒙德（Richmond，Virginia）地区的洲际高速公路系统。从西北向佛罗里达州进发的游客应该非常清楚这种情况——在里奇蒙德背部，95号公路出现分叉，驾驶员可以选择继续沿南北主干道行驶并途径市中心，或者选择295号公路，在外围绕过该城市并在里奇蒙德南部再进入95号公路。
　　她解释说，如果用户提供一个搜索词条，谷歌将其扩展为替代性的形式以及同义词等，之后提供一个算法测试，从而了解它是否与“知识图谱”结果具有相关性。“然后，用户可能会选择295号公路的出口，说‘好，有什么可能的知识图谱内容会对这个词条有用？’——我们搜索所有的文件，给出相关的内容。之后用户再次回到95号公路，我们说‘好，我们认为这些内容足够有用，让我们更显著地呈现这些信息吧’。”
　　谷歌搜索与“知识图谱”整合的2年多里，该公司继续改善这款产品（谷歌并未正式公布设计“知识图谱”回答的词条比例，不过似乎大约为25%）。初，“知识图谱”较为动态。不过这款产品逐渐掌握谷歌搜索本身所具有的学习能力，能够分析用户的习惯。莫斯利举了“谁在电影《太空炮弹》（Spaceballs）中扮演Barf？”作为例子，“知识图谱”已经接触了非常多词条，因而知道如何提供涉及演员和电影的图解——并且以非常快的速度完成。
　　“知识图谱”也在另一个重要领域——新鲜度——取得较大进步。由于谷歌假定对一个问题提供一个正确答案，因此其信息必须与时俱进。否则，答案会是错误的，对用户造成的影响会比没有答案更糟糕。莫斯利表示，“知识图谱”在2012年推出的时候，其中一个实体的变化——例如大众汽车（Volkswagen）决定聘请新的首席执行官——该系统可能要花长达2周来反映这种变化。现在该系统能够在几分钟内处理这些新闻并进行调整。但是她承认，对“知识图谱”而言，这种特定的“大众汽车首席执行官”词条既是成功也是失败。新任首席执行官要几个月后才会正式上任。“知识图谱”仍然展示当前的，不过很多在谷歌输入“大众汽车首席执行官”词条的用户可能寻求的是有关继任者的信息。因此，尽管“知识图谱”是正确的，其回复可能不会令用户满意。
　　谷歌还需要进行很多改进。首先是增加更多领域和行业；该项目近增加了汽车、视频游戏及雨果奖（Hugo Award）获奖者的知识。不过她表示，谷歌正尝试找出如何提供更加复杂的结果——不再只是快速事实，还提供更主观、更模糊的联想。“人们不只是对事实感兴趣，”她说。“他们对一些主观性的东西也感兴趣，如该电视节目是否好看。这些东西能帮助将‘知识图谱’提升至新的级别。”这像谷歌并不希望让用户感觉自己在进行机械搜索，而是咨询一位圣人，这位圣人不仅无所不知而且在文化方面还具有自己的独立见解。
　　不过这还需要走很长的路，并且由于对“知识图谱”所提供信息的预期提升，其所犯错误也不断令用户感到失望。莫斯利近较为烦恼，因为她意识到“知识图谱”虽然了解电视节目的信息，但是缺乏有关新节目以及何时播出的内容。她说：“我希望有这样的提醒，能告诉我本周有新节目播出，我也想知道哪些网站有放映，从而可以登陆观看，”承诺终谷歌将穿越这个“中间阶段”，虽然该项目还没有将所有东西都收入到目录中。
　　谈到期望提升，可能“知识图谱”显眼的错误是谷歌在2010年夏天收购Metaweb时提到的两个问题。4年后，其搜索引擎仍然未能对“美国西岸学费低于3万美元的大学”或“至少夺得过一个奥斯卡奖项的40岁以上艺人”等问题提供一站式答案。
　　语音输入
　　在意识到移动技术将变得无处不在后，谷歌决定对搜索业务进行一项细微但意义重大的调整。该公司不再将搜索词条视为向计算机系统提交的指令，而是把所有输入的内容都当成是对话。“很显然，一旦你拥有这种类型的设备（他举起手机做例证），语音输入将变得非常重要，”本·戈麦斯说，“同样非常明确的是，用户说话比打字更自然。”
　　这种调整不仅涉及改变搜索引擎处理词条的方式。它意味着改变我们。我们现在可以将搜索框——不管在PC或在移动端上——视为可以进行对话的对象。塔玛尔·耶霍舒亚(Tamar Yehoshua)表示：“在谷歌出现前，人们并没有词条的概念，我们花了多年时间教会大家使用词条。不过，如果你以平常的方式进行交流，不必进行很认真的思考，这样不是更轻松吗？这会是非常美好的情景。”
　　进行这种变革需要2个方面。首先，谷歌的搜索引擎必须加强，从而更仔细地倾听，对输入的语音内容进行分析。之后谷歌必须确保当用户向手机发出语音指示——或者在搜索框通过文字进行交流，其系统会理解用户在说什么。
　　的确，谷歌已经在语音识别方面进行了一段时间的努力。“在很多年前，我们当然知道这些基础部分——语音、自然语言处理——将具有重要意义，”耶霍舒亚说。“我们知道那些都是投资，都是科技界未曾解决的问题，我们需要花多年时间才能收获成果。”在20世纪初的几年里，谷歌有一项服务名为Google 411，所做的事情跟用户拨打（付费）电话号码查询系统时电话公司所做的事情一样。谷歌使用那数百万的免费电话来学会如何正确地解译不同语言和口音的语音。这一点非常有用，不过在其他一些地方，谷歌并没有获得分析语音输入所需的大约2500个短语样本。因此，该公司开始派遣小型团队到多个不同的地区，并在此之前在谷歌网络发布消息称该公司希望收集语音样本。在印度尼西亚进行的努力具有代表意义。谷歌语音专家林奈·哈（Linne Ha）说：“在第二天，有900人现身。”谷歌进行这些研究的时候，会选择在与该地区相匹配的现场条件进行收集：如在香港的街道和巴黎的地铁路里记录物体。

本文内容不用于商业目的，如涉及知识产权问题，请权利人联系SPASVO小编(021-61079698-8054)，我们将立即处理，马上删除。