如何谷歌工程


  Share  
|


之前,你可以了解如何谷歌工程,你或许应该有一个基本的想法如何上网工程。 当你访问一个网站,你的浏览器实际上是接触网络服务器,计算机,其任务是提供网页等。 所以当你点击一个链接,你的浏览器中的接触,服务器和说, "送我此页" 该服务器的请求,然后发送页面浏览器,它显示在您的计算机上。

公告

服务器计算机,其任务是履行一个专门工作和提供信息。 举例来说, aweb服务器提供了市场上的网站,而邮件服务器发送或接收电子邮件。


好吧,你现在有这个基本的背景下,让我们来看看如何谷歌工程。

在一些很基本的方式,谷歌工程就像其它的搜索引擎。 它的基本操作是完全一样的。 象所有的搜索引擎,谷歌组成,由三部分组成:

  • 一只蜘蛛,也称为履带这蜘蛛"抓取"网页和认定内容的网页。

  • 一个索引这一软件需要的所有资料蜘蛛给它,并创造了一个巨大的索引,可以检索。

  • 查询引擎,这是需要你的搜索要求,把它送到了索引,并报告结果给你。

公告

搜索引擎网站,让您在搜索引擎网站。

蜘蛛

蜘蛛的一部分,该谷歌搜索引擎是一种自动化的软件,也可以叫做机器人,即要求很多好几千页,从数以百计的网站上同时进行。 当病毒发现链接页,因此,这些项目,并请那些为良好。

主要谷歌蜘蛛是googlebot的,它本质上抓取网站每月一次。 显然,许多网站变化多,每月一次,所以谷歌也有履带式命名freshbot即抓取页面不断。

该索引

蜘蛛发送信息的每一页,他们寻找到索引部分的搜索引擎。 该索引那么漂亮惊人jobit创建一个指标的每一个字每一页发送给它由谷歌蜘蛛。 它不只是指数的每一句话和每一个网址,而且还留存纪录那里的每一个字,是对每一页。

多份副本,这个指数是保持对各种谷歌服务器。 一台服务器上,将无法与时并进所有的搜索请求都做了。

该查询引擎

唯一的一部分谷歌你看到的是查询引擎,而你看到的只是一部分。 它的市民面对googlethat邀请的搜索框,在顶部的谷歌页。

当你输入一个搜索来说,谷歌网络服务器发送你的请求转交索引,这是居住在多个索引服务器。 该指数伺服器期待透过指数,并配合他们看到的与你的要求。 索引服务器,然后发送信息,文件服务器,其中取出正确的信息和格式,它使你的浏览器是可以理解的。 这格式化资料,然后发送到你的浏览器。

这一切发生在几分之一秒。

谷歌的特殊酱料

这一切搜索引擎的逻辑是什么新的或革命性的转变。 这项技术已经多年,早谷歌是一线希望,在其创始眼睛是雪亮的。

那么为什么这样谷歌是如此地好,但确实吗?

谷歌用途更好的算法比其他任何搜索引擎,并不断精益求精。 算法是套规则,为执行一项特殊的任务。 在谷歌的情况下,其算法是负责为你的搜索请求,并决定采用何种结果,以示你。

公告

算法的一套规则,为执行一项任务。 在谷歌的情况下,算法是什么因素决定哪些网页,它说,配合你的搜索请求。


谷歌的算法并不特别容易,只是凡人了解,他们就会改变一切的时候,他们不会公开。 谷歌利用100多因素,在其算法。 为每一个搜索,你做的,它考虑了所有这些因素,然后计算出得分为每一个可能的匹配网页。 页面与全场得分最高的是第一项搜索结果。 页与第二最高分数是第二个搜索结果,等等。

部分的度量都是相当obviousthe搜索长远需要出现一个网页,举例来说。 谷歌的算法也因子在多少次中期出现一个网页,无论一词似乎是一个突出的一个部分页,有否出现在标题中的一个网页,和许多其他的因素。

这一切都不是特别革命的,要么。 许多搜索引擎做同样的事。

谷歌的真正辉煌是在利用集体的智慧,在网上以计算出哪些是真正相关的,而不是仅仅依靠这种规则。 谷歌还给出了大量的重量,以数量和种页面链接到某一网页。 举例来说,谷歌数字说,如果一个网页,有很多网站连接到它,赔率都是非常好的说,页是一个重要问题。 如果重要的地点,连接这一页,它的更重要。

所以谷歌计算出一个页面级的每一页,那一页秩成为一个非常重要的部分计算。 例如,你做的一个搜索,并谷歌寻找到你的搜索,任期5倍,对一个网页而几乎没有任何页面链接,但3倍于一个页面(如对纽约时报网站)表示,有很多网站连接到它。 更重要的一页(纽约时报页) ,似乎更高于搜索结果列表中,即使搜索来说,似乎就它不那么频繁。

这是一篇文章说,由西蒙布朗

Share  

© 2005-2010 E-articles.info All Rights Reserved - Terms and conditions