|
Post by account_disabled on Jan 25, 2024 4:37:45 GMT -5
的输入(因为没有更好的术语)。例如,如果谷歌对某个网站发出手动处罚,则必须在某处标记并输入系统。这可能是索引的一部分,但由于此过程是手动管理的并与 网站管理员工具相关联,我认为将其视为一个单独的概念是有用的。 同样,谷歌的拒绝工具是一个单独的输入,在这种情况下部分由网站管理员控制。此数据必须定期处理,然后反馈到算法和 或链接图中。据推测,有一个半自动的编辑过程涉及验证和清理用户提交的数据。所以,这给了我们这样的东西: 当然,还有许多输入可以馈送到系统。 的其他部分。例如, 网站管理员工具中的 站点地图有助于塑造索引。我的目标是让您对主要概念有所了解。如您所 电话数据 见,即使是 简单 版本也很快变得复杂起来。 更新:熊猫、企鹅和蜂鸟 最后,我们有了众所周知和喜爱的算法更新。在许多情况下,更新实际上只是对 代码的一小部分进行更改或添加。不过,在过去几年中,算法更新变得更加棘手。 让我们从最初于 年 月推出的 开始。 更新不仅仅是对代码的调整 它是(并且可能仍然是)一个具有自己的数据结构的子算法,存在于核心算法。 之外(从概念上讲)。每个月左右, 算法都会重新运行, 数据会更新,并且该数据会将您所谓的 排名因素反馈回核心算法。 的操作可能与此类似,因为它是一个子算法和单独的数据集。我们将把它们放在大的蓝色椭圆形之外: 我并不是要暗示 和 是一样的 它们的运作方式截然不同。我只是建议这两种算法更新都依赖于它们自己的代码和数据源,并且只是定期反馈到系统中。 为什么谷歌不直接重写算法来解释熊猫和 或企鹅的意图?其中一部分是计算性的 处理这些数据所需的资源超出了实时基础设施可能处理的范围。随着 变得更快、更强大,这些子算法可能会完全集成( 可能比以前更集成)。另一个原因可能涉及测试和减轻影响。由于第一次 更新产生的巨大影响, 很可能只定期更新 。这可能不是他们只想实。
|
|