最近,谷歌搜索的内部文件意外泄露,为SEO专家们提供了前所未有的机遇,深入了解谷歌排名算法的内在工作机制。这些文件揭示了谷歌如何利用点击数据、链接、内容、实体、Chrome浏览器数据等多种因素来决定网页的排名。
发生了什么
2024年3月13日,一个名为yoshi-code-bot的自动化机器人在Github上发布了数千份来自谷歌内部的Content API Warehouse文件。这些文件随后被SparkToro联合创始人Rand Fishkin在本月早些时候获得。
我们为什么关心
这些泄露的文件可能揭示了谷歌排名算法的运作方式,对SEO专家来说,这是宝贵的信息。就像2023年Yandex搜索排名因素泄露事件一样,这次谷歌文件泄露事件可能会成为SEO和谷歌搜索历史上的重大新闻。
文件内容
根据Fishkin和iPullRank首席执行官Michael King的说法,我们了解到以下信息:
- 当前性:文件显示的信息截至到2024年3月是准确的。
- 排名特征:API文档中有2,596个模块,包含14,014个属性。
- 权重:文件并未指明这些排名特征的具体权重,只是确认了它们的存在。
- Twiddlers:根据King的说法,这些是重新排序功能,能够“调整文档的信息检索分数或改变文档的排名”。
链接依旧重要
虽然谷歌官方人员曾否认链接是“前三大排名因素”或链接对排名的重要性下降,但这些文件显示链接的多样性和相关性依旧是关键,PageRank依然在谷歌排名特征中占有一席之地。
成功点击至关重要
根据文件,如果你想要排名良好,就需要不断创造优质内容和用户体验。谷歌使用多种测量方式,包括badClicks、goodClicks、lastLongestClicks和unsquashedClicks。
品牌和实体至关重要
Fishkin的主要观点是品牌比任何其他因素都更重要。谷歌存储与内容相关的作者信息,并尝试确定一个实体是否是文档的作者。
Chrome数据
ChromeInTotal这个模块表明,谷歌使用Chrome浏览器的数据来进行排名。
小站点的机会
smallPersonalSite这个特征为个人小站点或博客提供了机会。King推测谷歌可能通过Twiddler提升或降低这些站点的排名,但这仍然是一个未知数。
其他有趣的发现
- 新鲜度:谷歌会查看byline(bylineDate)、URL(syntacticDate)和页面内容(semanticDate)中的日期。
- 文档是否为网站核心主题:谷歌会对页面和网站进行向量化,然后比较页面嵌入(siteRadius)与网站嵌入(siteFocusScore)。
- 域名注册信息:谷歌存储域名注册信息(RegistrationInfo)。
- 页面标题:谷歌有一个名为titlematchScore的特征,用于衡量页面标题与查询的匹配程度。
- 字体大小:谷歌测量文档中术语的平均加权字体大小(avgTermWeight)和锚文本。
结论
这些泄露文件为我们提供了谷歌搜索排名背后的秘密。SEO专家们可以利用这些信息来优化内容,从而提高在谷歌搜索结果中的排名。当然,我们还需要进一步分析和理解这些特征的权重和应用。
澄清
关于这些文件是被“泄露”还是“发现”的说法有所争议。有消息称,这些内部文件可能是在代码审查中意外包含在内,并从谷歌的内部代码库推送到线上,随后被发现。
来源
EA Eagle Digital的CEO和SEO总监Erfan Azimi在一段视频中声称,他负责与Fishkin分享这些文件。Azimi并非谷歌员工。
Inlinks的CEO Dixon Jones使这14,000个谷歌搜索变量可搜索。Jones表示,这个工具将告诉你谷歌存储了哪些信息以及它们的用途。
发表回复