Google 会从很多不同的来源获取信息,包括:
- 网页;
- 用户提交的内容,例如“Google 我的商家”和地图用户提交的内容;
- 图书扫描;
- 互联网上的公共数据库;
- 以及许多其他来源。
Google按照以下三个基本步骤来生成基于网页的结果:
1、抓取
第一步是找出网络上存在哪些网页。不存在包含所有网页的中央注册表,因此Google必须不断搜索新网页并将其添加到已知网页列表中。由于Google之前已经访问过某些网页,因此这些网页是Google已知的网页。当跟踪已知网页上指向新网页的链接时,Google会发现其他网页。当网站所有者以列表形式(站点地图)提交一系列网页供Google抓取时,Google也会发现其他网页。如果您使用受管的网站托管服务,如Wix或Blogger,这些服务可能会让Google抓取您更新后的网页或添加的新网页。
Google发现网页网址后,会访问或抓取该网页以了解其中的内容。Google会呈现该网页,并分析文字和非文字内容以及整体视觉布局,确定该网页应显示在搜索结果中的什么位置。Google越了解您的网站,就越能准确地将您的网站与正在查找您内容的用户相匹配。
如何改善网站抓取效果:
验证Google能否访问您网站上的网页,以及这些网页看起来是否正确。确保Google能以匿名用户(没有密码和信息的用户)的身份访问网页。Google还应该能够查看该网页的所有图片和其他元素,以便能够正确了解该网页。您可以在移动设备适合性测试工具中输入网页网址快速检查网页。
如果您创建或更新了单个网页,您可以向Google提交具体网址。如需让Google同时了解多个新网页或更新后的网页,您可以使用站点地图。
如果您想让Google只抓取1个网页,请将该网页设为首页。在Google看来,您的首页就是您网站上最重要的网页。为促成完整网站抓取,请确保您的首页(以及所有网页)包含一个良好的网站导航系统,能链接到您网站上的所有重要版块和网页。这会有助于用户(和Google)在您的网站上找到所需内容。对于小型网站(少于1000个网页),只需让Google知道您的首页即可,前提是Google可以通过从首页开始的链接路径访问所有其他网页。
将您的网页链接到Google已知的其他网页。但是,请务必注意,Google不会跟踪广告中的链接、其他网站中由您付费的链接、评论中的链接或其他未遵循Google网站站长指南的链接。
您无法通过向Google付费来提高网站抓取频率或网站排名。任何关于Google会在收取费用后提高网站抓取频率的消息均是子虚乌有。
2、编入索引
发现网页后,Google会尝试了解该网页的内容。此过程称为“编入索引”。Google会分析该网页的内容、为网页上嵌入的图片和视频文件编制目录,并通过其他方式尝试了解网页。这些信息存储在Google索引中,而Google索引是一个存储在很多很多计算机中的巨大数据库。
如何改善网页索引编制效果:
制作简短且有意义的网页标题。
使用传达网页主题的网页标题。
使用文字(而非图片)传达内容。(尽管Google能够理解一些图片和视频,但相比图片和视频,文字更易于理解。请至少使用替代文本和其他属性为视频和图片添加适当的注释。)
3、呈现(和排名)
当用户输入查询时,Google会根据许多因素尝试从其索引中找到最相关的答案。Google会努力确定最优质的答案,并会考虑其他因素(例如,考虑用户所在位置、使用的语言及设备(桌面设备或手机)等因素),以便提供最佳用户体验和最恰当的答案。例如,在用户搜索“自行车维修店”后,Google向巴黎用户显示的答案与向香港用户显示的答案有所不同。Google不会通过收取费用来提高网页排名,网页排名是以编程方式完成的。
要改善您的网页呈现和排名效果,请注意以下事项:
提高网页加载速度,并使其适合移动设备访问。
在网页上发布实用的内容并保持更新。
遵循Google网站站长指南,这有助于提供良好的用户体验。(摘自谷歌官方)
- 我的微信
- 这是我的微信扫一扫
-
- 我的微信公众号
- 我的微信公众号扫一扫
-
2020年11月29日 上午1:57 1F
只有掌握了原理才能进一步发展
2020年12月2日 上午12:31 2F
这应该是所有搜索引擎的原理吧
2020年12月5日 下午10:15 3F
抓取-索引-排名