博客收录配置:Google、Bing
前言
博客上线之后,页面能访问只是第一步。后续如果想从 Google、Bing 这些搜索引擎拿到自然流量,至少要先让文章有机会被抓取和收录。新站刚开始没什么外链,等搜索引擎自己发现会比较慢,可以先把 Google 和 Bing 的站长工具配置好。
一、Google Search Console
所有权验证
Google Search Console 需要先确认这个站点归你管理,后面才能提交 Sitemap、查看抓取状态和请求编入索引。
这里用的是 HTML 文件验证。Google 会给一个类似这样的文件:
google1812d4946f844c89.html
Astro 项目里,想让一个文件部署后出现在网站根目录,最简单的方式是放到 public/ 目录:
public/google1812d4946f844c89.html
构建后它会被复制到 dist/ 根目录。文件放好并部署完成后,Google 需要能访问到这个地址:
https://blog.okuum.com/google1812d4946f844c89.html
在浏览器访问一下这个地址,检查页面内容是否和 Google 提供的验证文件一致。确认没问题后,再回到 Google Search Console 点验证就行。
确认 Sitemap 入口
Sitemap 入口指的是提交给搜索引擎的站点地图地址。对于 Astro 生成的 Sitemap,入口是:
https://blog.okuum.com/sitemap-index.xml
不同框架或插件生成的地址不完全一样,常见情况如下:
| 框架 | Sitemap 地址 | 生成方式 |
|---|---|---|
| Hugo | yourblog.com/sitemap.xml | 内置自动生成 |
| Hexo | yourblog.com/sitemap.xml | 安装 hexo-generator-sitemap 插件 |
| Jekyll | yourblog.com/sitemap.xml | 安装 jekyll-sitemap 插件 |
| WordPress | yourblog.com/sitemap_index.xml | Yoast SEO 插件自动生成 |
提交 Sitemap
验证通过以后,在 Search Console 里这样提交:
- 选择已经验证过的站点资源。
- 打开“站点地图”。
- 在输入框里填写:
sitemap-index.xml
- 提交,等 Google 读取结果。
提交 Sitemap 不等于马上收录。它只是把站点 URL 提交给 Google,后面还要等 Google 抓取和判断是否收录。按照 Google 官方说法,重新抓取可能需要几天到几周。
收录验证
可以在 Google 搜索框里输入:
site:blog.okuum.com
查看当前已经被 Google 收录的页面。
二、Bing Webmaster Tools
Bing Webmaster Tools 可以直接导入 Google Search Console 的数据,省去重复验证站点和提交 Sitemap 的操作。
- 打开 Bing Webmaster Tools。
- 选择从 Google Search Console 导入站点数据。
三、百度搜索资源平台
四、加速收录的额外技巧
单篇文章手动请求索引(Google 独有)
新文章发布后,可以在 Google Search Console 顶部搜索框输入文章 URL,然后点击“请求编入索引”。这一步适合刚发布的单篇文章,但请求抓取不保证马上收录,通常仍需要几天到几周。
在 robots.txt 确认没有误屏蔽
robots.txt 里可以直接声明 Sitemap 地址,爬虫访问时会自动发现:
User-agent: *
Allow: /
Sitemap: https://blog.okuum.com/sitemap-index.xml