推广 热搜： 广告账号设备品程序魅力十大中国关键词金

网站终于被百度收录了！

日期：2024-12-16 作者：0lz7a caijiyuan

核心提示：作者：陌溪大家好，我是阿Q之前一直有小伙伴跑来问我，为啥蘑菇博客上线了这么久，百度出来只有首页？百度收录在聊这个问题之前

作者：陌溪

大家好，我是阿Q

之前一直有小伙伴跑来问我，为啥蘑菇博客上线了这么久，百度出来只有首页？

百度收录

在聊这个问题之前，我们先谈谈什么是 SEO。搜索引擎优化（Search engine optimization，简称 SEO ），指为了提升网页在搜索引擎自然搜索结果中（非商业性推广结果）的收录数量以及排序位置而做的优化行为，是为了从搜索引擎中获得更多的免费流量，以及更好的展现形象。

其实蘑菇网站上线快几年了，但是只收录了首页，归根到底还是因为之前项目选型的时候，采用了 Vue 作为前端开发框架，而我们知道 Vue 作为单页面应用框架，所有的数据都是通过 axios 进行返回的，也可以想成是 ajax 请求异步返回的，是非常不利于 SEO 的。

而百度收录的原理，其实就是百度的爬虫程序去爬取咱们的网站网站，但是因为我们内容都是通过 axios 异步返回，所以只能看到下面这样的骨架代码，因此百度也就只会收录咱们的首页了。

蘑菇页面源码

一般爬虫抓取页面内容是先从一个页面出发，从中提取出其他页面的链接，然后当作下一个请求的对象，一直重复这个过程。所以要有良好的 SEO，需要你在各大网站上拥有外链，这样会提高你的网站被搜索引擎爬虫的几率。

而 Vue 为了解决 SEO 问题，官方有 Vue SSR 方案，后面又推出了 Nuxt.js 框架。

蘑菇其实在旧版本中，也是使用 nuxt.js 实现了一波，经过测试后也确实能够被百度所收录，但是因为同时维护两份代码，有些耗时耗力，并且切换到 nuxt.js后，因为是服务器渲染，网站打开也变慢了很多，因此在种种因素下，也放弃了维护 nuxt_mogu_web 项目

nuxt.js版蘑菇博客

同时，后面也在积极的探索更优雅的 SEO 实现方案，预期是不会较大的改变现有逻辑的基础上，就能够实现。

回归到原始需求，为了提高用户体验我们用了 Vue、React 这些 SPA 技术、为了 SEO 我们用了 SSR、预渲染等技术。

不同技术方案有一定差距，不能兼顾优点。但仔细想，需要这些技术优点的 "用户"，其实时不一样的，SPA 针对的是浏览器普通用户、SSR 针对的是网页爬虫，如 googlebot、baiduspider 等，那为什么我们不能给不同“用户”不同的页面呢，服务端动态渲染就是这种方案。

后来，陌溪在网上冲浪的时候，在 Github 上发现了 prender-alpine 这个开源项目

https://github.com/tvanro/prerender-alpine

prerender项目

prender-alpine 的原理，在 Alpine Linux 上构建的轻量级 Prerender 容器，带有 Node 和 Headless Chrome

Prerender ：可以当做是一个预渲染的容器，项目的原理其实就是相当于跑了一层 node.js 的 Render 层，帮助我们做服务器渲染。

针对爬虫的预渲染

服务端对请求的 user-agent 进行判断，浏览器端直接给 SPA 页面，如果是爬虫，需要通过 Prerender 容器动态渲染的 html 页面进行返回

完整的流程图如下，我们需要通过 nginx 识别出访问我们网站的用户是否是爬虫，还是普通用户，从而请求不同的页面。

完整流程

为了方便小伙伴们的使用，陌溪也把 prender-alpine 项目放到了蘑菇镜像仓库，同时提供了一份 prerender.yml 文件

只需要将其拷贝到蘑菇一键部署的 yaml 目录下即可，同时使用命令进行启动

启动完成后，可以看到项目运行在 3000 端口

容器运行

搭建完成后，我们可以打开浏览器进行测试，打开 172.184.166.150:3000/https://www.moguit.cn 页面，后面挂着的就是你要预渲染的页面，如果能够打开下面的页面，说明已经预渲染成功了

预渲染成功

同时，通过查看网页源码，也能够看到页面的文字和链接了，这样爬虫也就能爬取到我们网站的其它信息

查看源码

下面，我们就需要改造我们的 nginx 了，通过 $http_user_agent 来识别请求的 user_agent 是否属于 Google、百度、必应、360…. 的爬虫

如果识别成功，那么会跳转到刚刚搭建的 prerender 容器中进行预渲染，否则继续返回原来的 Vue 页面

下面是完整的 nginx 配置文件 vue_mogu_web.conf

注意，这个配置需要修改 vue_mogu_web.yml，把刚刚创建的配置文件挂载出来

修改完成后，就可以开始使用接口工具进行测试了，通过设置 Headers 设置请求头信息，加入 User-agent = googlebot 用来标识这个请求是爬虫

调用接口可以看到，我们的页面能够把完整的数据给返回

模拟爬虫请求

同时，如果我们把 User-agent 删掉，这个时候返回的就是我们正常的 SPA 单应用页面了

模拟正常用户

到这里，网站针对爬虫专属的 SEO 就改造完毕了

经过几天测试后，通过 site:www.moguit.cn 进行查询，也可以看到被百度收录了好几个页面了~

百度收录多个页面

好了，本期蘑菇 SEO 优化讲解就到这里

我是陌溪，我们下期再见~

本文地址：http://yejunbin01.xhstdz.com/xwnews/536.html 物流园资讯网 http://yejunbin01.xhstdz.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类生活信息

文章列表

相关文章

最新动态

推荐图文

生活信息

点击排行

• 再次确认！中国将从零实现全球第二：设立自己的	• Faiss(4)：索引(Index)
• 企业网络推广优化策略，高效市场渗透秘籍揭晓	• 微信输入法来了，其他输入法接得住吗？
• 外链规划师：淘宝外链建设规划及执行方案	• 手机百度 13.63.5.10
• 2024汇总！咸阳市各区县科技型中小企业认定奖补	• 「沈阳关键词排名优化软件」沈阳关键词推广公司
• 如何在巨量引擎广告上投放广告？电商平台信息流	• 广元百度推广优化，企业市场抢占新引擎