SEO收录异常诊断:负载均衡架构导致的SEO问题及解决方案( 二 )

  
就是百度根本没有抓取到真实的页面URL , 实际上抓取的是API域名+request_uri ,   
即假设数据库服务器API给前端渲染的数据路径是api.**.com , 走内网IP,  
抓取到的页面URL为:https://api.**.com/post/1.html  
真实应该是外网IP的URL:https://www.**.com/post/1.html  
既然核心问题已把握30% , 下一步自然是数据证明 , 主要从几个点 。  
1、翻开发日志记录  
2、4月前后的服务器日志整理对比  
从1中发觉 , 4.13号负载均衡的数据服务器api取消代理 , 这样造成的后果是前端直接抓取了host主机值为api域名下的数据在前端渲染 , 因为是直接使用内网IP没经过代理 , 同时api二级域名为host主机值 。  
从2中发觉 , 4月前后日志的host主机值出现了改变 , 由www.**.com变成了api.**.com 。  
最终 , 问题就出现在host主机为api的站点 , 没有使用代理 , 也就是说只要api站点通过代理变成www的二级站点渲染即可 。如果没有使用代理 , 百度GET返回的页面是内网IP , 抓取到的也就是https://api.**.com/post/1.html 这个URL 。  
解决方案:  
1、负载均衡的数据服务器api接口使用代理  
2、Head区增加标签  
3、前端渲染的HTML使用绝对路径  
4、开发个API接口推送数据  
本文完 。鉴于本人仅是SEO , 运维能力有限 , 单机服务器配置下站可以 , 负载均衡只是略微听过 , 如有运维方面错误之处请见谅 。  
来源:卢松松博客 作者:深圳传说 文中举例完成主域名网址为www.name.com  

SEO收录异常诊断:负载均衡架构导致的SEO问题及解决方案
  
文章插图  
申请创业报道 , 分享创业好点子 。 , 共同探讨创业新机遇!  


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。