网站SEO基本架构怎么做 广州SEO优化公司

网站SEO架构是指网站的搜索引擎可读性,简单来说就是将网站设计的更符合搜索引擎蜘蛛的抓爬规则,实现高收录,高排名,这样的网站SEO基本机构一般从两点可以体现,第一点是技术上的,优化代码,第二个就是体验上的404页面以及301跳转等等。下面越视界小编来和大家说说网站SEO基本架构怎么做 广州SEO优化公司

网站SEO基本机构怎么做 广州SEO优化公司
网站SEO基本机构怎么做 广州SEO优化公司

SEO信息架构

信息架构是在网站上组织和标记内容以提高用户效率和可资性的实践。最好的信息架构是直观的,这意味着用户不必非常努力地想通过您的网站或找到一些东西。

当访问者点击死链接或错误输入网址时,您的网站还应该有一个有用的404(页面未找到)页面。最好的404页面允许用户点击回到您的网站,这样他们就不会因为他们试图访问不存在的链接而退回。

 

SEO抓取架构

除了确保抓取工具可以访问您最重要的网页之外,还要注意您的网站上有不希望他们找到的网页。这些可能包括具有精简内容的旧URL,重复的URL(例如电子商务的排序和过滤器参数),特殊促销代码页,登台或测试页等等。

阻止搜索引擎中的网页也可以帮助抓取工具确定最重要网页的优先级,并最大限度地提高抓取预算(搜索引擎机器人在您网站上抓取的平均网页数)。

通过抓取工具指令,您可以使用robots.txt文件,元标记,sitemap.xml文件或Google Search Console来控制Googlebot要抓取和索引的内容。

robots.txt

Robots.txt文件位于网站的根目录(例如yourdomain.com/robots.txt)中,并建议您的网站搜索引擎的哪些部分应该也不应该通过特定的robots.txt指令进行抓取。当尝试阻止您网站上的非私人网页搜索引擎时,这是一个很好的解决方案。

您不希望阻止私人/敏感页面在此处被抓取,因为用户和机器人可以轻松访问该文件。

SEO提示:

  • 如果Googlebot无法找到网站的robots.txt文件(40X HTTP状态代码),则会继续抓取该网站。
  • 如果Googlebot找到网站的robots.txt文件(20X HTTP状态代码),它通常会遵守这些建议并继续抓取该网站。
  • 如果Googlebot既未找到20X或40X HTTP状态代码(例如501服务器错误),则无法确定您是否拥有robots.txt文件,并且不会抓取您的网站。

Meta指令

两种类型的元指令是元机器人标签(更常用)和x机器人标签。每个都为抓取工具提供了有关如何抓取和索引网址内容的更强说明。

如果您想大规模阻止搜索引擎,x-robots标记提供了更多的灵活性和功能,因为您可以使用正则表达式,阻止非HTML文件以及应用全站点的noindex标记。

这些是阻止搜索引擎中更敏感的* /私人URL的最佳选择。

*对于非常敏感的URL,最佳做法是从中删除它们或要求安全登录以查看页面。

WordPress提示:在仪表板>设置>阅读中,确保未选中“搜索引擎可见性”框。这会阻止搜索引擎通过您的robots.txt文件访问您的网站!

避免这些常见的陷阱,并且您将拥有干净,可抓取的内容,以便机器人轻松访问您的网页。

一旦确保您的网站已被抓取,下一个业务目标就是确保将其编入索引。

站点地图

站点地图就是这样的:网站上的网址列表,抓取工具可以使用这些网址来发现和索引您的内容。确保Google找到最高优先级网页的最简单方法之一是创建符合Google标准的文件,并通过Google Search Console提交。虽然提交站点地图并不能取代对良好站点导航的需求,但它肯定可以帮助爬​​虫跟踪所有重要页面的路径。

Google Search Console

某些网站(最常见的是电子商务)通过将某些参数附加到网址,在多个不同的网址上提供相同的内容。如果您曾在网上购物,则可能会通过过滤器缩小搜索范围。例如,您可以在亚马逊上搜索“鞋子”,然后按大小,颜色和样式优化搜索。每次细化时,URL都会略有变化。Google如何知道向搜索者提供哪个版本的网址?Google在确定代表性网址方面做得非常出色,但您可以使用Google Search Console中的网址参数功能告诉Google您希望他们如何处理您的网页。

 

索引:搜索引擎如何理解并记住您的网站?

一旦确保您的网站已被抓取,下一个业务目标就是确保将其编入索引。这是正确的 – 只是因为您的网站可以被搜索引擎发现和抓取并不一定意味着它将存储在他们的索引中。在上一节关于抓取的部分中,我们讨论了搜索引擎如何发现您的网页。该指数是你找到的网页存储。在爬虫找到页面后,搜索引擎会像浏览器一样呈现它。在这样做的过程中,搜索引擎分析该页面的内容。所有这些信息都存储在其索引中。

继续阅读以了解索引如何工作以及如何确保您的站点进入这个非常重要的数据库。

我可以看到Googlebot抓取工具如何看到我的网页吗?

是的,您网页的缓存版本将反映googlebot最后一次抓取它的快照。

Google以不同的频率抓取和缓存网页。更成熟,知名网站经常发表像 https://www.nytimes.com将比备受不太知名网站罗杰的Mozbot的身边喧嚣,更频繁地抓取http://www.rogerlovescupcakes.com(如果只是真的 …)

您可以通过单击SERP中URL旁边的下拉箭头并选择“缓存”来查看页面的缓存版本:

您还可以查看网站的纯文本版本,以确定是否正在有效地抓取和缓存重要内容。

页面是否已从索引中删除?

是的,页面可以从索引中删除!可能会删除URL的一些主要原因包括:

  • 该URL返回“未找到”错误(4XX)或服务器错误(5XX) – 这可能是偶然的(页面被移动并且没有设置301重定向)或故意(页面被删除和404ed以便把它从索引中删除)
  • 该URL添加了noindex元标记 –网站所有者可以添加此标记,以指示搜索引擎从其索引中省略该页面。
  • 该网址因违反搜索引擎的网站管理员指南而受到人工处罚,因此已从索引中删除。
  • 在访问者访问该页面之前,已添加密码,因此已阻止URL进行爬网

如果您认为以前在Google索引中的网站上的页面不再显示,您可以通过导航到Search Console中的“ 提交网址 ”工具手动将网址提交给Google 。

网站SEO基本架构怎么做 广州SEO优化公司,全文到这里就结束了,不知道大家在看过之后了解了多少,希望网站SEO基本架构怎么做 广州SEO优化公司这篇文章对大家能够有所帮助!

北京网站优化公司_SEO优化公司_北京新闻发稿_稿件策划撰写_越视界

相关新闻