首页 SEO 使用GSC正则表达式,让Google Search Console 的报告筛选变得更加强大高效

使用GSC正则表达式,让Google Search Console 的报告筛选变得更加强大高效

目前Google Search Console的Performance报告下的“Page”及“Query”报告支持使用正则表达(RegEx)筛选,点击下图中的New按钮,在下拉菜单中可以选择这两个报告

2021年4月,Google Search Console的Performance报告筛选增加了对正则表达式的支持,6月初又新增了否定的选项,支持直接排除符合正则条件的页面。应该很多SEO运营人员都关注到了这一功能更新,但是可能因为对正则不太熟悉,未能充分利用这个功能来促进Google Search Console的数据分析工作。

因此,本文分享了一些大家可能会用到的正则表达式,不熟悉如何写表达式的人也能轻松体验这个功能。

目前Google Search Console的Performance报告下的“Page”及“Query”报告支持使用正则表达(RegEx)筛选,点击下图中的New按钮,在下拉菜单中可以选择这两个报告。

根据需要筛选的是关键词还是页面,选择对应的报告,之后,就可以输入正则条件进行筛选了。

操作过程其实是比较简单的,但是如果对于不熟悉正则表达式的人而言,就没法利用好这个高级版的筛选功能。

下面给大家介绍一些独立站运营人员经常使用到的筛选条件以及对应的正则表达式如何撰写,大家可以根据需要复制后稍作修改就能完成自身网站的数据筛选分析。

1. 筛选包含某个词的关键词或者页面

筛选包含某个词的关键词或者页面,在这个词前后用.*。例如,需要搜索包含pro的词,正则的写法是.*pro.*。

2. 筛选多个特定的页面

如果需要筛选多个页面,URL相同的部分可以只写一次,后面的文件路径使用 | 进行连接,例如:

^https://crossborderdigital.cn/(google-seo|orm-service/sem-service)/ $

表达式符号说明:

  • ^ 表示开始
  • ()表示将一系列元素组合在一起
  • | 表示或的意思,满足其中一个条件即可
  • $ 表示结束

3. 否定筛选

Google Search Console的支持正则表达式否定筛选,直接选择Doesn’t match regex即可,下面的正则表达式跟非否定筛选写法一致,如需要筛选不包含pro的词,如下图:

4. 指定关键词字符数进行筛选

如果需要直接查看网站非长尾关键词来源,可以选择字符数少于10的关键词(也可以更长字符数),正则表达式的写法是:^[\w\W\s\S]{1,10}$,那么,符合这一条件的关键词就能快速被筛选出来,超过10个字符数的长尾关键词将被排除。

正则表达式符号说明:

  • ^ 表示开始
  • [ ] 匹配字符数长度
  • \w 表示匹配任何大小写字母,数字以及下划线。等同于[A-Za-z0-9_]\g
  • \s 表示空格
  • \W 表示匹配非字母,数字及下划线
  • \S 表示匹配任何非空格
  • {1,10} 表示前面的规则重复1-10次
  • $ 表示结束

注意,如果觉得这个表达式的符号太多不容易记住,可以直接复制上面的样例,[\w\W\s\S]整体的意思就是匹配任意字符,因此只需要修改{1,10}来调整限定的字符数长度。

5. 筛选长尾关键词

筛选长尾关键词,可以选择按照字符数长度筛选,例如要搜索字符数大于40的长尾词,对应的正则表达是:^[\w\W\s\S]{40,}$

正则表达式符号说明:

  • ^ 表示开始
  • [\w\W\s\S] 表示匹配任何字符,拆分的符号对应意义见上文第四点。
  • {40,} 表示重复40次及以上
  • $ 表示结束

筛选长尾关键词的方法还有一个是指定单词之间的空格数,比如包含5个空格以上,对应的正则表达式是:(\w+\s){4,}\w+。

正则表达式符号说明:

  • (\w+\s) 表示任何字数后面紧跟一个空格
  • {4,} 表示重复4次以上
  • \w+表示以单词结尾

6. 查找长URL

如果要查找URL较长的页面,例如,超过100个字符数的URL,可以使用正则表达式:^[\w\W\s\S]{100,}$

7. 查找包含特殊字符的URL

查找URL包含特殊字符,正则表达式撰写:[^\/\.\-:0-9A-Za-z_]

正则表达式符号说明:

  • [^] 表示排除一系列字符
  • \/\.\-\: 表示排除URL里面非字母类的字符,例如 ://, –
  • 0-9A-Za-z_ 需要排除的字母,数字

8. 分析关键词了解用户意图

我们在做关键词分析的时候,经常会把关键词分为四大类,包括Informational,Navigational, Commercial, Transactional. 对应的正则筛选模板可参考下方:

  • Information: who|what|when|how|why
  • Navigational: .*brand.*
  • Commercial: .*(best|top|vs|review*).*

最后需要提醒大家注意的是,Google Search Console 对正则表达式的字符数长度有限制,所以建议尽可能精简表达式,例如 example.com/aa|example.com/bb 建议写成 example.com/(aa|bb),两个表达式条件一致,但是后者就精简许多。

使用正则表达式,让Google Search Console 的报告筛选变得更加强大高效,欢迎大家留言分享自己觉得很实用的正则表达式,解决什么情况的快速筛选需求。或者有想筛选/查找的情况但是不知道正则表达式怎么写的,也可以留言一起研究。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

作者: CrossBorderDigital

Google SEO+SEM整合营销服务商,Sermush国内独家金牌代理商,致力于为进行全球业务拓展的中国企业提供服务. 专注于跨境数字营销全案,从品牌规划,广告投放,内容优化,SEO到销售线索获取,包括整体和各环节的规划与落地

为您推荐

7个SEO效果进行考核的指标

我们怎么去判定网站的SEO效果做得好不好呢?跟着小编从以下7大指标来进行考核吧

ASO优化指南:掌握应用商店优化的7个关键点

了解应用商店优化 (ASO)的基础要素,提升应用程序的可见性、增加自然安装量,并降低获客成本

如何利用Semrush找到低竞争难度的关键词

如果你能够了解困难关键词和低竞争难度关键词之间的区别,就可以开始寻找低竞争度关键词,并添加至你的SEO 计划中

如何用 Semrush AI Writing Assistant 四步写出高质量文章

AI Writing Assistant是一款强大的Semrush 应用程序,它集合了75 种不同的 AI 内容生成工具,比如博客和文章内容、社交媒体和广告、营销和电子商务工具等

语义化SEO的10个最佳实践

语义化SEO是指围绕主题或用户需求(而非仅针对关键词)来优化内容的过程,当用户搜索相关词时,从而能获得更好的排名

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部