2021年4月,Google Search Console的Performance报告筛选增加了对正则表达式的支持,6月初又新增了否定的选项,支持直接排除符合正则条件的页面。应该很多SEO运营人员都关注到了这一功能更新,但是可能因为对正则不太熟悉,未能充分利用这个功能来促进Google Search Console的数据分析工作。
因此,本文分享了一些大家可能会用到的正则表达式,不熟悉如何写表达式的人也能轻松体验这个功能。
目前Google Search Console的Performance报告下的“Page”及“Query”报告支持使用正则表达(RegEx)筛选,点击下图中的New按钮,在下拉菜单中可以选择这两个报告。
根据需要筛选的是关键词还是页面,选择对应的报告,之后,就可以输入正则条件进行筛选了。
操作过程其实是比较简单的,但是如果对于不熟悉正则表达式的人而言,就没法利用好这个高级版的筛选功能。
下面给大家介绍一些独立站运营人员经常使用到的筛选条件以及对应的正则表达式如何撰写,大家可以根据需要复制后稍作修改就能完成自身网站的数据筛选分析。
1. 筛选包含某个词的关键词或者页面
筛选包含某个词的关键词或者页面,在这个词前后用.*。例如,需要搜索包含pro的词,正则的写法是.*pro.*。
2. 筛选多个特定的页面
如果需要筛选多个页面,URL相同的部分可以只写一次,后面的文件路径使用 | 进行连接,例如:
^https://crossborderdigital.cn/(google-seo|orm-service/sem-service)/ $
表达式符号说明:
- ^ 表示开始
- ()表示将一系列元素组合在一起
- | 表示或的意思,满足其中一个条件即可
- $ 表示结束
3. 否定筛选
Google Search Console的支持正则表达式否定筛选,直接选择Doesn’t match regex即可,下面的正则表达式跟非否定筛选写法一致,如需要筛选不包含pro的词,如下图:
4. 指定关键词字符数进行筛选
如果需要直接查看网站非长尾关键词来源,可以选择字符数少于10的关键词(也可以更长字符数),正则表达式的写法是:^[\w\W\s\S]{1,10}$,那么,符合这一条件的关键词就能快速被筛选出来,超过10个字符数的长尾关键词将被排除。
正则表达式符号说明:
- ^ 表示开始
- [ ] 匹配字符数长度
- \w 表示匹配任何大小写字母,数字以及下划线。等同于[A-Za-z0-9_]\g
- \s 表示空格
- \W 表示匹配非字母,数字及下划线
- \S 表示匹配任何非空格
- {1,10} 表示前面的规则重复1-10次
- $ 表示结束
注意,如果觉得这个表达式的符号太多不容易记住,可以直接复制上面的样例,[\w\W\s\S]整体的意思就是匹配任意字符,因此只需要修改{1,10}来调整限定的字符数长度。
5. 筛选长尾关键词
筛选长尾关键词,可以选择按照字符数长度筛选,例如要搜索字符数大于40的长尾词,对应的正则表达是:^[\w\W\s\S]{40,}$
正则表达式符号说明:
- ^ 表示开始
- [\w\W\s\S] 表示匹配任何字符,拆分的符号对应意义见上文第四点。
- {40,} 表示重复40次及以上
- $ 表示结束
筛选长尾关键词的方法还有一个是指定单词之间的空格数,比如包含5个空格以上,对应的正则表达式是:(\w+\s){4,}\w+。
正则表达式符号说明:
- (\w+\s) 表示任何字数后面紧跟一个空格
- {4,} 表示重复4次以上
- \w+表示以单词结尾
6. 查找长URL
如果要查找URL较长的页面,例如,超过100个字符数的URL,可以使用正则表达式:^[\w\W\s\S]{100,}$
7. 查找包含特殊字符的URL
查找URL包含特殊字符,正则表达式撰写:[^\/\.\-:0-9A-Za-z_]
正则表达式符号说明:
- [^] 表示排除一系列字符
- \/\.\-\: 表示排除URL里面非字母类的字符,例如 ://, –
- 0-9A-Za-z_ 需要排除的字母,数字
8. 分析关键词了解用户意图
我们在做关键词分析的时候,经常会把关键词分为四大类,包括Informational,Navigational, Commercial, Transactional. 对应的正则筛选模板可参考下方:
- Information: who|what|when|how|why
- Navigational: .*brand.*
- Commercial: .*(best|top|vs|review*).*
最后需要提醒大家注意的是,Google Search Console 对正则表达式的字符数长度有限制,所以建议尽可能精简表达式,例如 example.com/aa|example.com/bb 建议写成 example.com/(aa|bb),两个表达式条件一致,但是后者就精简许多。
使用正则表达式,让Google Search Console 的报告筛选变得更加强大高效,欢迎大家留言分享自己觉得很实用的正则表达式,解决什么情况的快速筛选需求。或者有想筛选/查找的情况但是不知道正则表达式怎么写的,也可以留言一起研究。