搜索引擎信息收集(百度)
下面是百度搜索是一些有用的命令和操作符
-
site:[域]
返回与特定域相关的检索结果。域没有层次的限制,可以是具体的域,如www.cnblogs.com,也可以是.edu等域。
-
inurl:[关键词]
限定在URL中搜索
-
filetype:[文件后缀]
检索特定类型的文件,如Word.Excel等。
-
intitle:[检索条件]
用于检索标题中含有特定文本的页面。该命令其实与inurl有些类似。
-
index of
可以直接找到网站的资源列表。
-
其他
cache:[web页面] 查看快照。百度搜索框不可用
link:[web页面]给出和指定页面相连接的站点
related:[web页面]返回与所给页面相似的站点
info 查询网站一些信息。百度搜索框不可用
百度图形化的高级搜索
百度查看快照的一种方法
参考文章:
http://www.youxiaseo.com/seo/zl/24.html
https://blog.csdn.net/sunxinty/article/details/52624380 (对index of 介绍较全)