新建的网站,这个robots是什么意思?

网编 268 0

1、网站开放给所有搜索引擎爬虫抓取(User-agent: *)

2、禁止所有爬虫程序抓取根目录下的caches目录(Disallow: /caches)

新站收录本身没有那么快,可尝试加入百度站长平台,利用官方工具提交网站Sitemap文件。可在一定程度上加快收录速度。

检测网站是否存在影响爬虫程序抓取的“陷进”,比如框架结构、JS文件等,培养良好的内容更新习惯,让爬虫程序每次来的时候都有新的内容产生。

标签: #爬虫 #程序 #网站 #文件 #目录

  • 评论列表

留言评论