Nutch为什么不能用在分布式爬虫抓取中? ,1、Nutch依靠hadoop运行,hadoop本身就会花费大量的时间。,若集群机数量较少,爬行速度反而不如单机爬虫快。,2、Nutch是为搜索引擎设计的爬虫,不精确。,大多数用户需要一个爬虫来爬取... 网站建设# hadoop# nutch# 分布式 3年前140