FileCacheQueueScheduler中开启了一个线程周期运行来保存数据但在爬虫结束后没有关闭导致程序无法结束,以及没有关闭io流。 解决方法: 让FileCacheQueueScheduler实现Closable接口,在close方法中关闭线程以及流。 在Spider的close方法中添加对scheduler的关闭操作。 |
||
---|---|---|
.. | ||
src | ||
README.md | ||
pom.xml |
README.md
webmagic-extension
webmagic的扩展模块。包括注解格式定义爬虫、JSON、分布式等支持。