magic-Dependency/webmagic-core
zhangheng09 6b179c3d55 这个改动的原因基于两点:1)代理归还给代理池的时机应该是执行完http请求后就要尽早归还 2)http代理应该是HttpClientDownloader该考虑的事,不应该有Spider来处理,Spider并不知道它的downloader是个HttpClientDownloader 2016-03-12 20:09:41 +08:00
..
src 这个改动的原因基于两点:1)代理归还给代理池的时机应该是执行完http请求后就要尽早归还 2)http代理应该是HttpClientDownloader该考虑的事,不应该有Spider来处理,Spider并不知道它的downloader是个HttpClientDownloader 2016-03-12 20:09:41 +08:00
README.md update readme 2013-08-07 09:45:38 +08:00
module_webmagic-core.xml merege 2013-09-05 20:53:15 +08:00
pom.xml remove useless files 2016-01-21 19:31:50 +08:00
pom.xml.releaseBackup remove submodules for relase 2016-01-21 19:25:13 +08:00
pom.xml.versionsBackup update version to 0.5.3-SNAPSHOT 2016-01-21 17:58:36 +08:00

README.md

webmagic-core

webmagic核心部分。只包含爬虫基本模块和基本抽取器。webmagic-core的目标是成为网页爬虫的一个教科书般的实现。