magic-Dependency/webmagic-core
fengwuze 95494d3c4d 增加处理meta的逻辑。
遗留:
3、网页没有指定编码的情况下,需要采用cpdetector,但目前cpdetector这个在Maven的中央库里面没有,不清楚如何解决。
2014-05-14 14:53:54 +08:00
..
src 增加处理meta的逻辑。 2014-05-14 14:53:54 +08:00
README.md update readme 2013-08-07 09:45:38 +08:00
pom.xml update version to snapshot 2014-05-05 07:03:55 +08:00

README.md

webmagic-core

webmagic核心部分。只包含爬虫基本模块和基本抽取器。webmagic-core的目标是成为网页爬虫的一个教科书般的实现。