From 0a2b9137fc160d407b674acbe34cfce386edc0ef Mon Sep 17 00:00:00 2001 From: "yihua.huang" Date: Wed, 24 Jul 2013 22:07:54 +0800 Subject: [PATCH] release --- README.md | 4 ---- release-note.md | 8 +++----- 2 files changed, 3 insertions(+), 9 deletions(-) diff --git a/README.md b/README.md index 3b8d40b..ade3b5e 100644 --- a/README.md +++ b/README.md @@ -9,10 +9,6 @@ webmagic的发起源于工作中的需要,其定位是帮助开发者更便捷 webmagic的功能覆盖整个爬虫的生命周期(链接提取、页面下载、内容抽取、持久化),开发者可以便捷的使用xpath和正则表达式进行链接和内容的提取,只需编写少量代码即可完成一个定制爬虫。 -#### 请注意 - -webmagic正处于开发阶段,目前还没有稳定版本。欢迎开发者参与到webmagic的试用和修改中来。 **如果只是想以外部jar包的方式,引用webmagic并进行自己的业务开发,建议你等待webmagic的第一个稳定版本。** - ###特色### * ####垂直爬虫#### diff --git a/release-note.md b/release-note.md index 893fc86..7dbe92a 100755 --- a/release-note.md +++ b/release-note.md @@ -8,10 +8,8 @@ Release Notes 增加下载的重试机制,支持gzip,支持自定义UA/cookie。 +增加多线程抓取功能,只需在初始化的时候指定线程数即可。 + 增加jquery形式的CSS Selector API,可以通过`page.getHtml().$("div.body")`形式抽取元素。 -完善了文档,架构说明:[webmagic的设计机制及原理-如何开发一个Java爬虫](http://my.oschina.net/flashsword/blog/145796),Javadoc:[http://code4craft.github.io/webmagic/docs](http://code4craft.github.io/webmagic/docs)。 - - - - +完善了文档,架构说明:[webmagic的设计机制及原理-如何开发一个Java爬虫](http://my.oschina.net/flashsword/blog/145796),Javadoc:[http://code4craft.github.io/webmagic/docs](http://code4craft.github.io/webmagic/docs)。 \ No newline at end of file