update manual for objectformatter
parent
ba05227594
commit
9e6d55dbee
|
@ -395,9 +395,21 @@ webmagic-extension包括注解模块。为什么会有注解方式?
|
|||
|
||||
* #### 类型转换
|
||||
|
||||
webmagic的注解模式直接对抽取结果进行类型转换,通过`ObjectFormatter`实现。webmagic内置了基本类型的支持,这样抽取结果的字段可以是任意基本类型(需要保证抽取结果能够被转换到对应类型)。
|
||||
|
||||
```java
|
||||
@ExtractBy("//ul[@class='pagehead-actions']/li[1]//a[@class='social-count js-social-count']/text()")
|
||||
private int star;
|
||||
```
|
||||
抽取结果也可以是`java.util.Date`类型,不过需要指定日期格式化的方式:
|
||||
|
||||
```java
|
||||
@Formatter("yyyy-MM-dd HH:mm")
|
||||
@ExtractBy("//div[@class='BlogStat']/regex('\\d+-\\d+-\\d+\\s+\\d+:\\d+')")
|
||||
private Date date;
|
||||
```
|
||||
|
||||
你也可以编写一个实现`ObjectFormatter`接口的类,进行自己的类型解析。要使用自己的类,需要调用`ObjectFormatters.put()`对这个类进行注册。
|
||||
|
||||
|
||||
* #### AfterExtractor
|
||||
|
|
Loading…
Reference in New Issue