add FilePageModelPipeline
parent
0b9e0465ed
commit
478ace7e97
|
@ -0,0 +1,55 @@
|
||||||
|
package us.codecraft.webmagic.pipeline;
|
||||||
|
|
||||||
|
import org.apache.commons.codec.digest.DigestUtils;
|
||||||
|
import org.apache.commons.lang3.builder.ToStringBuilder;
|
||||||
|
import org.apache.log4j.Logger;
|
||||||
|
import us.codecraft.webmagic.Task;
|
||||||
|
import us.codecraft.webmagic.model.HasKey;
|
||||||
|
import us.codecraft.webmagic.model.PageModelPipeline;
|
||||||
|
import us.codecraft.webmagic.utils.FilePersistentBase;
|
||||||
|
|
||||||
|
import java.io.FileWriter;
|
||||||
|
import java.io.IOException;
|
||||||
|
import java.io.PrintWriter;
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Store results objects (page models) to files in plain format.<br>
|
||||||
|
* Use model.getKey() as file name if the model implements HasKey.<br>
|
||||||
|
* Otherwise use SHA1 as file name.
|
||||||
|
*
|
||||||
|
* @author code4crafter@gmail.com <br>
|
||||||
|
* @since 0.2.2
|
||||||
|
*/
|
||||||
|
public class FilePageModelPipeline extends FilePersistentBase implements PageModelPipeline {
|
||||||
|
|
||||||
|
private Logger logger = Logger.getLogger(getClass());
|
||||||
|
|
||||||
|
/**
|
||||||
|
* new JsonFilePageModelPipeline with default path "/data/webmagic/"
|
||||||
|
*/
|
||||||
|
public FilePageModelPipeline() {
|
||||||
|
setPath("/data/webmagic/");
|
||||||
|
}
|
||||||
|
|
||||||
|
public FilePageModelPipeline(String path) {
|
||||||
|
setPath(path);
|
||||||
|
}
|
||||||
|
|
||||||
|
@Override
|
||||||
|
public void process(Object o, Task task) {
|
||||||
|
String path = this.path + "/" + task.getUUID() + "/";
|
||||||
|
try {
|
||||||
|
String filename;
|
||||||
|
if (o instanceof HasKey) {
|
||||||
|
filename = path + ((HasKey) o).key() + ".html";
|
||||||
|
} else {
|
||||||
|
filename = path + DigestUtils.md5Hex(ToStringBuilder.reflectionToString(o)) + ".html";
|
||||||
|
}
|
||||||
|
PrintWriter printWriter = new PrintWriter(new FileWriter(getFile(filename)));
|
||||||
|
printWriter.write(ToStringBuilder.reflectionToString(o));
|
||||||
|
printWriter.close();
|
||||||
|
} catch (IOException e) {
|
||||||
|
logger.warn("write file error", e);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
Loading…
Reference in New Issue