Sat Aug 17 14:14:45 CST 2013 这个类的所有getter方法,一般都只会被爬虫框架内部进行调用。
@author code4crafter@gmail.com
Date: 13-4-21 Time: 下午12:13 ]]>
目前不支持多个域名的抓取。抓取多个域名请新建一个Spider。 @param domain 爬虫会抓取的域名 @return this ]]> 一般无需设置encoding,如果发现下载的结果是乱码,则可以设置此项。
@param charset 编码格式,主要是"utf-8"、"gbk"两种 @return this ]]>
)]]> 默认为200,正常情况下,无须设置此项。
某些站点会错误的返回状态码,此时可以对这个选项进行设置。
@param acceptStatCode 可接受的状态码 @return this ]]>