Sat Aug 17 14:14:45 CST 2013
这个类的所有getter方法,一般都只会被爬虫框架内部进行调用。
@author code4crafter@gmail.com
Date: 13-4-21
Time: 下午12:13
]]>
目前不支持多个域名的抓取。抓取多个域名请新建一个Spider。
@param domain 爬虫会抓取的域名
@return this
]]>
一般无需设置encoding,如果发现下载的结果是乱码,则可以设置此项。
@param charset 编码格式,主要是"utf-8"、"gbk"两种
@return this
]]>
)]]>
默认为200,正常情况下,无须设置此项。
某些站点会错误的返回状态码,此时可以对这个选项进行设置。
@param acceptStatCode 可接受的状态码
@return this
]]>