添加采集规则 规则说明 系统默认变量:<{articleid}> - 文章序号,<{chapterid}> - 章节序号, <{subarticleid}> - 文章子序号, <{subchapterid}> - 章节子序号。 系统标签 * 可以替代任意字符串。 系统标签 ! 可以替代除了<和>以外的任意字符串。 系统标签 ~ 可以替代除了<>'"以外的任意字符串。 系统标签 ^ 可以替代除了数字和<>之外字符串。 系统标签 $ 可以替代数字字符串。 采集规则中,需要获取的内容部分用四个以上系统标签代替,如 !!!! 基本设置 网站标识configs\article\collectsite.php中所添写的标识,可随便填写,一般为所采集站点的域名简写,以和其他规则区分。例:feiku 网站名称所采集站的名称。例:飞库 网站地址所采集站的地址。例:http://www.feiku.com 文章子序号运算方式不是必须添写的,我这里就留空了。 支持使用<{articleid}>标记的四则运算(+加,-减,*乘,/除,%取余) 章节子序号运算方式不是必须添写的,我这里就留空了。(谁知道他一个文件夹放多少书啊,他不按规则放,我不是采集不到 ) 支持使用<{articleid}>标记的四则运算(+加,-减,*乘,/除,%取余) 代理服务器地址 不使用代理服务器请留空 代理服务器端口 现有章节无法对应时候是否全部清空重新采集 是 否 根据自己需要选择 是否默认把采集到的文章设置为全本 是 否 根据自己需要选择,如果选择"是"无论文章是连载还是完结,你站上都显示全本,建议选“否” 发送HTTP_REFERER标志,用于突破防采集设置 是 否 默认选“是”,不知道什么用,我选“是”先突破下再说 对方网页编码 (自动检测 GB2312 UTF8 BIG5)默认“自动检测” 编码与本站不同将自动尝试转换 文章信息页面采集规则 文章信息页面地址书籍信息页网址,书籍ID用<{articleid}>代替。例: http://feiku.com/Book/<{articleid}>/Index.html 文章标题采集规则要求会查看网页的源文件啊 ,不会的可以停止了 .查看下信息页面的源文件,然后找到文章标题在源文件的什么位置(我们是以飞库为例的,就是章节信息页面那个《文章标题》在源文件的位置).这里以《我的美女大小姐》这个为例,找到标题附近的代码是
