DESTOON9.0自带的采集功能规则设置说明:
步骤较为复杂,请看完步骤
1、找到后台功能-我的面板 - 数据采集 - 添加采集
1-1、填写标题
1-2、采集网址 以采集网址为例 https://www.abc.com/product/ec/
1-3、采入目标(这里要选对应的模块和数据表)
1-4、选择 目标分类
效果看图
2、规则设置,
2-1、
选择对应的编码(一般为 UTF-8)
他的列表网址为 https://www.abc.com/product/ec/p2.html
分页规则 填 https://www.abc.com/product/ec/p ,后缀填 .html (这里的网址和后缀,要看你采集的网站具体网址)
翻页限制 (我们测试填5)
列表区域(这里的设置要看你采集的网站具体网址的源代码,) 是 <div class="info-list"> 至 </div>
内容页基准URL (我们测试留空)
内容页网址包含 (我们测试填的 .html )(这里要看你采集的网站具体网址的源代码)
内容页网址不包含 (我们测试留空)
内容标题区域 (我们测试填的 ; 至 留空)(这里要看你采集的网站具体网址的源代码)
内容页抓取成功标志 (我们测试留空)
内容页抓取失败标志 (我们测试留空)
自定义函数 (不选,如果你有自定义字段,请自行设置)
自定义文件 (不选,如果你有,请自行设置)
清除内容链接 (开启)
下载远程图片 (开启)
默认发布状态 (根据自己的情况选择)
模拟客户端 (根据自己的情况选择)
其他参数看图
3、采集测试
4、抓取网址
5、数据发布
6、找到对应的模块查看数据发布情况,完美!!!!!