最详细火车头数据采集系统DedeCMS发布文章攻略(2)

作者: 本站原创  发布时间:  浏览:

第二步:采集内容规则

       打开任意的目标站的内容页,找到标题、作者、来源、发布时间、正文内容对应的特征代码片段。获取方式和前面审查元素一样,最后测试一下目标内容页能否正常采集。

火车头采集内容规则

第三步:发布内容设置

①这里选择启用方式一:web在线发布到网站

       刚开始添加发布配置的是空的,需要点击“Web发布配置管理”。

火车头采集发布内容设置方法

       在弹出的对话框内,新建一个发布模块。跟一定要填写好根目录地址

http://127.0.0.1/lvshi/

②设置网站自动登陆(难点)

火车头采集新建发布配置

       上图的第四个红框就是自动登陆设置,采取的是URL抓包的方法,继续往下看。

       打开Fiddler,如果软件左侧很多url,可以按Ctrl+X删除,建议把浏览器其他无关的页面关闭。可以看到Fiddler工具里面会显示当前web的数据,由于是在本地测试,DedeCMS安装在htdocs的lvshi目录下,完整路径是

E:\APMServ5.2.6\www\htdocs\lvshi\dede\

       找到相应的登陆url,点击

http://127.0.0.1/lvshi/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php 

       点击右侧的Inspectors按钮,显示代码如下(每个人的都不一样)。

采集URL抓包工具Fiddler使用方法

       分别复制下面红色的字体部分,填写到对应文本框内

User-Agent(User-Agent后面代码):Mozilla/5.0(windows NT 10.;WOW64)...(此处代码省略) 
登陆地址后缀(GET:后面代码):/dede/login.php
来源地址后缀(Referer:后面代码):/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php
粘贴抓包获取的数据(Cookie:后面代码):CNZZDATA1000250736=2025245578-1461249721-http%253A%252F%252F127.0.0.1%252F%7C1461299919;..(此处代码省略)

       把双击用户名、密码、验证码等,在弹出的对话框内,把对应的值替换成对应的标签。

       用默认的标签进行替换规则,一般有[用户名]、[密码]、[验证码]等。

dede火车头设置网站自动登陆

       最后填写自定义的系统命名及版本号,保存模块即可。

上一篇:DedeCMS移动端内容页附件绝对路径修改

下一篇:DedeCMS筛选伪静态跳转移动端JS

相关文章

织梦打官司赢了还是输了

dedecms织梦网站停止使用了还侵权吗

被织梦起诉的案例

织梦中英文等多语言站点分页方法

织梦dede:arclist及dede:list调用tag标签(适用

添加微信
添加微信,免费咨询

15205695834

新手指南支付购买售后服务关于我们版权合规
合肥秀站网络科技有限公司
Copyright 2002-2022 麦站 版权所有
皖ICP备12018676号 网站地图