火车头采集器循环匹配出错怎么设置能够解决?,求支招

    火车头采集器循环匹配出错怎么设置能够解决?,求支招

    话题:火车头采集循环匹配出错怎么设置能够解决

    问题:使用火车头采集器采集同一个页面上的多条数据,设置规则的时候假如设置了四个标签,但是如果对于多条数据来说,有的是四个标签内容都有的,有的是只有其中两个标签的内容,采用循环匹配之后,采集器就会将下一条数据里不为空的内容填充到上一条标签内容为空的数据中,造成最后生成表格的整体匹配出错怎么设置能避免这种情况?

    推荐回答:貌似无法避免,只能从标签的抓取规则上来想办法。想办法让你的标签抓取内容不为空,比如你可以把抓取内容的规则设置大一点,就算这个标签为空,不要设置标签的代码过滤,应该可以抓些代码,让这个标签内容不为空,那么采集器就会正确匹配了。至于代码的干扰,后期可以通过数据的批量处理来删除。

    话题:用火车头采集后出现错误【请高手帮忙,在线等】

    问题:v用火车头采集后出现错误,以前正常采集没出现过生成标签不能点了,别的都能点,提示DedeCMSErrorWarning!TechnicalSupport:page:/dede/index_menu_load.php?openitem=5Errorinfos:DedeCms错误警告:连接数据库失败,可能数据库密码不对或数据库服务器出错

    推荐回答:建议你在火车头内置的浏览器里面登陆一下后台管理,然后自动获取cookie应该就好了,我的小站:www.1-1-1-1-b.cn

    话题:火车头采集器为什么有些图片采集不了,怎么设置

    推荐回答:这不是已经下载好了?只是不支持续传。不过如果方便,可以试试爱飞seo软件,自动下载图片、附件,自动发布上传到网站,破解防采集!但有些图片看不到,我现在只要采集,不需要发布上传的,只要能采集图片跟说明文字,能匹配一致的采集在一起,免得又要去分,哪个软件比较好一点;采集到一起?关键要保存成什么格式?爱飞支持采集到软件内置的数据库中,同时保存文字、图片、附件。

    话题:火车头采集器如何使用正则匹配内容

    问题:有这么一段代码


就三个字,我等你
才是真正的爱情。

我想匹配[参数]

,但div间的内容必须包含图片,没有图片的过滤掉,比如我的这段代码想要的结果就是把最后一段文字删除我写的是[参数][\s\S]*?)

,但他老是提示错误,不知正确的应该怎样写??火车头里的[参数](*)(?[\s\S]*?)这三个如何使用???然后我又用(?[\s\S]*?)

选择标签内容必须包含

原创文章,作者:admin,如若转载,请注明出处:http://www.8942.cn/s/2450.html

(0)
上一篇 2021年9月5日 pm8:23
下一篇 2021年9月5日 pm8:23

相关推荐

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注