11#
lizhizilt 中级会员 发表于 2017-7-12 01:02:18 | 只看该作者
Fuller 发表于 2017-7-11 22:45
在转换成excel的时候,把html片段中的属性也当成采集数据进行转换了,这个应该是转换程序的问题。我会把 ...

对了,如果之后会员中心的转换程序改变了,能够满足我提到的问题的话,到时候公布下,或者私信一下我?谢谢,会员中心的转换功能升级之后,我就可以再次修改规则满足需求了
举报 使用道具
12#
Fuller 管理员 发表于 2017-7-12 19:18:41 | 只看该作者
lizhizilt 发表于 2017-7-12 01:02
对了,如果之后会员中心的转换程序改变了,能够满足我提到的问题的话,到时候公布下,或者私信一下我?谢 ...

好的,我们正在修改
举报 使用道具
13#
Fuller 管理员 发表于 2017-7-12 19:39:23 | 只看该作者

我们的开发人员检查了一下,应该是你修改过规则,某个抓取内容一开始勾上了抓取“网页片段”,采了一些结果数据,然后,修改了规则,去掉了“网页片段”,又采集了一些结果数据。最后,这些结果数据一起导入了会员中心,会员中心依照最新的规则,发现没有“网页片段”,就把html的节点都当成抓取内容解析开了。

如果发生这种类型的修改,不要一起入库。以前的采集结果就不要入库了
举报 使用道具
14#
lizhizilt 中级会员 发表于 2017-7-13 02:23:31 | 只看该作者
Fuller 发表于 2017-7-12 19:39
我们的开发人员检查了一下,应该是你修改过规则,某个抓取内容一开始勾上了抓取“网页片段”,采了一些结 ...

最后的问题还是回到了“把html的节点都当成抓取内容解析开了”,这个是转换规则导致的问题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-15 03:52