麻烦看下这个任务为什么抓取失败,谢谢

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2026-4-12 18:54

沙发
Fuller 管理员 发表于 2026-4-10 16:22:19 | 只看该作者
百度搜索结果详情页的结构各不一样。你做的第二级只能适应一种网页。要么做一个通用的规则,就是采集整个body元素中的内容
举报 使用道具
板凳
15802751899 初级会员 发表于 2026-4-11 15:06:53 | 只看该作者
Fuller 发表于 2026-4-10 16:22
百度搜索结果详情页的结构各不一样。你做的第二级只能适应一种网页。要么做一个通用的规则,就是采集整个bo ...

已经设置成采集整个body的内容了,但是报错,麻烦再帮忙看下,谢谢

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
Fuller_test20260411 新手上路 发表于 2026-4-11 15:14:22 | 只看该作者
15802751899 发表于 2026-4-11 15:06
已经设置成采集整个body的内容了,但是报错,麻烦再帮忙看下,谢谢

并不是每个网页的标题和时间都在相同的位置。所以,要想规则通用,不能采集标题和时间。如果实在想要,可以从head的title中取标题


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
15802751899 初级会员 发表于 2026-4-11 16:42:36 | 只看该作者
Fuller_test20260411 发表于 2026-4-11 15:14
并不是每个网页的标题和时间都在相同的位置。所以,要想规则通用,不能采集标题和时间。如果实在想要,可 ...

删除了时间和标题,怎么还是报错,抓取又失败了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
15802751899 初级会员 发表于 2026-4-12 17:53:05 | 只看该作者
15802751899 发表于 2026-4-11 16:42
删除了时间和标题,怎么还是报错,抓取又失败了

还是不行,这个问题搞这么久了,怎么还是解决不了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
Fuller 管理员 发表于 2026-4-12 18:12:21 | 只看该作者
二级任务没有问题,
一级任务出错,要给抓取内容坐上定位映射,也要做样例复制。
另外,按这个帖子https://www.gooseeker.com/doc/article-528-1.html,把超时时长设置为300s 试试
举报 使用道具
8#
Fuller 管理员 发表于 2026-4-12 18:13:05 | 只看该作者
把电脑里的360卫士关掉,360卫士会拖慢电脑速度
举报 使用道具
9#
Fuller 管理员 发表于 2026-4-12 18:54:00 | 只看该作者
一个网页上能下载到几十个图片。其中某一个图片下载不下来,比如,无效网址,就会报那个错误。你要检查一下结果中有没有图片。如果一个都没有,那就有问题了。

另外,检查一下超时时间是多少。你用了弹窗采集,每个网页上还要下载图片。超时时长至少要60秒
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-14 22:38