逝水年华 发表于 2025-6-7 20:34:17

问:高铁采集器,怎么采集组合json数据?

是这样的,目标列表页的url返回的是json数据,json数据里的值:{"caozuo":"有数据","Id":"值1","act":值2,...},实际每篇文章的URL是 domain/abc.asp?id=值1&act=值2;
请问通过高铁采集器怎么把这些文章的URL组合采集起来?

Crystαl 发表于 2025-6-7 20:34:51

***内容可能违规暂时被隐藏***

婷姐 发表于 2025-6-7 20:35:44

没用过这个啊

婷姐 发表于 2025-6-7 20:36:33

内容可能违规暂时被隐藏
AI说的吧,逻辑我懂,主要是这个采集器功能上不知道怎么整。比如这个列表页是下拉翻页,通过抓包获取了page=2这种URL,然后这种返回的是json数据,就回到这个问题了,我就不知道怎么做组合了,我试了试不太行。需要组合成新的内页URL再进行内页采集,栏目页面JSON的文本内容我会提取。

拾光 发表于 2025-6-7 20:37:25

内容可能违规暂时被隐藏
目前我想的是写两个,第一个做一些参数和URL,然后再写一个规则用上面采集的URL再采集内页的图片啥的。就是天天麻烦点。

婷姐 发表于 2025-6-7 20:38:06

头像不错
页: [1]
查看完整版本: 问:高铁采集器,怎么采集组合json数据?