问:高铁采集器,怎么采集组合json数据?
是这样的,目标列表页的url返回的是json数据,json数据里的值:{"caozuo":"有数据","Id":"值1","act":值2,...},实际每篇文章的URL是 domain/abc.asp?id=值1&act=值2;请问通过高铁采集器怎么把这些文章的URL组合采集起来? ***内容可能违规暂时被隐藏*** 没用过这个啊 内容可能违规暂时被隐藏
AI说的吧,逻辑我懂,主要是这个采集器功能上不知道怎么整。比如这个列表页是下拉翻页,通过抓包获取了page=2这种URL,然后这种返回的是json数据,就回到这个问题了,我就不知道怎么做组合了,我试了试不太行。需要组合成新的内页URL再进行内页采集,栏目页面JSON的文本内容我会提取。 内容可能违规暂时被隐藏
目前我想的是写两个,第一个做一些参数和URL,然后再写一个规则用上面采集的URL再采集内页的图片啥的。就是天天麻烦点。 头像不错
页:
[1]