返回頂部
關閉軟件導航
位置:首頁 > 教程中心>沒有分頁號而是動態加載的列表頁怎么采集

前面學習了隱藏列表頁(欄目頁)抓包分析教程,但有時列表頁沒有分頁號并且是動態加載,本教程講解怎么采集這種列表頁

 本教程所使用到的天線貓軟件有:文章組合工具集  萬能文章采集

抓包工具:

 

抓包可選傲游瀏覽器或其他谷歌內核瀏覽器或任何抓包工具。

抓包時注意,在網頁上鼠標右鍵-審查-網絡(Network)才能進入抓包界面:

 網頁的訪問方法(Method):有GET和POST兩種,GET就是【一條網址】,而POST是【一條網址+投遞參數】,一般都是GET方法,但是如果抓包列表頁地址時碰到POST方法(比如百度百科)就需要特殊處理下才能使用到軟件上進行采集

抓包過程:

 以今日頭條為例,使用天線貓萬能文章采集器等多款軟件輔助

 1、開始抓包:

當下拉滾動條到底部時,該網頁就會刷新出新的新聞列表,通常抓包會抓到很多地址,可以通過響應正文(Response)是否包含目標內容(如列表頁中的文章標題、文章地址)、響應內容的大小(一般注意大尺寸)來判斷哪個才是新聞列表的刷新讀取地址(后面簡稱刷新地址)。 

我這里抓包到的刷新地址是:http://toutiao.com/api/article/recent/?...

復制刷新地址的方法

可以右鍵單擊抓包列表中的刷新地址彈出菜單-Copy Link Address 

或者左鍵單擊刷新地址Headers-General-Request URL-選中地址-右鍵菜單-復制

然后繼續抓下一個的刷新地址:http://toutiao.com/api/article/recent/?... 

使用天線貓文章組合工具集比對-網址參數比對比較這2個刷新地址,可以發現有3個參數產生了變化。

 1.jpg

2、分析抓包數據:

在抓包時可以發現新聞列表的響應正文是JSON數據,因此使用天線貓Json解析助手來分析這3個參數是怎么來的:

復制響應正文的方法

可以右鍵單擊抓包列表中的刷新地址彈出菜單-CopyResponse 

或者左鍵單擊刷新地址Response-右鍵菜單-全選-復制

 a1ffc496gw1f511qy6n2tj20f907zabb.jpg

可以看到,Json數據中的 next.max_behot_time 節點的值構成了刷新地址中的第一個 max_behot_time 參數

 

而Json數據中的 data.[15].create_time 節點(也就是新聞列表中的最后一個即序號為15的項目的 create_time)的值構成了刷新地址中的第二個 max_create_time 參數

 

而第三個 _ 參數我們可以使用一個動態時間戳(實際上這個參數沒什么作用,可以保留抓包時的原值,也可以使用一個動態值)。

結果構建出來的模板刷新地址:http://toutiao.com/api/article/recent/?source=2&count=15&category=__all__&max_behot_time=[#next.max_behot_time#]&utm_source=toutiao&offset=0&max_create_time=[#data.[15].create_time#]&_={#毫秒時間戳#}

然后發現這個今日頭條還要求提供Cookies,否則抓取到的新聞列表就不準確,因此在抓包時可以到請求里復制出Cookies:uuid="w:2336ce5e12794f1c9d90ea07c2d4dc47"; tt_webid=19421740959; csrftoken=19f08b2051f0abbb85ee449e648fb3ad; CNZZDATA1258609184=1681606143-1466332000-%7C1466337400; _ga=GA1.2.451981020.1466332236; utm_source=toutiao

 

3、最后采集列表頁:

 3.jpg

采集好列表頁后,在萬能文章采集器的【采集文章URL列表】對這些列表頁采集出文章地址列表時,請保持【采集列表頁URL(動態加載)】窗口處于打開狀態,這樣才能調用該窗口中的Cookies設置,因為今日頭條刷新新聞列表時要求Cookies。

下面是采集文章地址的設置:

 4.jpg

如果您覺得 沒有分頁號而是動態加載的列表頁怎么采集 這篇文章對您有用,請分享給您的好友,謝謝
文章地址:http://m.meyanliao.com/course/1045.html
解放雙手無盡可能,有問題添加天線貓微信
主站蜘蛛池模板: 久久久无码精品亚洲日韩软件| 久久久久精品国产亚洲AV无码| 无码国模国产在线无码精品国产自在久国产 | 亚洲天堂2017无码中文| 久久av无码专区亚洲av桃花岛| 一区二区三区无码视频免费福利| 久久亚洲精品成人av无码网站| 亚洲av无码成人影院一区| 国产精品热久久无码av| 亚洲中文无码av永久| 亚洲日韩精品无码专区网站| 色AV永久无码影院AV| 手机在线观看?v无码片| 50岁人妻丰满熟妇αv无码区| 久久精品无码专区免费| 无码爆乳护士让我爽| 亚洲AV无码一区二区乱子伦| mm1313亚洲国产精品无码试看| 国产在线无码一区二区三区视频| 成人免费无码大片a毛片软件| 青青草无码免费一二三区| 一本大道无码人妻精品专区| 亚洲精品无码av中文字幕| 国产V亚洲V天堂A无码| 亚洲v国产v天堂a无码久久| 无码喷水一区二区浪潮AV| 久久久无码精品亚洲日韩按摩| 狠狠躁狠狠躁东京热无码专区| 精品无码成人片一区二区| 亚洲av无码片vr一区二区三区 | 亚洲日韩精品无码一区二区三区 | 99久无码中文字幕一本久道| 精品高潮呻吟99av无码视频| 亚洲av成人无码久久精品| 国产亚洲精品无码专区| 国产成人无码精品一区在线观看| 国产福利无码一区在线| 欧日韩国产无码专区| 精品久久久久久无码中文野结衣 | 无码八A片人妻少妇久久| 精品亚洲AV无码一区二区|