采集微信公眾號及公眾號發(fā)布的文章,可用于微信運營分析,微信資訊網(wǎng)站填充等。
1、目標網(wǎng)站:搜狗微信,網(wǎng)址http://weixin.sogou.com
①輸入關(guān)鍵詞,搜索文章,采集文章內(nèi)容;
②輸入關(guān)鍵詞,搜索關(guān)鍵詞,采集公眾號信息,以及公眾號中發(fā)布內(nèi)容;
③采集搜狗微信首頁欄目中的最新信息。
①搜狗微信地址過期較快;
②頻繁采集會出現(xiàn)驗證碼。
火車瀏覽器提取到列表地址之后可以立即請求得到網(wǎng)址獲得內(nèi)容,防止網(wǎng)址過期失效,采集時候如果出現(xiàn)驗證碼,可以使用集成的打碼工具,實現(xiàn)自動打碼。
三、應(yīng)用成果
可采集標題、內(nèi)容、發(fā)布時間、閱讀量、點贊數(shù)、公眾號名稱、微信號、微信認證、功能介紹,二維碼。