Python3.5+fiddler4 爬取微信公众号点赞,阅读,标题,推送时间等信息

2

Python3.5+fiddler4 爬取微信公众号点赞,阅读,标题,推送时间等信息

我可以帮助你描述如何使用Python3.5和Fiddler4爬取微信公众号的点赞、阅读、标题和推送时间等信息。

步骤一:准备工作

1. 创建自己的微信公众账号: 你需要先在微信上创建一个公众账号,用于测试爬虫。

2. 下载Fiddler4: Fiddler是Windows平台上的一个抓包工具,可以帮助你捕捉微信公众号的HTTP请求。下载地址: 安装Python3+版本: 确保你的电脑上已经安装了Python3+版本。

步骤二:配置Fiddler

1. 启动Fiddler: 双击Fiddler的exe文件,启动抓包工具。

2. 设置代理: 在Fiddler中,点击"Tools"菜单,然后选择"Options"。在弹出的窗口中,勾选"Proxy"选项,并输入你的电脑IP地址和端口号(默认为8888)。

3. 配置微信公众账号: 在微信上,打开你创建的公众账号,点击右上角的三个点,然后选择"设置"。在弹出的窗口中,勾选"允许Fiddler抓包"。

步骤三:使用Python爬虫

1. 安装必要库: 使用pip命令安装以下库:

```bashpip install requests beautifulsoup4```

2. 编写爬虫脚本: 创建一个新的Python文件,例如`wechat_spider.py`。在该文件中,导入上述库,并定义一个函数来抓取微信公众号的信息。

```pythonimport requestsfrom bs4 import BeautifulSoupdef get_wechat_info():

url = " 微信公众账号首页URL headers = {

"User-Agent": "Mozilla/5.0 (Windows NT10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.3"

}

response = requests.get(url, headers=headers)

soup = BeautifulSoup(response.content, "html.parser")

提取点赞、阅读、标题和推送时间等信息 likes = soup.find("span", class_="like").text.strip()

reads = soup.find("span", class_="read").text.strip()

title = soup.find("h1", class_="title").text.strip()

time = soup.find("span", class_="time").text.strip()

return likes, reads, title, time```

3. 运行爬虫脚本: 使用Python命令运行`wechat_spider.py`文件,例如:

```bashpython wechat_spider.py```

4. 查看抓取结果: 在Fiddler中,可以看到微信公众号的HTTP请求和响应。使用BeautifulSoup库提取点赞、阅读、标题和推送时间等信息。

注意事项

* 确保你的电脑上已经安装了Python3+版本。

* 使用Fiddler抓包工具时,需要设置代理,并配置微信公众账号允许Fiddler抓包。

* 使用BeautifulSoup库提取微信公众号的信息时,需要注意HTML结构的变化。

以上是使用Python3.5和Fiddler4爬取微信公众号点赞、阅读、标题和推送时间等信息的详细步骤。

公众号点赞

版权声明:除非特别标注,否则均为网络文章,侵权请联系站长删除。

上一篇 微信小程序点赞成功,取消点赞、评论。

下一篇 微信小程序点赞+取消点赞多项点击