Python3.5+fiddler4 爬取微信公众号点赞，阅读，标题，推送时间等信息

幽默大师 2024年11月01日 09:48 33

我可以帮助你描述如何使用Python3.5和Fiddler4爬取微信公众号的点赞、阅读、标题和推送时间等信息。

步骤一：准备工作

1. 创建自己的微信公众账号: 你需要先在微信上创建一个公众账号，用于测试爬虫。

2. 下载Fiddler4: Fiddler是Windows平台上的一个抓包工具，可以帮助你捕捉微信公众号的HTTP请求。下载地址： 安装Python3+版本: 确保你的电脑上已经安装了Python3+版本。

步骤二：配置Fiddler

1. 启动Fiddler: 双击Fiddler的exe文件，启动抓包工具。

2. 设置代理: 在Fiddler中，点击"Tools"菜单，然后选择"Options"。在弹出的窗口中，勾选"Proxy"选项，并输入你的电脑IP地址和端口号（默认为8888）。

3. 配置微信公众账号: 在微信上，打开你创建的公众账号，点击右上角的三个点，然后选择"设置"。在弹出的窗口中，勾选"允许Fiddler抓包"。

步骤三：使用Python爬虫

1. 安装必要库: 使用pip命令安装以下库：

```bashpip install requests beautifulsoup4```

2. 编写爬虫脚本: 创建一个新的Python文件，例如`wechat_spider.py`。在该文件中，导入上述库，并定义一个函数来抓取微信公众号的信息。

```pythonimport requestsfrom bs4 import BeautifulSoupdef get_wechat_info():

url = " 微信公众账号首页URL headers = {

"User-Agent": "Mozilla/5.0 (Windows NT10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.3"

}

response = requests.get(url, headers=headers)

soup = BeautifulSoup(response.content, "html.parser")

提取点赞、阅读、标题和推送时间等信息 likes = soup.find("span", class_="like").text.strip()

reads = soup.find("span", class_="read").text.strip()

title = soup.find("h1", class_="title").text.strip()

time = soup.find("span", class_="time").text.strip()

return likes, reads, title, time```

3. 运行爬虫脚本: 使用Python命令运行`wechat_spider.py`文件，例如：

```bashpython wechat_spider.py```

4. 查看抓取结果: 在Fiddler中，可以看到微信公众号的HTTP请求和响应。使用BeautifulSoup库提取点赞、阅读、标题和推送时间等信息。

注意事项

* 确保你的电脑上已经安装了Python3+版本。

* 使用Fiddler抓包工具时，需要设置代理，并配置微信公众账号允许Fiddler抓包。

* 使用BeautifulSoup库提取微信公众号的信息时，需要注意HTML结构的变化。

以上是使用Python3.5和Fiddler4爬取微信公众号点赞、阅读、标题和推送时间等信息的详细步骤。

本文地址： http://weixin.cidiancha.com/detail_30983.html