0%

爬虫的使用(python)

爬虫的使用(python)

案例一 获取王者荣耀英雄数据

打开王者荣耀网站

  • ctrl+shift+i,打开谷歌浏览器开发者模式,点击network查看网络请求的数据

image-20200714120815909

  • 发现英雄列表的请求数据

image-20200714121009737

  • 然后随便打开一个英雄的介绍网页,鼠标右键查看源代码分析标签内容,方便后面进行爬虫获取

image-20200714121245745

  • 打开vscode,写python代码,前提安装好并配置好python环境,我已经安装配置完成
    image-20200714121431414

  • 然后要安装这两个库(复制到命令行安装就行)

1
2
pip install requests
pip install PyMySQL
  • 如何获取(总纲)要模拟发出网络请求
1
2
3
4
5
6
import requests
#模拟请求的库
import re
#正则匹配的库
import pymysql
#连接mysql数据库
  • 点击herolist,查看请求头地址网址

image-20200714122845501

如果要在vscode运行python程序要安装这个插件

image-20200714123621211

1
2
3
4
5
6
7
8
9
10
11
12
import requests
#模拟请求的库
import re
#正则匹配的库
import pymysql
#连接mysql数据库
httpUrl ='https://pvp.qq.com/web201605/js/herolist.json'
#设置请求链接
resList = requests.get(httpUrl)
#通过链接获得英雄数据列表
resList = resList.json()
print(resList)
  • 点击运行到终端,发现有输出

    image-20200714124521333

  • 后面就写数据库代码

  • 下载mysql

  • 参考文档写增删改查即可(不同数据库略有不同)

我本机没有安装,就没有演示

总结

1.模拟请求获取数据(安装依赖)

2.处理数据(循环)

3.插入到数据库(insert)

坚持原创技术分享,您的支持将鼓励我继续分享!