实验背景:
无头浏览器
无头浏览器是没有图形用户界面(GUI)的web浏览器,通常是通过编程或命令行界面来控制的。它会把网站加载到内存并执行页面上的 JavaScript,因为不会展示图形界面,所以运行起来比完整的浏览器要高效。
Selenium自动化测试工具
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器),可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏。
Microsoft Edge Driver的介绍
Microsoft Edge Driver 是 Microsoft 为网站开发人员提供的自动化测试接口,它是 selenium和 edge浏览器进行通信的桥梁。selenium 通过一套协议和 Microsoft Edge Driver 进行通信,selenium 实质上是对这套协议的底层封装,同时提供外部 WebDriver 的上层调用类库。
实验工具:
Python、Pycharm、 selenium自动化测试工具、edge浏览器、edge浏览器驱动.
实验步骤:
用pip安装了selenium模块,并在PyCharm中添加该模块 首先输入pip -V查看pip有没有安装:
接着使用pip install selenium命令进行安装,直到我们看到Successfully installed 的字眼的时候,说明安装成功了。
可以使用pip list 查看已安装的库:
打开pycharm,并添加该模块
file->setting
下载edge浏览器对应版本的驱动,安装到python文件夹下
下载驱动网址:/en-us/microsoft-edge/tools/webdriver/#downloads
编写代码 爬虫 截图(对北邮官网进行截图)