博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python爬虫 Selenium初探
阅读量:7114 次
发布时间:2019-06-28

本文共 851 字,大约阅读时间需要 2 分钟。

####环境配置 1、selenium安装: sudo pip install selenium

2、浏览器驱动安装(我用的是chrome浏览器) brew install chromedriver

3、以我的简书首页网址为例:http://www.jianshu.com/u/5b771dd604fd 脚本示例:

from time import sleepfrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.common.action_chains import ActionChainsfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.wait import WebDriverWaitdriver = webdriver.Chrome()driver.implicitly_wait(10)driver.maximize_window()driver.get("http://www.jianshu.com/u/5b771dd604fd")firstTitle = driver.find_element_by_xpath('//*[@id="note-9068615"]/div/a')print firstTitle.text复制代码

输出结果如下:

#####若想获取当前页所有文章的标题:

titles = driver.find_elements(By.XPATH, '//a[@class="title"]')for title in titles:	print title.text复制代码

转载地址:http://uczel.baihongyu.com/

你可能感兴趣的文章
Dubbo 源码分析(一)一环境搭建
查看>>
Jenkins入门(一)[可以更换密码]
查看>>
rabbitmq集群搭建
查看>>
初学者区块链:你应该理解的关键术语
查看>>
manjaro学习使用
查看>>
PhalApi-Zip--压缩文件处理类
查看>>
适配iOS10 的相关权限设置
查看>>
android--ExpandableListView模仿qq好友
查看>>
NodeMCU快速开发
查看>>
Servlet 过滤器详解
查看>>
CSS技巧:word-wrap同word-break的区别
查看>>
OSChina 周三乱弹 ——不小心摔倒把班主任的裙子脱了
查看>>
OSChina 周三乱弹 ——Java酱接过了最后一棒
查看>>
OSChina 周二乱弹 ——一颗红豆,千万离人,最是相思毒
查看>>
OSChina 周五乱弹 —— 想不想把92年的萝莉退货
查看>>
C++ 解析Json——jsoncpp
查看>>
db2 列null 与 not null转换
查看>>
php swoole扩展
查看>>
JAVA 邮件发送工具
查看>>
家庭版win10开启远程桌面功能
查看>>