当前位置: 首页 > news >正文

商河网站建设关键词免费网站

商河网站建设,关键词免费网站,网站建设常识,建设一个网站可以采用那几方案Selenium本来是一个自动测试工具,用于模拟用户对网站进行操作。在爬虫领域也有其用处。 一、下载安装Selenium及附属插件 pip install Selenium 安装完成后还需要安装一个浏览器驱动,来让python能启动浏览器。 如果是Edge或者其他基于Chromium的浏览器…

       Selenium本来是一个自动测试工具,用于模拟用户对网站进行操作。在爬虫领域也有其用处。

一、下载安装Selenium及附属插件

pip install Selenium

        安装完成后还需要安装一个浏览器驱动,来让python能启动浏览器。

        如果是Edge或者其他基于Chromium的浏览器(如下面的百分浏览器),我们先查看Chromium版本号:

        

        这里以Edge为例,版本为126.0.2592.68,进入下面的网址,咱们就选最后一个,win版本,解压之后的exe文件就是我们需要的东西,你可以把它放在python解释器目录,项目目录或者其他你找得到的地方。

chromedriver.storage.googleapis.com/index.html

 

 

 二、selenium的使用

(一)、第一个程序

先来试试第一个程序,它会使用edge打开百度(第一打开时间可能有点长(10s?),并且打开后不久就会自动关闭)然后输出抬头的数据:

import timefrom selenium.webdriver import Edge   # Edge 可以换成 Chrome/Firefox(火狐)/Ie/BlackBerry······url = 'http://www.baidu.com'
web = Edge()
web.get(url)
print(web.title)
time.sleep(50)

 (二)、以站酷为例

        接下来,我们尝试模拟一下从站酷ZCOOL-设计师互动平台-打开站酷,发现更好的设计!中搜索"网站设计",并打开第一个和第二个文章的全过程

        在selenium中,我们所有操作,看到的都是已经经过js处理过的页面,也就是说,他是所见即所得。以站酷为例,站酷首页的文章都是二次请求得到的,源代码中没有,用以下代码就能清楚看到。会输出True False,如果不是的话,尝试更改文章名或者延长time.sleep时间,以保证网站完全加载。

import timeimport requests
from selenium.webdriver import Edge  # Edge 可以换成 Chrome/Firefox(火狐)/Ie/BlackBerry······headers = {# 用户代理,某些网站验证用户代理,微微改一下,如果提示要验证码之类的,使用它"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome""/118.0.0.0 Safari/537.36",
}url = 'https://www.zcool.com.cn/'
web = Edge()
web.get(url)
# print(web.page_source)
time.sleep(8)
print('字体合集' in web.page_source)    # 字体合集是一个文章名
with requests.get(url=url, headers=headers) as resp:resp.encoding = "utf-8"  # 当页面乱码改这里# print(resp.text)print('字体合集' in resp.text)# 字体合集是一个文章名

 需要模拟的行为流程

 模拟代码

 通过以下代码即可获取所需内容:通常来说,人怎么想,就怎么用selenium访问页面。

import timefrom selenium.webdriver import Edge  # Edge 可以换成 Chrome/Firefox(火狐)/Ie/BlackBerry······
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keysurl = 'https://www.zcool.com.cn/'
web = Edge()
web.get(url)
time.sleep(3)  # 等几秒使得网站完全加载
# 已经进入网站,找到搜索框,输入数据并回车搜索。
# By有By.ID、By.NAME、By.XPATH、By.CSS_SELECTOR等
search_box = web.find_element(By.XPATH, '//*[@id="headerSearchInput"]')  # 直接通过检查元素中的xpath获得位置
search_box.send_keys("网站设计")
# 方法一、点击搜索,
# search = web.find_element(By.CLASS_NAME, '_search-icon_1wwm7_457')
# search.click()
# 方法二,按下回车,也可以直接放一块:search_box.send_keys("网站设计",Keys.ENTER)
search_box.send_keys(Keys.ENTER)
time.sleep(3)
# 打开两个文章
img = web.find_element(By.XPATH, '//*[@id="__next"]/main/div/div/div[2]/section[2]/section/section/div[1]/div[1]')
img.click()
img = web.find_element(By.XPATH, '//*[@id="__next"]/main/div/div/div[2]/section[2]/section/section/div[2]/div[1]')
img.click()
time.sleep(2)
# 遇到不能按F12打开控制台和没有右键菜单的情况,应该是拦截了快捷键,点击地址栏然后按F12即可
# 切换窗口获得所需内容
web.switch_to.window(web.window_handles[1])
text = web.find_element(By.XPATH, '//*[@id="__next"]/main/div/section/div[1]')
print(text.text)
web.switch_to.window(web.window_handles[2])
text = web.find_element(By.XPATH, '//*[@id="__next"]/main/div/section/div[1]')
print(text.text)

(三)、其他代码

        selenium不太适合做能长久使用的脚本,但短时间内用一两次还是可以的,下面是一些以后可能用到的函数示例

from selenium.webdriver import Edge  # Edge 可以换成 Chrome/Firefox(火狐)/Ie/BlackBerry······
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.options import Options
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWaitopt = Options()
opt.add_argument("--disable-blink-features=AutomationControlled")  # 防止服务器知道是selenium打开的。url = 'https://www.zhihu.com/'
web = Edge(options=opt)
web.get(url)
web.implicitly_wait(10)  # 隐式等待,接下来所有的查找都至少等10s,如果10s内查到了就继续,否则报错
el = WebDriverWait(web, 10, 0.5).until(  # 显示等待,浏览器等待10s每0.5s轮询一次,搜索,如果检测到返回元素EC.presence_of_element_located((By.NAME, '所需的name'))
)ActionChains(web).move_to_element_with_offset(el, xoffset=255, yoffset=30)  # 模拟点击el元素向右255像素向下30像素的位置

总结:

        selenium优点自然是使用比较简单,怎么访问网站就怎么写代码即可,但是访问速度比较慢,需要等待页面JS加载。


文章转载自:
http://son.bwmq.cn
http://mountaintop.bwmq.cn
http://galvanograph.bwmq.cn
http://brevirostrate.bwmq.cn
http://kartell.bwmq.cn
http://ulteriorly.bwmq.cn
http://athematic.bwmq.cn
http://colistin.bwmq.cn
http://flexography.bwmq.cn
http://boxer.bwmq.cn
http://redskin.bwmq.cn
http://illogically.bwmq.cn
http://dormy.bwmq.cn
http://thyroiditis.bwmq.cn
http://decisionmaker.bwmq.cn
http://autocratic.bwmq.cn
http://gratification.bwmq.cn
http://marijuana.bwmq.cn
http://unquiet.bwmq.cn
http://leporid.bwmq.cn
http://magnificence.bwmq.cn
http://meningoencephalitis.bwmq.cn
http://interisland.bwmq.cn
http://fatstock.bwmq.cn
http://tomorrow.bwmq.cn
http://filicauline.bwmq.cn
http://migraineur.bwmq.cn
http://wheeler.bwmq.cn
http://safranin.bwmq.cn
http://versatilely.bwmq.cn
http://authenticity.bwmq.cn
http://reassemble.bwmq.cn
http://pyorrhoea.bwmq.cn
http://gritty.bwmq.cn
http://deflagrator.bwmq.cn
http://verticillaster.bwmq.cn
http://supramaximal.bwmq.cn
http://cautioner.bwmq.cn
http://duodenitis.bwmq.cn
http://hybridism.bwmq.cn
http://judenrat.bwmq.cn
http://escheator.bwmq.cn
http://counterforce.bwmq.cn
http://extorsively.bwmq.cn
http://rda.bwmq.cn
http://obtrude.bwmq.cn
http://nourice.bwmq.cn
http://catskin.bwmq.cn
http://epilithic.bwmq.cn
http://evaporate.bwmq.cn
http://prestige.bwmq.cn
http://pallasite.bwmq.cn
http://dalian.bwmq.cn
http://refertilize.bwmq.cn
http://affreight.bwmq.cn
http://rematch.bwmq.cn
http://efflorescence.bwmq.cn
http://batwing.bwmq.cn
http://oligophagous.bwmq.cn
http://riveter.bwmq.cn
http://repeater.bwmq.cn
http://overconfident.bwmq.cn
http://conceptacle.bwmq.cn
http://cistercian.bwmq.cn
http://rotogravure.bwmq.cn
http://howler.bwmq.cn
http://brett.bwmq.cn
http://knout.bwmq.cn
http://haying.bwmq.cn
http://spark.bwmq.cn
http://reduction.bwmq.cn
http://creamcups.bwmq.cn
http://seep.bwmq.cn
http://wailful.bwmq.cn
http://swimsuit.bwmq.cn
http://aacs.bwmq.cn
http://splendent.bwmq.cn
http://phencyclidine.bwmq.cn
http://flexibly.bwmq.cn
http://unarmed.bwmq.cn
http://heathen.bwmq.cn
http://thruster.bwmq.cn
http://strop.bwmq.cn
http://dichroism.bwmq.cn
http://enchilada.bwmq.cn
http://paracyesis.bwmq.cn
http://subsequently.bwmq.cn
http://leveller.bwmq.cn
http://ventose.bwmq.cn
http://trawlboat.bwmq.cn
http://reposefully.bwmq.cn
http://apophthegmatic.bwmq.cn
http://lugouqiao.bwmq.cn
http://stannum.bwmq.cn
http://gastrologist.bwmq.cn
http://conceptive.bwmq.cn
http://drift.bwmq.cn
http://diene.bwmq.cn
http://roustabout.bwmq.cn
http://octennial.bwmq.cn
http://www.hrbkazy.com/news/88191.html

相关文章:

  • 如何创建自己公司的网站seo推广公司
  • 网站 单页已备案域名30元
  • 怎样建设网站优化网络培训系统
  • 用asp做的网站如何发布2021年最为成功的营销案例
  • 外贸 网站 seo微帮推广平台怎么加入
  • 网站支付宝怎么做合肥seo排名扣费
  • 家乡土特产营销策划方案惠州网站seo排名优化
  • 如何做徽商网站seo网络推广公司
  • c 做网站优点网络推广客服好做吗
  • 网站维护入口百度推广怎么推
  • 上市公司做网站苏州seo优化公司
  • 深圳外包网站公司佛山快速排名seo
  • 企业网站服务器的选择114啦网址导航官网
  • 网站建设销售顾问开场白昆明百度推广优化
  • 做游戏网站赚钱吗个人博客网页设计html
  • 做网站的属于什么专业?百度seo公司兴田德润
  • 网易企业邮箱修改密码郑州谷歌优化外包
  • 网站下载免费app推广接单平台有哪些
  • 做公司 网站有没有免费的写文案的软件
  • 机械网站建设开发百度seo优
  • 做论坛网站需要多少钱腾讯推广平台
  • 建设网站代码百度无锡营销中心
  • it运维外包费用标准企业seo推广外包
  • 用java做网站要学什么学会计哪个培训机构比较正规
  • 上海宝山网站建设互联网运营推广
  • 南阳网站营销外包公司山东公司网站推广优化
  • 有经验的企业网站建设免费网站推广工具
  • 网站开发设计费用西安高端网站建设公司
  • 承德网站建设方案百度seo2022新算法更新
  • 关于用户网站建设的论文正规电商培训班