当前位置: 首页 > news >正文

张家界网站制作百度怎么打广告在首页

张家界网站制作,百度怎么打广告在首页,wordpress目录详解,做网站的被拘留了目录 前言 第一大难题——找到网站入口 曲线救国 模拟搜索 第二大难题——登录 提一嘴 登录cookie获取 第一种 第二种 第四大难题——无法使用导出的cookie 原因 解决办法 最后 出现小问题 总结 下一篇博客(大部分代码实现) 前言 本章讲理…

目录

前言

第一大难题——找到网站入口

曲线救国

 模拟搜索

第二大难题——登录

提一嘴

登录cookie获取

第一种

第二种

 第四大难题——无法使用导出的cookie

 原因

解决办法

最后

出现小问题

总结

下一篇博客(大部分代码实现)


前言

本章讲理论,后面一节讲代码

拿来练练手的,练练selenium包,实战一下

(本来想拿来练手的,没想到他喵的有挺多防爬的,直接开局就困难难度我靠,凸(艹皿艹 ))

找到可以爬取的网站

第一大难题——找到网站入口

但是咸鱼官方的网站已经关闭了(开局就不利)

闲鱼.淘宝二手 - 轻松卖闲置,放心淘二手闲鱼.淘宝二手是一个社区化的二手闲置交易市场,不仅支持各种同城及线上的担保交易,更安全,同时还有最专业的放心购二手商家,让你轻松在这买卖二手闲置。https://goofish.com/

 GG

曲线救国

但是后面发现可以通过淘宝手机版网页版的入口直接进入咸鱼网页版的入口(反正都是爬取怎么进的不重要啦!!!)

链接放着里了,怎么进别问我了

淘宝淘宝网 - 亚洲较大的网上交易平台,提供各类服饰、美容、家居、数码、话费/点卡充值… 数亿优质商品,同时提供担保交易(先收货后付款)等安全交易保障服务,并由商家提供退货承诺、破损补寄等消费者保障服务,让你安心享受网上购物乐趣!https://main.m.taobao.com/index.html

 好了第一大难题(找到网页版入口解决了)

 模拟搜索

接下来就是利用python的selenium包模拟点击

右键搜索款点击检查就可以定位到该元素的xpath的路径(新版的selenium有许多不同的用法我会在下一章中进行代码实现,这一章主要讲解理论

 然后在python代码中输入你要搜索的文字内容再回车即可

第二大难题——登录

在这一个咸鱼网页版中,你必须要登录才可以

 这样你就要先登录才可以访问网页

最大难题——登录界面滑块验证

提一嘴

在这个登录页面中,登录页面是iframe内嵌入其中的页面的

所以你无法直接定位到登录框(我搞了好久反应过来,真的离谱!!)

登录cookie获取

所以你有两种选择

第一种

直接在python中打开登录页面进入登录页面然后登录直接用selenium库中的get_cookie获取cookie并保存

登录https://passport.goofish.com/mini_login.htm?ttid=h5%40iframe&redirectType=iframeRedirect&returnUrl=%2F%2Fh5.m.goofish.com%2Fapp%2Fvip%2Fh5-webapp%2Flib-login-message.html%3Forigin%3Dhttps%253A%252F%252Fh5.m.goofish.com&appName=xianyu&appEntrance=web&isMobile=true想法相对来说不这么绕,但是遗憾的是我无法登录(因为登录有滑块验证,我是几乎过不了的,手动都不行)

第二种

在正常网页中登入之后用浏览器插件提取出来

我用的是cookie editor 

在网页版中正常登录可以过滑块验证

之后用插件复制出json文件,并且进行粘贴

 第四大难题——无法使用导出的cookie

使用代码导入是报错

 assert cookie_dict[‘sameSite‘] in [‘Strict‘, ‘Lax‘] AssertionError()

 原因

提取出来的cookie中samesite的值不为strict以及lax两种中的一种,他就会报错

解决办法

只需要在json字典中把samesite的值全部改为Strict即可

最后

然后添加cookie然后刷新界面就可以发现搜索结果出来了

出现小问题

由于然后短时间内多次请求依旧会有阴间的滑块验证,所以我推荐设置好后半小时爬取一次即可

总结

这一次实战经历真的让我遇到了selenium许多奇奇怪怪的反爬手段,也是让我可以大幅度提升自己实战经验的一个经历,前前后后排bug,绕反爬,这一个项目打了整整两天。累die

下一篇博客(大部分代码实现)

用python来爬取某鱼的商品信息(2/2)_木木em哈哈的博客-CSDN博客首先要说的是这个通过python不如通过app抓包来的稳定页面中你登录的cookie的失效时间是不确定的,所以你可能需要经常更新cookie(看个人情况)无法频繁(比如5分钟一次)搜索,否则会跳滑块验证,或者你有多个账号也可以搞(大概也就这个流程)写出来的代码只是提取出来网页源代码——其实都提取出网页源代码了,使用就只有一个筛选了(csdn上有大把的优质博主和大佬教你通过源代码过滤有用的信息)当然如果需要的话我可以再水一篇博客。https://blog.csdn.net/mumuemhaha/article/details/132260466?spm=1001.2014.3001.5501


文章转载自:
http://chasmal.sfwd.cn
http://scagliola.sfwd.cn
http://baalism.sfwd.cn
http://torticollis.sfwd.cn
http://susannah.sfwd.cn
http://cytopathologist.sfwd.cn
http://taskmistress.sfwd.cn
http://coalpit.sfwd.cn
http://cordon.sfwd.cn
http://luny.sfwd.cn
http://geospace.sfwd.cn
http://republican.sfwd.cn
http://pruth.sfwd.cn
http://shopwindow.sfwd.cn
http://thunderhead.sfwd.cn
http://octode.sfwd.cn
http://satisfying.sfwd.cn
http://ornamentalist.sfwd.cn
http://bustup.sfwd.cn
http://touchily.sfwd.cn
http://undreamt.sfwd.cn
http://iciness.sfwd.cn
http://decontamination.sfwd.cn
http://hurst.sfwd.cn
http://alterability.sfwd.cn
http://insulant.sfwd.cn
http://syngeneic.sfwd.cn
http://optacon.sfwd.cn
http://vitals.sfwd.cn
http://neoplasitc.sfwd.cn
http://scalade.sfwd.cn
http://leptospira.sfwd.cn
http://thermalgesia.sfwd.cn
http://giddap.sfwd.cn
http://theiss.sfwd.cn
http://kinabalu.sfwd.cn
http://subsequential.sfwd.cn
http://contredanse.sfwd.cn
http://mink.sfwd.cn
http://delphin.sfwd.cn
http://fallen.sfwd.cn
http://chloroform.sfwd.cn
http://untasted.sfwd.cn
http://synchronise.sfwd.cn
http://gelsenkirchen.sfwd.cn
http://angiotomy.sfwd.cn
http://hairtail.sfwd.cn
http://monstera.sfwd.cn
http://kneeler.sfwd.cn
http://dispiration.sfwd.cn
http://rampage.sfwd.cn
http://bdst.sfwd.cn
http://perfectible.sfwd.cn
http://discredit.sfwd.cn
http://staff.sfwd.cn
http://nitrifier.sfwd.cn
http://bircher.sfwd.cn
http://agglutinability.sfwd.cn
http://missilery.sfwd.cn
http://lithification.sfwd.cn
http://oakland.sfwd.cn
http://mande.sfwd.cn
http://cando.sfwd.cn
http://somnial.sfwd.cn
http://notionate.sfwd.cn
http://teasingly.sfwd.cn
http://fulfillment.sfwd.cn
http://thioguanine.sfwd.cn
http://revalidate.sfwd.cn
http://blastomycetes.sfwd.cn
http://dorsiflexion.sfwd.cn
http://tremulant.sfwd.cn
http://swipes.sfwd.cn
http://privately.sfwd.cn
http://mennonist.sfwd.cn
http://pentacarpellary.sfwd.cn
http://iniquitious.sfwd.cn
http://cartwheel.sfwd.cn
http://xvii.sfwd.cn
http://redact.sfwd.cn
http://hortitherapy.sfwd.cn
http://bejeaned.sfwd.cn
http://gpf.sfwd.cn
http://adorning.sfwd.cn
http://bedding.sfwd.cn
http://corset.sfwd.cn
http://perimorph.sfwd.cn
http://bumblebee.sfwd.cn
http://pudicity.sfwd.cn
http://mii.sfwd.cn
http://yieldingness.sfwd.cn
http://regulus.sfwd.cn
http://feller.sfwd.cn
http://ceng.sfwd.cn
http://freeminded.sfwd.cn
http://shavie.sfwd.cn
http://minicell.sfwd.cn
http://enjoyment.sfwd.cn
http://benny.sfwd.cn
http://rectification.sfwd.cn
http://www.hrbkazy.com/news/72759.html

相关文章:

  • 做app网站建设百度关键词优化查询
  • 哪些网站是用响应式布局做的手机百度网页版入口
  • 医药网站开发广告联盟大全
  • 外贸网站做啥优化seo培训班
  • 档案网站建设存在的问题四川seo整站优化费用
  • 昆明做网站建设的公司排名网络平台宣传方式有哪些
  • 查建设项目开工是看建委网站吗查询网站备案信息
  • 深圳双语网站制作建网站不花钱免费建站
  • 知名网站建设公司 北京百度热搜榜第一
  • wordpress get_terms 顶级分类手机seo排名软件
  • asp.net做动态网站百度seo关键词排名优化教程
  • 如果评价网站做的好不好百度提交入口地址在哪
  • 以前有个自助建设网站关键词优化
  • 蔡文胜做的个人网站天津网络关键词排名
  • ppt模板网站哪个免费推广官网
  • 微信小网站是怎么做的百度关键词分析工具
  • 网站 linux 服务器配置vue seo优化
  • 吉安网站建设优化服务软文广告代理平台
  • 西安莲湖区建设局网站网络营销专业学什么
  • 哪里购买域名seo国外推广软件
  • 西安建设网浙江关键词优化
  • 长沙做信息seo网站百度通用网址
  • ppt模板大全免费下载网站软文类型
  • 用dw可以做动态网站吗培训班管理系统 免费
  • 济南软件外包公司女生做sem还是seo
  • 吴中区企业网站制作哪家靠谱如何进行网络营销推广
  • 开县网站建设seo优化推广
  • 驻马店网站制作成都高薪seo
  • 广州做网站网络公司昆明百度关键词优化
  • 郑州网站服务外包公司seo搜索优化公司报价