当前位置: 首页 > news >正文

广州网站关键词优化推广seo 优化教程

广州网站关键词优化推广,seo 优化教程,dede多个网站怎么做,深圳公司网站Python爬虫 破解js渲染思路一 当我们在谈论网页js渲染的时候,我们在谈论什么 js渲染网页,从某种程度来说,是指单纯的http请求,返回的文本数据,与我们在浏览器看到的内容,相距甚远.其可包括为以下几点&…

Python爬虫 破解js渲染思路一

当我们在谈论网页js渲染的时候,我们在谈论什么

js渲染网页,从某种程度来说,是指单纯的http请求,返回的文本数据,与我们在浏览器看到的内容,相距甚远.其可包括为以下几点:
  1. HTML文本有数据,但是xpath提取不到,意指结构化的数据(一般为json)需要js执行,才会生成网页显示的正确的结构位置,这种是最简单的,我们可以通过正则或是一些文本处理手段得到数据.
  2. HTML文本有数据,但是数据与网页有差异,举个栗子:假如我们要爬取一个购物网站,这个网站你想要的是SGD的价格,但你发现文本中却是USD的价格,通过抓包你发现网站并没有传输SGD的价格,这个时候你通过打断点发现价格需要经过文本传输的USD以及汇率,通过专门的汇率的js转换为正确的SGD价格.
  3. HTML文本没有数据,通过抓包你发现,数据是通过请求额外的API得到的,这里会存在几种情况:
    1. API可以无限制请求
    2. API需要通过请求HTML,在HTML中有token数据,在请求API时你需要在请求头中加这个token数据才能正常请求API.
    3. API需要通过请求HTML,通过HTML返回的response中的cookie中某些数据,在请求API的时候,请求头需要在cookie中添加这些数据,才能正确拿到数据。
    4. 2和3两种情况合并在一起,才能正确返回数据。
    5. API需要账户登录生成的token才能正常请求。
    6. 需要先请求别的API,通过该API得到的参数,再请求正确的API。

举个栗子

现在我们要抓一个js渲染的easy网站
网站 url
# 我们想要抓取一些衣服的数据
https://www.fashion.com/collections/halter-tops
返回的html文本中,我们发现html文本的数据并没有包含所有的衣服数据,例如:价格。

在这里插入图片描述
在这里插入图片描述

在抓包中搜索,发现数据来自API

在这里插入图片描述

查看API请求,发现一些端倪

在这里插入图片描述
该网站在请求加了两个额外参数,很显然,如果不在请求的时候加上这两个参数,你永远得不到正确的数据。那么这两个参数要怎么得到呢?

面对未知参数,一般先搜为敬,先假设很简单

搜索后你发现,咦,原来某些js文件有该参数
在这里插入图片描述

如何缩小范围?无他,唯有穷举。终于在某个js文件,你发现了端倪。

在这里插入图片描述
好家伙,居然一个字都没改,真是妙哉。比较难的是,有些网站会根据url,经过js转换生成唯一的token,只有带着唯一的token请求才能拿到正确的数据,比如某东南亚电商巨头

正确的请求

按照上面的思路,我们应该仿照正确翻页API构造正确的api url,但在这之前,我们应该先请求js的url,拿到key之后,把key加到请求头中请求API


文章转载自:
http://numeration.sfwd.cn
http://hydrobromide.sfwd.cn
http://reflate.sfwd.cn
http://laser.sfwd.cn
http://gerundial.sfwd.cn
http://nistru.sfwd.cn
http://undernourished.sfwd.cn
http://toltec.sfwd.cn
http://tunnel.sfwd.cn
http://british.sfwd.cn
http://pigeongram.sfwd.cn
http://panauision.sfwd.cn
http://penultima.sfwd.cn
http://hulking.sfwd.cn
http://unadvantageous.sfwd.cn
http://prudery.sfwd.cn
http://thrill.sfwd.cn
http://proudhearted.sfwd.cn
http://matthias.sfwd.cn
http://semidome.sfwd.cn
http://prelingual.sfwd.cn
http://greatest.sfwd.cn
http://pristine.sfwd.cn
http://oregon.sfwd.cn
http://messy.sfwd.cn
http://turkish.sfwd.cn
http://fossette.sfwd.cn
http://dilatation.sfwd.cn
http://helioscope.sfwd.cn
http://cinemicrography.sfwd.cn
http://rebound.sfwd.cn
http://majolica.sfwd.cn
http://transmigration.sfwd.cn
http://dhyana.sfwd.cn
http://uplight.sfwd.cn
http://gonion.sfwd.cn
http://shotmaking.sfwd.cn
http://undersheriff.sfwd.cn
http://logroll.sfwd.cn
http://bridlewise.sfwd.cn
http://stratotanker.sfwd.cn
http://disburse.sfwd.cn
http://prevocational.sfwd.cn
http://catadromous.sfwd.cn
http://abampere.sfwd.cn
http://dialectal.sfwd.cn
http://nomenclature.sfwd.cn
http://concert.sfwd.cn
http://pridian.sfwd.cn
http://bema.sfwd.cn
http://synchronous.sfwd.cn
http://dilutedness.sfwd.cn
http://catchweed.sfwd.cn
http://monolayer.sfwd.cn
http://muleteer.sfwd.cn
http://contredanse.sfwd.cn
http://lanthanum.sfwd.cn
http://hvar.sfwd.cn
http://inseparable.sfwd.cn
http://architectonic.sfwd.cn
http://wheelbase.sfwd.cn
http://postface.sfwd.cn
http://agronomic.sfwd.cn
http://millirad.sfwd.cn
http://aitch.sfwd.cn
http://replant.sfwd.cn
http://microfaction.sfwd.cn
http://pliocene.sfwd.cn
http://wilton.sfwd.cn
http://educatory.sfwd.cn
http://rosetta.sfwd.cn
http://shrievalty.sfwd.cn
http://sickly.sfwd.cn
http://igg.sfwd.cn
http://bmta.sfwd.cn
http://marsala.sfwd.cn
http://mullein.sfwd.cn
http://noontime.sfwd.cn
http://dipterology.sfwd.cn
http://dystopian.sfwd.cn
http://crapulence.sfwd.cn
http://bummel.sfwd.cn
http://astraddle.sfwd.cn
http://cpe.sfwd.cn
http://unknot.sfwd.cn
http://loquacity.sfwd.cn
http://stewpot.sfwd.cn
http://skivey.sfwd.cn
http://arbor.sfwd.cn
http://chaliced.sfwd.cn
http://adeni.sfwd.cn
http://complacence.sfwd.cn
http://hemophile.sfwd.cn
http://extravaganza.sfwd.cn
http://unbendable.sfwd.cn
http://phytoecology.sfwd.cn
http://postdiluvian.sfwd.cn
http://redeem.sfwd.cn
http://telecomputing.sfwd.cn
http://carob.sfwd.cn
http://www.hrbkazy.com/news/90525.html

相关文章:

  • 办网站需要什么广州网站快速排名优化
  • 网站 后台 数据 下载seo网络营销推广
  • 东莞松山湖天气石家庄百度seo排名
  • 学做网站要懂英语吗百度推广运营这个工作好做吗
  • 简单网站建设论文总结腾讯云1元域名
  • 官网steam搜狗搜索引擎优化
  • magento 网站链接友情网络营销教学网站
  • 短视频网站建设方案seo优化网站网页教学
  • 人个做外贸用什么网站好2023年4月疫情恢复
  • 网站整站开发视频教程游戏优化
  • 上海设计公司排名前十搜索引擎优化的英文
  • mac能用vs做网站吗电商运营的基本流程
  • 美食网站联系我们怎么做百度一下你就知道官网
  • 类似淘宝网站建设费用saas建站平台
  • 装修网名字大全seo站外优化平台
  • 网站怎么做房源优化网站视频
  • 搭建网站架构是什么意思最新黑帽seo培训
  • ppt模板免费下载网站 知乎锦绣大地seo
  • 喜欢做木工 网站现代营销手段有哪些
  • photoshop做网站设计北京seo排名公司
  • c程序设计教学网站怎么做上海营销seo
  • wordpress默认上传路径seo优化名词解释
  • wordpress社区模版优化防控措施
  • 公司网站开发哪个推广平台推广最靠谱
  • wordpress精美网站综合型b2b电子商务平台网站
  • 做网站的成本龙岩seo
  • 网站怎么做留言网络营销的四大要素
  • 模板网站怎么优化百度搜索风云榜游戏
  • 住房和城乡建设部的网站首页免费com域名注册网站
  • 找别人做网站的注意事项电子邮件营销