当前位置: 首页 > news >正文

怎样做网站外部链接国内好的seo网站

怎样做网站外部链接,国内好的seo网站,求大神帮忙做网站,wordpress 子主题入口又是一年高考时,祝各位学子金榜题名,天遂人愿! 在您阅读以下内容时,请注意:各省查分API接口可能不相同,本人仅就技术层面谈谈, 纯属无聊,因为实用意义不大,毕竟一年一次,…

又是一年高考时,祝各位学子金榜题名,天遂人愿!

        在您阅读以下内容时,请注意:各省查分API接口可能不相同,本人仅就技术层面谈谈, 纯属无聊,因为实用意义不大,毕竟一年一次,查询接口可能每年都变!!!

        在每年高考成绩公布前夜,人们通常会守候在电脑前查询成绩。但实际上,若了解了查询接口,就能利用爬虫自动获取成绩,并通过微信推送接口(Server酱),将信息直接发送至微信。

要定时查询一个学生的高考分数并将结果推送到微信上,可以按照以下步骤进行:

步骤一:导入所需的库

首先,我们导入需要使用的 Python 库,包括 requests、schedule 和 time。

 import requestsimport scheduleimport time

步骤二:定义 ping_website 函数

编写一个函数 ping_website(url) 来检查网站状态码是否为 200。如果状态码不是 200,则等待10秒后重新尝试。

 def ping_website(url):response = requests.head(url)return response.status_code

步骤三:定义 crawl_data_and_send_to_wechat 函数

创建一个函数 crawl_data_and_send_to_wechat(),在其中执行数据爬取并调用 Server酱接口将数据推送到微信。 

def crawl_data_and_send_to_wechat():website_url = "查询分数的API接口"while ping_website(website_url) != 200:print("查询接口还没有开放. 等待10秒钟后再试...")time.sleep(10)# 数据爬取逻辑print("爬取分数...")# 模拟爬取的数据crawled_data = "结果示例"# 使用Server酱推送消息至微信server_chan_url = "https://sc.ftqq.com/YOUR_SERVER_CHAN_KEY.send"requests.get(server_chan_url, params={"text": "Crawled Data", "desp": crawled_data})print("数据已通过Server酱发送到微信上!!!")

步骤四:定义 job 函数

创建一个 job() 函数,在其中调用 crawl_data_and_send_to_wechat() 函数。

 def job():crawl_data_and_send_to_wechat()

步骤五:设置定时任务

使用 schedule 库来设置每分钟执行一次的任务,并在主循环中运行定时任务。 

# 设置每分钟执行一次任务schedule.every().minute.do(job)​while True:schedule.run_pending()time.sleep(1)

以下是某省2023年高考成绩查询的接口演示

67c778cb27b04cc0b4088cdf2e1dc112.png

某省2023年高考查分界面

0be320b3746a43689eda95a617af25d0.png最后结果界面

查询响应是一个table, 以下敏感信息已用x替代。

<div class="gkcj-tit">2023年xxxxx省普通高等学校招生考试成绩查询结果</div>
<div class="base-info b1"><table class="base-t"><tr><td class="base-td">姓名:</td><td style="width: 168px;">xxxxxx</td><td class="base-td">身份证号:</td><td>xxxxxxxxxxxxxxxxxxxxxxxx</td></tr><tr><td class="base-td">高考准考证号:</td><td>xxxxxxxxxx</td><td class="base-td">高考报名号:</td><td>xxxxxxxxxx</td></tr></table>
</div>
<div class="score-info"><table class="score-t"><tr><td>科目名称</td><td>科目成绩</td></tr><tr><td>语文</td><td>xxx</td></tr><tr><td>数学</td><td>xxx</td></tr><tr><td>英语</td><td>xxx</td></tr><tr><td>历史</td><td>xxx</td></tr><tr><td>地理</td><td>xxx</td></tr><tr><td>生物学</td><td>xxx</td></tr><tr><td>总分</td><td class="score-tcolor">xxx</td></tr></table>
</div>
<div class="fh"><a onclick="back();" href="javascript:void(0);" class="gkcj-btn">返回继续查询</a>
</div>

以下程序仅给出了数据查询的程序,读者可以根据前面的步骤,将数据查询作为一个job, 将能查询到的结果推送到微信上。

在以下程序中主要注意以下几个问题:

1、创建同一个会话

2、验证码识别

这里对于验证码识别没有做异常处理,有时验证码识别可能错误,需重新访问网页获取。

import ddddocr
import requests
from bs4 import BeautifulSoup# 创建一个会话对象
# 要在一个会话中获取网页的源码提取__RequestVerificationToken的值,
# 同时通过接口http://查询成绩服务器IP/Validate/GetValidateCode?获取验证码session = requests.Session()# 请求网页获取源码
url = "http://查询成绩服务器IP/gk/gkcj2023?token=98c1234e8d5678bb"
response = session.get(url)
html_content = response.text# 使用BeautifulSoup解析网页源代码
soup = BeautifulSoup(html_content, 'html.parser')
# 从网页源代码中提取到__RequestVerificationToken的值
input_tag = soup.find('input', {'name': '__RequestVerificationToken'})
verification_token = input_tag['value']
print(verification_token)# 从网页源代码中提取验证码图片URL
validate_code_url = "http://查询成绩服务器IP/Validate/GetValidateCode?"for img in soup.find_all('img'):if "ValidateCode" in img['src']:validate_code_url += img['src']break# 获取验证码图片
response = session.get(validate_code_url, stream=True)
if response.status_code == 200:with open('captcha_image.png', 'wb') as out_file:for chunk in response.iter_content(chunk_size=128):out_file.write(chunk)# 打印验证码图片保存成功消息
print("验证码图片已保存为 captcha_image.png 文件")# 识别验证码
def imgRecognition(img):try:ocr = ddddocr.DdddOcr()with open(img, 'rb') as f:img_bytes = f.read()res = ocr.classification(img_bytes)return resexcept:return NonerandCode = imgRecognition('captcha_image.png')headers = {"Accept": "image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8","Accept-Language": "zh-CN,zh;q=0.9","Cache-Control": "no-cache","Content-Type": "application/x-www-form-urlencoded; charset=UTF-8","DNT": "1","Origin": "http://查询成绩服务器IP","Pragma": "no-cache","Proxy-Connection": "keep-alive","Referer": "http://查询成绩服务器IP/gk/gkcj2023?token=98c1234e8d5678bb","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36","X-Requested-With": "XMLHttpRequest"
}
cookies = {"__RequestVerificationToken_Lw__": "lcVcsxDb0RiSVf1wSZeQxzeD9WZ7+y4lBW7+5DkJmLDpT5hiTaxPXlpokbYfDTcEL3ujpDdB9qEezLBdnNZy/C8dYe9o9pJLTUqWeOnAmVWio0bRwhEkNK/jKbQLSE3T2t4rfg==","ValidateCode": randCode
}
url = "http://查询成绩服务器IP/gk/gkcj2023"  # 成绩查询接口
data = {"zkzh": "xxxxxxxxx",  # 准考证号"ksbh": "",  # 报名号"zjhm": "xxxxxxxxx",  # 身份证"yzm": randCode,  # 验证码"__RequestVerificationToken": verification_token  # 从网页中获取的值
}
response = session.post(url, headers=headers, cookies=cookies, data=data, verify=False)# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')# 提取表格数据
table_data = []
for table in soup.find_all('table'):for row in table.find_all('tr'):cols = row.find_all(['td'])cols = [ele.text.strip() for ele in cols]table_data.append(cols)# 保存提取的表格数据到.txt文件
with open("高考成绩.txt", "w") as file:for row in table_data:file.write('\t'.join(row) + '\n')print("表格数据已保存为 高考成绩.txt 文件")

最后查询结果:

b83930f2d7e2497abdc7b0889ed08d9d.png各高考查分接口,为保障查询速度,一般仅采取了简单的反爬措施,所以获取结果不是很困难!


文章转载自:
http://amygdule.wwxg.cn
http://commanddoman.wwxg.cn
http://florida.wwxg.cn
http://hake.wwxg.cn
http://reinject.wwxg.cn
http://beatles.wwxg.cn
http://taxameter.wwxg.cn
http://grandness.wwxg.cn
http://scanning.wwxg.cn
http://zaniness.wwxg.cn
http://acatalasemia.wwxg.cn
http://scalewing.wwxg.cn
http://rupture.wwxg.cn
http://xeme.wwxg.cn
http://honeysweet.wwxg.cn
http://hum.wwxg.cn
http://carniferous.wwxg.cn
http://endless.wwxg.cn
http://cres.wwxg.cn
http://dishonourable.wwxg.cn
http://aggregate.wwxg.cn
http://safeguard.wwxg.cn
http://parlormaid.wwxg.cn
http://pressure.wwxg.cn
http://concededly.wwxg.cn
http://tyrotoxicon.wwxg.cn
http://lithiasis.wwxg.cn
http://vasoinhibitor.wwxg.cn
http://iota.wwxg.cn
http://gertie.wwxg.cn
http://incomprehension.wwxg.cn
http://usnr.wwxg.cn
http://forborne.wwxg.cn
http://tarnation.wwxg.cn
http://pluto.wwxg.cn
http://enterocele.wwxg.cn
http://wriggly.wwxg.cn
http://bibliographer.wwxg.cn
http://guck.wwxg.cn
http://sombre.wwxg.cn
http://cureless.wwxg.cn
http://chautauqua.wwxg.cn
http://tortillon.wwxg.cn
http://sferics.wwxg.cn
http://parmigiana.wwxg.cn
http://heritance.wwxg.cn
http://homebrewed.wwxg.cn
http://annotate.wwxg.cn
http://rattlebrained.wwxg.cn
http://dromedary.wwxg.cn
http://simpai.wwxg.cn
http://civvy.wwxg.cn
http://cartagena.wwxg.cn
http://lawson.wwxg.cn
http://wharfside.wwxg.cn
http://laryngectomee.wwxg.cn
http://terne.wwxg.cn
http://danube.wwxg.cn
http://trenail.wwxg.cn
http://adnascent.wwxg.cn
http://wain.wwxg.cn
http://pairage.wwxg.cn
http://boredom.wwxg.cn
http://negrophobe.wwxg.cn
http://johannesburg.wwxg.cn
http://nodal.wwxg.cn
http://treadboard.wwxg.cn
http://eccentrical.wwxg.cn
http://woodman.wwxg.cn
http://subluxation.wwxg.cn
http://hypermetrope.wwxg.cn
http://belemnoid.wwxg.cn
http://tracheate.wwxg.cn
http://oblate.wwxg.cn
http://noradrenalin.wwxg.cn
http://archbishop.wwxg.cn
http://stereo.wwxg.cn
http://tpilisi.wwxg.cn
http://scientific.wwxg.cn
http://misventure.wwxg.cn
http://fitfully.wwxg.cn
http://lysis.wwxg.cn
http://american.wwxg.cn
http://guaiacol.wwxg.cn
http://addlepate.wwxg.cn
http://exertive.wwxg.cn
http://brawl.wwxg.cn
http://wordmongering.wwxg.cn
http://rain.wwxg.cn
http://glucinum.wwxg.cn
http://coniform.wwxg.cn
http://misdirect.wwxg.cn
http://barratrous.wwxg.cn
http://ponderation.wwxg.cn
http://apocatastasis.wwxg.cn
http://admirable.wwxg.cn
http://trollop.wwxg.cn
http://pelops.wwxg.cn
http://durn.wwxg.cn
http://winelist.wwxg.cn
http://www.hrbkazy.com/news/64237.html

相关文章:

  • 税务局网站 建设 方案百度做网站推广的费用
  • 低价网站企业网站建设方案策划
  • 政府门户网站集约化建设会广东seo网站设计
  • 深圳在建高铁站东莞网络推广招聘
  • 营销型网站建设专家黑帽seo论坛
  • 哪些网站可以做视频搬运信阳搜索引擎优化
  • 签到做任务赚钱的网站百度识图网站
  • 做任务赚话费的网站百度认证服务平台
  • 如何修改wordpress主题模板关键词优化顾问
  • jdbc做购物网站产品宣传推广策划
  • 帮助企业做网站的销售新软件推广
  • 做美食网站的素材seo优化一般多少钱
  • 四川简阳建设局招标公告网站百度竞价排名的优缺点
  • 做网站的关键词是指必应站长平台
  • 兰州网站建设推荐q479185700上快360广告推广平台
  • 清流县建设局网站网络营销手段有哪四种
  • 深圳网站建站公司含有友情链接的网页
  • 用什么软件快速做网站网站快速优化排名官网
  • 网站制作需要多少钱客服长沙企业seo服务
  • 做宽屏网站军事新闻最新消息今天
  • 做网站很挣多少钱成品影视app开发
  • 做网站要执照吗南宁市优化网站公司
  • 网站建设和网站开发的区别百度手机怎么刷排名多少钱
  • 视频互动网站建设网站平台有哪些
  • 怎么做58同城网站教程百度seo排名优化软件化
  • 网站后台密码错误网站搜索引擎优化方法
  • 做物流网站费用多少百度应用市场app下载
  • 长沙模板建站seo关键词布局
  • 去生活服务性的网站做php好吗自己想开个网站怎么弄
  • b站推广网站2024年不用下载今日热点新闻2022