当前位置: 首页 > news >正文

手机手机端网站建设免费网站制作软件平台

手机手机端网站建设,免费网站制作软件平台,积极加强网站建设,武汉推广工具网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~ 效果如图: 源码与所需的依赖: pip install requests pip install requests beautifulsoup4…

网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~

 效果如图:

源码与所需的依赖:

pip install requests
pip install requests beautifulsoup4 lxml 
requests.packages.urllib3.disable_warnings()
pip install urllib3
pip install pyOpenSSL requests[security] urllib3[secure]
import os
import time
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoup# 配置requests,不验证SSL证书
requests.packages.urllib3.disable_warnings()
session = requests.Session()
session.verify = False  # 不推荐,仅用于测试目的def sanitize_filename(filename):return "".join(i for i in filename if i not in "\/:*?<>|").split('?')[0]def ensure_dir(file_path):if file_path:directory = os.path.dirname(file_path)if directory and not os.path.exists(directory):os.makedirs(directory)def download_resource(url, dest_folder, local_path):try:r = session.get(url, stream=True)r.raise_for_status()ensure_dir(local_path)with open(local_path, 'wb') as f:for chunk in r.iter_content(chunk_size=8192):f.write(chunk)return Trueexcept requests.exceptions.RequestException as e:print(f"Error downloading {url}: {e}")return Falsedef update_resource_links(soup, tag, attribute, base_url, dest_folder, sub_folder):resources = soup.find_all(tag, {attribute: True})for resource in resources:old_url = resource[attribute]new_url = urljoin(base_url, old_url)local_filename = sanitize_filename(new_url.split('/')[-1])local_path = os.path.join(dest_folder, sub_folder, local_filename)full_local_path = os.path.abspath(local_path)if download_resource(new_url, dest_folder, full_local_path):resource[attribute] = os.path.join(sub_folder, local_filename).replace('\\', '/')def save_complete_webpage(url, dest_folder):response = session.get(url)response.raise_for_status()# 尝试从响应头部或内容中获取编码if response.encoding is None:response.encoding = response.apparent_encodingsoup = BeautifulSoup(response.content, 'html.parser', from_encoding=response.encoding)base_url = urlupdate_resource_links(soup, 'img', 'src', base_url, dest_folder, 'images')update_resource_links(soup, 'link', 'href', base_url, dest_folder, 'css')update_resource_links(soup, 'script', 'src', base_url, dest_folder, 'js')ensure_dir(os.path.join(dest_folder, 'index.html'))with open(os.path.join(dest_folder, 'index.html'), 'w', encoding=response.encoding) as file:file.write(soup.prettify())if __name__ == "__main__":timestamp = str(int(time.time()))[-5:]  # 获取当前时间戳的最后5位数字target_url = input("请输入网址:")  # 目标网址destination_folder = f'downloaded_website_{timestamp}'  # 添加时间戳后5位的本地文件夹路径save_complete_webpage(target_url, destination_folder)print(f"已完整,保存到{destination_folder}文件夹中")

 

http://www.hrbkazy.com/news/4456.html

相关文章:

  • 广州企业网站建设韩国电视剧
  • 如何用ps做网站首页的图片黄页推广引流
  • 全国企业查询系统官网无锡整站百度快照优化
  • 信誉好的集团网站建设seo技术培训教程视频
  • 邢台做wap网站价格数据分析师35岁以后怎么办
  • 艺术网站源码山西seo谷歌关键词优化工具
  • 有没有个人做的网站赚流量费常州网络推广平台
  • 网页设计与网站建设案例课堂网站推广的6个方法是什么
  • 网站开发平台自动优化app
  • wap网站制作哪家好营销策划公司是干什么的
  • 石排镇专业建站公司广州seo优化公司排名
  • 腾宁科技做网站399元全包网络推广有哪些
  • 手机商店app下载山西seo和网络推广
  • 常州微网站建设2023年的新闻十条
  • 绵阳网站建设多少钱百度竞价推广计划
  • 网站建设制作收费视频号推广方法
  • 只能在线观看的电影网站咋么做长沙网络推广平台
  • 株洲网页seo与sem的区别和联系
  • wap网站不流行百度搜索页面
  • 焦作市网站建设科技软文营销什么意思
  • 美工网站销售外包公司
  • 万创网做的网站怎么样网站排名优化培训电话
  • 帮人做钓鱼网站以及维护线上推广的优势和好处
  • 如何给网站加二级域名网络营销的方法有哪些?举例说明
  • 宿迁做网站公司自助建站工具
  • 网站开发质保旅游产品推广有哪些渠道
  • 苏州在线网站制作培训网站搭建
  • 企业风首页中文官网模板临沂seo排名外包
  • 建筑行业一般在哪个网站招聘谷歌seo靠谱吗
  • 汶上网站建设哪家便宜高佣金app软件推广平台