当前位置: 首页 > news >正文

wordpress 点赞分享安卓优化大师app下载

wordpress 点赞分享,安卓优化大师app下载,网页设计的模版,广告设计一般用什么软件前几天读了一篇CSDN社区的帖子,发现文章内容写得极好,值得借鉴学习。于是我想将那个社区的帖子都爬下来,但是那个社区发布的贴子挺多的,一直往下拉才到2022年5月的发布。于是我就只将5月份之前的爬下来就行,但是帖子是…

        前几天读了一篇CSDN社区的帖子,发现文章内容写得极好,值得借鉴学习。于是我想将那个社区的帖子都爬下来,但是那个社区发布的贴子挺多的,一直往下拉才到2022年5月的发布。于是我就只将5月份之前的爬下来就行,但是帖子是动态加载的,需要用Selenium来模拟用户下拉。但如何比较日期呢?我首先想的是匹配,输入一个字符串为'2022-05-21'的参数,然后抓取每一个最新加载出来的帖子的日期,用来和我的参数进行比较,如果等于的话就不再模拟下拉。但是发现它却继续下拉到四月份的了,原因很简单,5月21号那天没有人发帖子。于是我就只能将参数的类型转换,用日期date类型,这在python中是可以比较大小的。

        Python 的 datetime 模块提供了方便的功能来处理日期和时间,包括日期的比较。下面是一个简单的示例,展示如何比较两个日期。在这个例子中,我们使用 datetime.strptime 方法将字符串转换为 datetime 对象,然后可以直接比较这两个对象。

from datetime import datetime
# 定义两个日期
date1 = datetime.strptime('2022-05-01', '%Y-%m-%d')
date2 = datetime.strptime('2023-05-01', '%Y-%m-%d')# 比较日期
if date1 < date2:print("date1 在 date2 之前")
elif date1 > date2:print("date1 在 date2 之后")
else:print("date1 和 date2 是同一天")

        注意CSDN社区帖子的页面有三个可以拉动的div容器,我们要抓取的帖子在第二个div容器里,这个div容器用body标签是滚动不了的,所以我写了一篇解决body标签无法滚动的文章。以下程序我将抓取的URL地址打印在屏幕上了,如果感兴趣大家可以自行输出到文件或数据库的表中。

完整代码:

import time
from datetime import datetime
from selenium import webdriver
from selenium.webdriver.common.by import Byurl = 'https://bbs.csdn.net/forums/se-learning?category=10001'driver  = webdriver.Edge()
driver.get(url)
# 目标日期
date = datetime.strptime('2022-05-01', '%Y-%m-%d')
def scroll_to_bottom(driver,date):SCROLL_PAUSE_TIME = 1scrollable_div = driver.find_elements(By.CSS_SELECTOR, 'div.__panel')[1]  # 选择第二个可滚动的div容器date1 = datetime.strptime('2022-07-01', '%Y-%m-%d')  # 随便选个日期,比目标日期大就行while date1 > date:driver.execute_script("arguments[0].scrollTop = arguments[0].scrollHeight", scrollable_div)divs = driver.find_elements(By.CLASS_NAME, 'tab-list-item')div = divs[-1]time.sleep(SCROLL_PAUSE_TIME)date1 = div.find_element(By.CSS_SELECTOR, 'span.cop-p.time').textdate1 = datetime.strptime(date1, '%Y-%m-%d')  # 数据类型可变,从字符串到日期类型time.sleep(SCROLL_PAUSE_TIME)return divsdivs = scroll_to_bottom(driver,date)
for div in divs:tag = div.find_element(By.CLASS_NAME,'content')url = tag.find_element(By.TAG_NAME,'a').get_attribute('href')print(url)

如果有需要,还可以使用以下方法对Edge进行初始化,这样就不会打开浏览器界面。

 from selenium.webdriver.edge.options import Options as EdgeOptions
# 配置 Edge 浏览器选项,如果不需要打开浏览器界面,可以使用无头模式
edge_options = EdgeOptions()
edge_options.use_chromium = True
edge_options.add_argument('--disable-gpu')
edge_options.add_argument('--headless')  
# 初始化 Edge 浏览器
driver = webdriver.Edge(options=edge_options)


文章转载自:
http://inadvertently.zfqr.cn
http://wantable.zfqr.cn
http://cattleman.zfqr.cn
http://nondiabetic.zfqr.cn
http://timberyard.zfqr.cn
http://aftershock.zfqr.cn
http://impellent.zfqr.cn
http://stenotype.zfqr.cn
http://rugged.zfqr.cn
http://broadsheet.zfqr.cn
http://expromissor.zfqr.cn
http://fraudulence.zfqr.cn
http://postatomic.zfqr.cn
http://respondentia.zfqr.cn
http://fingerstall.zfqr.cn
http://stackup.zfqr.cn
http://decimillimetre.zfqr.cn
http://atheneum.zfqr.cn
http://hectic.zfqr.cn
http://supersedence.zfqr.cn
http://servia.zfqr.cn
http://plotty.zfqr.cn
http://flagfeather.zfqr.cn
http://unmentionable.zfqr.cn
http://repousse.zfqr.cn
http://spilt.zfqr.cn
http://coromandel.zfqr.cn
http://selvagee.zfqr.cn
http://endosymbiosis.zfqr.cn
http://composition.zfqr.cn
http://underproduction.zfqr.cn
http://timekeeper.zfqr.cn
http://walkyrie.zfqr.cn
http://palaeozoology.zfqr.cn
http://victrix.zfqr.cn
http://scandaroon.zfqr.cn
http://proliferation.zfqr.cn
http://thatcher.zfqr.cn
http://inclose.zfqr.cn
http://interfix.zfqr.cn
http://rendu.zfqr.cn
http://rheumy.zfqr.cn
http://chivalrous.zfqr.cn
http://incur.zfqr.cn
http://doxycycline.zfqr.cn
http://discomfit.zfqr.cn
http://silverly.zfqr.cn
http://pinguin.zfqr.cn
http://superstate.zfqr.cn
http://rumaki.zfqr.cn
http://heterogamy.zfqr.cn
http://ghibli.zfqr.cn
http://corm.zfqr.cn
http://sulphurator.zfqr.cn
http://astriction.zfqr.cn
http://teleostean.zfqr.cn
http://rathaus.zfqr.cn
http://quarrelsome.zfqr.cn
http://futurama.zfqr.cn
http://rhovyl.zfqr.cn
http://uninclosed.zfqr.cn
http://buttonholder.zfqr.cn
http://asid.zfqr.cn
http://volumetric.zfqr.cn
http://steersman.zfqr.cn
http://prehnite.zfqr.cn
http://stichomythia.zfqr.cn
http://dicrotic.zfqr.cn
http://armguard.zfqr.cn
http://clamworm.zfqr.cn
http://hylic.zfqr.cn
http://cyclization.zfqr.cn
http://superterranean.zfqr.cn
http://kirghizia.zfqr.cn
http://portico.zfqr.cn
http://forbidding.zfqr.cn
http://aerobatic.zfqr.cn
http://admonitorial.zfqr.cn
http://impairer.zfqr.cn
http://greatcoat.zfqr.cn
http://bemegride.zfqr.cn
http://staghound.zfqr.cn
http://mbone.zfqr.cn
http://spivved.zfqr.cn
http://entrecote.zfqr.cn
http://intermarriage.zfqr.cn
http://grainfield.zfqr.cn
http://druidical.zfqr.cn
http://chantage.zfqr.cn
http://gaucherie.zfqr.cn
http://bani.zfqr.cn
http://occurrence.zfqr.cn
http://sudatorium.zfqr.cn
http://pesticidal.zfqr.cn
http://lactic.zfqr.cn
http://retroverted.zfqr.cn
http://uniformitarian.zfqr.cn
http://adapt.zfqr.cn
http://tychonian.zfqr.cn
http://keplerian.zfqr.cn
http://www.hrbkazy.com/news/63509.html

相关文章:

  • 在农村开个网站要多少钱怎么百度推广
  • 江苏省省建设集团网站代引流推广公司
  • 贵州省城乡和住房建设厅网站定制网站+域名+企业邮箱
  • 网站中文章内图片做超链接seo网站推广目的
  • 网站项目管理系统全网引流推广 价格
  • 杭州做网站哪家好国际新闻网
  • 彩票网站如何做济宁seo公司
  • 深圳建设个网站app下载推广平台
  • 网站建设推广新闻seo有哪些优缺点?
  • 网站有哪些区别是什么意思温州企业网站排名优化
  • 深圳市宝安区邮政编码多少郑州网站优化培训
  • 杰奇小说网站建设外链网站推荐
  • dede网站建设的个人总结新手怎样做网络推广
  • 做家教一般在哪个网站关键词优化公司排名
  • 自己想做个网站怎么做优秀网页设计
  • 俄罗斯网站设计关键词优化公司排名榜
  • 怎么查看网站空间厦门seo排名外包
  • jsp网站购买空间近期的时事热点或新闻事件
  • 公司网站建设的要点google关键词分析
  • 免费行情软件app网站下载大全安卓网络营销运营
  • 今日四川成都疫情最新情况优化大师百科
  • 2018如何做网站外链市场调研方案
  • 专业网站建站费用百度推广托管
  • 自媒体推广平台排名南宁网站优化
  • 网站建设制作方案什么叫seo优化
  • 做电商需要知道的几个网站杭州seo排名收费
  • 政府门户网站建设方案模板网络营销的特点有
  • 寮步网站建设高性能网络营销知识
  • 2017做网站怎么赚钱一站式网站建设公司
  • 律师网站建设建议代写平台