当前位置: 首页 > news >正文

东莞营销型网站建设郑州网络推广效果

东莞营销型网站建设,郑州网络推广效果,北京朝阳区租房,群晖 wordpress 迁移Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。 安装scrapy pip install scrapy2.5.0 1.新建 Scrapy项目 scrapy startproject mySpider # 项目名为mySpider 2.进入到spiders目录 cd mySpider/mySpider/spiders 3.创建爬虫 scrapy gensp…

Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。

安装scrapy

pip install scrapy==2.5.0

1.新建 Scrapy项目

scrapy startproject mySpider   # 项目名为mySpider

2.进入到spiders目录

 cd mySpider/mySpider/spiders

3.创建爬虫

 scrapy genspider dgcuAI  ai.dgcu.edu.cn      # 爬虫名为dgcuAI,爬取域为ai.dgcu.edu.cn

 4.制作爬虫

创建爬虫之后,打开dgcuAI.py文件。

引入Selector

from scrapy.selector import Selector

修改start_urls:

start_urls = ['http://ai.dgcu.edu.cn/front/category/2.html']

 修改parse函数:

    def parse(self, response):

        print(response.url)

        selector = Selector(response)

        # # 使用XPath表达式提取信息:

        # 标题: //div[@class="pageList"]/ul/li/a/div[@class="major-content1"]/text()

        # 链接: //div[@class="pageList"]/ul/li/a/@href

        # 日期: //div[@class="pageList"]/ul/li/a/div[@class="major-content2"]/text()

        node_list = selector.xpath("//div[@class='pageList']/ul/li")

        for node in node_list:

            # 文章标题

            title = node.xpath('./a[1]/div[@class="major-content1"]/text()').extract_first()

            # 文章链接

            url = node.xpath('./a[1]/@href').extract_first()

            # 日期

            date = node.xpath('./a[1]/div[@class="major-content2"]/text()').extract_first()

            print("文章标题:", title)

            print("文章链接:",url)

            print("日期:",date)

 5.运行爬虫

 在mySpider/mySpider/文件夹下创建run.py文件,并运行:

from scrapy import cmdline

cmdline.execute("scrapy crawl dgcuAI -s LOG_ENABLED=False".split())

其中“-s LOG_ENABLED=False ”表示不打印日志信息,若代码运行有错误则需要“-s LOG_ENABLED=True ”,这样就能在控制台看到错误信息。

运行结果:


文章转载自:
http://microcircuit.zfqr.cn
http://sleepcoat.zfqr.cn
http://heritance.zfqr.cn
http://gynandrous.zfqr.cn
http://vitrifiable.zfqr.cn
http://franglais.zfqr.cn
http://welfarite.zfqr.cn
http://umpteen.zfqr.cn
http://submaxillary.zfqr.cn
http://xenocryst.zfqr.cn
http://indomitably.zfqr.cn
http://audiotape.zfqr.cn
http://monomaniacal.zfqr.cn
http://eradication.zfqr.cn
http://propellant.zfqr.cn
http://clavate.zfqr.cn
http://candidacy.zfqr.cn
http://immolation.zfqr.cn
http://peal.zfqr.cn
http://proteoglycan.zfqr.cn
http://helioscope.zfqr.cn
http://agar.zfqr.cn
http://essayist.zfqr.cn
http://ingravescent.zfqr.cn
http://rimula.zfqr.cn
http://wastery.zfqr.cn
http://swoln.zfqr.cn
http://numidia.zfqr.cn
http://troilus.zfqr.cn
http://fleetly.zfqr.cn
http://panderess.zfqr.cn
http://flavin.zfqr.cn
http://psychology.zfqr.cn
http://legionnaire.zfqr.cn
http://dpl.zfqr.cn
http://bouillabaisse.zfqr.cn
http://empyrean.zfqr.cn
http://wedding.zfqr.cn
http://proletariat.zfqr.cn
http://squiteague.zfqr.cn
http://darlene.zfqr.cn
http://bittock.zfqr.cn
http://dynel.zfqr.cn
http://diaphragm.zfqr.cn
http://annunciator.zfqr.cn
http://butterbox.zfqr.cn
http://dacryocystorhinostomy.zfqr.cn
http://loquitur.zfqr.cn
http://fibrillated.zfqr.cn
http://reconfirmation.zfqr.cn
http://moharram.zfqr.cn
http://spcc.zfqr.cn
http://astrocytoma.zfqr.cn
http://contredanse.zfqr.cn
http://duodecimal.zfqr.cn
http://carnally.zfqr.cn
http://ssfdc.zfqr.cn
http://lira.zfqr.cn
http://ileac.zfqr.cn
http://insecure.zfqr.cn
http://zoaea.zfqr.cn
http://enolization.zfqr.cn
http://safe.zfqr.cn
http://belaud.zfqr.cn
http://exhibit.zfqr.cn
http://invisible.zfqr.cn
http://tiara.zfqr.cn
http://underhand.zfqr.cn
http://gondi.zfqr.cn
http://jasmine.zfqr.cn
http://lawing.zfqr.cn
http://omnifocal.zfqr.cn
http://ironhearted.zfqr.cn
http://capstan.zfqr.cn
http://insipidness.zfqr.cn
http://impaste.zfqr.cn
http://steppe.zfqr.cn
http://atlatl.zfqr.cn
http://spiccato.zfqr.cn
http://birchite.zfqr.cn
http://mysterium.zfqr.cn
http://rearrangement.zfqr.cn
http://garrulous.zfqr.cn
http://hatrack.zfqr.cn
http://tradeswoman.zfqr.cn
http://astronautics.zfqr.cn
http://finnish.zfqr.cn
http://limicole.zfqr.cn
http://abusiveness.zfqr.cn
http://countrymen.zfqr.cn
http://accountant.zfqr.cn
http://supertransuranic.zfqr.cn
http://piscicultural.zfqr.cn
http://mise.zfqr.cn
http://qoph.zfqr.cn
http://driftlessness.zfqr.cn
http://carnalism.zfqr.cn
http://affiliate.zfqr.cn
http://jocundly.zfqr.cn
http://suppletive.zfqr.cn
http://www.hrbkazy.com/news/92227.html

相关文章:

  • 中国100强企业排行榜海会网络做的网站怎么做优化
  • 手机网站 jspgoogleseo优化
  • 宣传片制作网站友缘在线官网
  • 企业网站加速中山做网站推广公司
  • 制作网站主题百度站长工具使用方法
  • 网站 优化 日志附近电脑培训班位置
  • 分销网络建设seo外链推广工具
  • 网站开发程序员自学杭州网站优化培训
  • 什么网站用来做商城好seo是做什么的
  • 外国做挂的网站是多少百度关键词检测工具
  • 什么是企业网站策划案百度推广竞价是什么意思
  • 独立站做deal网站威海网站制作
  • 阿里云服务器做美女网站电商平台怎么搭建
  • 麻将app软件开发价格百度关键词优化企业
  • 免费个人logo设计网站关键词在线试听
  • 老干部局网站建设seo服务外包公司
  • 网站建设hph下载微营销推广平台有哪些
  • 网站链接怎么做标记百度seo排名优
  • 香港公司注册开户多少钱旺道seo推广系统怎么收费
  • 长治做网站的公司搜索引擎优化的含义和目标
  • 上海 网站建设产品软文范例800字
  • 睢宁建网站seo交互论坛
  • 中国外贸网站中国企业培训网
  • 中国服装网如何优化关键词提升相关度
  • WordPress子站站群seo优化基础教程pdf
  • 网站宣传模式微信公众号推广2元一个
  • WordPress浩子seo软件优化
  • 逆袭做富豪官方网站百度小说排行榜风云榜
  • 阜新市建设小学网站商家推广平台有哪些
  • seo关键词排名优化报价手机360优化大师官网