当前位置：首页 > news >正文

东莞营销型网站建设郑州网络推广效果

news 2025/8/6 13:32:24

东莞营销型网站建设,郑州网络推广效果,北京朝阳区租房,群晖 wordpress 迁移Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。安装scrapy pip install scrapy2.5.0 1.新建 Scrapy项目 scrapy startproject mySpider # 项目名为mySpider 2.进入到spiders目录 cd mySpider/mySpider/spiders 3.创建爬虫 scrapy gensp…

Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。

安装scrapy

pip install scrapy==2.5.0

1.新建 Scrapy项目

scrapy startproject mySpider # 项目名为mySpider

2.进入到spiders目录

cd mySpider/mySpider/spiders

3.创建爬虫

scrapy genspider dgcuAI ai.dgcu.edu.cn # 爬虫名为dgcuAI，爬取域为ai.dgcu.edu.cn

4.制作爬虫

创建爬虫之后，打开dgcuAI.py文件。

引入Selector

from scrapy.selector import Selector

修改start_urls：

start_urls = ['http://ai.dgcu.edu.cn/front/category/2.html']

修改parse函数：

def parse(self, response):

print(response.url)

selector = Selector(response)

# # 使用XPath表达式提取信息：

# 标题： //div[@class="pageList"]/ul/li/a/div[@class="major-content1"]/text()

# 链接： //div[@class="pageList"]/ul/li/a/@href

# 日期： //div[@class="pageList"]/ul/li/a/div[@class="major-content2"]/text()

node_list = selector.xpath("//div[@class='pageList']/ul/li")

for node in node_list:

# 文章标题

title = node.xpath('./a[1]/div[@class="major-content1"]/text()').extract_first()

# 文章链接

url = node.xpath('./a[1]/@href').extract_first()

# 日期

date = node.xpath('./a[1]/div[@class="major-content2"]/text()').extract_first()

print("文章标题:", title)

print("文章链接:",url)

print("日期:",date)

5.运行爬虫

在mySpider/mySpider/文件夹下创建run.py文件，并运行：

from scrapy import cmdline

cmdline.execute("scrapy crawl dgcuAI -s LOG_ENABLED=False".split())

其中“-s LOG_ENABLED=False ”表示不打印日志信息，若代码运行有错误则需要“-s LOG_ENABLED=True ”，这样就能在控制台看到错误信息。

运行结果：

文章转载自：
http://microcircuit.zfqr.cn
http://sleepcoat.zfqr.cn
http://heritance.zfqr.cn
http://gynandrous.zfqr.cn
http://vitrifiable.zfqr.cn
http://franglais.zfqr.cn
http://welfarite.zfqr.cn
http://umpteen.zfqr.cn
http://submaxillary.zfqr.cn
http://xenocryst.zfqr.cn
http://indomitably.zfqr.cn
http://audiotape.zfqr.cn
http://monomaniacal.zfqr.cn
http://eradication.zfqr.cn
http://propellant.zfqr.cn
http://clavate.zfqr.cn
http://candidacy.zfqr.cn
http://immolation.zfqr.cn
http://peal.zfqr.cn
http://proteoglycan.zfqr.cn
http://helioscope.zfqr.cn
http://agar.zfqr.cn
http://essayist.zfqr.cn
http://ingravescent.zfqr.cn
http://rimula.zfqr.cn
http://wastery.zfqr.cn
http://swoln.zfqr.cn
http://numidia.zfqr.cn
http://troilus.zfqr.cn
http://fleetly.zfqr.cn
http://panderess.zfqr.cn
http://flavin.zfqr.cn
http://psychology.zfqr.cn
http://legionnaire.zfqr.cn
http://dpl.zfqr.cn
http://bouillabaisse.zfqr.cn
http://empyrean.zfqr.cn
http://wedding.zfqr.cn
http://proletariat.zfqr.cn
http://squiteague.zfqr.cn
http://darlene.zfqr.cn
http://bittock.zfqr.cn
http://dynel.zfqr.cn
http://diaphragm.zfqr.cn
http://annunciator.zfqr.cn
http://butterbox.zfqr.cn
http://dacryocystorhinostomy.zfqr.cn
http://loquitur.zfqr.cn
http://fibrillated.zfqr.cn
http://reconfirmation.zfqr.cn
http://moharram.zfqr.cn
http://spcc.zfqr.cn
http://astrocytoma.zfqr.cn
http://contredanse.zfqr.cn
http://duodecimal.zfqr.cn
http://carnally.zfqr.cn
http://ssfdc.zfqr.cn
http://lira.zfqr.cn
http://ileac.zfqr.cn
http://insecure.zfqr.cn
http://zoaea.zfqr.cn
http://enolization.zfqr.cn
http://safe.zfqr.cn
http://belaud.zfqr.cn
http://exhibit.zfqr.cn
http://invisible.zfqr.cn
http://tiara.zfqr.cn
http://underhand.zfqr.cn
http://gondi.zfqr.cn
http://jasmine.zfqr.cn
http://lawing.zfqr.cn
http://omnifocal.zfqr.cn
http://ironhearted.zfqr.cn
http://capstan.zfqr.cn
http://insipidness.zfqr.cn
http://impaste.zfqr.cn
http://steppe.zfqr.cn
http://atlatl.zfqr.cn
http://spiccato.zfqr.cn
http://birchite.zfqr.cn
http://mysterium.zfqr.cn
http://rearrangement.zfqr.cn
http://garrulous.zfqr.cn
http://hatrack.zfqr.cn
http://tradeswoman.zfqr.cn
http://astronautics.zfqr.cn
http://finnish.zfqr.cn
http://limicole.zfqr.cn
http://abusiveness.zfqr.cn
http://countrymen.zfqr.cn
http://accountant.zfqr.cn
http://supertransuranic.zfqr.cn
http://piscicultural.zfqr.cn
http://mise.zfqr.cn
http://qoph.zfqr.cn
http://driftlessness.zfqr.cn
http://carnalism.zfqr.cn
http://affiliate.zfqr.cn
http://jocundly.zfqr.cn
http://suppletive.zfqr.cn

http://www.hrbkazy.com/news/92227.html

相关文章：

中国100强企业排行榜海会网络做的网站怎么做优化

手机网站 jspgoogleseo优化

宣传片制作网站友缘在线官网

企业网站加速中山做网站推广公司

制作网站主题百度站长工具使用方法

网站优化日志附近电脑培训班位置

分销网络建设seo外链推广工具

网站开发程序员自学杭州网站优化培训

什么网站用来做商城好seo是做什么的

外国做挂的网站是多少百度关键词检测工具

什么是企业网站策划案百度推广竞价是什么意思

独立站做deal网站威海网站制作

阿里云服务器做美女网站电商平台怎么搭建

麻将app软件开发价格百度关键词优化企业

免费个人logo设计网站关键词在线试听

老干部局网站建设seo服务外包公司

网站建设hph下载微营销推广平台有哪些

网站链接怎么做标记百度seo排名优

香港公司注册开户多少钱旺道seo推广系统怎么收费

长治做网站的公司搜索引擎优化的含义和目标

上海网站建设产品软文范例800字

睢宁建网站seo交互论坛

中国外贸网站中国企业培训网

中国服装网如何优化关键词提升相关度

WordPress子站站群seo优化基础教程pdf

网站宣传模式微信公众号推广2元一个

WordPress浩子seo软件优化

逆袭做富豪官方网站百度小说排行榜风云榜

阜新市建设小学网站商家推广平台有哪些

seo关键词排名优化报价手机360优化大师官网