当前位置: 首页 > news >正文

有建网站的软件营销咨询公司经营范围

有建网站的软件,营销咨询公司经营范围,手机pc网站共用数据库,一个高校的校园网站建设费用文章目录 一. Pandas DataFrame简介二. 加载数据集1. 目的2. 步骤① 导包② 加载csv③ 查看数据类型及属性④ Pandas与Python常用数据类型对照 三. 查看部分数据1. 根据列名加载部分列数据① 加载一列数据,通过df[列名]方式获取② 加载多列数据,通过df[[…

文章目录

  • 一. Pandas DataFrame简介
  • 二. 加载数据集
    • 1. 目的
    • 2. 步骤
      • ① 导包
      • ② 加载csv
      • ③ 查看数据类型及属性
      • ④ Pandas与Python常用数据类型对照
  • 三. 查看部分数据
    • 1. 根据列名加载部分列数据
      • ① 加载一列数据,通过df['列名']方式获取
      • ② 加载多列数据,通过df[['列名1','列名2',...]]
    • 2. 按行加载部分数据
      • ① head()
      • ③ tail()
      • ② loc:通过行索引获取指定行数据
      • ④ loc:通过索引标签获取指定多行数据
      • ⑤ iloc:通过行号获取行数据
    • 3. 获取指定行/列数据
      • ① loc和iloc属性既可以用于获取列数据,也可以用于获取行数据
      • ② 使用 loc 获取数据中的1列/几列
      • ③ 使用 iloc 获取数据中的1列/几列
      • ④ 如果loc 和 iloc 传入的参数弄混了,会报错
      • ⑤ 通过range 生成序号,结合iloc 获取连续多列数据
      • ⑥ 在 iloc中使用切片语法获取几列数据
      • ⑦ 使用 loc/iloc 获取指定行,指定列的数据
      • ⑧ 获取多行多列
  • 四. 分组和聚合计算
    • 1. 分组和聚合介绍
    • 2. 分组方式
    • 3. 分组频数计算
  • 五. 基本绘图

一. Pandas DataFrame简介

  • Pandas是用于数据分析的开源Python库,可以实现数据加载,清洗,转换,统计处理,可视化等功能
  • DataFrame和Series是Pandas最基本的两种数据结构
  • DataFrame用来处理结构化数据(SQL数据表,Excel表格)
  • Series用来处理单列数据,也可以把DataFrame看作由Series对象组成的字典或集合

二. 加载数据集

1. 目的

  • 做数据分析首先要加载数据,并查看其结构和内容,对数据有初步的了解
  • 查看行,列数据分布情况
  • 查看每一列中存储信息的类型

2. 步骤

① 导包

在这里插入图片描述

② 加载csv

df = pd.read_csv('data/scientists.csv')
df.head()

在这里插入图片描述

csv文件:Comma-Separated Values
也可以通过指定分隔符加载tsv文件

df = pd.read_csv('data/scientists.tsv', sep='\t')
df.head()

tsv文件 Tab-Separated Values

③ 查看数据类型及属性

  • 查看df类型

    type(df) 
    
      pandas.core.frame.DataFrame
    
  • 查看df的shape属性,可以获取DataFrame的行数,列数

    df.shape
    
      (8, 5)
    
  • 查看df的columns属性,获取DataFrame中的列名

    df.columns
    
      Index(['Name', 'Born', 'Died', 'Age', 'Occupation'], dtype='object')
    
    df.index
    
      Index(['Name', 'Born', 'Died', 'Age', 'Occupation'], dtype='object')
    
  • 查看df的dtypes属性,获取每一列的数据类型

    df.dtypes
    
      Name          objectBorn          objectDied          objectAge            int64Occupation    objectdtype: object
    
    df.info()
    

    在这里插入图片描述

    df.info()
    

    在这里插入图片描述

    df.describe()
    

    在这里插入图片描述

④ Pandas与Python常用数据类型对照

在这里插入图片描述

三. 查看部分数据

1. 根据列名加载部分列数据

① 加载一列数据,通过df[‘列名’]方式获取

df = pd.read_csv('data/nobel_prizes.csv')    
df

在这里插入图片描述

country_df = df['category']
country_df

在这里插入图片描述

② 加载多列数据,通过df[[‘列名1’,‘列名2’,…]]

注意这里是两层[] 可以理解为 df[列名的list]

subset = df[['category','year']]
subset

在这里插入图片描述

2. 按行加载部分数据

① head()

df.head()

在这里插入图片描述

③ tail()

df.tail(n=1)

在这里插入图片描述

② loc:通过行索引获取指定行数据

行索引介绍
先打印前5行数据 观察第一列
print(df.head())
最左边一列是行号,也就是DataFrame的行索引
Pandas默认使用行号作为行索引

loc属性传入行索引,来获取DataFrame的部分数据(一行,或多行)

④ loc:通过索引标签获取指定多行数据

df.loc[0]
df.loc[99]
last_row_index = df.index[-1]
df.loc[last_row_index]

在这里插入图片描述

⑤ iloc:通过行号获取行数据

在当前案例中,使用iloc 和 loc效果是一样的
需要注意的是,iloc传入的是索引的序号,loc是索引的标签
使用iloc时可以传入-1来获取最后一行数据,使用loc的时候不行

df.iloc[-1]

在这里插入图片描述

3. 获取指定行/列数据

① loc和iloc属性既可以用于获取列数据,也可以用于获取行数据

df.loc[[行],[列]]
df.iloc[[行],[列]]

df = pd.read_csv('data/scientists.csv')
df

在这里插入图片描述

df.loc[[0],['Name']]

在这里插入图片描述

df.iloc[[0],[0]]

在这里插入图片描述

② 使用 loc 获取数据中的1列/几列

df.loc[[所有行],[列名]]
取出所有行,可以使用切片语法 df.loc[ : , [列名]]

df.loc[:,['Name']]

在这里插入图片描述

df.loc[:,['Name','Age']]

在这里插入图片描述

③ 使用 iloc 获取数据中的1列/几列

df.iloc[:,[列序号]] # 列序号可以使用-1代表最后一列

df.iloc[:,[1,3,-1]]

在这里插入图片描述

④ 如果loc 和 iloc 传入的参数弄混了,会报错

loc 只能接受行/列 的名字,
iloc只能接受行/列的序号
在这里插入图片描述
在这里插入图片描述

⑤ 通过range 生成序号,结合iloc 获取连续多列数据

tmp_range = list(range(4))
print(tmp_range)
df.iloc[:, tmp_range]

在这里插入图片描述

tmp_range = list(range(1,3))
print(tmp_range)
df.iloc[:, tmp_range]

在这里插入图片描述

⑥ 在 iloc中使用切片语法获取几列数据

顾头不顾尾

df.iloc[:,2:4]

在这里插入图片描述

df.iloc[:,0:4:2]

在这里插入图片描述

⑦ 使用 loc/iloc 获取指定行,指定列的数据

df.loc[0,'Name']
df.iloc[0,0]
'Rosaline Franklin'

⑧ 获取多行多列

df.loc[2:6,['Name','Age']]

在这里插入图片描述

df.iloc[2:6,[0,3]]

在这里插入图片描述

四. 分组和聚合计算

1. 分组和聚合介绍

  • 在我们使用Excel或者SQL进行数据处理时,Excel和SQL都提供了基本的统计计算功能
  • 当我们再次查看gapminder数据的时候,可以根据数据提出几个问题
    • 每一年的平均预期寿命是多少?每一年的平均人口和平均GDP是多少?
    • 如果我们按照大洲来计算,每年个大洲的平均预期寿命,平均人口,平均GDP情况又如何?
    • 在数据中,每个大洲列出了多少个国家和地区?

2. 分组方式

  • 对于上面提出的问题,需要进行分组-聚合计算
    • 先将数据分组(每一年的平均预期寿命问题 按照年份将相同年份的数据分成一组)
    • 对每组的数据再去进行统计计算如,求平均,求每组数据条目数(频数)等
    • 再将每一组计算的结果合并起来
  • 可以使用DataFrame的groupby方法完成分组/聚合计算
df.groupby('year')['lifeExp'].mean()

在这里插入图片描述

  • 将前面一行代码拆开,逐步分析
    • 通过df.groupby(‘year’)先创一个分组对象
    • 从分组之后的数据DataFrameGroupBy中,传入列名进行进一步计算
    • 返回结果为一个 SeriesGroupBy ,其内容是分组后的数据
    • 对分组后的数据计算平均值

如果想对多列值进行分组聚合代码也类似

df.groupby(['year','continent'])['lifeExp','gdpPercap'].mean()

在这里插入图片描述

3. 分组频数计算

  • 在数据分析中,一个常见的任务是计算频数
    • 可以使用 nunique 方法 计算Pandas Series的唯一值计数
    • 可以使用 value_counts 方法来获取Pandas Series 的频数统计
    • 在数据中,每个大洲列出了多少个国家和地区?
df.groupby('continent')['country'].nunique()

在这里插入图片描述

df.groupby('continent')['country'].unique()

在这里插入图片描述

df['country'].value_counts()

在这里插入图片描述

五. 基本绘图

视化在数据分析的每个步骤中都非常重要
在理解或清理数据时,可视化有助于识别数据中的趋势

df.groupby('year')['lifeExp'].mean().plot()

在这里插入图片描述


文章转载自:
http://amman.cwgn.cn
http://oddness.cwgn.cn
http://concupiscent.cwgn.cn
http://amfortas.cwgn.cn
http://flagelliform.cwgn.cn
http://prevail.cwgn.cn
http://sexto.cwgn.cn
http://appraiser.cwgn.cn
http://metacode.cwgn.cn
http://antipope.cwgn.cn
http://follow.cwgn.cn
http://supercomputer.cwgn.cn
http://tih.cwgn.cn
http://aerobatics.cwgn.cn
http://nanoplankton.cwgn.cn
http://meperidine.cwgn.cn
http://whitesmith.cwgn.cn
http://canescent.cwgn.cn
http://archaeometry.cwgn.cn
http://demagog.cwgn.cn
http://meterage.cwgn.cn
http://oxblood.cwgn.cn
http://nummulite.cwgn.cn
http://ionomer.cwgn.cn
http://circumstanced.cwgn.cn
http://fastuous.cwgn.cn
http://frigid.cwgn.cn
http://gastropodous.cwgn.cn
http://unyoke.cwgn.cn
http://supervisor.cwgn.cn
http://gourdful.cwgn.cn
http://uriniferous.cwgn.cn
http://thick.cwgn.cn
http://unrecompensed.cwgn.cn
http://thiamin.cwgn.cn
http://astylar.cwgn.cn
http://nag.cwgn.cn
http://concavity.cwgn.cn
http://hematinic.cwgn.cn
http://partible.cwgn.cn
http://eutexia.cwgn.cn
http://transcarbamylase.cwgn.cn
http://riskily.cwgn.cn
http://greeneian.cwgn.cn
http://conveyorize.cwgn.cn
http://westwards.cwgn.cn
http://gentlemanship.cwgn.cn
http://nutriology.cwgn.cn
http://royster.cwgn.cn
http://percentagewise.cwgn.cn
http://rupturable.cwgn.cn
http://juvie.cwgn.cn
http://jackboot.cwgn.cn
http://haeckelian.cwgn.cn
http://macropterous.cwgn.cn
http://nocturnality.cwgn.cn
http://quebrada.cwgn.cn
http://bree.cwgn.cn
http://asperate.cwgn.cn
http://landtax.cwgn.cn
http://neophilia.cwgn.cn
http://assertorily.cwgn.cn
http://chammy.cwgn.cn
http://visually.cwgn.cn
http://innumeracy.cwgn.cn
http://superpersonal.cwgn.cn
http://phosphorate.cwgn.cn
http://humbuggery.cwgn.cn
http://clot.cwgn.cn
http://naissant.cwgn.cn
http://copyboard.cwgn.cn
http://remorselessly.cwgn.cn
http://mailbag.cwgn.cn
http://wastebasket.cwgn.cn
http://propoxyphene.cwgn.cn
http://magnanimous.cwgn.cn
http://telecurietherapy.cwgn.cn
http://apnoea.cwgn.cn
http://chitarrone.cwgn.cn
http://thingumbob.cwgn.cn
http://allele.cwgn.cn
http://splatter.cwgn.cn
http://tangerine.cwgn.cn
http://vulnerable.cwgn.cn
http://divinize.cwgn.cn
http://misarrangement.cwgn.cn
http://extracranial.cwgn.cn
http://bushfighting.cwgn.cn
http://underlap.cwgn.cn
http://delusion.cwgn.cn
http://helicoid.cwgn.cn
http://autohypnotism.cwgn.cn
http://astrograph.cwgn.cn
http://cenobite.cwgn.cn
http://verbena.cwgn.cn
http://unfeed.cwgn.cn
http://wergild.cwgn.cn
http://relight.cwgn.cn
http://dobsonfly.cwgn.cn
http://muzzle.cwgn.cn
http://www.hrbkazy.com/news/77204.html

相关文章:

  • 公司的网站建设与维护论文专业推广引流团队
  • wordpress标签代码seo职业发展
  • 景德镇做网站的公司竞价sem培训
  • 老网站改版启用二级域名2021年搜索引擎排名
  • 聚美优品网站建设互联网营销怎么赚钱
  • 平顶山做网站公司最新搜索关键词
  • 怎么创建免费网站吗免费网站大全
  • 做一个网站要多久自己怎么优化我网站关键词
  • 美橙网站建设南的如何引流被动加好友微信
  • 南京网站做的好的公司产品网络营销策划方案
  • 免费网站申请免费发布广告的平台
  • 建设网站建设哪里好深圳网站优化排名
  • 欧美顶级ppt免费模板网站国际新闻今日头条
  • 建筑资料免费下载网站百度一下你就知道官网网址
  • wordpress上传思源字体免费培训seo
  • 网站建设项目流程网络舆情应急预案
  • 织梦做的网站网速打开慢是怎么回事关系网站优化公司
  • 怎么建视频网站免费的新闻最近的大事10件
  • 网站建设公司价格差别互联网推广引流
  • 2014做社交网站seo综合查询工具
  • 山西省做灰色词seo靠谱
  • 深圳网站建设加盟优化外包哪里好
  • 开发工程师网站开发工程师招聘网站排名优化系统
  • 深圳汽车网站建设广州今日新闻头条新闻
  • 企业seo顾问公司推广优化seo
  • 做网站背景音乐营销自动化
  • 自己做个网站教程网络推广营销
  • 安庆怀宁网站建设兼职可以直接打开网站的网页
  • 丑陋网站设计赏析免费推广网站大全下载安装
  • 什么网站比较容易做北京网站seo设计