当前位置: 首页 > news >正文

网站模版更新公告怎么开发网站

网站模版更新公告,怎么开发网站,网站域名是不是就是网址,太原流量大的网站很多时候我们在探讨数据的相关性问题时,很容易会忽略到底是数据本身的特点还是真的是因为特征的区分导致的不同,从而误以为是特征起的效果比较大。 这就好比测试一款新药是否真的能治病,假如吃药的患者康复的更快,那到底是因为药…

很多时候我们在探讨数据的相关性问题时,很容易会忽略到底是数据本身的特点还是真的是因为特征的区分导致的不同,从而误以为是特征起的效果比较大。

这就好比测试一款新药是否真的能治病,假如吃药的患者康复的更快,那到底是因为药物本身的效果好,还是因为患者本身更健康,平时有控制饮食合理作息与运动,从而在患病后更快地凭借自身免疫力战胜病毒。这需要我们意识到对照试验还需要人为地补足某些条件,也就是探讨是否真的是X导致了Y。

以下是一个例子:

# 加载必要包
library(tidyverse)
library(broom)# 生成模拟数据集(1000名患者)
set.seed(123)
data <- tibble(# 年龄影响病情严重程度和治疗选择age = rnorm(1000, mean = 50, sd = 10),# 病情严重程度(年龄越大病情越重)severity = 0.3 * age + rnorm(1000, sd = 5),# 治疗选择(病情越重越可能接受治疗)treatment = rbinom(1000, 1, plogis(-2 + 0.05 * severity)),# 康复时间(治疗有效,但病情越重康复越慢)recovery_time = 30 - 5 * treatment + 0.5 * severity + rnorm(1000, sd = 3)
)# 查看前几行数据
head(data)data1 <- data
data1 %>% group_by(treatment) %>% summarise(mean_recovery = mean(recovery_time))
# 会发现治疗组康复时间更长!(因为治疗组病情更重)model <- lm(recovery_time ~ treatment + severity + age, data = data)
tidy(model) %>% filter(term == "treatment")
# 现在能看到治疗真实效果(约减少5天)library(MatchIt)# 计算倾向得分(基于年龄和病情)
match_model <- matchit(treatment ~ age + severity,data = data,method = "nearest"
)# 匹配后的数据
matched_data <- match.data(match_model)# 分析匹配后的数据
lm(recovery_time ~ treatment, data = matched_data) %>% tidy()ggplot(data, aes(x = severity, y = recovery_time, color = factor(treatment))) +geom_point(alpha = 0.5) +geom_smooth(method = "lm") +labs(title = "康复时间 vs 病情严重程度",subtitle = "控制病情后,治疗组(红色)康复更快",color = "是否治疗")

输出:

  treatment mean_recovery<int>         <dbl>
1         0          37.5
2         1          33.0term      estimate std.error statistic  p.value<chr>        <dbl>     <dbl>     <dbl>    <dbl>
1 treatment    -5.43     0.238     -22.8 3.69e-93term        estimate std.error statistic  p.value<chr>          <dbl>     <dbl>     <dbl>    <dbl>
1 (Intercept)    38.3      0.295     130.  0       
2 treatment      -5.36     0.418     -12.8 7.49e-32
`geom_smooth()` using formula = 'y ~ x'

从结果可以看到,单纯的比较康复时间,会隐藏在背后的很多原因,比如患者本身的病情,患者年龄较大,免疫力低等。进一步看线性回归控制变量,控制了相同的病情和年龄去看康复时间,治疗的方案会减少5天多,用倾向得分模拟的随机试验的得到的结果跟控制变量得到的结果差不多,加强了结果的可信度。而从图像来看,治疗组始终低于对照组,也就是说不管怎样,治疗组总是康复得更快,这也暗含了一种因果关系,只是以图像的形式表现。

http://www.hrbkazy.com/news/31078.html

相关文章:

  • 网站及建设中页面免费行情网站
  • 做网站怎么备份数据推广方式都有哪些
  • 专门找图片的网站seo还有未来吗
  • 设计类网站排名百度下载安装2021
  • 网站建设工作室起名学电商哪个培训学校好
  • 南通网站推广怎么收费株洲疫情最新情况
  • 用自己电脑做网站服务器百度入驻商家
  • 企业网站怎么做的搜索引擎优化的英文缩写
  • 公明网站建设公司seo教程技术优化搜索引擎
  • 网站开发项目建设经验seo实战技巧100例
  • 乌海网站建设公司网络营销策划的内容
  • 企业做网站需要提供什么资料市场营销四大分析方法
  • 在线教育网站设计杭州网站建设 seo
  • wordpress 隐藏后台常州网络推广seo
  • 惠州网站建设 英语360优化大师
  • 做网站需要展示工厂么?google下载app
  • 广东建设监理协会网站题库软件测试培训费用大概多少
  • 设计公司网站价格最新百度关键词排名
  • led网站模板百度搜索首页
  • 做销售用什么网站培训心得简短200字
  • 网站分析工具精准营销案例
  • 怎么叫人做网站天津seo诊断技术
  • 能够做冶金工程毕业设计的网站网页制作html代码
  • 自己做网站 最好的软件下载找广告商的平台
  • 建筑英才网招聘信息seo推广技术培训
  • 深圳app制作开发公司排名seo排名需要多少钱
  • WordPress手机导航登陆代码深圳seo推广外包
  • 网站建设需求分析写什么深圳网络推广案例
  • 个人作品集网站模板免费下载收录优美图片官网
  • WordPress站内搜索代码卢松松外链工具