这篇文章主要介绍了R语言之左连接的三种实现操作,具有很好的价值,希望对大家有所帮助。一起跟随小编过来看看吧
数据处理中经常遇到表连接问题,本次介绍R语言中三种左连接方法,这三种是等价的,不过会有时间快慢问题,斟酌使用。
法一:
> data0 <- merge(a,c,all.x=TRUE,by='CELLPHONE')
法二:
> data1 <- sqldf('select a.*,b.* from a left join c on a.CELLPHONE=c.CELLPHONE')
法三:
> data2 <- c[a,on='CELLPHONE']
注意:第三种方法的顺序不能写反了。
补充:R语言中的inner_join, full_join, left_join, right_join
在R for Data Science中,作者用了非常直观的例子解释了上面的四个概念。说明如下:
我们的数据集是这样的:
x <- tribble(
~key, ~val_x,
1, "x1",
2, "x2",
3, "x3"
)
y <- tribble(
~key, ~val_y,
1, "y1",
2, "y2",
4, "y3"
)
可以看出,x与y的key都有1,2,但是x的key里面有3,y的key里面有4.
下面我们来看这四个概念:
1. inner_join
x %>%
inner_join(y, by = "key")
其结果是
key val_x val_y
<dbl> <chr> <chr>
1 x1 y1
2 x2 y2
可以看出,此时基于key的连接只保留了共同的key值1与2对应的数据;
2. full_join
x %>%
full_join(y, by = "key")
其结果是
key val_x val_y
<dbl> <chr> <chr>
1 x1 y1
2 x2 y2
3 x3 NA
4 NA y3
可以看出,此时基于key的连接保留了所有key值对应的数据,当相应的值不存在的时候,用NA代替;
3. left_join
x %>%
left_join(y, by = "key")
此时的结果为
<dbl> <chr> <chr>
1 x1 y1
2 x2 y2
3 x3 NA
可以看出, 此时基于key的连接只保留了x对应的key值的数据,当相应的值不存在的时候,用NA代替;
4. right_join
x %>%
right_join(y, by = "key")
此时的结果为
key val_x val_y
<dbl> <chr> <chr>
1 x1 y1
2 x2 y2
4 NA y3
可以看出,此时基于key的连接只保留了y对应的key值的数据,当相应的值不存在的时候,用NA代替。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程学习网。如有错误或未考虑完全的地方,望不吝赐教。
织梦狗教程
本文标题为:R语言之左连接的三种实现操作


基础教程推荐
猜你喜欢
- win10下使用virtualbox + vagrant配置ruby开发机环境 2023-07-23
- Ruby3多线程并行Ractor使用方法详解 2023-07-23
- ruby on rails validates 2023-09-22
- Swift中重写和重载的使用与对比总结 2023-07-05
- ruby-on-rails-为使用Rails 4,nginx和乘客的用户设置自定义域 2023-09-21
- R语言-修改(替换)因子变量的元素操作 2022-11-26
- R语言绘制折线图实例分析 2022-11-21
- 浅析ELF转二进制允许把 Binary 文件加载到任意位置 2023-07-06
- R语言 ggplot2改变柱状图的顺序操作 2022-11-17
- Swift初始化器与可选链的使用方法介绍 2023-07-08