R语言读取数据来源一般有.csv、.xls或.xlsx、.txt和各种数据库等。其中R从Excel读取数据推荐openxlsx和readxl包,其他格式的数据一般rio包轻松搞定,这里不多介绍,看帮助文档即可。一般数据分享很少有通过Word作为载体的,但有些时候我们确实需要从Word文档里读取一些数据,这里推荐一个神奇的包docxtractr。下面我给出示例代码供参考:

1
2
3
library(docxtractr)
doc = read_docx("path/to/sample.docx") # 告诉R数据源的位置并读入内存
docx_extract_tbl(doc, tbl_number = 3) # 提取sample.docx文档的第三个表格

经测试效果非常好。默认表格是带表头的,对于没有表头的数据可以指定header = FALSE即可,更多信息请通过help(package = "docxtractr")查看包的官方手册。