收集数据 当光学字符识别软件第一次处理文件时,它将文件划分成一个矩阵,从而网格中的每一个单元包含一个单一的图像字符,当图像字符被扫描到计算机中
基于关联规则的购物篮分析
理解关联规则 购物篮分析主要用于超市数据。例如{尿布,婴儿食品,啤酒}在超市可能是一个典型的交易,该交易中识别的规则或许可以表示为如下形式{尿
Stata和R Markdown
调用Stata引擎 1 library(Statamarkdown) 接下来的代码就这样写了 1 2 3 4 5 ```{stata} -- Stata code here -- ``` 描述统计 1 2 3 4 ```{stata, collectcode=TRUE} sysuse auto summarize ``` 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 (1978 Automobile Data) Variable
主成分分析
理解主成分分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。例如,使用PCA
K最近邻算法(KNN)
理解近邻分类 你知道蛋白质、蔬菜和水果是怎么分类的吗?生活中我们发现既不脆也不甜的是蛋白质,脆而不甜的是蔬菜,而水果往往是甜的,有可能脆也有可
利用R实现考生和考题随机抽样
班里有15个人,10个topic,其中5个topic要求出现两次,这样正好15个人选择15个topic,用sample函数分别对同学和top