自然语言处理库nltk学习(一)

nltk是一个快捷方便的自然语言处理库,是一个免费,开源,社区驱动的项目。。可以用来处理一些人类语言数据比如一些论坛上的评论,电子邮件等等。结合深度学习可以用来对评论,电子邮件进行分类。安装可以...

数据挖掘算法-回归分析

回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。是数据挖掘中比较大的一个分类,运用十分广泛。回归分析研究的主要问题是:(1)确定Y与X间的定量关系表达式,这种表达式称为回...

数据挖掘算法--Apriori算法

Apriori算法是数据挖掘里边关联规则挖掘的常用方法。关联规则挖掘目标是发现数据项集之间的关联关系或相关联系,是数据挖掘中的一个重要课题。典型的案例是购物篮分析,有时候我们想通过分析客户的购物...

变量的相关性分析

大数据分析中,在数据探索的时候我们往往要知道各个变量之间的关系。我们可以通过绘制散点图来直观地看出变量的相关性:更加准确地描述变量的相关性,我们可以通过计算变量的相关系数。常用的相关系数是Pea...
xxxxx