数据挖掘的十大经典算法,什么是数据挖掘论文( 二 )


以上就是我认为的三个区别,其实不论数据分析还是数据挖掘,能抓住老鼠的就是好猫,真的没必要纠结他们之前的区别,难道你给领导汇报时,第一部分是数据分析得出,第二部分是数据挖掘得出?他们只关注你分析的逻辑、呈现的方式 。下来说说我理解的大数据,常常有人问我,感觉现在的大数据分析培训和讲解,都是把之前的各类数据分析资料,前面加了了“大”,然后变成了大数据分析培训....,其实想一想这位兄弟说的真TM对 。
大数据对我的感觉并不是数据量大,也不是数据复杂,这些都可以用工具和技术去处理,而是它可以做到千人千面,而且是实时判断规则例如定向广告的推送,就是大数据,它根据你以往的浏览行为,可以准确的给你推相关的信息,基本做到了你一个人就是一个数据库,而不是一条数据 。但我们所作的数据分析更多是针对群体的,而非针对每个个人 。
要做到千人前面,侵犯你隐私数据是避免不了的,或多或少都有知道一些,而做到千人千面的大数据不就是要更多的了解你,引导你、杀你、留住你吗?为了达到这类手段,就要不断的去完善自家数据,甚至要购买数据来360度的让你在数据下裸奔,从而解决数据孤岛的问题所以大数据时代也显露出了各类问题,数据的隐私、数据杀熟、数据孤岛等,这也许就是我们目前看到大数据分析更看重的是技术、手段的原因,它其实是一门纯技术,但有时候确实可能需要艺术 。
将来想从事数据挖掘工作,考研学什么专业好呢?

数据挖掘的十大经典算法,什么是数据挖掘论文


我自己本科和研究生学的是统计,毕业后一直做的数据挖掘相关的的工作 。我简单谈一下对这个问题的看法:简单来说,要看你自身的数学功底和计算机功底 。如果计算机功底不怎么好,那建议学统计学:该专业所学的理论和模型方法和数据挖掘里面用到的很多方法和理论一致 。但是数据挖掘里面用到的理论方法会更多样一些,也更深入一些 。
另外就是统计模型和数据挖掘里面的算法模型在建模思路上面会有一些差异;如果计算机功底比较好,可以选目前比较流程的大数据相关的专业或者数据科学专业 。这些专业所学的课程跟数据挖掘里面用到的方法和理论更加一致;当然在真正报考研究生的,无论是选择统计学(概率论与数理统计)专业还是选择大数据(或者数据科学)专业,都要认证去参考教育部所列的专业排名 。
千万注意,千万注意,千万注意,重要的事情说三遍:是参考,不是完全信任 。主要是因为教育部的排名有些明显还是有漏洞的 。比如统计专业的排名里面在20名之后的很多学校是概率相关的专业不错,但统计真的比较乱 。所以不要全信排名 。大数据专业我也简单看过一些,也存在类似的问题 。如果是在看不明白,最简单的方法就是找个专业一点人仔细去咨询一下 。
人工智能这么火,数据挖掘和机器学习有什么区别?
数据挖掘的十大经典算法,什么是数据挖掘论文


工作后,我首先知道的概念是数据挖掘,而不是机器学习 。因此我想数据挖掘这个概念更加广泛,属于工程应用范畴 。5年前,我单位谈的都是数据挖掘,也举办这类竞赛,我们也掌握了数据挖掘的应用软件和数据挖掘标准流程,比如sas,clementine等数据挖掘平台 。这些平台多数基于图形化操作,应用门槛较低 。最近两年才开始谈机器学习,深度学习和人工智能等概念 。
从我工作经历来讲,数据挖掘是比较大众化的说法,单位业务部门都知道这个概念,而机器学习属于专业化的说法,现在业务部门还不清楚机器学习究竟是什么 。其实很难严格去区分两者的关系,看看最权威的数据挖掘和机器学习的教材,你会发现它们大部分都是重复的 。既然是两个名称,那么它们的侧重点应该是不一样的 。我的理解是数据挖掘的后端与机器学习的前端重复,机器学习的后端与深度学习的前端重复 。

推荐阅读