当前位置:
首页 > 大学专业介绍 > 数据挖掘需要学什么 数据挖掘简介(徐克达)

知识点

数据挖掘需要学什么 数据挖掘简介(徐克达)

很多同学想知道数据挖掘需要学习什么。以下是边肖整理的相关内容,希望对大家有所帮助!

数据挖掘需要学习什么

数据挖掘涉及的内容非常广泛,包括机器学习、数据挖掘、人工智能等,但其实这些知识大多是相通的。《实用机器学习》这本书是我看过的启蒙书里非常好的一本书。什么都有,理论和实践都很难,能很快对各种知识有个大概的了解。但是,如果你想在这个行业长期发展,你需要学习更多的知识,比如回归模型。你不仅要知道最小二乘法,还要思考如何对数据进行清理,哪些数据需要清理,如何对数据进行标准化,数据是否过多,是否降维或降维,使用哪个回归模型,达到什么样的精度水平,是否考虑拟合或欠拟合,是否进行交叉验证,如果回归模型不适用,有什么替代方案。

数据挖掘导论

数据挖掘是通过分析每一个数据,从大量的数据中找到其规则的技术,主要包括数据准备、规则发现和规则表示三个步骤。数据准备是从相关数据源中选择需要的数据,整合到数据集进行数据挖掘;规则搜索是通过某种方法找出数据集中包含的规则;规则表示是以用户能够尽可能理解的方式(比如可视化)表达发现的规则。数据挖掘的任务包括关联分析、聚类分析、分类分析、异常分析、特定群体分析和进化分析。

近年来,数据挖掘引起了信息产业的极大关注。主要原因是数据量大,可以广泛应用,迫切需要将这些数据转化为有用的信息和知识。获得的信息和知识可以广泛应用于各种应用,包括企业管理、生产控制、市场分析、工程设计和科学探索。数据挖掘使用来自以下领域的思想:①来自统计学的抽样、估计和假设检验;②人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也很快接受了其他领域的想法,包括优化、进化计算、信息论、信号处理、可视化和信息检索。其他一些领域也起到了重要的支撑作用。特别是,数据库系统需要为存储、索引和查询处理提供有效的支持。源自高性能(并行)计算的技术在处理海量数据集时通常很重要。分布式技术也可以帮助处理海量数据,当数据不能一起处理的时候就更重要了。