当前位置:
首页 > 技能培训 > 大数据挖掘是什么意思(薛诗瑜)

知识点

大数据挖掘是什么意思(薛诗瑜)

大数据挖掘是从人们事先不知道的大量不完整、有噪声、模糊和随机的数据中提取潜在有用信息和知识的过程。数据挖掘通常与计算机科学相关,通过统计分析、在线解析解、信息检索、机器学习算法、专家系统和模式识别等。

数据挖掘过程:

定义问题:明确定义业务问题,确定数据挖掘的目的。

数据准备:数据准备包括:选择数据——从大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理——数据再处理,包括检查数据完整性和数据一致性、去噪、填充丢失字段、删除无效数据等。

数据挖掘:根据数据函数的类型和数据的特点,选择相应的算法,对净化转换后的数据集进行数据挖掘。

结果分析:对数据挖掘的结果进行解释和评价,转化为用户最终能够理解的知识。