欢迎访问学兔兔,学习、交流 分享 !

返回首页 |
当前位置: 首页 > 书籍手册>计算机与网络 >数据挖掘技术与工程实践

数据挖掘技术与工程实践

收藏
推荐:升级会员 无限下载,节约时间成本!
关键词:技术   工程   挖掘   实践
资源简介
数据挖掘技术与工程实践
作者:(加)洪松林,(中)庄映辉,(中)李堃 著
出版时间:2014-10-01

【图书简介】

数据挖掘是当前最活跃的领域之一。《大数据技术丛书:数据挖掘技术与工程实践》作者根据自己20年数据挖掘方面的经验,总结了数据挖掘的理论知识和实践经验,提供了大量一线资料。本书首先介绍数据挖掘的概念和误区,然后介绍数据探索的方法,包括数据查探、数据描绘、数据变换、数据优化等,重点介绍了相关算法,包括:相关因子算法、聚类算法、分类算法、回归与测试算法等。不仅列举了详细示例,还介绍了算法在工程实践中的具体应用,特别是总结了自己独特的一些新算法,例如秩相关因子选择算法、矢量相关因子选择算法、密度分布聚类算法、概率特征模型算法等。还剖析了几个热门领域的实际应用,涉及医药学、信息安全、新闻分析、商品推荐、证券预测等领域的应用。最后归纳总结了数据挖掘应用系统的开发方案,并介绍一个数据挖掘工具的应用。本书可供数据挖掘、数据仓库、数据库等领域的技术人员参考,也可供想建立智能计算系统的企业信息系统管理人员参考。


【作者简介】

[加]洪松林,福安易数据技术(天津)有限公司(F&E DATA TECHNOLOGY CORP. )创始人,外国专家局引智技术专家,加拿大OCP认证专家,有20年智能计算(数据仓库、商务智能及数据挖掘)方面的研究、设计、开发和培训经验。掌握北美先进的项目经验,曾在加拿大安大略省卫生部(OMH)、蒙特利尔银行(BMO)、加拿大研科电讯公司(TELUS )、安省高教委(OCAS)等大型机构参与多个大型智能计算项目。近年来在国内主持多个智能计算产品的总体设计和研发工作,将北美的智能计算技术及业务经验与中国的专业需求和数据环境有效地结合起来,开发了以数据仓库、数据挖掘和数据统计为技术核心的智能数据分析产品,并在北京、天津等地得到成功应用。


【本书目录】

前 言

第1章 数据挖掘应用绪论1

1.1 认识数据挖掘1

1.1.1 数据挖掘概念2

1.1.2 数据挖掘与生活4

1.1.3 数据挖掘与知识6

1.2 数据挖掘应用基础6

1.2.1 事物与维度7

1.2.2 分布与关系9

1.2.3 描绘与预测11

1.2.4 现象和知识13

1.2.5 规律与因果13

1.3 数据挖掘应用系统工程14

1.3.1 数据层14

1.3.2 算法层18

1.3.3 应用层23

1.4 数据挖掘应用体会26

1.4.1 项目关键点26

1.4.2 技术与应用创新27

1.4.3 经验积累与应用28

1.5 无限三维嵌套空间假说28

1.5.1 一维空间29

1.5.2 二维空间29

1.5.3 三维空间29

1.5.4 突破三维空间30

1.5.5 五维空间31

1.5.6 六维空间31

1.6 本章小结32

第2章 数据探索与准备33

2.1 数据关系探索34

2.1.1 业务发现34

2.1.2 关系发现36

2.1.3 数据质量探索37

2.1.4 数据整合40

2.2 数据特征探索42

2.2.1 数据的统计学特征42

2.2.2 统计学特征应用48

2.3 数据选择52

2.3.1 适当的数据规模52

2.3.2 数据的代表性53
下载地址