主题:IBM SPSS 大数据分析算法及应用
主讲:王琎(IBM 高级软件工程师)
时间:2020年11月7 星期六(9:30--12:00)
地点:北校区致远楼108
主讲人简介:
王琎,IBM资深软件工程师,从事SPSS大数据算法及相关产品的开发工作,熟悉在大数据结构下机器学习算法的各种应用,对Hadoop,Spark等常见的大数据架构下的算法有深入研究,现在主要致力于IBM Watson Studio下的大数据产品的开发工作。
内容简介:
1.数据分析基础流程:
1.1 什么是数据科学;
1.2 训练模型和预测模型过程;
1.3 模型的训练分支和预测分支
2.IBM SPSS 算法模型:
2.1 算法模型;
2.2 大数据之 4个V;
2.3 算法模型–按类别分类;
3.算法家族:
3.1 Data Exploration(数据画像);
3.2 Data Preparation(数据准备);
3.3 Regression & Classification(分类与回归);
3.4 Frequent Pattern Mining(频繁项挖掘);
3.5 Clustering(聚类);
3.6 Forecasting(时间序列);
3.7 Survival Analysis(生存分析);
3.8 Spatial-Temporal(时空模型);
3.9 Ensemble Method;(加强模型);
4.IBM big data 产品交付:
4.1分析方案框架;
4.2Modeler 大数据分析流程
