简介
传统上如果我们想让计算机工作,我们给它一串指令,然后它遵照这个指令一步步执行下去,机器学习是一种让计算机利用数据而不是指令来进行各种工作的方法。
常用四大类模型
- 分类
- 聚合
- 预测
- 关联
模型过程方法论
- SEMMA
- Sample 数据抽样
- Explore 数据探索
- Modify 数据调整
- Model 模型研发
- Assess 综合评价
- 5A
- Assess 评价需求
- Access 存储数据
- Analyze 完备分析
- Act 模型演示
- Automate 结果展现
- CRISP-DM
- 商业理解
- 数据理解
- 数据准备
- 模型建立
- 模型评估
- 模型发布
算法
- 回归预测及相应的降维技术:
- 线性回归
- Logistic回归
- 主成分分析
- 因子分析
- 岭回归
- LASSO
- 分类器
- 决策树
- 朴素贝叶斯
- 贝叶斯信念网络
- 支持向量机
- 提升分类器准确率的Adaboost
- 随机森林
- 聚类与孤立点判别
- 人工神经网络
- 其他
- 信度分析
- 关联规则
- 效度分析