监督学习的用途: k-近邻算法、线性回归、朴素贝叶斯、局部加权线性回归、支持向量机、Ridge回归、决策树、Lasso最小回归系数估计
无监督学习的用途: K-均值、最大期望算法、DBSCAN、Parzen窗设计
选择合适的算法:
1,使用机器学习算法的目的
预测目标变量的值 – 监督学习算法
标变量类型
离散型(是/否、1/2/3 ..) – 分类算法
连续性数值(0.0 ~ 100.00 ..) – 回归算法
不想预测目标变量的值 – 无监督学习算法
需要将数据划分为离散的组 – 聚类算法
分组后还需要估计数据与没个分组的相似程度 – 密度估计算法