机器学习的主要问题
supervised learing:监督学习 unsupervised learing:非监督学习
discrete:离散的 continuous:连续的
classification(or categorization):分类 clustering:聚类
regression:回归
dimensionality reduction:维度下降
(1)监督学习:
用户将成对的输入和预期输出数据提供给算法,算法从中找到一种方法(,然后根据给定输入给出预期输出。
(事先知道正确答案,即拥有一个输入变量(x)和一个输出变量(Y),使用某种算法去学习从输入到输出的映射函数Y=f(X),我们的目标是足够好的近似映射函数,以便当我们在新的数据上可以预测输出变量)
监督式学习问题可以进一步被分为回归和分类问题
回归(Regression)和分类(Classification)的算法区别在于输出变量的类型,定量输出称为回归,或者说是连续变量预测;定性输出称为分类,或者说是离散变量预测。
回归模型可预测连续值(预测房子的价格)
分类模型可预测离散值(预测垃圾邮件、非垃圾邮件)
(2)非监督学习
非监督式学习问题可以进一步分为聚类问题、关联问题、概率分布估计,降维
(3)半监督式机器学习Semi-supervised learning
当我们拥有大部分的输入数据(X)(X)但是只有少部分的数据拥有标签(Y)(Y),这种情形
(4)增强学习reinforcement learning