机器学习可以分成监督学习和强化学习。如果严格细分的话,可以分成监督学习、无监督学习、半监督学习和强化学习。
什么是监督学习?什么是无监督学习?
根据定义监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。 监督学习是从标记的训练数据来推断一个功能的机器学习任务。
用人话来讲就是: 学习过程中是否允许人为干预。
监督学习:我们拿比较经典的猫狗识别为例,加入一个孩子刚开始认识事物(目标值)时,我们想让他正确识别猫和狗这两种不同的动物。我们首先告诉他,猫大概是什么样,狗大概是什么样(告诉特征)。经过一段时间的介绍,孩子逐渐知道了猫和狗的区别。如果孩子下一次再看到猫和狗给出答案时,其他人会指出错误(人工干预)。
主要用途:分类(Classify)和回归(Regression)。
常见算法:k-近邻算法、决策树与随机森林、逻辑回归、神经网络、朴素贝叶斯、Logistic回归、支持向量机、AdaBoost算法、线性回归、局部加权线性回归、收缩和树回归等
非监督学习:还是上面的那个例子,给他不同的猫和狗,但是并不告诉他哪个是猫哪个是狗,而是让他自己根据两个事物的特征自己进行判断,会把猫和狗分到两个不同组中,下次再给孩子一个狗的图片,他会把狗分到狗组中,而不是分到猫组中。
也就是说,在学习的过程中,只提供事物的具体特征(特征值),但不提供事物的名称(目标值),让学习者自己总结归纳。所以非监督学习又称为归纳性学习(Clustering),是指将数据集合分成由累死的对象组成的多个簇(或组)的过程。
主要用途:聚类等
常见算法:k-means、Apriori、FP-Growth等