日报标题:要考人工智能自学能力的这道题,人也给不出统一的答案
算有吧。无人指导下的学习 = Unsupervised Learning
这个问题其实就涉及到学者对机器学习的分类了:监督学习 Supervised Learning, 强化学习 Reinforcement Learning, 无监督学习 Unsupervised Learning
Supervised Learning: 应该是目前应用最广泛的机器学习类别了。就是提供一系列有标记的数据给机器学习算法,让这些算法学习到标记数据的规律。具体应用可以是分类(classification)或者回归(regression),算法如决策树、贝叶斯、SVM、随机森林、神经网络等。但这种机器学习方法对训练数据非常依赖。
例如下面这类题目,我们人类能够根据给定的训练数据,正确判断测试数据对应的结果。当然,现在的机器学习算法需要更多的数据集。
Reinforcement Learning:这个是另外一大类机器学习方法,大概就是通过定义奖惩机制,让机器不断尝试、搜索出合适的策略。这类方法有点类似于控制方法,最终找到的策略就是根据当前状态给出对应的动作,最近很火的 AlphaGo 就是用的类似方法。当然,算法的话,有 Q-learning,TD-learning,Deep Reinforcement Learning 等。
这类算法相比于监督学习,对标记数据的要求或者说人类的介入就更少了,我们只需要指定一个目标,让机器不断尝试就行了。毕竟,我们使用机器人的时候是会希望它能实现某些功能,因此,必然存在某些评价指标,所以,我认为 RL 会是下一阶段机器人的爆发点。
Unsupervised Learning:这应该是机器学习研究者的终极梦想了,就是我们不需要给数据做标记、也不需要特别指明目标,算法就能在一堆未标记数据中找到可用的信息。应用可以是聚类、异常检测、数据降维等。算法有 k-means,PCA 等。这部分的内容还有待进一步研究,就连我们人类自身,在面对不同的分类问题时,不同人都可能给出不同结果。
例如下面这类题目,有些人可能会认为答案是(b)帽子不是容器;但也有人认为是(d)没有把手。