监督学习要认为标出什么是输入什么是输出,俗称labels
半监督->监督的弱化版,不需要标注那么多(真的标注不过来鸭哇哇哇)
迁移学习:有很多不相干的数据
无监督学习:???这是机器能做到的?
监督学习中的结构化学习:
其实世界很大,俗话说regression,classification平分天下,但这只是冰山一角,还有structured learning很大的未探索的世界等我们去探索
强化学习:就很nice嘞,奖励机制
悄悄告诉你:Alpha Go就是监督学习+强化学习一起的
PS:
正经的说,现在强化学习很潮,如果你去面试,你说你是做机器学习的,面试官问你为什么不去学强化学习‘
你应该这么跟他说:reinforcement learning就是我们没有办法,没有data做监督学习的时候,才去做的