李宏毅机器学习课程---1、机器学习介绍
一、总结
一句话总结:
实际数据需求:机器学习 根据不同的 实际 数据情况 选择不同的机器学习方法
输入到输出:机器学习本质是一个由输入到输出的过程,就看你的输入给的详细不详细
1、机器学习的实质是什么?
Looking for a Function:去满足我们的需求
Machine Learning ≈ Looking for a Function
寻找一个函数去满足我们的需求
2、机器学习大致的应用方向举例?
Speech Recognition:声音识别
Image Recognition:图像识别
Playing Go:比如下围棋
Dialogue System:智能聊天系统
3、机器学习三个步骤?
1、define a set of function
2、goodness of function
3、pick the best function
goodness
英 [ˈɡʊdnəs] 美 [ˈɡʊdnəs] n. 善良,美德;仁慈,慷慨;精华,养分int. (表示吃惊或愤怒)天哪;上帝的替代语
4、机器学习中的regression 是什么意思?
回归学习
Regresion: The output of the target founction f is ‘scalar’. 我们在机器学习中要找的function输出是数值,
核心思想就是:连续函数下进行预测。
regression
英 [rɪ'greʃ(ə)n] 美 [rɪ'ɡrɛʃən] n. 回归;退化;逆行;复原
5、机器学习的分类问题中的两种分类是什么?
Binary Classification 输出是或否:判断是否为垃圾邮件
Multi-class Classification输出多个类型:将文件分为政治、经济、体育等多个大类
Binary Classification: Spam filtering(垃圾邮件过滤),判断是垃圾邮件,不是垃圾邮件。
Multi-classification: Document Classification(文件分类),将文件分为政治、经济、体育等多个大类。
6、机器学习中的线性模型和非线性模型是什么(Linear Model 与 Non-Linear Model)?
Linear Model:【能力有限】:能做的事有限,一些简单的模型可以用它来做,但遇到复杂问题就力不从心了。
Non-linear Model:【能做复杂工作:比如图像分类】:For example,现在的深度学习就是一个Non-linear Model,能完成一些很复杂的工作,比如图像分类等。
7、机器学习的Non-Linear Model(非线性模型)分为哪四种?
Deep Learning(深度学习)
SVN(支持向量机)
Decision Tree(决策树)
K-NN(临近算法)
8、Unsupervised Learning 非监督学习是什么意思?
给非标记数据,让机器自己学习
比如要让机器学会阅读,希望机器自己在网络上爬去很多文章,自己理解其中的意思,进而取得人类的一些理解,掌握阅读的技巧,这就是非监督学习要做的。
9、Unsupervised Learning 非监督学习的实例?
要让机器学会阅读:希望机器自己在网络上爬去很多文章,自己理解其中的意思,进而取得人类的一些理解,掌握阅读的技巧,这就是非监督学习要做的。
要让机器学会自主绘画:我们只给机器呈现显示世界中的景象并不做标识,机器要从中提炼绘画风格与内容,学会通过作画表达自己。
10、Semi-supervised Learning 半监督学习 是什么?
部分有标签data:利用Unlabeled data优化function,也常用于数据不足时进行学
要建立一个辨识猫与狗的系统,手上有一部分Labelled data(已经标记好的猫狗图片),和一部分Unlabeled data(未做过标记的猫狗图片),那么Semi-supervised Learning做的就是利用Unlabeled data优化function,也常用于数据不足时进行学习。
11、Structuerd Learning(结构化学习)是什么?
Beyond Classification:在实际运用中,常常会遇到Beyond Classification的情况,比如语音识别,人脸识别,语言翻译等,是结构化输出。此类问题常配合Reinforcement Learning 解决。
12、Transfer Learning(迁移学习)是什么?
利用这些data优化function:另一部分与猫狗没有关系的图片(比如狮子老虎,标未标记都可)
还是建立辨识猫与狗的系统,手上有一部分Labelled data(已经标记好的猫狗图片),和另一部分与猫狗没有关系的图片(比如狮子老虎,标未标记都可),那么Transfer Learning就是利用这些data优化function。
transfer
英 [træns'fɜː; trɑːns-; -nz-] 美 [træns'fɝ] v. 转让;转接;
13、Reinforcement Learning(增强学习)是什么?
解决超出分类的情况:会遇到Beyond Classification的情况,比如语音识别,人脸识别,语言翻译等
在实际运用中,以上方法并不能解决全部问题,常常会遇到Beyond Classification的情况,比如语音识别,人脸识别,语言翻译等,那么就要通过增强学习来解决问题。
reinforcement
英 [riːɪn'fɔːsm(ə)nt] 美 [,riɪn'fɔrsmənt] n. 加固;增援;援军;加强
14、增强学习(Reinforcement Learning)的一个实例?
google 阿法狗:增强学习的一个非常知名的应用就是 google 阿法狗。
15、机器学习 主要解决的是哪三个问题(task)?
Regression(回归问题)
Classification(分类问题):比如判断图片是猫还是是狗
Structured Learning(结构化问题)
16、增强学习与监督学习有什么区别呢(Reinforcement Learning VS Supervised)?
Supervised:手把手教会机器:就像给了机器一个点读机,他听到一句话时可以看到其含义,每一句话都有标签,就像有一个手把手教他的老师。
Reinforcement Learning:机器唯一可以知道的就是他做的好还是不好
而Reinforcement Learning 就像跟女朋友对话,反复讲来回讲很多句话,直到女朋友觉得你无言以对愤然离去,机器唯一可以知道的就是他做的好还是不好,除此之外没有任何information。而这更像人类现实生活中的学习过程,必须自己像哪里做得好做得不够好,怎么修正。
17、机器学习的学习方式(比如监督学习,比如增强学习)我们是依据什么来选的?
根据实际情况:比如没有那么多数据,那就可以选 半监督学习,没有那么多标记数据,可以选增强学习啊
能做监督学习肯定就做监督学习了,比如标记数据够的情况,
18、什么数据情况下选择什么样的机器学习方式?
部分有标签data:Semi-supervised Learning
无标签data:Unsupervised Learning
一堆不相干data:Transfer Learning
只有来自外界的评价:Reinforcement Learning
有标签data:Supervised Learning
二、内容在总结中