苏州科技大学-机器学习复习JU_JI自整.pdf 立即下载
2024-11-20
约9.7千字
约11页
0
702KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

苏州科技大学-机器学习复习JU_JI自整.pdf

苏州科技大学-机器学习复习JU_JI自整.pdf

预览

免费试读已结束,剩余 6 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

一、考试题型

1.选择题20题共40分
2.名词解释题10题共10分
3.简答题3题共30分
4.计算题1题共20分(4小问)

二、考试知识点整理

1.人工智能
ArtificialIntelligence,简记为AI,是当前科学技术迅速发展及新思想、新理论、新技
术不断涌现的形势下产生的一个学科,也是一门涉及数学、计算机科学、哲学、认知心理
学和心理学、信息论、控制论等学科的交叉和边缘学科。

2.智能的定义
智能是知识和智力的总和,知识是一切智能行为的基础,智力是获取知识并运用知识
求解问题的能力。

3.智能特征
1)感知能力
2)记忆和思维能力
3)学习和自适应能力
4)行为能力

4.机器学习
机器学习(MachineLearning,ML)是机器获取知识的根本途径,也是机器具有智能的重
要标志,是人工智能研究的核心问题之一。机器学习是使计算机无需明确编程就能学习的
研究领域。

5.人工智能的主要学派
1)符号主义
2)连接主义
3)行为主义

6.人工智能的主要研究内容
1)知识表示:实际上是对知识的一种描述,或者是一组约定,是机器可以接受的用
于描述知识的数据结构。
2)推理:指按照某种策略,从已知事实出发,利用知识推出所需结论的过程。
3)搜索与规划:搜索是指为了达到某个目标,不断寻找推理路线,以引导和控制推
理,使问题得以解决的过程。规划是一种重要的问题求解技术,是从某个特定问
题状态出发,寻找并建立一个操作序列,直到求得目标状态为止的一个行动过程
的描述。
4)机器学习:是机器获取知识的根本途径,也是机器具有智能的重要标志,是人工
智能研究的核心问题之一。

1

7.机器学习分类
1)监督式学习
2)无监督学习
3)强化学习

8.监督学习与非监督学习区别
1)原理不同:监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到
所要求性能的过程。无监督学习指根据类别未知(没有被标记)的训练样本解决模
式识别中的各种问题的过程。
2)算法不同:监督学习的算法是通过分析已知类别的训练数据产生的。无监督学习
的算法主要有主成分分析方法、等距映射方法、局部线性嵌入方法、拉普拉斯特
征映射方法、黑塞局部线性嵌入方法和局部切空间排列方法等。
3)适用条件不同:监督学习适用于样本数据已知的情况。非监督学习适用于无类别
信息的情况。

9.监督学习与强化学习区别
1)监督学习有两个主要任务,即回归和分类,而强化学习则具有不同的任务,例如
开发或探索,马尔可夫的决策过程,政策学习,深度学习和价值学习。
2)在监督学习中,存在各种数量的算法,它们的优缺点适合于系统要求。在强化学
习中,马尔可夫的决策过程为建模和决策情况提供了数学框架。
3)监督学习意味着名称本身就表示它是高度监督的,而强化学习则受到较少的监督,
并且依赖学习代理来通过确定不同的可能方式来确定输出解决方案,以实现最佳
解决方案。

10.过拟合与欠拟合
过拟合:当学习器把训练样本学得太好了的时候,很可能已经把训练样本自身的一些
特点当作了所有潜在样本都会具有的一般性质,这样就会导致泛化性能下降。
欠拟合:指对训练样本的一般性质尚未学好。

11.模型评估的关键在于如何获得测试集,且测试集应该与训练集互斥。

12.常见的模型评估方法
1)留出法
保持数据分布一致性(举例:分层采样)
多次重复划分(举例:100次随机划分)
测试集不能太大也不能太小(举例:1/5~1/3)
2)交叉验证法
3)自助法
4)调参与最终模型
算法参数由人工设定,模型参数由学习确定
调参过程相似:先产生若干模型,然后基于某种评估方法进行选择
算法参数选定后,要用“训练集+验证集”重新训练最终模型



2

13.性能度量是衡量模型泛化能力的评价标准,反映了任务需求,使用不同的性能度量往
往会导致不同的评判结果,回归任务最常用的性能度量是均方误差。

14.常用的性能度量
1)错误率与精度
2)查准率、查全率与F1
3)ROC与AUC
4)代价敏感错误率与代价曲线

15.比较检验(在某种度量下取得评估结果后,是否可以直接比较以评判优劣?)
在某种度量下取得评估结果后,不可以直接比较以评判优劣,因为测试性能不等于泛
化性能,测试性能会随着测试集的变化而变化,并且很多机器学习算法本身有一定的随机
性。

16.比较检验的常用方法
1)假设检验
2)交叉验证t检验
3)McNemar检验
4)Friedman检验与Nemenyi后续检验

17.偏差-方差分解
泛化性能是由学习算法的能力、数据的充分性以及学习任务本身的难度共同决定,偏
差-方差分解是解释学习算法泛化性能的一种重要工具。

18.偏差-方差窘境
训练不足时,学习器拟合能力不强,偏差主导
随着训
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

苏州科技大学-机器学习复习JU_JI自整

文档大小:702KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用