AI人工智能 机器学习的类型(ML)
学习是指通过学习或经验获取知识或技能。基于此,我们可以对机器学习(ML)作出如下定义:
机器学习是计算机科学的一个领域,更具体地说是人工智能的一项应用,它能让计算机系统借助数据学习,并从经验中改进,且无需进行显式编程。
本质上,机器学习的核心目标是让计算机在无需人类干预的情况下实现自主学习。那么问题来了,这种学习该如何启动和开展呢?首先要从数据观察入手,这些数据可以是实例、指令,也可以是直接经验。随后,计算机会基于这些输入数据,通过寻找其中的模式来作出更优决策。
机器学习的类型
机器学习算法能让计算机系统在无需显式编程的情况下完成学习,这些算法可分为监督式、无监督式两类。下面我们来了解部分常见算法:
监督式机器学习算法
这是最常用的机器学习算法。之所以称为“监督式”,是因为算法从训练数据集中学习的过程,就如同有老师监督指导一般。在这类机器学习算法中,可能的输出结果是已知的,且训练数据也会标注正确答案。具体可理解为:
假设我们有输入变量x和输出变量y,应用某种算法学习从输入到输出的映射函数,即:
Y = f(x)
其核心目标是充分逼近这个映射函数,这样当有新的输入数据(x)时,就能预测出该数据对应的输出变量(Y)。
监督式学习问题主要可分为以下两类:
- 分类问题:当输出结果为分类数据(如黑色、教学类、非教学类等)时,这类问题被称为分类问题。
- 回归问题:当输出结果为实数值(如距离、千克等)时,这类问题被称为回归问题。
决策树、随机森林、K近邻算法(KNN)、逻辑回归均属于监督式机器学习算法。
无监督式机器学习算法
顾名思义,这类机器学习算法没有任何“老师”提供指导。因此,无监督式机器学习算法与人们所说的“真正的人工智能”更为贴近。具体可理解为:
假设我们有输入变量x,但与监督式学习算法不同,它没有对应的输出变量。
简单来说,无监督式学习中不存在正确答案,也没有指导老师,算法的作用是发现数据中有趣的模式。
无监督式学习问题主要可分为以下两类:
- 聚类问题:需要发现数据中固有的分组结构,例如根据消费者的购买行为对其进行分组。
- 关联问题:这类问题需要发现能描述数据中大部分内容的规则,因此被称为关联问题。例如,找出同时购买商品x和商品y的消费者。
用于聚类的K均值算法、用于关联分析的先验算法(Apriori)均属于无监督式机器学习算法。
强化式机器学习算法
这类机器学习算法的应用范围相对较窄。它们的作用是训练系统作出特定决策。本质上,机器会处于一个特定环境中,通过试错法持续自主训练,从过往经验中学习,力求获取最优知识以作出准确决策。马尔可夫决策过程(Markov Decision Process)就是强化式机器学习算法的一个例子。