一、基本概念 聚类是把一个数据对象划分成多个组或簇的过程,使得簇内对象相似度很高,而簇间对象相似度很低。聚类属于无监督分类方式。主要得的聚类方法主要有:基于划分的方法,基于层次的方法,基于密度的方法,基于网格的方法,基于模型的方法。 二、基于划分的方法 1.划分的思想 给定一个有n个数据对象的集合,基于划分的方法会构建数据的k个分组,其中每个分组表示一个簇。对于给定的分组数k,算法会首先给
一、惰性学习法与急切学习法 急切学习法:指在利用算法进行判断之前,先利用训练集数据通过训练得到一个目标函数,在需要进行判断时利用已经训练好的函数进行决策。惰性学习法:在最开始的时候不会根据已有的样本创建目标函数,只是简单的把训练用的样本储存好,后期需要对新进入的样本进行判断的时候才开始分析新进入样本与已存在的训练样本之间的关系。 典型的惰性学习法是KNN,它不会根据训练集训练一个模型,而是将训练集
文章目录 一、全概率公式 1.引例 2.全概率公式 二、贝叶斯公式 1.引例 2.贝叶斯公式 三、朴素贝叶斯 1.概念 2.算法流程 3.拉普拉斯校准 四、一个示例 一、全概率公式 1.引例 p(活着) = 0.5 _ 0.8 + 0.5 _ 0.3花活着这一事件可以分为两种情况,一种是如果邻居记得浇水的情况下,花活着,另一种是如果邻居忘记浇水的情况下,花活着
一、基本介绍 决策树是一种类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每个分支代表该测试的一个输出,而每个叶子节点(终端节点)存放一个分类结果。上图是一个决策时的示例。当决策树构建好之后,对检验记录进行分类就很容易,从树的根节点开始,将测试条件用于检验记录,沿着树的分支达到叶子节点,得到分类结果。 二、决策树构建 原则上讲,对于给定的属性集,可以构造的决策树很多,所有如何在合
为什么要进行数据预处理? 只有当数据的质量好才能保证数据分析的结果好。然后实际系统中的原始数据会因为很多原因出现数据错误,数据缺失,不一致等情况,所以需要对原始数据进行预处理,包括数据清洗,数据集成,数据归约,数据转换。 一、数据清洗 目的:填充或删除缺失值,降低噪声与识别离群点。数据清洗的第一步偏差检测(数据的不一致性,字段过载),第二步纠正偏差1.缺失值处理(1)直接删除缺失属性的记录。(
文章目录 一、基本概念 二、关联规则挖掘步骤 1.两个关键步骤: 2.如何减少产生的关联规则数量: 三、Aprior算法 四、 关联规则有效性评估: 一、基本概念 关联规则挖掘:在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构。频繁模式:频繁地出现在数据集中的模式。假定某超时销售的商品包括:bread,beer,cak
一、数据类型 1.属性的定义 每一条数据可以称为数据集的一个样本,而每一条数据要用不同的特征描述出来,特征也称为属性。属性通常分为两大类。一类是定性描述的属性,其可以划分为标称属性,布尔属性,序值属性,不具备数的大部分性质。一类是定量描述的属性,即数值属性,用数表示,并且具有数的大部分性质,可以是整数值和离散值。 标称属性:符号或事物的名称。但是有时候,机器学习任务中,模型只能接受数值型属性,
文章目录 一、常用传感器及其原理 1.位置传感器 2.编码器 3.传输时间测量(磁反射)型位移传感器 4.速度传感器 5.力和压力传感器 6.力矩传感器 7.可见光和红外传感器 8.接触和触觉传感器 9.接近觉传感器 10.测距仪 11.嗅觉传感器 12.味觉传感器 13.视觉系统 一、常用传感器及其原理 1.
文章目录 一、机器人的移动方式设计 二、足式移动机器人 1.足的规模 2.足的稳定性 3.足的自由度 4.足行步态 5.动力学考虑 6.平衡控制 7.常见足式机器人实例 8.静态步行与动态步行 9.ZMP行走模型 三、轮式机器人 1.轮子结构 2.轮式移动平台的特征 3.轮子的部署 四、移动机器人的空间坐标变换
积分
粉丝
勋章
TA还没有专栏噢
第三方账号登入
看不清?点击更换
第三方账号登入
QQ 微博 微信