整个训练近似熵和样本熵集关于类属性的熵是多少

您的位置: &
基于信息熵的属性离散化算法在暂态稳定评估中的应用
优质期刊推荐君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
数据挖掘课件
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口君,已阅读到文档的结尾了呢~~
1粗糙集及其在数据挖掘中的应用研究一,研究,中的,粗糙集,粗糙集的,数据挖掘,数据挖掘中,应用研究,以及粗糙集,粗糙集理论
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
1粗糙集及其在数据挖掘中的应用研究
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口选择分类器属性类型的系统或方法
专利名称选择分类器属性类型的系统或方法
技术领域本发明总体上涉及一种从可能可以由分类器进行处理的属性池中选择分类器中要使用的健壮属性的系统或方法(统称为“选择系统”)。具体地说,本发明涉及一种根据统计分布来选择属性的选择系统。
背景技术 分类器是从由一个或多个传感器收集的传感器数据中产生类别的设备。类别的确定是基于与传感器数据中属性类型关联的属性值。例如,在桌子的数字图象中,桌子的高度就是一种属性类型。相应地,与属性类型关联的数值就是属性值。在“高度”属性类型的情况下,属性值可以是顶部到底部的象素个数,或是以如英寸、英尺、码、米为单位的测量值。属性值和属性类型是分类器产生类别的手段,而每种类型的传感器都可以捕捉可能很多种的属性类型。
类别可以很多种不同格式产生,并用于很多种不同用途。例如,气囊展开机制中的分类器可以用于识别乘客上体的位置,从而气囊展开机制能够跟踪乘客的位置,这是一种在做气囊展开决策时很有用的能力。另一种分类器实例与自动叉车传感器相关,该传感器系统能区分不同的可能障碍,如其它叉车、行人、货物或其他形式的物体。
在分类器的许多不同实施方案和环境下,分类器要承受所谓“维数灾难”。由于不同属性被加入到分类器的确定过程中,因此分类器的精度通常会降低,而不是提高。这与人类的通常行为方式形成了鲜明对比,因为当可用信息越多时,人类越容易作出更好的决策。期望有一种选择系统,能够从可能属性类型池中确定一个健壮属性类型子集。优选地,这可以通过使用真实的测试数据来实现。
期望将非健壮的特性过滤掉,从而提高而不是最小化分类器的精度。通过使用更少的属性类型,可以在降低成本的同时提高性能。现有技术中选择属性的方法依靠或者属性与属性的相关性测量值,或者如熵的测量值。如果可以使用在特性处理过程中的统计分布来消除冗余的属性类型并选择期望的属性类型,这将是理想的。理想的是估计出不同的属性值是否服从同一基础分布,而不是仅计算出数据点对的协应差。
这种特性选择方法对于气囊展开机制中的分类器是特别有利的。座椅区域内的频繁移动加上人类衣着与外观的高差异性都需要更好的属性选择方法。
本发明是一种从可能可以由分类器进行处理的属性池中选择分类器中要使用的健壮属性的系统或方法(统称为“选择系统”)。该选择系统根据与那些属性类型关联的属性值的统计分布识别属性类型子集。
通过为各种可能属性类型计算统计分布,该系统能够有选择地从可能属性类型池中识别属性类型子集。不在有选择地确定的属性类型子集中的属性类型可以在这些数据被送至分类器之前过滤掉。
该系统可以使用测试数据子系统来存储并访问真实的传感器数据,在该子系统中测试滤波器。这种测试数据对于识别基础统计分布是必需的。分布分析子系统可以对测试数据执行统计分析以识别基础分布,并将每个属性类型与该分布进行比较。属性选择子系统,其中所述属性选择子系统有选择地从所述属性类型子集中识别属性类型子集。
通过以下对优选实施方案的详细描述并参考附图,本发明的各个方面对本领域技术人员来说将变得很明显。
图1是说明过程实例的过程流程图,该过程从捕获传感器数据开始,以分类器从所捕获到的传感器数据中得到计算结果结束;图2示出了说明一种体系结构实例的体系结构图,该体系结构从传感器捕获到的“目标信息”的总“属性空间”开始,以与属性类型关联的各个属性值结束;图3是说明属性选择系统的子系统层视图的实例的方框图;图4是说明能够在基于分布的选择启发式算法(heuristic)中执行的一些处理步骤实例的流程图;图5是气囊展开机制的汽车的局部环境视图,气囊展开机制使用具有有选择地识别出的属性类型的滤波器;图6是气囊展开过程流程的方框图,该流程使用了过滤掉除嵌入的预定属性类型列表上的那些属性类型以外的全部属性类型的滤波器;图7是说明利用类别跟踪乘客外形特征和运动特征的气囊展开机制实例的过程流程图。
具体实施例方式
本发明是一种从可能可以由分类器进行处理的属性池中选择分类器中要使用的健壮属性的系统或方法(统称为“选择系统”)。该选择系统根据与那些属性类型关联的属性值的统计分布识别属性类型子集。
I、要素的介绍及定义图1是说明加入到传感器处理系统(或简单地称为“传感器系统”)20中的一些要素的过程流程图。
A、目标目标22可以是任何单独的人、动物、植物、物体、空间区域或是系统20所用传感器24的对象或目标的感兴趣的其它方面(统称为“目标”22),也可以是这些的组合。传感器处理系统20的用途是准确地捕获与目标22相关的有用信息。不同目标22的种类可以象不同传感器处理系统20的种类那样多。
在传感器系统20的一种实施方案(“气囊展开机制”
实施方案或简单地称为“气囊”实施方案)中,传感器系统20的输出被气囊展开机制所使用。在气囊实施方案中,目标22通常是机动车辆座椅上的乘客。通过准确地捕获乘客的关键属性,气囊展开机制可以作出恰当的展开决定。不必要的展开或不恰当的展开故障可以通过气囊展开机制访问准确的乘客类别来避免。
在传感器系统20的其它实施方案中,目标22可以是人(各种安全设备实施方案)、机动车辆外部的人和物体(各种外部机动车辆传感器实施方案)、特定区域的空气或水(各种环境检测实施方案)或一些其它类型的目标22。
B、传感器传感器24可以是用于捕捉与目标22或目标22周围区域相关的信息的任何类型的设备。不同类型传感器24的种类可以象不同类型物理现象和人类感觉的种类一样多。
一些传感器24是光学传感器,用来捕获不同波长光线,如红外线、紫外线、x-射线、伽马射线、肉眼可见光(“可见光”)的光学图象及其它光学图象。在很多实施方案中,传感器24可以是摄像机。在一种优选的安全气囊实施方案中,传感器24是摄像机。
其它类型的传感器24差眼于不同类型的信息,如声音(“噪声传感器”)、气味(“气味传感器”)、触觉(“触觉传感器”)或味觉(“味觉传感器”)。传感器还可以将很多种不同物理现象,如重量(“重量传感器”)、电压(“电压传感器”)、电流(“电流传感器”)及其它物理现象(统称为“现象传感器”)的属性作为目标。
C、目标信息目标信息26的集合可以是与目标22相关并由传感器24捕获的任何格式的任何信息。对于利用光学传感器24的实施方案,目标信息26是目标图象。这种图象通常包括各象素。对于非光学传感器24,目标信息26是一些其它形式的表示,这种表示通常可以转换成可视或数学格式。例如,但关于地震检测或火山活动预测的物理传感器24还是可以产生可视格式的输出,虽然该传感器24不是光学传感器24。
在许多气囊展开实施方案中,目标信息26将以乘客可见光图象的形式出现,其中图象以象素为单位。但是,目标信息26的格式甚至比传感器24的类型还要多,因为一种类型的传感器24可以用来捕获多于一种格式的目标信息26。传感器系统20特定实施方案所期望的目标信息26的类型将决定传感器系统20中所使用的传感器24的类型。
D、滤波器滤波器28可能是任何能够从目标信息26提取属性向量30的装置。在一种优选实施方案中,滤波器28只能是可编程逻辑的形式。这种逻辑可以是硬件、软件、或硬件与软件的某种组合的形式。在其它实施方案中,传感器信息26受物理滤波器28的控制,从而限制通过并到达分类器32的信息类型和数量。
滤波器28是一种机制,利用该机制只有预定类型和数量的信息能够通过并到达分类器32。其它的属性类型被该滤波器阻止了。滤波器28使用过滤启发式算法来消除目标信息26中的非健壮或非期望属性。传感器系统20可以包括很多种不同的过滤启发式算法。不管可能采用哪种启发式算法,都只有一个目标信息26的子集可以通过并到达分类器32。在系统20的很多实施方案中,目标信息26的子集存储在属性向量30中,该向量可以传到一个或多个分类器32。
有很多种属性选择启发式算法可以用于选择包含在属性向量30中的目标信息26。可以对特定属性进行测试,从而每种包含在滤波器28中要传到分类器32的属性都是健壮的、有用的和期望的。下面会更加详细地描述该属性选择过程。
E、属性向量属性向量30可以是任何能够将来自滤波器28的目标信息26的子集传送到分类器32的数据结构或信息格式。属性可以是目标信息26的任何特征或特性。只有与目标信息26的子集相关的属性才包括在属性向量30中。属性向量30中不同属性的个数随实施方案变化很大。与下面要讨论的属性选择启发式算法一致,只有有用和期望的属性才应当被选择用于属性向量30。
属性向量30中的每个属性都可以包括两部分属性类型和属性值。“宽度”是属性类型的一个实例。“15(象素)”是属性值的一个实例。属性向量30上的每个位置都表示一种特定的预定义属性类型。那个位置上的每个数值就是属性值。
F、分类器分类器32是接收属性向量30作为输入并产生一个或多个类别34作为输出的任何设备。分类器32的逻辑可以是以软件、硬件或硬件与软件的某种组合的形式嵌入的。在许多实施方案中,滤波器28和分类器32在同一个设备中。
在传感器系统20的有些实施方案中,不同的分类器32将专门用于目标22的不同方面。例如,在气囊展开实施方案中,一个分类器32可能着眼于乘客的头部,而另一个分类器32可能着眼于乘客的运动是否与安全带的使用一致。
G、类别类别34是由分类器32作出的任何确定。类别34可以是数值的形式或目标22分类的形式。例如,在气囊实施方案中,类别34可以是不需要任何定量测量的乘客分类。乘客可以划分为成人、儿童、后向婴儿座椅等。气囊实施方案中的其它类别34可以包括定量属性,如头部最高位置或最接近气囊展开机制的上体位置。
H、属性空间图2是说明属性空间40的最高层到与该空间中的类42关联的属性类型44关联的属性值46的体系结构的图。
属性空间40只是所有可能属性类型44的一种图形化表示,其中属性类型44可以从由传感器24捕获的目标信息26的格式中获得。根据与目标22、传感器24及目标信息26相关的差异,属性空间40随传感器系统20的实施方案不同变化很大。
I、类在广泛范围的属性空间40和具体的属性类型44之间是类42这一层。类42是根据传感器系统20的目的定义的。例如,在传感器系统20的气囊展开应用实施方案中,气囊展开机制可能想要区分乘客的不同类42,如成人、青少年、儿童、后向婴儿座椅(RFIS)、前向婴儿座椅(FFIS)、增高椅、空座椅、杂物及不确定乘客。类42是与各种属性类型44及属性值46的范围关联的。在一种优选实施方案中,将属性类型44按组划分到类42中优选地是基于从与属性类型44关联的属性值46得到的共享基础统计分布。下面会更加详细地讨论该基础统计分布。类42事实上基于几乎任何其它共享特征的共性。例如,属性类型44的一类42可以关于距离测量值,如高度、宽度、深度或距离。类42可以关于二维测量值,如面积。另一类42还可以关于三维测量值,如体积。传感器系统20可以包括许多不同类型的类42。在使用传感器测量值可视表示的实施方案中,属性类型44的类42可以关于色彩、亮度、辉度或一些其它分类。不同类42的可能个数可以象用于描述物理世界中现象的属性类型44分类的个数一样无限多。
如图2中所公开的,每种属性类型44不一定只属于一类42。而在有些实施方案中,类42可以只包括一种属性类型44。如图2中所公开的,类可以彼此重叠,一种属性类型44可以属于多于一类42。类42是由传感器系统20的设计者定义的。
J、属性类型和属性值属性向量30中的每个项都关于目标信息26的一个特定方面或特性。属性类型44只是该特征或特性的类型。相应地,属性值46只是一个特定目标信息组中该特定属性类型44的定量值。例如,目标信息26中一个特定物体的高度(一种属性类型44)可以是200象素高(一种属性值46)。不同的属性类型44和属性值46在系统20的不同实施方案中变化很大。
一些属性类型44可以关于目标信息26图象表示中两个或多个点之间的距离测量值。这种属性类型44可以包括高度、宽度或其它距离测量值(统称为“距离属性”)。在安全气囊实施方案中,距离属性可以包括乘客的高度或乘客的宽度。
一些属性类型44可以关于目标信息26图象表示中的相对水平位置、相对垂直位置或一些其它基于位置的属性(统称为“位置属性”)。在气囊实施方案中,位置属性可以包括这些特性,如乘客的最高位置、乘客的最低位置、乘客的最右位置、乘客的最左位置、乘客的最右上位置等。
属性类型44不一定要限制为目标信息26中的直接测量值。属性类型44可以通过各种组合和/或数学运算来产生。例如,每个“on”象素(都表示某种类型物体的每个象素)的x和y坐标可以相乘,而所有“on”象素的平均乘积将构成一种属性。x坐标平方值和y坐标平方值的平均乘积也是一种可能的属性类型44。
具有预定属性类型44的传感器系统20的一个好处是它特别地预计到传感器系统20的设计者会创建新的和有用的属性类型44。从而,从已知特征得到新特征的能力对于本发明的实践是很有好处的。在一些实施方案中,新的特征可以从现有特征中得到。
II、子系统视3说明了一种属性选择系统(“选择系统”)50的子系统层视图实例。
A、测试数据子系统测试数据子系统52可以用于捕获、存储和访问测试数据的样本。在选择系统50的一种优选实施方案中,对特定用途属性类型44的估计是利用测试数据进行的。例如,在气囊展开实施方案中,坐在机动车辆座椅上的人的真实图象应当用于估计属性类型44,并有选择地识别关于乘客类别和跟踪的健壮属性类型44的子集。包含具有各种属性类型44和属性值46的目标信息26的是测试数据库。因此,测试数据子系统52包括可能的属性类型44,从该属性类型44选择一个健壮属性类型44的子集。
在测试数据子系统52的一些实施方案中,测试数据子系统52包括一个用于将属性值46转换成标准化定标值的标准化模块。在测试数据子系统52的其它实施方案中,可以调用一个冗余启发式算法来除去冗余的测试数据组。在另外的实施方案中,该冗余启发式算法是k最近邻样本(k-nearestneighbor)启发式算法,该算法将在下面更加详细地描述。
B、分布分析子系统分布分析子系统54负责确定两种属性类型是否来自一个共同的类42。该分布分析子系统54从各属性值46中为与那些属性值46关联的各属性类型44产生各种分布统计量。在选择系统50的许多实施方案中,分布分析子系统54从属性值46中产生标准化值,并在产生分布统计量时使用该标准化值。下面会更加详细地描述该标准化过程。一组标准化值的一个实例是一组最小值为0、最大值为1的定标值。
在一些实施方案中,分布统计量是通过调用Mann-Whitney启发式算法来产生的。但是,如果期望,这种实施方案还可以包括多于两个类42。
C、属性选择子系统属性选择子系统56负责有选择地从测试数据中的属性类型44池中识别一个属性类型44的子集。有很多种不同的选择启发式算法可以被属性选择子系统56所使用。
在一类实施方案(“阈值实施方案”)中,来自分布分析子系统的各分布统计量可以同一个分布阈值进行比较。将低于预定分布阈值的分布统计量从考虑范围中除去。
在另一类实施方案(“前N项选择实施方案”)中,选择系统50的用户定义可通过的属性类型44的预定个数。在一些实施方案中,属性选择子系统56可以使用专家系统、神经网络、人工智能及其它智能技术(统称为“智能”)来计算属性类型44的期望个数。可以对各分布统计量进行排队,只有前N项(其中N可以是用户定义的任意数)被选择。在一些“前N项选择实施方案”排队中,排队是按类42实现的。在这种实施方案中,每一类42的前N个属性类型44被选择。
在另一类实施方案(“合并统计量实施方案”)中,合并的类统计量是利用分布统计量产生的,不同的类被赋予不同的“权”。从而可以通过对与属性类型44关联的合并类统计量进行排队来对属性类型44进行排队。
在识别期望属性类型44的适当子集后,属性选择子系统56可以在滤波器28中嵌入适当的属性类型44列表。
III、属性选择启发式算法图4是说明一种属性选择启发式算法实例的流程图。不同的实施方案可以包括更少步骤、更多步骤或不同的步骤。
A、接收可能属性组在60,选择系统50接收可能属性类型44组,送入测试数据子系统52。为了进行测试和估计,没有属性类型44需要排除在属性向量30之外。大量的测试目标信息26增强了选择系统50检测统计分布的能力增强了。
B、标准化属性值属性值46在62被标准化。
进入属性向量30的属性值46可以被转换为成定标值。将属性值46转换为成定标值的过程称为标准化启发式算法。
在一种优选实施方案中,标准化值的范围是在属性类型44的选择和测试开始之前预定的。所使用的不同范围可以很广。在一种优选实施方案中,对于一个测试样本中的所有属性类型44应使用相同的标准化值范围。选择系统50是高度灵活的,可以加入很多不同的预定范围。
在一种“最小-最大”标准化启发式算法中,属性值46被转换为最小为0、最大为1的定标值(一种特定类型的标准化值)。这是在从样本中的所有属性类型44中减去最小属性值46之后完成的。然后可用最大属性值46去除所有的属性类型44。
在一种“零平均值”标准化启发式算法中,标准化值的平均值设置为0,方差为1。选择系统50还可以使用很多其它类型的标准化启发式算法。
将属性值46标准化为标准化值的目的是减小属性值44可变动态范围对分类器32的影响。如果属性值46没有以某种形式标准化,则具有很大动态范围的单个属性值46会弱化并覆盖其它属性类型44和属性值46。
标准化属性值46的重要性在目标22是运动着的人的选择系统50实施方案中尤为重要。在这种实施方案中,许多最佳属性类型44可以图象几何矩的形式或其它数学矩的形式来估计。在模式识别、物体识别、三维物体位姿估计、机器人传感、图象编码和重建等领域,几何矩是重要的。但是,这种矩可以随矩的阶单调增长,从而能够人为赋予较高阶矩增加的重要性。等式1是几何矩的一种数学实例,其中Mpq是几何矩。
等式1Mpq=&Sy=1m&Sx=1nxpyqI(x,y)]]&在一种优选实施方案中,目标信息26或者是以二维格式捕获的,或者被转换成二维格式。例如,摄像机捕获以许多具有各种辉度值的象素形式存在的目标信息26。等式1可以用于这种实施方案。在等式1中举例来说,I(x,y)是象素(x,y)处的亮度值,而p,q=0、1、2、...、N。如果对所有x、y都有I(x,y)=1且以上等式能够正确地定标,则M00给出了感兴趣的2D图象图形的面积(以象素为单位),而(M10,M01)给出了图形重心的坐标。因此,“几何矩”的概念可以用来识别人或其它目标22的重心。不幸的是,基本函数(xp,yq)尽管完整,但却包含冗余(例如,不是正交的)。因此,期望使用滤波器28。
定标值由选择系统50存储,如下面讨论的那样以后要参考这些值。在一种优选实施方案中,是定标值而不是属性值46用于随后的选择系统50的过程。因此,在下面的讨论中,说到相关属性类型44或其它基于属性类型44的数学运算实际上是利用特定属性类型44的定标值执行的。
在可选实施方案中,可以使用定标值和属性值46某种类型的加权组合。此外,选择系统50不需要为随后选择系统50的过程调用标准化启发式算法。
C、除去选定的相关属性相关属性类型44可以在64被有选择地除去。在一种优选实施方案中,相关是对与同属性类型44关联的属性值46关联的定标值计算的。因此,在下面的讨论中,对属性类型44的估计就是对与属性类型44关联的定标值的估计。
目标图象26中的许多属性类型44都有相对较高的互相关。如果两个属性类型44高度相关,则意味着信息中存在相对大量的相似性或冗余。
这会欺骗分类器32陷入一种错误的置信度(例如,没有任何真正附加信息的高置信度系数),而不是对于特定类别34进行计算的置信度。
为了除去相关属性类型44,首先必须为样本中所有属性类型44计算每对属性类型44之间的相关系数。系统20可以包括很多种不同的相关启发式算法。在一种优选实施方案中,相关启发式算法是等式2中公开的数学运算。
等式2相关系数(A,B)=Cov(A,B)/sqrt[Var(A)*Var(B)]Cov(A,B)是属性类型A与属性类型B的协方差。Var(A)是属性类型A在可能属性类型44的样本中的所有属性类型44中的属性类型A的方差。
相关系数可以与一个相关阈值进行比较。如果一个特定属性类型44的相关系数超过该相关性阈值,则该特定属性类型44可以从样本中除去。在有些实施方案中,相关阈值是一个预定阈值。在其它实施方案中,相关性阈值是在计算出相关系数以后,根据“通过”测试的属性类型44的预定个数确定的。例如,相关阈值可以利用各相关系数的统计数据设置,从而只有前N%的属性类型44留在属性类型44的样本中。不在前N%中的属性类型44可以除去,不需要进行随后的测试。在另一些实施方案中,相关阈值是在计算出各相关系数以后确定的,该计算不基于任何预定的数值。
D、执行分布分析分布分析启发式算法可在66执行。分布分析启发式算法可以仅使用统计方法来确定特定属性类型44是否与其它属性类型44具有相同的统计分布。
在一种优选实施方案中,分布分析启发式算法是同时对两种属性类型44执行的(例如,“基于对的分布分析启发式算法”)。在基于对的分布分析启发式算法的一种优选实施方案中,对每种属性类型44都执行Mann-Whitney测试(例如,“Mann-Whitney启发式算法”)。其它类型的数学和计算过程也可以用作分布分析启发式算法。
分布分析启发式算法的目的是推断各属性类型44是服从相同的分布还是服从不同的分布。在一种基于对的分布分析中,每一对中的任意两个属性类型44或者属于相同的分布,或者属于两个完全不同的分布,在该分布分析中,每个属性类型44是作为与其它属性类型44的一对中的一部分来估计的。
随后每种属性类型44都可以被处理。对于每种属性类型44,测试数据中与类i(例如,分布i)和类j(例如,分布j)对应的所有定标值都被提取出来并放在一个向量中。然后对定标值进行分类,并记录每个定标值的分级。然后,就可以为每个类计算分级的总数。根据等式3和等式4,就可以计算统计量(“虚统计量”)的一个虚假设组(“虚统计量启发式算法”)。
等式3null_hyp_mean=num_class*(num_class+num_else+1)/2等式4null_hyp_sigma=sqrt{num_class*num_else*(num_class+num_else+1)}/12变量“null_hyp_mean”表示虚假设组的平均值。变量“num_class”指属于一个特定类的标准化值,而“num_else”是属于一个不同类42的定标值或归一化值的个数。
然后通过使用统计量启发式算法,就可以产生估计统计量,如等式5中的计算结果。
等式5统计量=(rank_sum_class-null_hyp_mean-0.5)/null_hyp_sigma在上面的等式中,“rank_sum_class”指分级的和,这个变量对每个类计算。在计算出统计量以后,为了完成分布分析启发式算法,还可执行一些不同的过程。
1、阈值启发式算法完成分布分析启发式算法的一种可选子过程是阈值启发式算法。在阈值启发式算法中,将统计量与一个统计量阈值进行比较。这个阈值可以是在执行阈值启发式算法之前预定义的,或者利用任意数量的不同条件在产生所有属性类型的统计量以后再计算的。如果各个类是平均可分或大致平均可分的,则统计量阈值可以直接根据结果的置信度进行选择。例如,根据现有技术已知的统计文献资料,置信度为0.001意味着阈值是3.291。
统计量超过统计量阈值的属性类型44被保留下来,而那些统计量低于统计量阈值的属性类型44被除去了。使用阈值启发式算法会导致任意个数的属性类型44。
2、前N项启发式算法不象可能产生不可预测数目的留下的属性类型44的阈值启发式算法,前N项启发式算法为每一类42找出前N项最可分的属性类型44。N可以是1到保留属性类型44个数之间的任意数。不在前N项中的属性类型44被除去。如果一个类42远不及其它类42可分,则这是一种特别好的方法,如对于在基于视觉的乘客应用中识别小个子成人与大个子儿童之间的不同的情形。如上面所讨论的,可以用于传感器系统20中的类42的个数和类型应当取决于传感器系统20的目的和期望的功能。在一种期望阻止展开气囊的气囊实施方案中,类42的个数和类型应当足够可以使得在期望使用时展开气囊,而在不期望使用时避免展开气囊。用于计算属性类型44最终个数的前N项启发式算法可以包括等式6的数学运算。
等式6属性类型的最终个数=N*类的个数3、合并统计量可用于完成分布分析启发式算法的一种过程是包括计算合并统计量的合并启发式算法。合并启发式算法的一种实例是等式7。
等式7comb_statistic=所有类对组合的统计量绝对值的总和等式5中描述的统计量可以对属性类型44样本中的所有类对合并进行计算。那些统计量绝对值的总和可以加在一起来计算等式7的合并统计量(comb_statistic)。组合启发式算法提供组合的可分性度量。如果期望总和取决于每一类的重要性或一些其它因数,则这种方法可以包括一个加权的总和。这种方法还提供固定个数的属性类型44。等式7范围以外的其它可选组合启发式算法也可以包括到选择系统50。
E、删除冗余样本当收集训练样本时,样本空间中经常会有相当大的冗余,或者换句话说,多个样本提供非常相似甚至完全相同的信息。当训练样本是在单一位置,如一个学生或任何其它人群的教室收集到的时候,尤其如此。当为整个人群提取个体数据的样本时,大小、服饰样式及其它特征就非常有可能都是相似的。为在68删除冗余样本,由选择系统50调用一个删除冗余样本启发式算法。在一种优选实施方案中,删除冗余样本启发式算法是k最近邻样本启发式算法。
对每个训练样本的k最近邻样本启发式算法类别可以对照其它训练样本来执行。如果分类器32要在分类器36的处理中使用k最近邻样本启发式算法,则所使用的序数k应当至少是终端系统k值的2倍。因为人装着的变化性非常大而且几乎不可能合理地用参数表示所有的可能性,因此,对于人类目标22,k最近邻样本启发式算法是一种有效的方法。k最近邻样本启发式算法对照剩余的所有以前还未被删除的属性类型44来测试每个样本的类别。如果类别34正确且置信度为100%(即,每个k最近邻样本都属于正确的类),则该样本被认为是冗余的,然后被丢弃。
F、格式化输出在70,选定的属性类型进入一个可以嵌入到传感器系统20中或传输到一个可能适用于不同测试样本的不同测试元件中的数据格式。选择系统50是高度灵活的,可以包括很多不同的格式和协议。属性向量30中的精确位置需要链接到特定的属性类型44。
G、为属性组调用额外的训练如果选择系统50的用户期望让有选择地确定的属性类型子集接受额外的测试,则可以在72调用这些测试。
H、将属性组嵌入到分类器在74,所选定的属性类型44被嵌入到分类器32中,与分类器32对应的滤波器28配置成除去所有不与有选择地识别出的属性类型44子集关联的属性值46。该过程在传感器系统20嵌入选择系统50的结果以后结束。
IV、气囊实施方案A、局部环境视5是传感器系统20的可能很多不同气囊实施方案中周围环境的局部视图,表示为气囊传感器系统(“气囊系统”)80。如果有乘客96,则乘客96可以坐在座椅98上。在有些实施方案中,摄像机或任何其它能够快速捕获图象的传感器(统称为“照相机”86)可以放在车顶内衬板82中,并在乘客96上方但比乘客96更接近前风挡玻璃88。为了捕获由于在座椅98上前后运动造成的乘客96上体角度的变化,照相机86可以以一个面向乘客96稍微向下的角度放置。照相机86还有很多可能的位置,这在本领域中是公知的。此外,气囊系统80还可以使用很多种不同的照相机86,包括通常每秒捕捉大约40帧图象的标准摄像机。气囊系统80也可以使用更高及更低速度的照相机86。
在有些实施方案中,照相机86可以包含或包括工作在直流条件下的红外线或其它光源,从而在黑暗背景中提供恒定的照明。气囊系统80可以设计成用于黑暗的环境,如夜间、雾、大雨、浓云、日食及其它任何比一般白天条件暗的环境。气囊系统80也可以用于更亮的环境。红外线的使用能够向乘客96隐瞒光源的使用。可选实施方案可以利用以下一种或多种光源独立于照相机的光源;发射除红外线以外其它光线的光源;及只利用交流电周期性发射的光线。气囊系统80可以包括很多种其它照明设备和照相机86配置。此外,根据照明条件,气囊系统80可以采用不同的启发式算法和阈值。因此,气囊系统80可以应用关于乘客96当前环境的“智能”。
能够实现启发式算法或运行计算机程序的计算机、计算机网络或任何其它计算设备或配置(统称为“计算机系统”84)安装气囊系统80的逻辑。计算机系统84可以是能够执行下述编程逻辑的任何类型的计算机或设备。计算机系统84几乎可以位于机动车辆中或上的任何位置。优选地,计算机系统84位于靠近照相机86的位置,以避免要通过很长的电线来发送照相机图象。气囊控制器90示为位于仪表板94中。但是,即使气囊控制器90位于不同的环境,气囊系统80仍然可以工作。相似地,尽管气囊系统80可以使用其它位置,但气囊展开机制92优选地也位于乘客96和座椅98前面的仪表板94中。在有些实施方案中,气囊控制器90与计算机系统84是同一个设备。气囊系统80可以灵活地实现为包括在设计机动车辆和气囊应用机制92时加入更多变化。
在客户可以使用气囊应用机制之前,计算机系统84加载气囊展开机制设计者所期望的优选预定类42。计算机系统84加载在区分优选预定类42时有用的优选预定属性类型44的列表。属性类型44优选地是利用图4公开的过程选定的。真实的人或其它测试“乘客”或至少真实的人或其它测试“乘客”的图象可以被分解成构成可能属性类型44池的各种属性类型44的列表。这些属性类型44可以从特征或属性类型44池中选定,其中包括特征,如高度、亮度、质量(根据体积计算)、到气囊展开机制的距离、上体的位置、头部的位置及其它可能的相关属性类型44。这些属性类型44可以对于特定的预定义类42来测试,有选择地除去高度相关的属性类型44和具有高度冗余统计分布的属性类型44。图4中的其它步骤及可选过程和启发式算法也可以使用,从而只有期望和有用的属性类型44被加载到计算机系统84中。
B、气囊展开的高级过程流程图6公开了说明用于气囊系统80的传感器系统20的一种实例的高级过程流程图。包括乘客96和周围座椅区域100的座椅区域100的环境图象89可由照相机86捕获。尽管在很多不同情形和实施方案下,只能捕获到乘客96的一部分图象,尤其是当照相机86位于不能拍到乘客较低的肢端的位置时,但是图中,座椅区域100包括整个乘客96。
环境图象89可以被发送到滤波器28。滤波器28接收环境图象89作为输入并发送属性向量30,该向量填充有根据上述选择启发式算法的属性类型44。然后分析属性向量30来确定适当的气囊展开决策。该过程也在下面进行描述。例如,属性向量30可以用来确定在展开时乘客96是否太靠近展开的安全气囊92。属性向量30中的属性类型44和属性值46可以被发送到气囊控制器90,从而允许气囊展开机制92以所获得的关于乘客96的信息作出适当的展开决策。
C、详细的过程流程图7公开了从捕获周围图象89的点发送适当的乘客数据到气囊控制器的过程的更详细的实例。只要乘客96在车上,该过程就不停地重复。在一种优选实施方案中,老数据加入到当前数据的分析中,从而有一个过程流程箭头从图底部的气囊控制器90指回图的顶部。
在环境图象89(这是一类特殊的传感器信息26)被照相机86捕捉到以后,可以由滤波器28对其进行过滤启发式算法。上面已经非常详细地描述了属性选择和过滤的过程。
滤波器28允许外形跟踪器和预测器102忽略照相机86捕获到的很多属性类型44。用于展开目的的关键属性类型44通常关于乘客96的位置和运动特征。
跟踪和预测子系统102可以用来跟踪乘客96的特征,如位置、速度、加速度及其它特征。在有些实施方案中,跟踪子系统102还可用来“前推”乘客的特征,产生对传感器测量值之间过渡时期中的这些特征的预测。在一种优选实施方案中,跟踪和预测子系统102使用一个或多个卡尔曼滤波器将老的传感器测量值与最近的传感器测量值以概率加权的方式集成到一起。
跟踪子系统102可以包括很多种着眼于不同乘客特征子集的不同子系统。例如,跟踪子系统102可以包括用于跟踪和预测“外形”特征的外形跟踪和预测模块106以及用于跟踪和预测“运动”特征的运动跟踪和预测模块104。
然后,跟踪子系统102可将信息发送到气囊控制器90,以由气囊展开机制92来实现适当的行为。在有些情况下,由于乘客当前处于或即将处于临界危险区域而阻止了展开。在有些实施方案中,气囊展开可以配置成在对应于气囊需要从乘客96吸收的动能数量的各种强度下发生。跟踪子系统102还可以用于确定是否发生了撞车,及此次撞车是否需要使气囊展开。
V、可选实施方案根据专利法的规定,本发明的原理和工作模式已经在优选实施方案中进行了解释和说明。但是应当理解,在不背离本发明精神和范围的前提下,本发明还可以通过与所具体解释和说明的不同的方式来实现。
1.一种配置与分类器(32)一起使用的滤波器(28)的方法,包括利用分布统计量(66)有选择地从多种属性类型(44)中识别属性类型子集;以及修改滤波器(28),从而使分类器(32)只能访问属性类型(44)的子集。
2.根据权利要求1的方法,还包括利用Mann-Whitney启发式算法产生分布统计量(66)。
3.根据权利要求1的方法,还包括从统计量的虚假设组中产生分布统计量(66)。
4.根据权利要求1的方法,还包括从多个分布类(42)产生分布统计量(66)。
5.根据权利要求1的方法,还包括将分布统计量(66)与预定的分布统计量阈值比较。
6.根据权利要求1的方法,还包括将分布统计量(66)排队;及除去与低于预定队列位置的排队相关的属性类型(44)。
7.根据权利要求1的方法,还包括产生合并类(42)统计量;将合并类统计量(42)排队;及从属性类型(44)的子集中除去与低于预定队列位置的排队关联的属性类型(44)。
8.根据权利要求1的方法,还包括通过执行k最近邻样本启发式算法来识别属性类型(44)的冗余测试样本;及从属性类型(44)的子集中除去冗余测试样本(68)中的属性类型。
9.根据权利要求1的方法,还包括将与每种属性类型(44)关联的属性值(46)转换成定标值。
10.根据权利要求1的方法,还包括根据协方差启发式算法产生协方差系数;比较该协方差系数与预定的协方差阈值;及从属性类型(44)的子集中除去与超过预定协方差阈值的协方差系数关联的属性类型(44)。
11.根据权利要求1的方法,其中滤波器(28)和分类器(32)由气囊展开机制(92)使用。
12.一种选择包含在分类器(32)中的属性类型(44)的系统,包括测试数据子系统(52),包括包含多种属性类型(44)的数据样本;分布分析子系统(54),包括多个分布统量(66),其中所述分布分析子系统(54)从所述多种属性类型(44)中产生所述多个分布统计量(66);及属性选择子系统(56),其中所述属性选择子系统(56)有选择地从所述属性类型(44)的子集中识别一个属性类型(44)子集。
13.根据权利要求12的系统,其中所述属性选择子系统(56)包括预定阈值,且其中所述属性类型(44)的子集是通过比较所述分布统计量(66)与该预定阈值有选择地识别的。
14.根据权利要求12的系统,其中所述分布分析子系统(54)还包括多个合并类统计量,其中所述分布分析子系统(54)从所述分布统计量(66)产生所述合并类统计量,且其中所述属性选择子系统(56)通过对所述合并类统计量排队来对属性类型(44)进行排队。
15.根据权利要求12的系统,其中所述属性选择子系统(56)有选择地识别预定个数的属性类型(44)。
16.权利要求12的系统,其中所述测试数据子系统(52)还包括标准化模块,所述标准化模块包括多个定标值,其中所述标准化模块产生所述多个定标值并使该多个定标值与所述多种属性类型关联。
17.根据权利要求12的系统,其中所述数据样本包括冗余数据子集,其中所述测试数据子系统包括冗余度启发式算法,且其中所述测试数据子系统调用所述冗余启发式算法来除去所述冗余数据(68)的子集。
18.根据权利要求12的系统,其中所述分布统计量(66)是利用Mann-Whitney启发式算法产生的。
19.根据权利要求12的系统,其中所述有选择地识别出的属性类型(44)的子集被嵌入(74)到气囊展开机制中。
20.一种用于跟踪乘客(96)的安全气囊传感器系统,包括乘客图象(89),包括多种属性类型(44)和与所述多种属性类型关联的多个属性值(46),其中只有一个所述属性类型(44)的子集最终被识别为统计上健壮的属性类型;从乘客捕获所述乘客图象(89)的传感器(96);分类器(32),包括类别(34),其中所述分类器(32)从所述统计上健壮的属性类型产生所述类别(34);及滤波器(28),包括预定的统计上健壮的属性类型列表,其中所述滤波器只允许所述统计上健壮的属性类型通过并到达所述分类器(32)。
一种用于在传感器系统中为分类器(32)选择属性(44)的系统或方法(统称为“选择系统”)。该选择系统利用与那些属性类型关联的属性值(46)的统计分布(66)来选择属性类型(44)。不在有选择地识别出的属性类型(44)的子集中的属性类型(44)可以在这些数据被送至分类器(32)之前过滤掉。该系统可以使用一个测试数据子系统(52)来存储和访问真实的传感器数据(26)。一个分布分析子系统(54)可对测试数据执行统计分析以识别基础分布(66),并比较单个属性类型(44)与该分布(66)。一个属性选择子系统(56),其中所述属性选择子系统(56)有选择地从所述属性类型(44)的子集中识别一个属性类型(44)的子集。
文档编号G06K9/62GK
公开日日 申请日期日 优先权日日
发明者M·E·法默, M E 法默 申请人:伊顿公司

我要回帖

更多关于 近似熵 样本熵 的文章

 

随机推荐