cdf累积分布函数数可以评价聚类结果吗

当前位置: >>
聚类有效性评价综述
第 25 卷 第 6 期 2008 年 6 月计 算 机 应 用 研 究 Application Research of ComputersVol. 25 No. 6 Jun. 2008聚类有效性评价综述*杨 燕 , 靳1蕃 , KAMEL Mohamed12( 1. 西南 交通 大学 信息 科学 与技 术学 院 , 成 都 . Dept. of Electrical & Computing Engineering, University of Waterloo, Waterloo, Ontario, Canada, N2L 3 G1) 摘 要 : 在 聚类 分析 应用 中 , 迫切 需要 一种 客观 公正 的质 量 评 价 方 法 来 评判 聚 类 结 果 的 有 效 性。 为 此 , 从 外 部评价 法、 内部 评价 法和 相对 评价 法三个 方面 , 归纳综 述了 常用 的聚 类有 效性 评价 方法 , 并 讨论 了模 糊 聚 类评 价 法 和聚 类最 佳类 别数的 自动 确定 问题 。 关键 词 : 聚 类 ; 聚类 评价 ; 有效 性指 数 中图 分类 号 : TP311 文 献标 志码 : A 文 章编 号 : 1001 - ) 06- 1630- 03Survey of clustering validity evaluationYANG Yan1 , J IN Fan1 , KAMEL Mohamed2( 1. School of Information Science & Technology, Southwest Jiaotong University, Chengdu 610031 , C 2 . Dept. of Electrical & Computing Engineering, University of Waterloo, Waterloo, Ontario N2 L 3 G1 , Canada)Abstract: The need for fair methods that can assess the validation of clustering results is becom ing more and more critical in cluster analysis applications. The paper surveyed the widely known clustering validity evaluation based on external criteria, internal criteria, and relative criteria. It presented a review of fuzzy clustering validity measures and the determining of optimal number of clusters adaptively. Key words: c validity index 聚类分析是数据挖掘过程中的一种重要手段和工具 , 它可 以发现隐含在数据集中的簇 , 标志出感兴趣的分布或模式。聚 类问题是将一组对象分成若干个簇或聚类 , 使簇内的对象尽可 能具有最大的相似性 , 不同簇之间的对象尽可能有最大的相异 性。聚类过程可以看做是一种无监督的学习过程 , 因为没有预 先定义的分类或示例来表明数 据集中 哪种期 望的关 系是有 效 的, 多数聚类算法依靠假设和猜测进行。如何用一种客观公正 的质量评价方法来评判聚类结 果的有 效性是 一个困 难而复 杂 的问题。广义上讲 , 聚类 有效性 评价包 括聚类 质量的 度量、 聚 类算法适合某种特殊数据集的程度 , 以及某种划分的最佳聚类 数目 [ 1] 。常用的聚类 有 效性 评价 方 法有 外 部评 价法、 内部评 价法和相对评价法[2~ 4]先指定的结构。这种结构反映 了人们 对数据 集聚类 结构的 直 观认识。每个数据项的分 类标记 已知。下面介 绍两种 常用 的 外部评价法。 1) F-measure 它组 合了 信息 检索 中查 准率 ( precision) 与[ 12]查全率 ( recall) 的思想来进行聚 类评价。一 个聚类 j 及与此 相 关的分类 i 的 precision 与 recall 定义为P = precision( i, j) = Nij / Ni R = recall( i, j) = Nij / Nj ( 1) ( 2)其中 : Nij 是在聚类 j 中分类 i 的数目 ; Nj 是聚类 j 中所有对象 的 数目 ; Ni 是分类 i 中 所有对 象的数 目。分类 i 的 F-measure 定 义为F( i) = 2 PR / ( P + R) ( 3)。外部和内部评价法均基于统计测试 ,具有较高的计算复杂性 , 这些方法中的有效性指数是为了度量 一个数据集与预先已知结 构的相 符程度。相 对评价 法寻求 一 个聚类算法在一定假设和 参数下 能定义 的最好 聚类结 果。此 外, 还有一类针对软 ( 模糊 ) 划分 的聚类评价 方法 , 称 之为模 糊 聚类有效性度量 [ 3 ~5] 。在聚类性能评价方法中 , 某些有效 性指 数能够求得具有最佳 聚类数 目的划 分 [ 1, 类评价的应用热点之一。5~ 11]对分类 i 而言 , 哪个聚类的 F-measure 值高 , 就认为该聚 类 代表分类 i 的映射。换句话说 , F-measure 可看成分 类 i 的评 判 分 值。 对 聚 类 结 果 来 说 , 其 总 F-measure 可 由 每 个 分 类 i 的 F-measure加权平均得到 :F =?[ | i | ×F( i) ] / ?| i|i i( 4)。这 也是 目前 聚其中 : |i |为分类 i 中所有对象的数目。 2) Rand 指数 ( index) 和 Jaccard 系数 ( coefficient) 设数 据 集 X 的一个聚类结构为 C = { C1 , C2 , … , Cm} , 数 据集已知的 划11. 1聚类评价方法外部评价法 外部评价方法意味着评判 聚类算 法的结 果是基 于一种 预收 稿日期 : ; 修 回日期 : 分为 P = { P1 , P2 , … , Ps } , 可通过比较 C 和 P 以 及邻近矩阵 与 P 来评价聚类的质量。对数 据集中 任一 对点 ( Xv , Xu ) 计算 下 列项 [ 3] : SS― ― ―如果两个点属于 C 中同一簇 , 且 P 中同一组 ;基 金项 目 : 四 川省 重大基 础研 究基金 子项目 ( 04JY029- 001- 4 )作 者简介 : 杨燕 ( 1964- ) , 女 , 安徽合 肥人 , 计 算机学 会高级 会员 , 副教 授 , 博 士 , 主要 研 究 方 向为 数 据 挖 掘、 计 算 智 能 ( yyang@ home. swjtu. edu. cn) ; 靳蕃 ( 1935 - ) , 男 , 湖南长 沙人 , 国 家有突 出贡 献专家 , 教授 , 博导 , 主 要研 究方向 为编 码、 神经网 络、 计 算 智能 ; KAMEL Mohamed( 1948- ) , 男 , 教 授 , 博士 , 主要 研究 方向为 计算 智能、 模式 识别 、 分 布式及 多 agent 系 统、 IEEE Fellow. 第6期杨燕 , 等 : 聚类 有效 性评 价综 述Scat( c) = 1 / c? ‖σ ( vi ) ‖ / ‖σ ( X) ‖i =1 c? 1631?( 13 )SD― ― ―如果两个点属于 C 中同一簇, 但 P 中不同组 ; DS― ― ―如果两个点不属于 C 中同一簇 , 而 P 中属同一组 ; DD― ― ―如果两个点不属于 C 中同一簇, 且 P 中不同组。 设 a、 b、 c、 d 分别表示 SS、 SD、 DS、 DD 的数目 , 则 a + b + c + d = M 为数据集中所有对的最大数 , 即 M = N( N - 1) / 2。其中 : N 为数据集中点的总数。 C 与 P 之间的 相似 程度 可由 如下 有 效性指数定义 :Rand 指数 Jaccard 系 数 R = ( a + d) / M J = a /( a + b + c) ( 5) ( 6)聚类间总体分离性定义为Dis( c ) = Dmax / Dmin ? ( ? ‖ vk - vZ ‖ )k =1 z =1 c c -1( 14 )其中 : Dmax = max( ‖vi - vj ‖ ) , Dmin = min( ‖ vi - vj ‖ ) ( P i, j∈ { 1, 2, … , c} ) 分别是聚类中心间的最大和最小距离 ; c 为聚类个 数。 最后可得到质量指数SD( c) = α Scat( c) + Dis( c ) ( 15 )上述两指数取值 均为 [ 0, 1 ] 。当 m = s 时 , 有最 大 值。其 余指数定义以及邻近矩阵与划分 P 的 比较方 法可以 参考文 献 [ 3] 。 1. 2 内部评价法 内部评价方法是利用数据 集的固 有特征 和量值 来评价 一 个聚类算法的结果 , 数据集的结构未知 1) Cophenetic 相关系数[ 3]其中 : 加权因子 α= Dis( cmax) ; c max 为输入聚类的最大数目。 2) 基于聚类分布的有效性 度量 用聚类 结果分 布的自 然 属性来评价聚类内的同一性和 聚类间 的分离 性与最 大化聚 类 内相似性和最小化聚类间 相似性 这一聚 类目标 是相符 的。 受 SD 有效性指数[ 1]和 文献 [ 13, 14 ] 启 发 , 这里 介 绍聚 类密 集 性。与邻近性度量。 聚类密集性是一种有关 聚类内 方差的 测量 , 方差越 小 , 说 明数据集的同一性越高。给定一个数据集 X, 其 簇内方差被 定 义为var( X) = 1 /N ? d ( x , - x) 2 i =1 i N对层次聚 类算法 来说 , 其产生 的层次图可用 Cophenetic 矩阵 P c 表示 , 矩阵中 元素 Pc ( i, j) 表示 数据 xi 和 xj 首次在同一个簇中出现的邻近层 , 则可以定义 一个 Cophenetic 相关系数来度量 P c 与邻近矩阵 P 的相似程度 :CPCC = 1 /N- 1 N N- 1 N( 16 )[ (1/ M) ? ?
μμ] / [ ( 1 /
M) ? ?i =1 j= i +1 N- 1 P Cd2 ijN-2 μ P]×[ ( 1 / M) ? ? d ij cij i = 1 j= i +1其中 : d( xi , - x) 是矢量 xi 与 - x 之间 的距 离 ; N 是 X 的总 个 数;
x( 7)i = 1 j= i +12 c2 ij - μ C ] ; - 1 ≤ CPCC≤ 1是 X 的均值。- x = 1 /N? x ii =1 N其中 : M = N( N - 1) / 2; N 为 数据 集中 点的 总数 ; μ P 和 μ c 分别 是矩阵 P c 与 P 的均 值; dij 和 c ij 分 别是矩 阵 P c 与 P 中元 素 ( i, j) 。 CPCC 的取值为 [ - 1, 1 ] , 其接 近于 0 时 说明 两个 矩阵 具 有较大的相似性。 2) Hubert’ s Γ统计 对包含 k 个簇的单 个聚类结果 C, 其 质量评价可通过 比 较 C 与 邻近 矩 阵 P 之间 的 一 致性 程 度 进 行。这个方法定义的指数为 Hubert’ s Γ统计。Γ = ( 1 /M) ?N- 1 N i =1 j =i + 1( 17 )对聚类输出结果 c1 , c2 , …, c C, 聚类密集性被定义为CCmp = 1 / C? [ var( c i ) / var( X) ]i=1( 18 )其中 : C 为聚类个数 ; var( ci ) 是簇 c i 的方 差。每个 聚类 内的 成 员应尽可能地接近 , 所以聚类密集性越小越好。但是在极端情 况下 , 当每个输入矢量被分 为单独 的类时 , 聚 类密集 性有最 小 值 0。 聚类邻近性被定义为2 Prox = 1 / [ C( C - 1 ) ] ? ? exp[ - d2 ( xc , xc ) /( 2 σ )] i = 1j = 1, j≠i i j C C? X( i, j) Y( i, j)( 8)其中 : X 为数据集矩阵 ; 矩阵 Y 定义为Y( i, j) ={( 19 )1 if xi and xj belong t i, j =1, …, N 0 otherwise( 9)2 其中 : σ为高斯常数 , 为简化计算 , 取 2σ = 1. 0; xc 是聚类 c i 的 iΓ的值越大 , 表明 X 与 Y 之间的相似性越大。 1. 3 相对评价法 相对评价法根据预定义的评价标准 , 针对聚类算法不同的 参数设置进行测试 , 最终选择最优的参数设置和聚类模式。相 对评价法主要有改进的 Hubert’ s Γ统计、 Dunn 指数、 DB 指数、 用于层次聚类算法的 RMSSDT/ SPR / RS/ CD 指数以 及 SD 有 效 性指数等[ 3]中心 ; d( xci , xcj ) 为聚类 ci 中心与 cj 中心之间的距离。各聚类 应 有效地分开 , 且聚类邻近性 反比于 聚类间 距离 , 所以 聚类邻 近 性越小越好。然而 , 当整个 输入矢 量被聚 为一个 类时 , 聚类 邻 近性有最小值 0。 为了评价一个聚类系统的综合质量 , 可将上述聚类密集性 与聚类邻近性组合为一种评价方法 , 称做聚类综合质量。它被 定义为Ocq( ξ ) = 1 - [ ξ×Cmp + ( 1 - ξ ) ×Prox] ( 20 )。 2000 年 由 Halkidi 等 人提 出[ 1]1) SD 有 效性 指数, 它是基于聚类平均散布性和聚类间 总体分 离性的 一种相 对度量 方 法。已知数据集 X 的方差为 σ ( x) , 其第 p 维方差定义为σp xn其中 : ξ ∈ [ 0, 1] 是平 衡聚 类密 集性 与聚 类邻 近 性的 权 值。 例 如 , Ocq( 0. 5) 表示两种评价有相等的权 值。显然 , 聚 类综合 质 量越大越好。=1/ n? (k =1xp k- p) - x2( 10)3) 基 于多代 表点的 有效性 指数 CDbwHalkidi 等 人在 文p 其中 : x
是第 p 维均值。献 [ 6] 中介 绍 的 多 代 表 点 有 效 性 指 数 ( composing density ben k= 1- x = 1/ n? xk , ?xk ∈ X( 11)tween and within clusters) 是用多个具有代表性的点表达聚类结 构。这比只用单个中心点表达聚类结构的方法要好, 可适用于 非球形聚类。 CDbw 依赖于聚 类密 集 性 ( 聚 类 内密 度 ) 和 聚 类聚类 i 的方差为 σ ( vi ) , 其第 p 维方差定义为σp v in= 1/ ni? (k =1xp k-2 vp i)( 12)分离性 ( 聚类间距离与密度综合 ) 。 使 D = { V1 , V2 , … , Vc } 表示一个数据集 X 被聚类成 c 个 凸则聚类的平均散布性定义为 ? 1632?计 算 机 应 用 研 究第 25 卷簇。其中 : Vi = { vi1 , vi2 , … , viri} 表 示第 i 簇中 代表点 的集合 ; vij 为第 j 个代表点 ; ri 为 代表 点的 总数。第 i 簇 的 平均 标准 方 差 被定义为stdev( Vi ) =ni性指数主要分为两大类。第一类指数只涉及隶属度值 , 如划分 系数[ 3] N cPC = 1 / N ? ? u2 iji = 1j = 1( 30 )1/ ( ni - 1 ) ? d2 ( x k, mi )k =1( 21)其中 : c 为聚类个数 ; PC 取值为 [ 1 /c, 1] 。 PC 越接近 1, 划分越 清晰 ; 反之 , PC 越接近 1 /c, 划分越模糊。 划分熵[ 3]其中 : ni 为第 i 簇 中数据 个数 ; d 为 xk 与 mi 之间的 距离 ; xk 为 第 i 簇中数据 ; mi 为均值。 聚类内平均密度被定义为 聚类中 属于代 表点邻 域的数 据 点的百分数 , 它越高表明聚类越密集。其定义为Intra_dens( c ) = 1 / c ?1 / ri ? [ density( vij ) / stdev( Vi ) ] ; c &1, c ≠0 ( 22)i =1 j =1 c ri也属于这类指标, 其定义为PE = - 1 / N ? ? uij ×log a ( uij )i = 1j = 1 N c( 31 )PE 取值为 [ 0, loga c ] , c & 1。分类 越分 明时 , PE 的值 就 越 小 ; 分类越模糊时 , PE 的值就越接近于 loga c 。 李洁等人提出了一个修正的划分模糊度指数 [ 5] :MPF = PF / PEN c H其中 : vij 对应第 i 簇中第 j 个 代表点 vij 以一指 定因 子向 簇的 中 心收缩后的位置。项 density( vij ) 被定义为ni( 32 ) | ( 33 )density( vij ) = ? f( xl , vij )l=1( 23)PF = 1 /N ?? | uij - ( uij )i = 1j = 1它表示第 i 簇 代表点 vij 的 邻域 中点的 数目。 vij 的邻 域定 义 为 以 vij 为中心、 簇的平 均方差 stdev( Vi ) 为 半径 的超 球体。函 数 f( x, vij ) 被定义为f( x, vij ) =其中 : ( uij )H对应硬 划分指 数; PE为平滑 后的划 分熵。该修 正划分模糊度补偿了由于类别数 的增加 所引起 的划分 模糊度 的 递增趋势。 另一类指标同 时涉 及 隶属 度 和 数据 集 结 构信 息 , 如 XieBeni( XB) 指数 , 其定义为 [ 3]XB = π/ ( N ×dmin ) ( 34 ){1 0d( x, vij ) ≤ stdev( Vi ) otherwise( 24)在每个点被分 为一 个 簇 的极 端 情 况下 , 即 c = n 时 , stdev ( Vi ) = 0, density( vij ) = 1。于是 , Intra_dens( n) = 1。 聚类间密度用于度量聚 类周围 区域的 平均密 度 , 显 然 , 此 密度越低越好。当一个数据集 被分 为两类 以上 ( 即 c & 1) 时 , 其聚类间密度定义为c c其中 : N 为数据集的数据 个数 ; dmin 是 簇间 最短 模糊 距离 ; π是 簇的平均方差。显然 , XB 的值越小越好。 此外 , 还有 Fukuyama-Sugeno( FS) 指 数 指数 [ 15] 等。 文献 [ 16] 在 研 究 KFCM 聚 类 算 法 的 有 效 性 准 则 时 , 将 XB、 FS、 CWB 等六个著名 的 模糊 有 效性 指数 推 广到 高维 特 征( 25 )[ 3]、 Rezaee( CWB)Inter_dens( c) = ? ? [ d( close_rep( i) , close_rep( j) ) /i = 1j = 1 j≠i( stdev( Vi ) + stdev( Vj ) ) ] ×density( uij ) ; c & 1 , c≠ n空间 , 得到其对应的核化形式。其中 : close_rep( i) 和 close_rep( j) 是第 i 与 j 簇 间最 近的 代 表 点; uij 为 close_rep( i) 和 close_rep( j) 连线的中点 ; density( uij ) 被 定义为ni + nj2聚类有效性评价的应用聚类是一种无教师的学 习, 没 有关于 分类的 先验信 息 , 按density( uij ) = 1 / ( ni + nj ) ? f( x l , uij )l =1( 26)照相似性准则把数据划分 成各种 不同的 类别。但在 大多数 聚 类算法中 , 需要用户事先输 入希望 产生的 簇的个 数 , 这使聚 类 结果带有一定的主观性和 人为误 差。 而在聚 类性能 评价的 研 究中 , 聚类有效性问题经常可转换为最佳类别数的自动确定。 Halkidi 等人在文献 [ 1] 中利用 SD 有效性指数评价一个聚 类算法以不同输入参数得到的不同划分 , 从而选取具有最佳聚 类个数的聚类结果。 自组织 映射 ( self-organizing map, SOM) 聚类 是 由 Kohonen 教授提出的一种无监督的 聚类方 法。 它由全 互连的 输入层 和 竞争层组成 , 模拟人脑的处 理过程 , 通 过若干 个单元 竞争当 前 对象来实现聚 类。 Ressom 等 人提 出自 适 应双 SOM( ADSOM) 模型 [ 8] , 具有灵活的拓扑结构和 可视化 优势 , 不需要 关于聚 类 数目的先验知识 , 利用基于树的评价指数确定聚类数目。文献 [ 9] 用例子说明了 SD 指数可以 求得最 佳 SOM 聚类 个数。 Wu 等人将多代表点评 价 指数[ 6]它表示在第 i 和 j 簇中属于 uij 邻域的点的百分数。 uij 的邻域定 义为以 uij 为中心、 平均方差为半径的超球体。函数 f( x, uij ) 被 定义为f( x, uij ) ={1 0d( x, uij) ≤ ( stdev( Vi ) + stdev( Vj ) ) / 2 otherwise( 27)很显然, 如果一个数据点到 uij 的距离 小于簇的平均标准方 差, 它必然属于 uij 的邻域。在每个点被分 为一个簇的极端情况 下, 即 c = n 时 , stdev( Vi ) = 0, density( uij ) = 0。于是, Inter_dens ( n) = 0。 聚类分离性与最近聚类 间的距 离和聚 类间密 度有 关。希 望聚类间的距离大而密度低 , 故聚类分离性定义为c cSep( c) = ? ? ( d( close_rep( i ) , close_rep( j) ) /i = 1j = 1 j≠ i( 1 + Inter_dens( c) ) ] ; c & 1( 28), 不 仅 用做 全局 寻 求输 入数 据 的最后 , 有效性指数 CDbw 定义为CDbw( c) = Intra_dens( c) ×Sep( c) ; c & 1 ( 29)最好划分数目 , 而且局 部用于 确定层 次 SOM 聚类 算法 两邻 域 簇的合并 [ 10, 11] 。 笔者在文献 [ 7] 中提出 基于 聚类 有效 性指 数的 蚁群 聚 类 算法 , 利用基于多代表点的评价指 数 CDbw[ 6 ] 自动求 得最佳 聚 类数目 ; 同时, 用其局部有效性指数减少孤立点。 文献 [ 5] 探讨了 用修正 的划 分模 糊度 指数 如何 确定 数 值 型数据和类属型数据聚类中的最佳类别数。 ( 下 转第 1638 页 )1. 4模糊评价法 模糊聚类评价是寻求数据 集中大 多数矢 量在一 个簇中 有高的隶属 度 的 聚 类 模式。 一 个 模糊 聚 类 由 隶 属 度 矩 阵 U =[ uij ] 表示。这里 uij 代 表簇 j 中矢 量 i 的 隶属 程度。模 糊有 效 ? 1638?system, SAE 912683[ R] . 1991.计 算 机 应 用 研 究[ J] . 机 电工 程 , 2005, 22 ( 10 ) : 55- 57.第 25 卷[ 12] 刘凤 霞 , 孙凤 英 , 纪峻岭 . 专 家系 统故障 诊断 法及其 在汽 车故 障诊 断中 的应用 [ J] . 交 通科 技与经 济 , 2001, 3 ( 2) : 40 -43. [ 13] 杨兴 , 朱 大奇 , 桑 庆 兵 . 专 家系 统 研 究 现 状 与 展 望 [ J] . 计 算 机 应 用研 究 , 2007, 24 ( 5) : 2- 6. [ 14] 陈铭 , 李 纲 , 王成 焘 . 基于油 液分 析的汽 车发 动机摩 擦系 统故 障诊 断专 家系统 知识库 的建 立 [ J] . 润滑 与密封 , 1998 ( 4) : 21 -23. [ 15] 盛颂 恩 , 劳佳 锋 , 陈久军 . 基 于粗 集理论 的故 障规则 自动 获取 系统 的研 究 [ J] . 浙江工 业大 学学报 , 2004 , 32 ( 2) : 203- 207. [ 16] 闵永 军 , 万茂 松 , 黄银 娣 , 等 . 汽车 功 能故 障 知识 表 示 的 研 究 [ J] . 林业 机械与 木工设 备 , 1999, 27 ( 6) : 20- 22 . [ 17] 赵志 宏 . 确定 性故 障 诊 断 知识 节 点 式 表 示 技 术 [ J] . 长 安 大 学 学 报 , 2003, 23 ( 1) : 80- 83 . [ 18] 成曙 , 张 振仁 , 李 晓建 , 等 . 汽 车 电 气设 备 故 障 诊断 专 家 系 统的 设 计与 实现 [ J] . 工业 仪表 与自动 化装 置 , 2004( 2) : 21- 23. [ 19] 王璐玮 , 尹朝庆 , 葛守飞 . 基于 Java 规则引擎 的汽车发 动机故障 诊断 专家系统研究与开发 [ J] . 交通与计算机 , 2005, 23 ( 5) : 30- 34. [ 20] 许占 文 , 葛岳 . 关 于神 经网络 的汽 车 故障 诊 断专 家 系 统 [ J] . 沈 阳 工业 大学学 报 , 1998, 20 ( 5) : 46- 49 . [ 21] 赵树 朋 , 张世 芳 , 邝朴生 . 汽 车电 喷发动 机故 障诊断 专家 系统 的开 发研 究 [ J] . 河北农 业大 学学报 , 2002 , 25 ( 2) : 79 -81. [ 22] 崔林 , 杨 铁皂 , 朱 圣柳 . 汽车 发动 机点火 系统 故障诊 断专 家系 统的 开发 [ J] . 洛 阳工学 院学 报 , 1998, 19 ( 3) : 40- 44. [ 23] 尹旭 日 , 张从 文 , 王 教东 . 汽 车 故障 诊 断 中 基于 粗 糙 集 的 CBR 方 法研 究 [ J] . 交通与 计算 机 , 2005, 23 ( 1) : 83- 86. [ 24] 尹旭 日 , 周 志 华 , 陈 世 福 . AFDES 中 基 于 Case 推 理 方 法 的 研 究 [ J] . 计 算机 应用与 软件 , 2002 , 19 ( 1) : 39- 41. [ 25] 张力 军 , 石湘 龙 . 案例 推理在 汽车 维 修故 障 诊断 中 的 应 用 [ J] . 湖 南理 工学院 学报 , 2005, 18 ( 9 ) : 73-76. [ 26] 王秉 仁 , 姜小 丽 , 张雷 . 基于 模糊 逻辑推 理的 汽车故 障诊 断的 研究[ 27] 胡琳 . 汽 车故 障诊 断 专 家系 统 诊 断 模 型 的 研 究 [ J] . 电 子 技 术 应 用 , 1997( 12) : 23- 26. [ 28] 冯雷 , 应 霞芳 , 何 勇 . 基于神 经网 络的汽 油机故 障诊 断的专 家系 统 [ J] . 科 技通 报 , 2000, 16 ( 2) : 93- 96. [ 29] 陈朝 阳 , 张代胜 . 神经网 络技 术 在汽 车 故 障 诊 断专 家 系 统 中的 应 用 [ J] . 合肥 工业大 学学 报 , 2000, 23 ( 1) : 28 - 31. [ 30] 曹建 国 , 罗辑 . 基 于神经 网络 的发 动 机异 响 故障 诊 断 方 法 [ J] . 机 械制造 技术 , 2004 , 42 ( 2) : 19- 20. [ 31] 王伟 杰 , 赵学 增 , 黄文涛 . 基于 BP 网 络 的故 障 诊断 正 向 推 理方 法 [ J] . 车 用发 动机 , 2001( 8 ) : 33- 35. [ 32] 孙乔 , 潘 旭峰 , 李 晓雷 . 神经 网络 在汽车 传动系 统故 障诊断 中的 应 用 [ J] . 计算 机应用 系统 , 1996( 8) : 16-18. [ 33] 卫绍 元 , 张蕾 . 基 于神经 网络 的 汽车 故 障 诊 断 专家 系 统 开 发中 的 问题研 究 [ J] . 公路 交通 科技 , 2001, 18 ( 2) : 78- 81. [ 34] 张蕾 , 董 恩国 . 遗 传优化 算法 在压 缩 机故 障 诊断 中 的 应 用 [ J] . 压 缩机技 术 , 2004( 4) : 4 -6 . [ 35] 胡奕 涛 , 武和 雷 . 车用发 动机 故障 综 合智 能 诊断 方 法 研 究 [ J] . 车 用发动 机 , 2003( 6) : 4 -6 . [ 36] 辛惠 娟 , 钱东平 , 李志 芳 . 基 于 ASP 网 络 开 发 汽车 发 动 机 故 障 诊 断专家 系统 [ J] . 农 机化 研究 , 2006( 2 ) : 190 -193. [ 37 ] 陈 豪 , 张 为 公 . 基 于 B / S 的 汽 车 远 程 故 障 诊 断 系 统 [ J] . 北 京 汽 车 , 2004( 2) : 33- 36 . [ 38] PUCHER H, JANKOV J. Experimental design and development of an expert system for the knowledge-based engine process optimization of modern diesel engines, SAE 11[ R] . 2006. [ 39] HADJIMICHAEL M, MCCARTHY J. Development of a fuzzy expert system for aviation risk modelling, SAE 57[ R] . 2005. [ 40] YEH I, KOCHNOWSKI B, SUBBIAN T. An expert system for vehicle restraint system design, SAE 04 [ R] . 2005.( 上 接第 1632 页 )using ant colony algorithm and validity index[ C] / / Proc of IEEE International Joint Conference on Neural Networks. Montreal: [ s. n. ] ,3结束语[ 8]- 2735. RESSOM H, WANG D, NATARAJAN P. Adaptive double self-organizing maps for clustering gene expression profiles [ J] . Neural Networks, 2003, 16 ( 5- 6) : 633 -640. [ 9] 杨占华 . 聚类分 析研究 及其 在文本 挖掘 中的应 用 [ D] . 成 都 : 西 南 交 通大学 , 2006 . [ 10] WU Si-tao, CHOW T W S. Self-organizing-map based clustering using a local clustering validity index [ J] . Neural Processing Letters,
( 3 ) : 253- 271. [ 11] WU Si-tao, CHOW T W S. Clustering of the self-organizing map using a clustering validity index based on inter-cluster and intra-cluster density[ J] . P attern Recogn ition , 2004, 37 ( 2) : 175-188 . [ 12] STEINBACH M, KARYPIS G, KUMAR V. A comparison of document clustering techniques [ C ] / / Proc of KDD-2000 Workshop on Text Mining. 2000. [ 13] HE Ji, TAN A H, TAN C L. Modified ART 2A growing network capable of generating a fixed number of nodes[ J] . IEE E Tra ns on Neural Networks, 2004, 15 ( 3) : 728 -737. [ 14 ] HE Ji, TAN A H, TAN C L, et al. On quantitative evaluation of clustering systems[ C] / / Proc of Information Retrieval and Clustering. Boston, MA: Kluwer, 2003. [ 15 ] REZAEE M R, LELIEVELDT B P F, REIBER J H C. A new cluster validity for the fuzzy C-mean [ J] . Patte rn Recogn ition Letters,
( 3 - 4) : 237- 246. [ 16] 普运 伟 , 金炜 东 , 朱明 , 等 . 核 模糊 C 均值 算 法 的聚 类 有 效 性研 究 [ J] . 计算 机科 学 , 2007, 34 ( 2) : 207- 210.聚类性能评价是聚类分析中的一个重要研究课题 , 其不得 不面对的主要困 难是 聚 类后 , 怎 样 评价 返回 的 聚类 结果 的 质 量? 然而 , 迄今为止 , 还没有一 个对所 有应用 领域都 普遍适 用 的评价方法 , 聚类评价方 法往往 与特定 应用问 题、 采 用的聚 类 算法等因素有关。探索更加成熟、 行之有效的聚类有效性度量 方法 , 是今后努力的方向。 参考文献 :[ 1] ALKIDI M, VAZIRGIANNIS M, BATISTAKIS Y. Quality scheme assessment in the clustering process [ C] / / Proc of the 4th Eur Conf Principles and Practice of Knowledge Discovery in Databases. - 276. [ 2] THEODORIDIS S, KOUTROUBAS K. Pattern recognition[ M] . [ S. l. ] : Academic Press, 1999. [ 3] HALKIDI M, BATISTAKIS Y, VAZIRGIANNIS M. On clustering validation techniques[ J] . Intellig ent In form ation System s, 2001, 17 ( 2-3) : 107-145. [ 4] 张惟 皎 , 刘春煌 , 李 芳玉 . 聚 类质 量 的评 价 方 法 [ J] . 计 算 机 工 程 , 2005 , 31 ( 20) : 10-12. [ 5] 李洁 , 高新 波 , 焦李成 . 一 种基 于修 正 划分 模 糊度 的 聚 类 有效 性 函 数 [ J] . 系统 工程与 电子 技术 , 2005, 27 ( 4) : 723-726. [ 6] HALKIDI M, VAZIRGIANNIS M. Clustering validity assessment using multi representatives[ C] / / Proc of SETN Conference. 2002. [ 7] YANG Yan, KAMEL M, JIN Fan. A model of document clustering
综合评价方法综述_管理学_高等教育_教育专区。现代综合评价方法综述 张晶 管理科学...DEA 方法的应用领域也很广泛, 可以用于多种方案之间的有效性评价、技 术进步...现代综合评价方法综述 张晶 管理科学与工程 现代综合评价方法综述摘要:将现代综合...DEA 方法的应用领域也很广泛, 可以用于多种方案之间的有效性评价、技 术进步...盗用函数法、多元统计综合评价技术法(包括 主成分分析法、因子分析法、聚类分析...罗兹等在研究部门之间“相对有效性评价”基础之上提出的一 种新的系统分析方法...组织有效性研究综述摘要: 组织有效性 摘要: (organizational effectiveness)的相关研究是组织理论、 组织管理及评价实践中日益受到关注的热点问题之一。组织有效性理论...市场有效性假说综述_金融/投资_经管营销_专业资料。课程设计 论文题目: 学生姓名: 学生学号: 专业班级: 学院名称: 日期时间: 市场有效性假说综述李远光 2 0 111...暂无评价|0人阅读|0次下载|举报文档课堂提问有效性研究综述_教学案例/设计_教学研究_教育专区。理论 课堂提问的有效性研究综述 摘要 有效提问是课堂教学的重要手段之...聚类算法综述 23页 1财富值 浅谈聚类算法及其存在的问... 2页 20财富值 kmean...所以,我们有必 要讨论一下聚类有效性,即对算法的结果进行定量的评价。评价中常...暂无评价|0人阅读|0次下载|举报文档《课堂学案应用的有效性研究》文献综述_教学案例/设计_教学研究_教育专区。《课堂学案应用的有效性研究》文献综述信息技术学科 一...国内课堂教学有效性研究历史与现状的文献综述_其它_高等教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 国内课堂教学有效性研究历史与现状的文献综述_其它_高等...关于有效问题的文献综述 [ 摘要 ] 课堂提问是课堂教学中极为普遍的一种行为,...注意灵活性 10、正确评价,注意鼓励性 11、面向全体,注意广泛性 12、选准时机,...
All rights reserved Powered by
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 标准正态累积分布函数 的文章

 

随机推荐