cdf累积分布函数数可以评价聚类结果吗

科学教育 | 学习帮助 | 出国/留学 | 工程技术科学 | 教育/科学 | 英语听力 | 梦幻西游电脑版 | 视频会议 | 口臭 | 暗黑破坏神3（游戏） | 面相 | 赛尔号 | linux | 山西省 | Xbox One | 思修 | 易经 | solidworks | 钢铁雄心4 | 休闲游戏 | 魔兽争霸3混乱之治 | 显卡 | 武汉大学 | 塞尔达传说（游戏） | 校服 | 剑侠情缘网络版叁 | 脱发 | 日本文化 | 数学建模 | 二次元 | 部落冲突（游戏） | 肖战 | 街机游戏 | 拳皇 | 马鞍山市 | 扑克 | 完美世界（游戏） | 三国志（游戏） | 热血传奇（游戏） | 意大利 | 跆拳道 | 东莞市 | 糖尿病 | 古琴 | 三国 | 电视节目 | 百度 | qq音乐 | 配音 | 电视 | 任天堂 | 科幻小说 | 虚拟专用服务器 | QQ游戏 | 大熊猫 | 微电影 | Android | 竞技游戏 | 动画制作 | QQ炫舞 | 电源 | 日语 | 魔兽争霸3冰封王座 | 产业 | ios开发 | 百度云 | 动画电影 | nba篮球 | 羽生结弦 | iOS应用 | galgame | 电吉他 | 平板电脑 | 周星驰（人物） | 离婚 | 后宫·甄嬛传（书籍） | 牙科 | 游戏开发 | 网络直播 | ios游戏 | 电子邮件 | SNH48 | 民国 | 美容 | 舰队 Collection | 心理 | Mac | 羽毛球技术 | 互联网公司 | 大学生兼职 | 烘焙 | 诸葛亮 | 跑跑卡丁车 | 武侠小说 | 微博 | 骨折 | 掌上游戏机 | 玉米 | 中国足球 | 电脑配置 | 洛奇英雄传 | 硬盘 | 张璐 | akb48 | 炉石传说 | 韩国 | 蓄电池 | QQ空间 | 房贷 | 麦克风 | 相声演员 | 抑郁 | 天下2（游戏） | 农业科学 | 神话 | 农历 | 中国足球协会超级联赛（CSL） | 流星花园 | 易烊千玺 | 火影忍者 | 日语歌曲 | 巴西 | 红酒 | 化疗 | 占地 | 网络小说 | 香烟 | 传奇世界 | 名字 | 日本电影 | 表演 | 西藏自治区 | 英雄传说：闪之轨迹（游戏） | 足球彩票 | 摩尔庄园 | 中国工商银行 | 游戏手柄 | 陈奕迅 | 联赛 | 天体物理学 | 英格兰足球超级联赛 | 超级机器人大战 | 命令与征服：红色警戒2（游戏） | 郭富城 | 一级方程式赛车（f1） | Adobe Photoshop | 英文歌曲 | 玄幻小说 | 猫和老鼠 | 杨凡 | 书籍改编电影 | 俄罗斯 | 网络赚钱 | 罗玉凤 | 刺客信条2 | 角色扮演 | 食物 | 药物 | 杨洋（演员） | 信息安全 | 胡歌（演员） | 张子枫 | 古典音乐 | 时尚 | 大片 | 电脑游戏 | 签证 | 徐佳莹 | 耽美 | 游戏攻略 | 音乐剧 | 前女友 | 男性 | 肠胃 | 刺客信条起源 | 剧场版 | 国际足联世界杯 | 彩虹六号（游戏） | 赵丽颖（演员） | 天体生物学 | 战神（游戏） | 吉他学习 | 飞机 | 三菱商事 | 关节炎 | 斗鱼直播 | 发电 | 张继科 | 华语流行音乐 | 搏击项目 | 主题曲 | 李信 | 刘德华（演员） | 即时战略游戏（RTS） | 欧阳娜娜 | 网址导航 | 海贼王 | 山地车 | 豆瓣电影 | 广场舞 |

你的位置：网站首页 >> 频道首页 >>函数 >>cdf累积分布函数数可以评价聚类结果吗

cdf累积分布函数数可以评价聚类结果吗

来源：蜘蛛抓取(WebSpider) 时间：2017-10-19 05:55 标签：标准正态累积分布函数

当前位置： >>
聚类有效性评价综述
第 25 卷第 6 期 2008 年 6 月计算机应用研究 Application Research of ComputersVol. 25 No. 6 Jun. 2008聚类有效性评价综述*杨燕 , 靳1蕃 , KAMEL Mohamed12( 1. 西南交通大学信息科学与技术学院 , 成都 . Dept. of Electrical & Computing Engineering, University of Waterloo, Waterloo, Ontario, Canada, N2L 3 G1) 摘要 : 在聚类分析应用中 , 迫切需要一种客观公正的质量评价方法来评判聚类结果的有效性。为此 , 从外部评价法、内部评价法和相对评价法三个方面 , 归纳综述了常用的聚类有效性评价方法 , 并讨论了模糊聚类评价法和聚类最佳类别数的自动确定问题。关键词 : 聚类 ; 聚类评价 ; 有效性指数中图分类号 : TP311 文献标志码 : A 文章编号 : 1001 - ) 06- 1630- 03Survey of clustering validity evaluationYANG Yan1 , J IN Fan1 , KAMEL Mohamed2( 1. School of Information Science & Technology, Southwest Jiaotong University, Chengdu 610031 , C 2 . Dept. of Electrical & Computing Engineering, University of Waterloo, Waterloo, Ontario N2 L 3 G1 , Canada)Abstract: The need for fair methods that can assess the validation of clustering results is becom ing more and more critical in cluster analysis applications. The paper surveyed the widely known clustering validity evaluation based on external criteria, internal criteria, and relative criteria. It presented a review of fuzzy clustering validity measures and the determining of optimal number of clusters adaptively. Key words: c validity index 聚类分析是数据挖掘过程中的一种重要手段和工具 , 它可以发现隐含在数据集中的簇 , 标志出感兴趣的分布或模式。聚类问题是将一组对象分成若干个簇或聚类 , 使簇内的对象尽可能具有最大的相似性 , 不同簇之间的对象尽可能有最大的相异性。聚类过程可以看做是一种无监督的学习过程 , 因为没有预先定义的分类或示例来表明数据集中哪种期望的关系是有效的, 多数聚类算法依靠假设和猜测进行。如何用一种客观公正的质量评价方法来评判聚类结果的有效性是一个困难而复杂的问题。广义上讲 , 聚类有效性评价包括聚类质量的度量、聚类算法适合某种特殊数据集的程度 , 以及某种划分的最佳聚类数目 [ 1] 。常用的聚类有效性评价方法有外部评价法、内部评价法和相对评价法[2～ 4]先指定的结构。这种结构反映了人们对数据集聚类结构的直观认识。每个数据项的分类标记已知。下面介绍两种常用的外部评价法。 1) F-measure 它组合了信息检索中查准率 ( precision) 与[ 12]查全率 ( recall) 的思想来进行聚类评价。一个聚类 j 及与此相关的分类 i 的 precision 与 recall 定义为P = precision( i, j) = Nij / Ni R = recall( i, j) = Nij / Nj ( 1) ( 2)其中 : Nij 是在聚类 j 中分类 i 的数目 ; Nj 是聚类 j 中所有对象的数目 ; Ni 是分类 i 中所有对象的数目。分类 i 的 F-measure 定义为F( i) = 2 PR / ( P + R) ( 3)。外部和内部评价法均基于统计测试 ,具有较高的计算复杂性 , 这些方法中的有效性指数是为了度量一个数据集与预先已知结构的相符程度。相对评价法寻求一个聚类算法在一定假设和参数下能定义的最好聚类结果。此外, 还有一类针对软 ( 模糊 ) 划分的聚类评价方法 , 称之为模糊聚类有效性度量 [ 3 ～5] 。在聚类性能评价方法中 , 某些有效性指数能够求得具有最佳聚类数目的划分 [ 1, 类评价的应用热点之一。5～ 11]对分类 i 而言 , 哪个聚类的 F-measure 值高 , 就认为该聚类代表分类 i 的映射。换句话说 , F-measure 可看成分类 i 的评判分值。对聚类结果来说 , 其总 F-measure 可由每个分类 i 的 F-measure加权平均得到 :F =?[ | i | ×F( i) ] / ?| i|i i( 4)。这也是目前聚其中 : |i |为分类 i 中所有对象的数目。 2) Rand 指数 ( index) 和 Jaccard 系数 ( coefficient) 设数据集 X 的一个聚类结构为 C = { C1 , C2 , … , Cm} , 数据集已知的划11. 1聚类评价方法外部评价法外部评价方法意味着评判聚类算法的结果是基于一种预收稿日期 : ; 修回日期 : 分为 P = { P1 , P2 , … , Ps } , 可通过比较 C 和 P 以及邻近矩阵与 P 来评价聚类的质量。对数据集中任一对点 ( Xv , Xu ) 计算下列项 [ 3] : SS― ― ―如果两个点属于 C 中同一簇 , 且 P 中同一组 ;基金项目 : 四川省重大基础研究基金子项目 ( 04JY029- 001- 4 )作者简介 : 杨燕 ( 1964- ) , 女 , 安徽合肥人 , 计算机学会高级会员 , 副教授 , 博士 , 主要研究方向为数据挖掘、计算智能 ( yyang@ home. swjtu. edu. cn) ; 靳蕃 ( 1935 - ) , 男 , 湖南长沙人 , 国家有突出贡献专家 , 教授 , 博导 , 主要研究方向为编码、神经网络、计算智能 ; KAMEL Mohamed( 1948- ) , 男 , 教授 , 博士 , 主要研究方向为计算智能、模式识别、分布式及多 agent 系统、 IEEE Fellow.第6期杨燕 , 等 : 聚类有效性评价综述Scat( c) = 1 / c? ‖σ ( vi ) ‖ / ‖σ ( X) ‖i =1 c? 1631?( 13 )SD― ― ―如果两个点属于 C 中同一簇, 但 P 中不同组 ; DS― ― ―如果两个点不属于 C 中同一簇 , 而 P 中属同一组 ; DD― ― ―如果两个点不属于 C 中同一簇, 且 P 中不同组。设 a、 b、 c、 d 分别表示 SS、 SD、 DS、 DD 的数目 , 则 a + b + c + d = M 为数据集中所有对的最大数 , 即 M = N( N - 1) / 2。其中 : N 为数据集中点的总数。 C 与 P 之间的相似程度可由如下有效性指数定义 :Rand 指数 Jaccard 系数 R = ( a + d) / M J = a /( a + b + c) ( 5) ( 6)聚类间总体分离性定义为Dis( c ) = Dmax / Dmin ? ( ? ‖ vk - vZ ‖ )k =1 z =1 c c -1( 14 )其中 : Dmax = max( ‖vi - vj ‖ ) , Dmin = min( ‖ vi - vj ‖ ) ( Ｐ i, j∈ { 1, 2, … , c} ) 分别是聚类中心间的最大和最小距离 ; c 为聚类个数。最后可得到质量指数SD( c) = α Scat( c) + Dis( c ) ( 15 )上述两指数取值均为 [ 0, 1 ] 。当 m = s 时 , 有最大值。其余指数定义以及邻近矩阵与划分 P 的比较方法可以参考文献 [ 3] 。 1. 2 内部评价法内部评价方法是利用数据集的固有特征和量值来评价一个聚类算法的结果 , 数据集的结构未知 1) Cophenetic 相关系数[ 3]其中 : 加权因子 α= Dis( cmax) ; c max 为输入聚类的最大数目。 2) 基于聚类分布的有效性度量用聚类结果分布的自然属性来评价聚类内的同一性和聚类间的分离性与最大化聚类内相似性和最小化聚类间相似性这一聚类目标是相符的。受 SD 有效性指数[ 1]和文献 [ 13, 14 ] 启发 , 这里介绍聚类密集性。与邻近性度量。聚类密集性是一种有关聚类内方差的测量 , 方差越小 , 说明数据集的同一性越高。给定一个数据集 X, 其簇内方差被定义为var( X) = 1 /N ? d ( x , － x) 2 i =1 i N对层次聚类算法来说 , 其产生的层次图可用 Cophenetic 矩阵 P c 表示 , 矩阵中元素 Pc ( i, j) 表示数据 xi 和 xj 首次在同一个簇中出现的邻近层 , 则可以定义一个 Cophenetic 相关系数来度量 P c 与邻近矩阵 P 的相似程度 :CPCC = 1 /N- 1 N N- 1 N( 16 )[ (1/ M) ? ?
μμ] / [ ( 1 /
M) ? ?i =1 j= i +1 N- 1 P Cd2 ijN-2 μ P]×[ ( 1 / M) ? ? d ij cij i = 1 j= i +1其中 : d( xi , － x) 是矢量 xi 与－ x 之间的距离 ; N 是 X 的总个数;
x( 7)i = 1 j= i +12 c2 ij - μ C ] ; - 1 ≤ CPCC≤ 1是 X 的均值。－ x = 1 /N? x ii =1 N其中 : M = N( N - 1) / 2; N 为数据集中点的总数 ; μ P 和 μ c 分别是矩阵 P c 与 P 的均值; dij 和 c ij 分别是矩阵 P c 与 P 中元素 ( i, j) 。 CPCC 的取值为 [ - 1, 1 ] , 其接近于 0 时说明两个矩阵具有较大的相似性。 2) Hubert’ s Γ统计对包含 k 个簇的单个聚类结果 C, 其质量评价可通过比较 C 与邻近矩阵 P 之间的一致性程度进行。这个方法定义的指数为 Hubert’ s Γ统计。Γ = ( 1 /M) ?N- 1 N i =1 j =i + 1( 17 )对聚类输出结果 c1 , c2 , …, c C, 聚类密集性被定义为CCmp = 1 / C? [ var( c i ) / var( X) ]i=1( 18 )其中 : C 为聚类个数 ; var( ci ) 是簇 c i 的方差。每个聚类内的成员应尽可能地接近 , 所以聚类密集性越小越好。但是在极端情况下 , 当每个输入矢量被分为单独的类时 , 聚类密集性有最小值 0。聚类邻近性被定义为2 Prox = 1 / [ C( C - 1 ) ] ? ? exp[ - d2 ( xc , xc ) /( 2 σ )] i = 1j = 1, j≠i i j C C? X( i, j) Y( i, j)( 8)其中 : X 为数据集矩阵 ; 矩阵 Y 定义为Y( i, j) ={( 19 )1 if xi and xj belong t i, j =1, …, N 0 otherwise( 9)2 其中 : σ为高斯常数 , 为简化计算 , 取 2σ = 1. 0; xc 是聚类 c i 的 iΓ的值越大 , 表明 X 与 Y 之间的相似性越大。 1. 3 相对评价法相对评价法根据预定义的评价标准 , 针对聚类算法不同的参数设置进行测试 , 最终选择最优的参数设置和聚类模式。相对评价法主要有改进的 Hubert’ s Γ统计、 Dunn 指数、 DB 指数、用于层次聚类算法的 RMSSDT/ SPR / RS/ CD 指数以及 SD 有效性指数等[ 3]中心 ; d( xci , xcj ) 为聚类 ci 中心与 cj 中心之间的距离。各聚类应有效地分开 , 且聚类邻近性反比于聚类间距离 , 所以聚类邻近性越小越好。然而 , 当整个输入矢量被聚为一个类时 , 聚类邻近性有最小值 0。为了评价一个聚类系统的综合质量 , 可将上述聚类密集性与聚类邻近性组合为一种评价方法 , 称做聚类综合质量。它被定义为Ocq( ξ ) = 1 - [ ξ×Cmp + ( 1 - ξ ) ×Prox] ( 20 )。 2000 年由 Halkidi 等人提出[ 1]1) SD 有效性指数, 它是基于聚类平均散布性和聚类间总体分离性的一种相对度量方法。已知数据集 X 的方差为 σ ( x) , 其第 p 维方差定义为σp xn其中 : ξ ∈ [ 0, 1] 是平衡聚类密集性与聚类邻近性的权值。例如 , Ocq( 0. 5) 表示两种评价有相等的权值。显然 , 聚类综合质量越大越好。=1/ n? (k =1xp k－ p) - x2( 10)3) 基于多代表点的有效性指数 CDbwHalkidi 等人在文p 其中 : x
是第 p 维均值。献 [ 6] 中介绍的多代表点有效性指数 ( composing density ben k= 1－ x = 1/ n? xk , ?xk ∈ X( 11)tween and within clusters) 是用多个具有代表性的点表达聚类结构。这比只用单个中心点表达聚类结构的方法要好, 可适用于非球形聚类。 CDbw 依赖于聚类密集性 ( 聚类内密度 ) 和聚类聚类 i 的方差为 σ ( vi ) , 其第 p 维方差定义为σp v in= 1/ ni? (k =1xp k-2 vp i)( 12)分离性 ( 聚类间距离与密度综合 ) 。使 D = { V1 , V2 , … , Vc } 表示一个数据集 X 被聚类成 c 个凸则聚类的平均散布性定义为? 1632?计算机应用研究第 25 卷簇。其中 : Vi = { vi1 , vi2 , … , viri} 表示第 i 簇中代表点的集合 ; vij 为第 j 个代表点 ; ri 为代表点的总数。第 i 簇的平均标准方差被定义为stdev( Vi ) =ni性指数主要分为两大类。第一类指数只涉及隶属度值 , 如划分系数[ 3] N cPC = 1 / N ? ? u2 iji = 1j = 1( 30 )1/ ( ni - 1 ) ? d2 ( x k, mi )k =1( 21)其中 : c 为聚类个数 ; PC 取值为 [ 1 /c, 1] 。 PC 越接近 1, 划分越清晰 ; 反之 , PC 越接近 1 /c, 划分越模糊。划分熵[ 3]其中 : ni 为第 i 簇中数据个数 ; d 为 xk 与 mi 之间的距离 ; xk 为第 i 簇中数据 ; mi 为均值。聚类内平均密度被定义为聚类中属于代表点邻域的数据点的百分数 , 它越高表明聚类越密集。其定义为Intra_dens( c ) = 1 / c ?1 / ri ? [ density( vij ) / stdev( Vi ) ] ; c &1, c ≠0 ( 22)i =1 j =1 c ri也属于这类指标, 其定义为PE = - 1 / N ? ? uij ×log a ( uij )i = 1j = 1 N c( 31 )PE 取值为 [ 0, loga c ] , c & 1。分类越分明时 , PE 的值就越小 ; 分类越模糊时 , PE 的值就越接近于 loga c 。李洁等人提出了一个修正的划分模糊度指数 [ 5] :MPF = PF / PEN c H其中 : vij 对应第 i 簇中第 j 个代表点 vij 以一指定因子向簇的中心收缩后的位置。项 density( vij ) 被定义为ni( 32 ) | ( 33 )density( vij ) = ? f( xl , vij )l=1( 23)PF = 1 /N ?? | uij - ( uij )i = 1j = 1它表示第 i 簇代表点 vij 的邻域中点的数目。 vij 的邻域定义为以 vij 为中心、簇的平均方差 stdev( Vi ) 为半径的超球体。函数 f( x, vij ) 被定义为f( x, vij ) =其中 : ( uij )H对应硬划分指数; PE为平滑后的划分熵。该修正划分模糊度补偿了由于类别数的增加所引起的划分模糊度的递增趋势。另一类指标同时涉及隶属度和数据集结构信息 , 如 XieBeni( XB) 指数 , 其定义为 [ 3]XB = π/ ( N ×dmin ) ( 34 ){1 0d( x, vij ) ≤ stdev( Vi ) otherwise( 24)在每个点被分为一个簇的极端情况下 , 即 c = n 时 , stdev ( Vi ) = 0, density( vij ) = 1。于是 , Intra_dens( n) = 1。聚类间密度用于度量聚类周围区域的平均密度 , 显然 , 此密度越低越好。当一个数据集被分为两类以上 ( 即 c & 1) 时 , 其聚类间密度定义为c c其中 : N 为数据集的数据个数 ; dmin 是簇间最短模糊距离 ; π是簇的平均方差。显然 , XB 的值越小越好。此外 , 还有 Fukuyama-Sugeno( FS) 指数指数 [ 15] 等。文献 [ 16] 在研究 KFCM 聚类算法的有效性准则时 , 将 XB、 FS、 CWB 等六个著名的模糊有效性指数推广到高维特征( 25 )[ 3]、 Rezaee( CWB)Inter_dens( c) = ? ? [ d( close_rep( i) , close_rep( j) ) /i = 1j = 1 j≠i( stdev( Vi ) + stdev( Vj ) ) ] ×density( uij ) ; c & 1 , c≠ n空间 , 得到其对应的核化形式。其中 : close_rep( i) 和 close_rep( j) 是第 i 与 j 簇间最近的代表点; uij 为 close_rep( i) 和 close_rep( j) 连线的中点 ; density( uij ) 被定义为ni + nj2聚类有效性评价的应用聚类是一种无教师的学习, 没有关于分类的先验信息 , 按density( uij ) = 1 / ( ni + nj ) ? f( x l , uij )l =1( 26)照相似性准则把数据划分成各种不同的类别。但在大多数聚类算法中 , 需要用户事先输入希望产生的簇的个数 , 这使聚类结果带有一定的主观性和人为误差。而在聚类性能评价的研究中 , 聚类有效性问题经常可转换为最佳类别数的自动确定。 Halkidi 等人在文献 [ 1] 中利用 SD 有效性指数评价一个聚类算法以不同输入参数得到的不同划分 , 从而选取具有最佳聚类个数的聚类结果。自组织映射 ( self-organizing map, SOM) 聚类是由 Kohonen 教授提出的一种无监督的聚类方法。它由全互连的输入层和竞争层组成 , 模拟人脑的处理过程 , 通过若干个单元竞争当前对象来实现聚类。 Ressom 等人提出自适应双 SOM( ADSOM) 模型 [ 8] , 具有灵活的拓扑结构和可视化优势 , 不需要关于聚类数目的先验知识 , 利用基于树的评价指数确定聚类数目。文献 [ 9] 用例子说明了 SD 指数可以求得最佳 SOM 聚类个数。 Wu 等人将多代表点评价指数[ 6]它表示在第 i 和 j 簇中属于 uij 邻域的点的百分数。 uij 的邻域定义为以 uij 为中心、平均方差为半径的超球体。函数 f( x, uij ) 被定义为f( x, uij ) ={1 0d( x, uij) ≤ ( stdev( Vi ) + stdev( Vj ) ) / 2 otherwise( 27)很显然, 如果一个数据点到 uij 的距离小于簇的平均标准方差, 它必然属于 uij 的邻域。在每个点被分为一个簇的极端情况下, 即 c = n 时 , stdev( Vi ) = 0, density( uij ) = 0。于是, Inter_dens ( n) = 0。聚类分离性与最近聚类间的距离和聚类间密度有关。希望聚类间的距离大而密度低 , 故聚类分离性定义为c cSep( c) = ? ? ( d( close_rep( i ) , close_rep( j) ) /i = 1j = 1 j≠ i( 1 + Inter_dens( c) ) ] ; c & 1( 28), 不仅用做全局寻求输入数据的最后 , 有效性指数 CDbw 定义为CDbw( c) = Intra_dens( c) ×Sep( c) ; c & 1 ( 29)最好划分数目 , 而且局部用于确定层次 SOM 聚类算法两邻域簇的合并 [ 10, 11] 。笔者在文献 [ 7] 中提出基于聚类有效性指数的蚁群聚类算法 , 利用基于多代表点的评价指数 CDbw[ 6 ] 自动求得最佳聚类数目 ; 同时, 用其局部有效性指数减少孤立点。文献 [ 5] 探讨了用修正的划分模糊度指数如何确定数值型数据和类属型数据聚类中的最佳类别数。 ( 下转第 1638 页 )1. 4模糊评价法模糊聚类评价是寻求数据集中大多数矢量在一个簇中有高的隶属度的聚类模式。一个模糊聚类由隶属度矩阵 U =[ uij ] 表示。这里 uij 代表簇 j 中矢量 i 的隶属程度。模糊有效? 1638?system, SAE 912683[ R] . 1991.计算机应用研究[ J] . 机电工程 , 2005, 22 ( 10 ) : 55- 57.第 25 卷[ 12] 刘凤霞 , 孙凤英 , 纪峻岭 . 专家系统故障诊断法及其在汽车故障诊断中的应用 [ J] . 交通科技与经济 , 2001, 3 ( 2) : 40 -43. [ 13] 杨兴 , 朱大奇 , 桑庆兵 . 专家系统研究现状与展望 [ J] . 计算机应用研究 , 2007, 24 ( 5) : 2- 6. [ 14] 陈铭 , 李纲 , 王成焘 . 基于油液分析的汽车发动机摩擦系统故障诊断专家系统知识库的建立 [ J] . 润滑与密封 , 1998 ( 4) : 21 -23. [ 15] 盛颂恩 , 劳佳锋 , 陈久军 . 基于粗集理论的故障规则自动获取系统的研究 [ J] . 浙江工业大学学报 , 2004 , 32 ( 2) : 203- 207. [ 16] 闵永军 , 万茂松 , 黄银娣 , 等 . 汽车功能故障知识表示的研究 [ J] . 林业机械与木工设备 , 1999, 27 ( 6) : 20- 22 . [ 17] 赵志宏 . 确定性故障诊断知识节点式表示技术 [ J] . 长安大学学报 , 2003, 23 ( 1) : 80- 83 . [ 18] 成曙 , 张振仁 , 李晓建 , 等 . 汽车电气设备故障诊断专家系统的设计与实现 [ J] . 工业仪表与自动化装置 , 2004( 2) : 21- 23. [ 19] 王璐玮 , 尹朝庆 , 葛守飞 . 基于 Java 规则引擎的汽车发动机故障诊断专家系统研究与开发 [ J] . 交通与计算机 , 2005, 23 ( 5) : 30- 34. [ 20] 许占文 , 葛岳 . 关于神经网络的汽车故障诊断专家系统 [ J] . 沈阳工业大学学报 , 1998, 20 ( 5) : 46- 49 . [ 21] 赵树朋 , 张世芳 , 邝朴生 . 汽车电喷发动机故障诊断专家系统的开发研究 [ J] . 河北农业大学学报 , 2002 , 25 ( 2) : 79 -81. [ 22] 崔林 , 杨铁皂 , 朱圣柳 . 汽车发动机点火系统故障诊断专家系统的开发 [ J] . 洛阳工学院学报 , 1998, 19 ( 3) : 40- 44. [ 23] 尹旭日 , 张从文 , 王教东 . 汽车故障诊断中基于粗糙集的 CBR 方法研究 [ J] . 交通与计算机 , 2005, 23 ( 1) : 83- 86. [ 24] 尹旭日 , 周志华 , 陈世福 . AFDES 中基于 Case 推理方法的研究 [ J] . 计算机应用与软件 , 2002 , 19 ( 1) : 39- 41. [ 25] 张力军 , 石湘龙 . 案例推理在汽车维修故障诊断中的应用 [ J] . 湖南理工学院学报 , 2005, 18 ( 9 ) : 73-76. [ 26] 王秉仁 , 姜小丽 , 张雷 . 基于模糊逻辑推理的汽车故障诊断的研究[ 27] 胡琳 . 汽车故障诊断专家系统诊断模型的研究 [ J] . 电子技术应用 , 1997( 12) : 23- 26. [ 28] 冯雷 , 应霞芳 , 何勇 . 基于神经网络的汽油机故障诊断的专家系统 [ J] . 科技通报 , 2000, 16 ( 2) : 93- 96. [ 29] 陈朝阳 , 张代胜 . 神经网络技术在汽车故障诊断专家系统中的应用 [ J] . 合肥工业大学学报 , 2000, 23 ( 1) : 28 - 31. [ 30] 曹建国 , 罗辑 . 基于神经网络的发动机异响故障诊断方法 [ J] . 机械制造技术 , 2004 , 42 ( 2) : 19- 20. [ 31] 王伟杰 , 赵学增 , 黄文涛 . 基于 BP 网络的故障诊断正向推理方法 [ J] . 车用发动机 , 2001( 8 ) : 33- 35. [ 32] 孙乔 , 潘旭峰 , 李晓雷 . 神经网络在汽车传动系统故障诊断中的应用 [ J] . 计算机应用系统 , 1996( 8) : 16-18. [ 33] 卫绍元 , 张蕾 . 基于神经网络的汽车故障诊断专家系统开发中的问题研究 [ J] . 公路交通科技 , 2001, 18 ( 2) : 78- 81. [ 34] 张蕾 , 董恩国 . 遗传优化算法在压缩机故障诊断中的应用 [ J] . 压缩机技术 , 2004( 4) : 4 -6 . [ 35] 胡奕涛 , 武和雷 . 车用发动机故障综合智能诊断方法研究 [ J] . 车用发动机 , 2003( 6) : 4 -6 . [ 36] 辛惠娟 , 钱东平 , 李志芳 . 基于 ASP 网络开发汽车发动机故障诊断专家系统 [ J] . 农机化研究 , 2006( 2 ) : 190 -193. [ 37 ] 陈豪 , 张为公 . 基于 B / S 的汽车远程故障诊断系统 [ J] . 北京汽车 , 2004( 2) : 33- 36 . [ 38] PUCHER H, JANKOV J. Experimental design and development of an expert system for the knowledge-based engine process optimization of modern diesel engines, SAE 11[ R] . 2006. [ 39] HADJIMICHAEL M, MCCARTHY J. Development of a fuzzy expert system for aviation risk modelling, SAE 57[ R] . 2005. [ 40] YEH I, KOCHNOWSKI B, SUBBIAN T. An expert system for vehicle restraint system design, SAE 04 [ R] . 2005.( 上接第 1632 页 )using ant colony algorithm and validity index[ C] / / Proc of IEEE International Joint Conference on Neural Networks. Montreal: [ s. n. ] ,3结束语[ 8]- 2735. RESSOM H, WANG D, NATARAJAN P. Adaptive double self-organizing maps for clustering gene expression profiles [ J] . Neural Networks, 2003, 16 ( 5- 6) : 633 -640. [ 9] 杨占华 . 聚类分析研究及其在文本挖掘中的应用 [ D] . 成都 : 西南交通大学 , 2006 . [ 10] WU Si-tao, CHOW T W S. Self-organizing-map based clustering using a local clustering validity index [ J] . Neural Processing Letters,
( 3 ) : 253- 271. [ 11] WU Si-tao, CHOW T W S. Clustering of the self-organizing map using a clustering validity index based on inter-cluster and intra-cluster density[ J] . P attern Recogn ition , 2004, 37 ( 2) : 175-188 . [ 12] STEINBACH M, KARYPIS G, KUMAR V. A comparison of document clustering techniques [ C ] / / Proc of KDD-2000 Workshop on Text Mining. 2000. [ 13] HE Ji, TAN A H, TAN C L. Modified ART 2A growing network capable of generating a fixed number of nodes[ J] . IEE E Tra ns on Neural Networks, 2004, 15 ( 3) : 728 -737. [ 14 ] HE Ji, TAN A H, TAN C L, et al. On quantitative evaluation of clustering systems[ C] / / Proc of Information Retrieval and Clustering. Boston, MA: Kluwer, 2003. [ 15 ] REZAEE M R, LELIEVELDT B P F, REIBER J H C. A new cluster validity for the fuzzy C-mean [ J] . Patte rn Recogn ition Letters,
( 3 - 4) : 237- 246. [ 16] 普运伟 , 金炜东 , 朱明 , 等 . 核模糊 C 均值算法的聚类有效性研究 [ J] . 计算机科学 , 2007, 34 ( 2) : 207- 210.聚类性能评价是聚类分析中的一个重要研究课题 , 其不得不面对的主要困难是聚类后 , 怎样评价返回的聚类结果的质量? 然而 , 迄今为止 , 还没有一个对所有应用领域都普遍适用的评价方法 , 聚类评价方法往往与特定应用问题、采用的聚类算法等因素有关。探索更加成熟、行之有效的聚类有效性度量方法 , 是今后努力的方向。参考文献 :[ 1] ALKIDI M, VAZIRGIANNIS M, BATISTAKIS Y. Quality scheme assessment in the clustering process [ C] / / Proc of the 4th Eur Conf Principles and Practice of Knowledge Discovery in Databases. - 276. [ 2] THEODORIDIS S, KOUTROUBAS K. Pattern recognition[ M] . [ S. l. ] : Academic Press, 1999. [ 3] HALKIDI M, BATISTAKIS Y, VAZIRGIANNIS M. On clustering validation techniques[ J] . Intellig ent In form ation System s, 2001, 17 ( 2-3) : 107-145. [ 4] 张惟皎 , 刘春煌 , 李芳玉 . 聚类质量的评价方法 [ J] . 计算机工程 , 2005 , 31 ( 20) : 10-12. [ 5] 李洁 , 高新波 , 焦李成 . 一种基于修正划分模糊度的聚类有效性函数 [ J] . 系统工程与电子技术 , 2005, 27 ( 4) : 723-726. [ 6] HALKIDI M, VAZIRGIANNIS M. Clustering validity assessment using multi representatives[ C] / / Proc of SETN Conference. 2002. [ 7] YANG Yan, KAMEL M, JIN Fan. A model of document clustering
综合评价方法综述_管理学_高等教育_教育专区。现代综合评价方法综述张晶管理科学...DEA 方法的应用领域也很广泛, 可以用于多种方案之间的有效性评价、技术进步...现代综合评价方法综述张晶管理科学与工程现代综合评价方法综述摘要:将现代综合...DEA 方法的应用领域也很广泛, 可以用于多种方案之间的有效性评价、技术进步...盗用函数法、多元统计综合评价技术法(包括主成分分析法、因子分析法、聚类分析...罗兹等在研究部门之间“相对有效性评价”基础之上提出的一种新的系统分析方法...组织有效性研究综述摘要: 组织有效性摘要: (organizational effectiveness)的相关研究是组织理论、组织管理及评价实践中日益受到关注的热点问题之一。组织有效性理论...市场有效性假说综述_金融/投资_经管营销_专业资料。课程设计论文题目: 学生姓名: 学生学号: 专业班级: 学院名称: 日期时间: 市场有效性假说综述李远光 2 0 111...暂无评价|0人阅读|0次下载|举报文档课堂提问有效性研究综述_教学案例/设计_教学研究_教育专区。理论课堂提问的有效性研究综述摘要有效提问是课堂教学的重要手段之...聚类算法综述 23页 1财富值浅谈聚类算法及其存在的问... 2页 20财富值 kmean...所以,我们有必要讨论一下聚类有效性,即对算法的结果进行定量的评价。评价中常...暂无评价|0人阅读|0次下载|举报文档《课堂学案应用的有效性研究》文献综述_教学案例/设计_教学研究_教育专区。《课堂学案应用的有效性研究》文献综述信息技术学科一...国内课堂教学有效性研究历史与现状的文献综述_其它_高等教育_教育专区暂无评价|0人阅读|0次下载|举报文档国内课堂教学有效性研究历史与现状的文献综述_其它_高等...关于有效问题的文献综述 [ 摘要 ] 课堂提问是课堂教学中极为普遍的一种行为,...注意灵活性 10、正确评价,注意鼓励性 11、面向全体,注意广泛性 12、选准时机,...
All rights reserved Powered by
copyright &copyright 。文档资料库内容来自网络，如有侵犯请联系客服。

cdf累积分布函数数可以评价聚类结果吗

我要回帖

更多关于标准正态累积分布函数的文章

随机推荐

cdf累积分布函数数可以评价聚类结果吗

我要回帖

更多关于 标准正态累积分布函数 的文章

随机推荐

更多关于标准正态累积分布函数的文章