怎样在9i里对基于excel函数公式大全的索引进行仅索引扫描

科学教育 | 学习帮助 | 出国/留学 | 工程技术科学 | 教育/科学 | 英语听力 | 梦幻西游电脑版 | 视频会议 | 口臭 | 暗黑破坏神3（游戏） | 面相 | 赛尔号 | linux | 山西省 | Xbox One | 思修 | 易经 | solidworks | 钢铁雄心4 | 休闲游戏 | 魔兽争霸3混乱之治 | 显卡 | 武汉大学 | 塞尔达传说（游戏） | 校服 | 剑侠情缘网络版叁 | 脱发 | 日本文化 | 数学建模 | 二次元 | 部落冲突（游戏） | 肖战 | 街机游戏 | 拳皇 | 马鞍山市 | 扑克 | 完美世界（游戏） | 三国志（游戏） | 热血传奇（游戏） | 意大利 | 跆拳道 | 东莞市 | 糖尿病 | 古琴 | 三国 | 电视节目 | 百度 | qq音乐 | 配音 | 电视 | 任天堂 | 科幻小说 | 虚拟专用服务器 | QQ游戏 | 大熊猫 | 微电影 | Android | 竞技游戏 | 动画制作 | QQ炫舞 | 电源 | 日语 | 魔兽争霸3冰封王座 | 产业 | ios开发 | 百度云 | 动画电影 | nba篮球 | 羽生结弦 | iOS应用 | galgame | 电吉他 | 平板电脑 | 周星驰（人物） | 离婚 | 后宫·甄嬛传（书籍） | 牙科 | 游戏开发 | 网络直播 | ios游戏 | 电子邮件 | SNH48 | 民国 | 美容 | 舰队 Collection | 心理 | Mac | 羽毛球技术 | 互联网公司 | 大学生兼职 | 烘焙 | 诸葛亮 | 跑跑卡丁车 | 武侠小说 | 微博 | 骨折 | 掌上游戏机 | 玉米 | 中国足球 | 电脑配置 | 洛奇英雄传 | 硬盘 | 张璐 | akb48 | 炉石传说 | 韩国 | 蓄电池 | QQ空间 | 房贷 | 麦克风 | 相声演员 | 抑郁 | 天下2（游戏） | 农业科学 | 神话 | 农历 | 中国足球协会超级联赛（CSL） | 流星花园 | 易烊千玺 | 火影忍者 | 日语歌曲 | 巴西 | 红酒 | 化疗 | 占地 | 网络小说 | 香烟 | 传奇世界 | 名字 | 日本电影 | 表演 | 西藏自治区 | 英雄传说：闪之轨迹（游戏） | 足球彩票 | 摩尔庄园 | 中国工商银行 | 游戏手柄 | 陈奕迅 | 联赛 | 天体物理学 | 英格兰足球超级联赛 | 超级机器人大战 | 命令与征服：红色警戒2（游戏） | 郭富城 | 一级方程式赛车（f1） | Adobe Photoshop | 英文歌曲 | 玄幻小说 | 猫和老鼠 | 杨凡 | 书籍改编电影 | 俄罗斯 | 网络赚钱 | 罗玉凤 | 刺客信条2 | 角色扮演 | 食物 | 药物 | 杨洋（演员） | 信息安全 | 胡歌（演员） | 张子枫 | 古典音乐 | 时尚 | 大片 | 电脑游戏 | 签证 | 徐佳莹 | 耽美 | 游戏攻略 | 音乐剧 | 前女友 | 男性 | 肠胃 | 刺客信条起源 | 剧场版 | 国际足联世界杯 | 彩虹六号（游戏） | 赵丽颖（演员） | 天体生物学 | 战神（游戏） | 吉他学习 | 飞机 | 三菱商事 | 关节炎 | 斗鱼直播 | 发电 | 张继科 | 华语流行音乐 | 搏击项目 | 主题曲 | 李信 | 刘德华（演员） | 即时战略游戏（RTS） | 欧阳娜娜 | 网址导航 | 海贼王 | 山地车 | 豆瓣电影 | 广场舞 |

你的位置：网站首页 >> 频道首页 >>编程语言 >>怎样在9i里对基于excel函数公式大全的索引进行仅索引扫描

怎样在9i里对基于excel函数公式大全的索引进行仅索引扫描

来源：蜘蛛抓取(WebSpider) 时间：2018-04-20 16:50 标签： excel函数公式大全

索引是应用设计和开发的一个重偠方面如果有太多的索引，DML的性能就会受到影响如果索引太少，又会影响查询（包括插入、更新和删除）的性能要找到一个合适的岼衡点，这对于应用的性能至关重要

我常常发现，人们在应用开发中总是事后才想起索引我坚持认为这是一种错误的做法。如果你知噵数据将如何使用从一开始就应该能提出应用中要使用怎样的索引，即具有一组代表性的索引不过，一般的做法却往往是随应用“放任自流“过后才发现哪里需要索引，这种情况实在太多了这说明，你没有花时间来了解数据将如何使用以及最终要处理多少行经过┅段时间后，随着数据量的增长你会不停地向系统增加索引（也就是说，你所执行的是一种反应式调优）你就有一些冗余而且从不使鼡的索引，这不仅会浪费空间还会浪费计算资源。磨刀不误砍柴工如果刚开始的时候花几个小时好好地考虑何时为数据加索引，以及洳何加索引这肯定能在以后的”调优“中节省更多的时间（注意，我所说的是”肯定能“节省更多时间而不只是”可能“节省更多时間）。

这一章的主旨是对Oracle中可用的索引提供一个概述讨论什么时候以及在哪里可以使用索引。这一章的风格和格式与本书其他章有所不哃索引是一个很宽泛的主题，光是介绍索引就可以单独写一本书其部分原因是：索引是开发人员和DBA角色之间的一个桥梁。一方面开發人员必须了解索引，清楚如何在应用中使用索引而且知道何时使用索引（以及何时不使用索引）等。另一方面DBA则要考虑索引的增长、索引中存储空间的使用以及其他物理特性。我们将主要从应用角度来考虑也就是从索引的实际使用来介绍索引。这一章前半部分提供叻一些基本知识这一章的后半部分回答了关于索引的一些最常问到的问题。

这一章中的各个例子分别需要不同的Oracle版本中的特性如果每個例子需要Oracle企业版或个人版的某些特性（而标准版中不支持），我会明确地指出来

可以看到这个查询计划与对基表的查询计划是一样的。这里所做的只是将SUBSTR(F(X)),11.6)隐藏在视图本身中优化器会识别出这个虚拟列实际上是加了索引的列，并采取“正确”的行动我们能看到同样的性能提升和同样的查询计划。使用这个视图与使用基表是一样的甚至还更好一些，因为它隐藏了复杂性并允许我们以后改变SUBSTR的大小。

基于excel函数公式大全的索引除了对使用内置excel函数公式大全（如UPPER、LOWER等）的查询显然有帮助之外还可以用来有选择地只是对表中的某些行建立索引。稍后会讨论B*树索引对于完成为NULL的键没有相应的条目。也就是说如果在表T上有一个索引I：

而且行中A和B都为NULL，索引结构中就没有相應的条目如果只对表中的某些行建立索引，这就能用得上

考虑有一个很大的表，其中有一个NOT NULL列名为PROCESSED_FLAG，它有两个可取值：Y或N默认值為N。增加新行时这个值为N，指示这一行未得到处理等到处理了这一行后，则会将其更新为Y来指示已处理我们可能想对这个列建立索引，从而能快速地获取值为N的记录但是这里有数百万行，而且几乎所有行的值都为Y所得到的B*树索引将会很大，如果我们把值从N更新为Y维护这样一个大索引的开销也相当高。这个表听起来很适合采用位图索引（毕竟基数很低！）但这是一个事务性系统，可能有很多人茬同时插入记录（新记录的“是否处理”列设置为N）前面讨论过，位图索引不适用于并发修改如果考虑到这个表中会不断地将N更新为Y，那位图就更不合适了根本不应考虑，因为这个过程会完全串行化

所以，我们真正想做的是只对感兴趣的记录建立索引（即该列值為N的记录）。我们会介绍如何利用基于excel函数公式大全的索引来做到这一点但是在此之前，先来看如果只是一个常规索引会发生什么使鼡本书最前面“环境设置”一节中描述的标准BIG_TABLE脚本，下面更新TEMPORARY列在此将Y变成N，以及N变成Y：

现在检查Y与N地比例：

可以看到在表的11.000,000条记录Φ，只有0.2%的数据应当加索引如果在TEMPORARY列上使用传统索引（相对于这个例子中PROCESSED_FLAG列的角色），会发现这个索引有11.000,000个条目占用了超过14MB的空间，其高度为3：

通过这个索引获取任何数据都会带来3个I/O才能达到叶子块这个索引不仅很“宽”，还很“高”要得到第一个未处理的记录，必须至少执行4个I/O（其中3个是对索引的I/O另外一个是对表的I/O）。

怎么改变这种情况呢我们要让索引更小一些，而且要更易维护（更新期间嘚运行时开销更少）采用基于excel函数公式大全的索引，我们可以编写一个excel函数公式大全如果不想对某个给定行加索引，则这个excel函数公式夶全就返回NULL；而对想加索引的行则返回一个非NULL值例如，由于我们只对列值为N的记录感兴趣所以只对这些记录加索引：

这就有很大不同，这个索引只有大约40KB而不是11..5MB。高度也有所降低与前面那个更高的索引相比，使用这个索引能少执行一个I/O

要利用基于excel函数公式大全的索引，还有一个有用的技术这就是使用这种索引来保证某种复杂的约束。例如假设有一个带版本信息的表，如项目表项目有两种状態：要么为ACTIVE，要么为INACTIVE需要保证以下规则：“活动的项目必须有一个惟一名；而不活动的项目无此要求。”也就是说只有一个活动的“項目X”，但是如果你愿意可以有多个名为X的不活动项目。

开发人员了解到这个需求时第一反应往往是：“我们只需运行一个查询来查看是否有活动项目X，如果没有就可以创建一个活动项目X。”如果你读过第7章（介绍并发控制和多版本的内容）就会知道，这种简单的實现在多用户环境中是不可行的如果两个人想同时创建一个新的活动项目X，他们都会成功我们需要将项目X的创建串行化，但是对此惟┅的做法是锁住这个项目表（这样做并发性就不太好了）或者使用一个基于excel函数公式大全的索引，让数据库为我们做这个工作

由于可鉯在excel函数公式大全上创建索引，而且B*树索引中对于完全为NULL的行没有相应的条目另外我们可以创建一个UNIQUE索引，基于这几点可以很容易做箌：

这就行了。状态（status）列是ACTIVE时NAME列将建立惟一的索引。如果试图创建同名的活动项目就会被检测到，而且这根本不会影响对这个表的並发访问

某些Oracle版本中有一个bug，其中基于excel函数公式大全的索引中引用的excel函数公式大全会以某种方式被重写以至于索引无法被透明地使用。例如前面的CASE语句

会悄悄地重写为以下更高效的语句：

但是这个excel函数公式大全与我们创建的那个excel函数公式大全不再匹配，所以查询无法使用此excel函数公式大全如果在11..11.0.3中执行这个简单的测试用例，然后再在11..11.0.4（该版本修正了这个bug）中执行它结果如下（在11..11.0.3中）：

看上去，基于excel函数公式大全的索引不仅不会工作而且不可用。但是这个FBI（基于excel函数公式大全的索引）其实是可用的只不过这里底层excel函数公式大全被偅写了，我们可以查看视图USER_IND_EXPRESSIONS来看看Oracle是如何重写它的从而验证这一点：

在Oracle11..11.0.4中，基于excel函数公式大全的索引中也会发生重写但是索引会使用偅写后的excel函数公式大全：

这是因为数据库选择不仅重写了CREATE INDEX中的excel函数公式大全，还重写了查询本身使用的excel函数公式大全因此二者是匹配的。

在以前的版本中对此的解决办法有以下几种：

但是，倘若优化器没有使用你的基于excel函数公式大全的索引而且你对此无法做出解释，鈈知道为什么没有使用你的excel函数公式大全在这种情况下，就可以检查USER_IND_EXPRESSIONS视图验证使用的excel函数公式大全是否正确。

对于基于excel函数公式大全嘚索引我注意到这样一个奇怪的现像，如果你要在内置excel函数公式大全TO_DATE上创建一个索引某些情况下并不能成功创建，例如：

这看上去很渏怪因为有时使用TO_DATE创建索引确实是可以的，例如：

相关的错误信息也很模糊让人摸不着头脑：

我们并没有使用SYSDATE；也没有使用“用户环境”（难道我们用了吗？）这里并没有使用PL/SQLexcel函数公式大全，而且没有涉及任何与会话状态有关的方面问题只是在于我们使用的格式：YYYY。给定完全相同的输入这种格式可能返回不同的答案，这取决于调用的excel函数公式大全时输入的月份例如，对于5月的每个时间：

YYYY格式会返回5月1日在6月它会返回6月1日，以此类推这就说明，如果用到YYYYTO_DATE就不是确定性的！这这是无法创建索引的原因：只有在创建一行（或插叺/更新一行）的多月它能正确工作。所以这个错误确实归根于用户环境，其中包含当前日期本身

要在一行基于excel函数公式大全的索引中使用TO_DATE，必须使用一种无歧义的确定性日期格式而不论当前是哪一天。

基于excel函数公式大全的索引很容易使用和实现他们能提供立即值。鈳以用基于excel函数公式大全的索引来加快现有应用的速度而不用修改应用中的任何逻辑或查询。通过使用基于excel函数公式大全的索引可以觀察到性能会呈数量级地增长。使用这种索引能提前计算出复杂的值而无需使用触发器。另外如果在基于excel函数公式大全的索引中物化表达式，优化器就能更准确度估计出选择性可以使用基于excel函数公式大全的索引有选择地只对感兴趣的几行建立索引（如前面关于PROCESSED_FLAG的例子所示）。实际上使用这种就是可以对WHERE子句加索引。最后我们研究了如何使用基于excel函数公式大全的索引来实现某种完整性约束：有选择嘚惟一性（例如，“每个条件成立时字段X、Y和Z必须惟一”）

基于excel函数公式大全的索引会影响插入和更新的性能。不论这一点对你是否重偠都必须有所考虑。如果你总是插入数据而不经常查询，基于excel函数公式大全的索引可能对你并不适用另一方面，要记住一般插入時都是一次插入一行，查询却会完成数千次所以插入方面的性能下降（最终用户可能根本注意不到）能换来查询速度数千倍的提高。一般来说在这种情况下利远大于弊。

应用域索引（application domain index）即Oracle所谓的可扩展索引（extensible indexing）利用应用域索引，你可以创建自己的索引结构使之像Oracle提供的索引一样工作。有人使用你的索引类型发出一个CREATE INDEX语句时Oracle会运行你的代码来生成这个索引。如果有人分析索引来计算统计信息Oracle会执荇你的代码来生成统计信息（采用你要求的存储格式）。Oracle解析查询并开发查询计划时如果查询计划中可能使用你的索引，Oracle会问你：这个excel函数公式大全的计算不同的计划时会有怎样的开销简单地说，利用应用域索引你能实现数据库中原本没有的一个新的索引类型。例如如果你开发一个软件来分析数据库中存储的图像，而且生成了关于图像的信息（如图像中的颜色）就可以创建你自己的图像（image）索引。向数据库中增加图象时会调用你的代码，从图像中抽取颜色并将其存储在某个地方（你想存储图像索引的任何地方）。查询时用戶请求所有“蓝色图像”时，Oracle就会在合适的时候从索引提供答案

对此最好的例子是Oracle自己的文本索引（text index）。这个索引用于对大量的文本项提供关键字搜索可以如下创建一个简单的文本索引：

这个索引的创建者向SQL语言中引入了一些文本运算符，接下来使用这些文本运算符：

咜甚至能对如下的命令做出响应：

它会与优化器合作在运行时确定使用文本索引（而不是其他某个索引或前面扫描）的相对开销。有意思的是任何人（包括你和我）都可以开发这样一个索引。文本索引的实现无需你了解“内部核心知识”这是使用专用的API完成的，这些API囿文档说明而且已经公开提供Oracle数据库内核并不关心文本索引如果存储（对于创建的每个索引，API会把它存储在多个物理数据库表中）Oracle也鈈知道插入新行时会做怎样的处理。Oracle文本实际上是建立在数据库之上的一个应用但采用了一种完全集成的方式。对于你和我来说这看仩去就像是如何其他Oracle数据库内核excel函数公式大全一样，但事实上它并不是内核excel函数公式大全

我个人认为，没有必要去构建一个标新立异的索引结构类型在我看来，这种特定的特性大多由第三方解决方案提供者使用（他们有一些创新性的索引技术）

我认为，应用域索引最囿意思的一点是：利用应用域索引这就允许其他人提供新的索引技术，而我可以在自己的应用中使用这些技术大多数人从来都没有用過这种特定的API来构建新的索引类型，但是我们大多都用到过某种非内置的新索引类型我参与的几乎每一个应用都有一些与之相关的文本（text）、待处理的XML或者要存储和分类的图像（image）。这些功能通过一个interMedia功能集（利用了应用域索引特性来实现）就能提供随着时间的推移，鈳用的索引类型越来越多我们将在下一章更深入地分析文本索引。

在本书的引言中曾经说过我回答过大量关于Oracle的问题。我就是Oracle Magazine上“Ask Tom”專栏和上的Tom在这个专栏和网站上我一直在回答大家提出的关于Oracle数据库和工具的问题。根据我的经验其中关于索引的问题最多。这一节Φ我将回答问得最多的一些问题。有些答案就像是常识一样很直接；但是有些答案可能会让你很诧异。可以这么说关于索引存在的許多神话和误解。

与这个问题相关的另一个问题是：“能对视图加索引吗”视图实际上就是一个存储查询（stored query）。Oracle会把查询中访问视图的囿关文本代之以视图定义本身视图只是为了方便最终用户或程序员，优化器还是会对基表使用查询使用视图时，完全可以考虑使用为基表编写的查询中所能使用的所有索引“对视图建立索引”实际上就是对基本建立索引。

B*树索引（除了聚簇B*树索引这个特例之外）不会存储完全为null的条目而位图好聚簇索引则不同。这个副作用可能会带来一些混淆但是如果你理解了不存储完全为null的键是什么含义，就能佷好地利用这一点

要看到不存储null值所带来的影响，请考虑下面这个例子：

这个表有4行而索引只有3行。前三行（索引键元素中至少有一個不为null）都在索引中最后一行的索引键是（NULL,NULL）,所以这一行不在索引中。倘若索引是一个惟一索引（如上所示）这就是可能产生混淆的┅种情况。考虑以下3个INSERT语句的作用：

这里并不认为新的（NULL,NULL）行与原来的（NULL,NULL）行相同：

看上去好像不可能的如果考虑到所有null条目，这就说奣我们的惟一键并不惟一事实上，在Oracle中考虑惟一性时（NULL,NULL）与（NULL,NULL）并不相同，这是SQL标准要求的不过对于聚集来说（NULL,NULL）和（NULL,NULL）则认为是楿同的。两个（NULL,NULL）在比较时并不相同但是对GROUP BY 子句来说却是一样的。所以应当考虑到：每个惟一约束应该至少有一个确实惟一的NOT NULL列

关于索引和null值还会提出这样一个疑问是：“为什么我的查询不使用索引？”下面是一个有问题的查询：

这个查询无法使用我们刚才创建的索引（NULL,NULL）行并不在索引中，因此使用索引的话实际上会返回错误的答案只有当索引键中至少有一个列定义为NOT NULL时查询才会使用索引。例如鉯下显示了Oracle会对X IS NULL谓词使用索引（如果索引的索引键最前面是X列，而且索引中其他列中至少有一列是NOT NULL）：

再来查询这个表会发现：

前面我說过，B*树索引中不存储完全为null的条目而且你可以充分利用这一点，以上就展示了应当如何加以利用假设你有一个表，其中每一列只有兩个可取值这些值分布得很不均匀，例如90%以上的行（多数行）都取某个值，而另外不到11.%的行（少数行）取另外一个值可以有效地对這个列建立索引，来快速访问那些少数行如果你想使用一个索引访问少数行，同时又想通过全面扫描来访问多数行另外还想节省空间，这个特性就很有用解决方案是：对多数行使用null，而对少数行使用你希望的任何值；或者如前所示使用一个基于excel函数公式大全的索引，只索引excel函数公式大全的非null返回值

既然知道了B*树如何处理null值，所以可以充分利用这一点并预防在全都允许有null值的列上建立惟一约束（當心这种情况下可能有多个全null的行）。

外键是否应该加索引这个问题经常被问到。我们在第6章讨论死锁时谈到过这个话题在第6章中，峩指出外键未加索引是我所遇到的导致死锁的最主要的原因；这是因为，无论是更新父表主键或者删除一个父记录，都会在子表中加┅个表锁（在这条语句完成前不允许对子表做任何修改）。这就会不必要地锁定更多的行而影响并发性。人们在使用能自动生成SQL来修妀表的某个工具时就经常遇到这种问题。这样的工具会生成一个更新语句它将更新表中的每一列，而不论这个值是否被UPDATE语句修改这僦会导致更新主键（即使主键值其实从未改变过）。例如Oracle Forms就会默认地这样做，除非你告诉它只把修改过的列发送给数据库除了可能遇箌表锁问题之外，在以下情况下外键未加索引也表现得很糟糕：

你会发现，如果没有索引会使查询减慢由于同样的原因，我在第11.章曾建议对嵌套表中的NESTED_COLUMN_ID加索引嵌套表的隐藏列NESTED_COLUMN_ID实际上就是一个外键。

那么什么时候不需要对外键加索引呢？一般来说如果满足以下条件則可如此：

q 不论从父表联结到子表，或者更一般地讲外键列不支持子表的一个重要的访问途径，而且你在谓词中没有使用这些外键列从孓表中选择数据（如DEPT到EMP）

如果满足上述所有3个条件，就完全可以不加索引也就是说，对外键加索引是不必要的还会减慢子表上DML操作嘚速度。如果满足了其中某个条件就要当心不加索引的后果。

另外说一句如果你认为某个子表会由于外键为加索引而被锁住，而且希朢证明这一点（或者一般来说你想避免这种情况），可以发出以下命令：

现在对父表的可能导致表锁的任何UPDATE或DELETE都会接收到以下错误：

這有助于跟踪到有问题的代码段，你以为它没有做某件事（比如你认为并没有对父表的主键执行UPDATE或DELETE），但实际上事与愿违通过以上命囹，最终用户就会立即向你反馈这个错误

对此有很多可能的原因。在这一节中我们会查看其中一些最常见的原因。

我们在使用一个B*树索引而且谓词中没有使用索引的最前列。如果是这种情况可以假设有一个表T，在T(X,Y)上有一个索引我们要做以下查询：SELECT * FROM T WHERE Y = 5。此时优化器僦不打算使用T(x,y)上的索引，因为谓词中不涉及X列在这种情况下，倘若使用索引可能就必须查看每一个索引条目（稍后我们会讨论一种索引跳跃式扫描，这是一种例外情况）而优化器通常更倾向于T对做一个全表扫描。但这并不完全排除使用索引如果查询是SELECT X, Y FROM T WHERE Y = 5，优化器就会紸意到它不必全面扫描表来得到X或Y（X和Y都在索引中），对索引本身做一个快速的全面扫描会更合适因为这个索引一般比底层表小得多。还要注意仅CBO能使用这个访问路径。

另一种情况下CBO也会使用T(x,y)上的索引这就是索引跳跃式扫描。当且仅当索引的最前列（在上一个例子Φ最前列就是Y）只有很少的几个不同值，而且优化器了解这一点跳跃式扫描（skip scan）就能很好地发挥作用。例如考虑（GENDER, EMPNO）上的一个索引，其中GENDER可取值有M和F而且EMPNO是惟一的。对于以下查询：

可以考虑使用T上的那个索引采用跳跃式扫描方法来满足这个查询这说明从概念上讲這个查询会如下处理：

它会跳跃式地扫描索引，以为这是两个索引：一个对于值M另一个对应值F。在查询计划中可以很容易地看出这一点我们将建立一个表，其中有一个二值的列并在这个列上建立索引：

做以下查询时，可以看到结果如下：

INDEX SKIP SCAN步骤告诉Oracle要跳跃式扫描这个索引查找GENDER值有改变的地方，并从那里开始向下读树然后在所考虑的各个虚拟索引中找到OBJECT_ID = 42。如果大幅增加GENDER的可取值如下：

我们会看到，Oracle鈈再认为跳跃式扫描是一个可行的计划优化器本可以去检查256个小索引，但是它更倾向于执行一个全表扫描来找到所需要的行：

T查询（或類似的查询）而且在表T上有一个B*树索引。不过优化器并不是统计索引条目，而是在全面扫描这个表（尽管索引比表要小）在这种情況下，索引可能建立在一些允许有null值的列上由于对于索引键完全为null的行不会建立相应的索引条目，所以索引中的行数可能并不是表中的荇数这里优化器的选择是对的，如若不然倘若它使用索引来统计行数，则可能会得到错误的答案

对于一个有索引的列，做以下查询：

却发现没有使用INDEX_COLUMN上的索引原因是这个列上使用了excel函数公式大全。我们是对INDEX_COLUMN的值建立了索引而不是对F(INDEXED_COLUMN)的值建索引。在此不能使用这个索引如果愿意，可以另外对excel函数公式大全建立索引

我们已经对一个字符创建了索引。这个列只包含数值数据如果所用以下语句来查詢:

注意查询中的数字5是常数5（而不是一个字符串），此时就没有使用INDEX_COLUMN上的索引这是因为，前面的查询等价于一些查询：

我们对这个列隐式地应用了一个excel函数公式大全如情况3所述，这就会禁止使用这个索引通过一个小例子能很容易地看出这一点。在这个例子我们将使鼡内置包DBMS_XPLAN。这个包只在Oracle9i Release 2及以上版本中可用（在Oracle9i Release 1中使用AUTOTRACE能很容易地查看计划，但是得不到谓词信息这只在Oracle9i Release 2及以上版本中可见）：

可以看箌，它会全面扫描表；另外即使我们对查询给出了以下提示：

在此使用了索引但是并不像我们想像中那样对索引完成惟一扫描（UNIQUE SCAN），而昰完成了全面扫描（FULL SCAN）原因从最后一行输出可以看出：filter(TO_NUMBER(“X”)=5)。这里对这个数据库列应用了一个隐式excel函数公式大全X中存储的字符串必须轉换为一个数字，之后才能与值5进行比较在此无法把5转换为一个串，因为我们的NLS（国家语言支持）设置会控制5转换成串时的具体形式（洏这是不确定的不同的NLS设置会有不同的控制），所以应当把串转换为数字而这样一来（由于应用了excel函数公式大全），就无法使用索引來快速地查找这一行了如果只是执行串与串的比较：

不出所料，这会得到我们期望的INDEX UNIQUE SCAN而且可以看到这里没有应用excel函数公式大全。一定偠尽可能地避免隐式转换苹果和橘子本来就是两样东西，苹果就和苹果比而橘子就该和橘子比。这里还经常出现一个关于日期的问题如果做以下查询：

而且发现这个查询没有使用DATE_COL上的索引。为了解决这个问题可以对TRUNC(DATE_COL)建立索引，或者使用区间比较运算符来查询（也许這是更容易的做法）下面来看对日期使用大于和小于运算符的一个例子。可以认识到以下条件：

与下面的条件是一样的：

如果可能的话倘若谓词中有excel函数公式大全，尽量不要对数据库列应用这些excel函数公式大全这样做不仅可以使用更多的索引，还能减少处理数据库所需嘚工作在上一种情况中，使用以上条件时：

查询只会计算一次TRUNC值然后就能使用索引来查找满足条件的值。使用TRUNC(DATE_COL) = TRUNC(SYSDATE)时TRUNC(DATE_COL)则必须对整个表（洏不是索引）中的每一行计算一次。

此时如果用了索引实际上反而会更慢。这种情况我见得太多了人们想当然认为，索引总是会使查詢更快所以，他们会建立一个小表再执行分析，却发现优化器并没有使用索引在这种情况下，优化器的做法绝对是英明的Oracle（对CBO而訁）只会在合理地时候才使用索引。考虑下面的例子：

如果运行一个查询它只需要表中相对较少的数据，如下：

此时优化器会很乐意哋使用索引；不过，我们发现如果估计通过索引获取的行数超过了一个阀值（取决于不同的优化器设计、物理统计等，这个阀值可能有所变化）就会观察到优化器将开始一个全部扫描：

这个例子显示出优化器不一定会使用索引，而且实际上它会做出正确的选择：采用跳跃式索引。对查询调优时如果发现你认为本该使用的某个索引实际上并没有用到，就不要冒然强制使用这个索引而应该先做个测试，并证明使用这个索引后确实会加快速度（通过耗用的时间和I/O次数来判断）然后再考虑让CBO“就范”（强制它使用这个索引）。总得先给絀理由吧

有一段时间没有分析表了。这些表起先很小但等到查看时，它们已经增长得非常大现在索引就还有意义（尽管原先并非如此）。如果此时分析这个表就会使用索引。

如果没有正确的统计信息CBO将无法做出正确的决定。

根据我的经验这6种情况就是不使用索引的主要原因。归根结底原因通常就是“不能使用索引，使用索引会返回不正确的结果“或者”不应该使用，如果使用了索引性能會变得很糟糕“。

这是我要彻底揭穿的一个神话：在索引中确实会重用空间这个神话是这样说的：假设有一个表T，其中有一个列X在某個时间点上，你在表中放了一个值X=5后来把它删除了。据这个神话称：X=5所用的空间不会被重用除非以后你再把X=5放回索引中。按这个神话嘚说法一旦使用了某个索引槽，它就永远只能被同一个值重用从这个神话出发还有一个推论，认为空闲空间绝对不会返回给索引结构而且块永远不会被重用。同样事实并非如此。

很容易证明这个神话的第一部分是错误的我们只需如下创建一个表：

因此，根据这个鉮话所述如果我从T中删除了X=2的行，这个空间就不会得到重用除非我再次插入数字2。当前这个索引使用了一个叶子块空间。如果索引鍵条目删除后绝对不会重用只要我不断地插入和删除，而且从不重用任何值那么这个索引就应该疯狂地增长。我们来看看实际是怎样嘚：

由此可以看出索引中的空间确实得到了重用。不过就像大多数神话一样，这里也有那么一点真实的地方真实性在于，初始数字2（介于1～9.999.999.999之间）所用的空间会永远保留在这个索引块上索引不会自行“合并“。这说明如果我用值1～500,000加载一个表，然后隔行删除表记錄（删除所有偶数行）那么这个索引中那一列上就会有250,000个”洞“。只有当我重新插入数据而且这个数据能在有洞的块中放下时，这些涳间才会得到重用Oracle并不打算“收缩”或压缩索引，不过这可以通过ALTER REBUILD或COALESCE命令强制完成另一方面，如果我用值1～500,000加载一个表然后从表中刪除值小于或等于250,000的每一行，就会发现从索引中清除的块将放回到索引的freelist中这个空间完全可以重用。

如果你还记得第二个神话：索引涳间从不“回收”。据这个神话称：一旦使用了一个索引块它就会一直呆在索引结构的那个位置上，而且只有当你插入数据并放回到原来那个位置上时，这个块才会被重用同样可以证明这是错误的。首先需要建立一个表，其中大约有500,000行为此，我们将使用big_table脚本有叻这个表，而且有了相应的主键索引后我们将测量索引中有多少个叶子块，另外索引的freelist上有多少个块要记住，对于一个索引只有当塊完全为空时才会放在freelist上，这一点与表不同所以我们在freelist上看到的块都完全为空，可以重用

执行这个批量删除之前，freelist上没有块而在索引的“叶子”层上有11.043给块，这些叶子块中包含着数据下面，我们将执行删除并再次测量空间的利用情况：

可以看到，现在索引中一半以上的块都在freelist上（520个块），而且现在只有523个叶子块如果将523和520相加，又得到了原来的11.043这说明freelist上的这些块完全为空的，而且可以重用（索引freelist上的块必须为空这与堆组织表的freelist上的块不同）。

索引块为空时会从索引结构中取出它，并在以后重用这可能是最早出现这个神話的根源：与表不同，在索引结构中不能清楚地看出一个块有没有“空闲空间”。在表中可以看到freelis上的块，即使其中包含有数据而茬索引中，只能在freelist上看到完全为空的块；至少有一个索引条目（但其余都是空闲空间）的块就无法清楚地看到

这看上去像是一个常识。對于一个有100,000行的表如果要在C1和C2列上创建一个索引，你发现C1有100,000个不同的值而C2有25,000个不同的值，你可能想在T(C1, C2)上创建索引这说明，C1应该在前媔这是“常识性”的方法。事实上在比较数据向量时（假设C1和C2是向量），把哪一个放在前面都关系不大考虑以下例子。我们将基于ALL_OBJECTS創建一个表并基于OWNER、OBJECT_TYPE和OBJECT_NAME列创建一个索引（这些列按从最没有差别到最有差别的顺序排列，即OWNER列差别最小OBJECT_TYPE次之，OBJECT_NAME列差别最大）另外还茬OBJECT_NAME、OBJECT_TYPE和OWNER上创建了另一个索引：

现在，为了显示这二者在高效使用空间方面难分伯仲下面测量它们的空间利用情况：

它们使用的空间大小唍全一样，细到字节级都一样二者没有什么区别。不过如果使用索引键压缩，第一个索引更可压缩这一点由OPT_CMP_PCTSAVE值可知。有人提倡索引Φ应该按最没有差别到最有差别的顺序来安排列这正是这种看法的一个理由。下面来看这两个索引的表现从而确定是否有哪个索引更“优秀”，总比另一个索引更高效要测试这一点，我们将使用一个PL/SQL代码块（其中包括有提示的查询指示要使用某个索引或者另一个索引）：

这些查询按索引读取表中的每一行。TKPROF报告显示了以下结果：

它们处理的行数完全相同而且块数也非常类似（之所以存在微小的差別，这是因为表中的行序有些偶然性而且Oracle相应地会做一些优化），它们使用了同样的CPU时间而且在大约相同的耗用时间内运行（再运行這个测试，CPU和ELAPSED这两个数字会有一点差别但是平均来讲它们是一样的）。按照各个列的差别大小来安排这些列在索引中的顺序并不会获得夲质上的效率提升另外如前所示，如果再考虑到索引键压缩可能还更倾向于把最没有选择性的列放在最前面。如果对索引采用COMPRESS 2再运荇前面的例子，你会发现对于给定情况下的这个查询，第一个查询执行的I/O次数大约是后者的2/3

不过事实上，对于是把C1列放在C2列之前这必须根据如果使用索引来决定。如果有大量如下的查询：

那么在T(C2,C1)上建立索引就更合理以上这两个查询都可以使用这个索引。另外通过使用索引键压缩（我们在介绍IOT时讨论过，后面还将进一步分析）如果C2在前，就能建立一个更小的索引这是因为，C2的各个值会在索引中岼均重复4次如果C1和C2的平均长度都是11.字节，那么按道理这个索引的条目就是2,000,000字节（100,000×20）倘若在（C2,C1）上使用索引键压缩，可以把这个索引收缩为11.250,000（100,000×11..5）字节因为C2的4次重复中有3次都可以避免。

在Oracle 5中（不错确实是“古老的”Oracle 5！），曾经认为应该把最有选择性的列放在索引的朂前面其理由缘于Oracle 5实现索引压缩的方式（不同于索引键压缩）。这个特性在Oracle 6中就已经去掉了因为Oracle 6中增加了行级锁。从那以后“把最囿差别的列放在索引最前面会使索引更小或更有效率”的说法不再成立。看上去好像是这样但实际上并非如此。如果利用索引键压缩則恰恰相反，因为反过来才会使索引更小（即把最没有差别的列放在索引最前面）不过如前所述，还是应该根据如何使用索引来做出决萣

这一章中，我们介绍了Oracle必须提供的不同类型的索引首先讨论了基本的B*树索引，并介绍了这种索引的几种子类型如反向键索引（为Oracle RAC所设计）和降序索引（来获取按升序和降序混合排序的数据）。我们还花了一些时间来讨论什么时候应当使用索引另外解释了为什么某些情况下索引可能没有用。

然后我们介绍了位图索引在数据仓库环境（即读密集型环境，而不是OLTP）中这对于为低到中基数的数据建立索引是一个绝好的方法。我们介绍了在哪些情况想适于使用位图索引并解释了为什么在OLTP环境（或多个用户必须并发地更新同一个列的任哬环境）中不应该考虑使用位图索引。

接下来转向基于excel函数公式大全的索引这实际上是B*树索引和位图索引的特例。基于excel函数公式大全的索引允许我们在一个列（或多个列）的excel函数公式大全上创建索引这说明可以预先计算和存储复杂计算和用户编写的excel函数公式大全的结果，以便以后以极快的速度完成索引获取我们介绍了有关基于excel函数公式大全的索引的一些重要的实现细节，如必须有一些必要的系统级和會话级设置才能使用基于excel函数公式大全的索引接下来分别在内置Oracleexcel函数公式大全和用户编写的excel函数公式大全上举了两个基于excel函数公式大全嘚索引例子。最后我们谈到了关于基于excel函数公式大全的索引的一些警告。

然后分析了一个非常特定的索引类型这称为应用域索引。在此没有深入地介绍如何从头构建这种形式的索引（这个过程很长也很复杂），而是介绍了Oracle所实现的一个例子：文本索引

最后我回答了┅些关于索引最常问的问题，还澄清了有关索引的一些神话这一节不仅涵盖了一些简单的问题，如“能在视图中使用索引吗”，也涉忣一些更复杂的神话如“索引中从不重用空间”。我们主要是通过具体的例子来回答这些问题揭穿上述神话，并在此过程中展示有关嘚概念