如何干预执行计划--使用hints提示

文档

如何干预执行计划--使用hints提示-CUUG

　　基于代价的优化器是很聪明的，在绝大多数情况下它会选择正确的优化器，减轻了DBA的负担。但有时它也聪明反被聪明误，选择了很差的执行计划，使某个语句的执行变得奇慢无比。此时就需要DBA进行人为的干预，告诉优化器使用我们指定的存取路径或连接类型生成执行计划，从而使语句高效的运行。例如，如果我们认为对于一个特定的语句，执行全表扫描要比执行索引扫描更有效，则我们就可以指示优化器使用全表扫描。在ORACLE中，是通过为语句添加hints(提示)来实现干预优化器优化的目的。

　　hints是oracle提供的一种机制，用来告诉优化器按照我们的告诉它的方式生成执行计划。我们可以用hints来实现：

　　1) 使用的优化器的类型

　　2) 基于代价的优化器的优化目标，是all_rows还是first_rows。

　　3) 表的访问路径，是全表扫描，还是索引扫描，还是直接利用rowid。

　　4) 表之间的连接类型

　　5) 表之间的连接顺序

　　6) 语句的并行程度

　　除了”RULE”提示外，一旦使用的别的提示，语句就会自动的改为使用CBO优化器，此时如果你的数据字典中没有统计数据，就会使用缺省的统计数据。所以建议大家如果使用CBO或HINTS提示，则最好对表和索引进行定期的分析。

　　1、如何使用hints:

　　Hints只应用在它们所在sql语句块(statement block，由select、update、delete关键字标识)上，对其它SQL语句或语句的其它部分没有影响。如：对于使用union操作的2个sql语句，如果只在一个sql语句上有hints，则该hints不会影响另一个sql语句。

　　我们可以使用注释(comment)来为一个语句添加hints，一个语句块只能有一个注释，而且注释只能放在SELECT, UPDATE, or DELETE关键字的后面

　　2、使用hints的语法：

　　{DELETE|INSERT|SELECT|UPDATE} /*+ hint [text] [hint[text]]… */

　　{DELETE|INSERT|SELECT|UPDATE} --+ hint [text] [hint[text]]…

　　注解：

　　1) DELETE、INSERT、SELECT和UPDATE是标识一个语句块开始的关键字，包含提示的注释只能出现在这些关键字的后面，否则提示无效。

　　2) “+”号表示该注释是一个hints，该加号必须立即跟在”/*”的后面，中间不能有空格。

　　3) hint是下面介绍的具体提示之一，如果包含多个提示，则每个提示之间需要用一个或多个空格隔开。

　　4) text 是其它说明hint的注释性文本

　　如果你没有正确的指定hints，Oracle将忽略该hints，并且不会给出任何错误。

　　3、使用全套的hints：

　　当使用hints时，在某些情况下，为了确保让优化器产生最优的执行计划，我们可能指定全套的hints。例如，如果有一个复杂的查询，包含多个表连接，如果你只为某个表指定了INDEX提示(指示存取路径在该表上使用索引)，优化器需要来决定其它应该使用的访问路径和相应的连接方法。因此，即使你给出了一个INDEX提示，优化器可能觉得没有必要使用该提示。这是由于我们让优化器选择了其它连接方法和存取路径，而基于这些连接方法和存取路径，优化器认为用户给出的INDEX提示无用。为了防止这种情况，我们要使用全套的hints，如：不但指定要使用的索引，而且也指定连接的方法与连接的顺序等。

　　下面是一个使用全套hints的例子，ORDERED提示指出了连接的顺序，而且为不同的表指定了连接方法：

　　SELECT /*+ ORDERED INDEX (b, jl_br_balances_n1) USE_NL (j b)

　　USE_NL (glcc glf) USE_MERGE (gp gsb) */

　　b.application_id, b.set_of_books_id ,

　　b.personnel_id, p.vendor_id Personnel,

　　p.segment1 PersonnelNumber, p.vendor_name Name

　　FROM jl_br_journals j, jl_br_balances b,

　　gl_code_combinations glcc, fnd_flex_values_vl glf,

　　gl_periods gp, gl_sets_of_books gsb, po_vendors p

　　WHERE …

　　4、指示优化器的方法与目标的hints：

　　ALL_ROWS -- 基于代价的优化器，以吞吐量为目标

　　FIRST_ROWS(n) -- 基于代价的优化器，以响应时间为目标

　　CHOOSE -- 根据是否有统计信息，选择不同的优化器

　　RULE -- 使用基于规则的优化器

　　例子：

　　SELECT /*+ FIRST_ROWS(10) */ employee_id, last_name, salary, job_id

　　FROM employees

　　WHERE department_id = 20;

　　SELECT /*+ CHOOSE */ employee_id, last_name, salary, job_id

　　FROM employees

　　WHERE employee_id = 7566;

　　SELECT /*+ RULE */ employee_id, last_name, salary, job_id

　　FROM employees

　　WHERE employee_id = 7566;

　　5、指示存储路径的hints：

　　FULL /*+ FULL ( table ) */

　　指定该表使用全表扫描

　　ROWID /*+ ROWID ( table ) */

　　指定对该表使用rowid存取方法，该提示用的较少

　　INDEX /*+ INDEX ( table [index]) */

　　使用该表上指定的索引对表进行索引扫描

　　INDEX_FFS /*+ INDEX_FFS ( table [index]) */

　　使用快速全表扫描

　　NO_INDEX /*+ NO_INDEX ( table [index]) */

　　不使用该表上指定的索引进行存取，仍然可以使用其它的索引进行索引扫描

　　SELECT /*+ FULL(e) */ employee_id, last_name

　　FROM employees e

　　WHERE last_name LIKE :b1;

　　SELECT /*+ROWID(employees)*/ *

　　FROM employees

　　WHERE rowid > 'AAAAtkAABAAAFNTAAA' AND employee_id = 155;

　　SELECT /*+ INDEX(A sex_index) use sex_index because there are few

　　male patients */ A.name, A.height, A.weight

　　FROM patients A

　　WHERE A.sex = ’m’;

　　SELECT /*+NO_INDEX(employees emp_empid)*/ employee_id

　　FROM employees

　　WHERE employee_id > 200;

　　6、指示连接顺序的hints:

　　ORDERED /*+ ORDERED */

　　按from 字句中表的顺序从左到右的连接

　　STAR /*+ STAR */

　　指示优化器使用星型查询

　　SELECT /*+ORDERED */ o.order_id, c.customer_id, l.unit_price * l.quantity

　　FROM customers c, order_items l, orders o

　　WHERE c.cust_last_name = :b1

　　AND o.customer_id = c.customer_id

　　AND o.order_id = l.order_id;

　　/*+ ORDERED USE_NL(FACTS) INDEX(facts fact_concat) */

　　7、指示连接类型的hints：

　　USE_NL /*+ USE_NL ( table [,table, …] ) */

　　使用嵌套连接

　　USE_MERGE /*+ USE_MERGE ( table [,table, …]) */

　　使用排序- -合并连接

　　USE_HASH /*+ USE_HASH ( table [,table, …]) */

　　使用HASH连接

　　注意：如果表有alias(别名)，则上面的table指的是表的别名，而不是真实的表名

　　8、具体的测试实例：

　　create table A(col1 number(4,0)，col2 number(4,0)， col4 char(30));

　　create table B(col1 number(4,0)，col3 number(4,0)， name_b char(30));

　　create table C(col2 number(4,0)，col3 number(4,0)， name_c char(30));

　　select A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE

　　1 0 MERGE JOIN

　　2 1 SORT (JOIN)

　　3 2 MERGE JOIN

　　4 3 SORT (JOIN)

　　5 4 TABLE ACCESS (FULL) OF 'B'

　　6 3 SORT (JOIN)

　　7 6 TABLE ACCESS (FULL) OF 'A'

　　8 1 SORT (JOIN)

　　9 8 TABLE ACCESS (FULL) OF 'C'

　　select /*+ ORDERED */ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=1 Bytes=110)

　　1 0 HASH JOIN (Cost=5 Card=1 Bytes=110)

　　2 1 HASH JOIN (Cost=3 Card=1 Bytes=84)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=1 Bytes=26)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=82 Bytes=4756)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=1 Bytes=26)

　　select /*+ ORDERED USE_NL (A C)*/ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=4 Card=1 Bytes=110)

　　1 0 HASH JOIN (Cost=4 Card=1 Bytes=110)

　　2 1 NESTED LOOPS (Cost=2 Card=1 Bytes=84)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=1 Bytes=26)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=82 Bytes=4756)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=1 Bytes=26)

　　创建索引：

　　create index inx_col12A on a(col1,col2);

　　select A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE

　　1 0 MERGE JOIN

　　2 1 SORT (JOIN)

　　3 2 NESTED LOOPS

　　4 3 TABLE ACCESS (FULL) OF 'B'

　　5 3 TABLE ACCESS (BY INDEX ROWID) OF 'A'

　　6 5 INDEX (RANGE SCAN) OF 'INX_COL12A' (NON-UNIQUE)

　　7 1 SORT (JOIN)

　　8 7 TABLE ACCESS (FULL) OF 'C'

　　select /*+ ORDERED */ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=1 Bytes=110)

　　1 0 HASH JOIN (Cost=5 Card=1 Bytes=110)

　　2 1 HASH JOIN (Cost=3 Card=1 Bytes=84)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=1 Bytes=26)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=82 Bytes=4756)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=1 Bytes=26)

　　select /*+ ORDERED USE_NL (A C)*/ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=4 Card=1 Bytes=110)

　　1 0 HASH JOIN (Cost=4 Card=1 Bytes=110)

　　2 1 NESTED LOOPS (Cost=2 Card=1 Bytes=84)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=1 Bytes=26)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=82 Bytes=4756)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=1 Bytes=26)

　　select /*+ USE_NL (A C)*/ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　我们这个查询的意思是让A、C表做NL连接，并且让A表作为内表，但是从执行计划来看，没有达到我们的目的。

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=3 Card=1 Bytes=110)

　　1 0 NESTED LOOPS (Cost=3 Card=1 Bytes=110)

　　2 1 MERGE JOIN (CARTESIAN) (Cost=2 Card=1 Bytes=52)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=1 Bytes=26)

　　4 2 SORT (JOIN) (Cost=1 Card=1 Bytes=26)

　　5 4 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=1 Bytes=26)

　　6 1 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=82 Bytes=4756)

　　对对象进行分析后：

　　analyze table a compute statistics;

　　analyze table b compute statistics;

　　analyze table c compute statistics;

　　analyze index inx_col12A compute statistics;

　　select A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=8 Bytes=336)

　　1 0 HASH JOIN (Cost=5 Card=8 Bytes=336)

　　2 1 MERGE JOIN (CARTESIAN) (Cost=3 Card=8 Bytes=64)

　　3 2 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=2 Bytes=8)

　　4 2 SORT (JOIN) (Cost=2 Card=4 Bytes=16)

　　5 4 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=4 Bytes=16)

　　6 1 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=30 Bytes=1020)

　　select /*+ ORDERED */ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=9 Bytes=378)

　　1 0 HASH JOIN (Cost=5 Card=9 Bytes=378)

　　2 1 HASH JOIN (Cost=3 Card=30 Bytes=1140)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=4 Bytes=16)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=30 Bytes=1020)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=2 Bytes=8)

　　select /*+ ORDERED USE_NL (A C)*/ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=7 Card=9 Bytes=378)

　　1 0 HASH JOIN (Cost=7 Card=9 Bytes=378)

　　2 1 NESTED LOOPS (Cost=5 Card=30 Bytes=1140)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=4 Bytes=16)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=30 Bytes=1020)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=2 Bytes=8)

　　select /*+ USE_NL (A C)*/ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=7 Card=9 Bytes=378)

　　1 0 HASH JOIN (Cost=7 Card=9 Bytes=378)

　　2 1 NESTED LOOPS (Cost=5 Card=30 Bytes=1140)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=4 Bytes=16)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=30 Bytes=1020)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=2 Bytes=8)

　　select /*+ ORDERED USE_NL (A B C) */ A.col4

　　from C , A , B

　　where C.col3 = 5 and A.col1 = B.col1 and A.col2 = C.col2

　　and B.col3 = 10;

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=35 Card=9 Bytes=378)

　　1 0 NESTED LOOPS (Cost=35 Card=9 Bytes=378)

　　2 1 NESTED LOOPS (Cost=5 Card=30 Bytes=1140)

　　3 2 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=4 Bytes=16)

　　4 2 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=30 Bytes=1020)

　　5 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=2 Bytes=8)

　　对于这个查询我无论如何也没有得到类似下面这样的执行计划：

　　Execution Plan

　　----------------------------------------------------------

　　0 SELECT STATEMENT Optimizer=CHOOSE (Cost=35 Card=9 Bytes=378)

　　1 0 NESTED LOOPS (Cost=35 Card=9 Bytes=378)

　　2 1 TABLE ACCESS (FULL) OF 'B' (Cost=1 Card=2 Bytes=8)

　　3 1 NESTED LOOPS (Cost=5 Card=30 Bytes=1140)

　　4 3 TABLE ACCESS (FULL) OF 'C' (Cost=1 Card=4 Bytes=16)

　　5 3 TABLE ACCESS (FULL) OF 'A' (Cost=1 Card=30 Bytes=1020)

　　从上面的这些例子我们可以看出：通过给语句添加HINTS，让其按照我们的意愿执行，有时是一件很困难的事情，需要不断的尝试各种不同的hints。对于USE_NL与USE_HASH提示，建议同ORDERED提示一起使用，否则不容易指定那个表为驱动表。