ORACLE
数据库管理员应按如下方式对
ORACLE
数据库系统做定期监控:  <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

(1) . 
每天
ORACLE
数据库的运行状态
,
日志文件
,
备份情况
,
数据库的磁盘空间使用情况
,
系统资源的使用情况进行检查
,
发现并解决问题。

(1).
确认所有的
INSTANCE
状态正常,登陆到所有数据库或例程
,
检测
ORACLE
后台进程
: $ps 
ef|grep ora_ 

(2). 
检查文件系统的使用(剩余空间)。如果文件系统的剩余空间小于
20%
,需删除不用的文件以释放空间。 清理空间时请务必小心! 
$df 

(3). 
检查日志文件和
trace
文件记录
alert
trace
文件中的错误。 

连接到每个需管理的系统对每个数据库
,cd 
bdump
目录
,
通常是
ORACLE_BASE/admin/<SID>/bdump 

使用 
Unix tail 
命令来查看
alert_<SID>.log
文件如果发现任何新的
ORA- 
错误
,
记录并解决
.

(4). 
检查数据库当日备份的有效性。 

RMAN
备份方式
检查第三方备份工具的备份日志以确定备份是否成功 

EXPORT
备份方式
检查
exp
日志文件以确定备份是否成功 

对其他备份方式
检查相应的日志文件 

(5). 
检查数据文件的状态记录状态不是“
online
”的数据文件,并考虑是否需要做恢复。 

Select file_name from dba_data_files where status=
OFFLINE
’ 

v$recover_file

(6). 
检查表空间的使用情况 

SELECT tablespace_name, max_m, count_blocks free_blk_cnt, sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_free 

FROM ( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name), 

( SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m, count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM dba_free_space GROUP BY tablespace_name ) 

WHERE tablespace_name = fs_ts_name 

order by pct_free

System
:  字典空间,不能被损坏

Sysaux
:  
10g
高并发,或者系统繁忙时候,会造成
system
争用,可以将工具放在
sysaux
中减轻
system
的压力,
sysaux
不影响系统(影响性能)

Example

Users
: 
10g 
用户数据从
system
剥离出来

Undo
: 
dml
dql
把数据快照到此,数据提交之后立即消失(用户回复)

解决方法:设置预警、设置表空间为自动增长、添加数据文件

(7). 
监控数据库性能 

运行
statspack
生成系统报告 

1
、使用
statspack
的要求   
job_queue_processes >0 ;    timed_statistics  =true 

2
statspack
存储统计信息,需要创建一个足够大的表空间。

create tablespace perfstat  datafile '/u01/perfstat.dbf' size 500m  extent management local;

3
、执行安装脚本,安装
statspack

cd $ORACLE_HOME/rdmbs/admin/spcreate.sql   
sp
开头的都是
statspack
的脚本

4
、收集统计信息
:  exec statspack.snap ;  exec statspack.snap 

5
、 查看统计信息   
@spreport.sql 

(8). 
检查数据库性能,记录数据库的
cpu
使用、
IO
buffer
命中率等等 

使用
vmstat,iostat,sar,top
等命令 

VMstat
显示虚拟内存的使用状态,

iostat
显示
cpu
和设备的输入输出统计信息的状态,

sar
收集并显示系统中的动态活动信息,

top
动态显示
linux
中的系统任务。

(2) . 
每周对数据库对象的空间扩展情况
,
数据的增长情况进行监控
,
对数据库做健康检查
,
对数据库对象的状态做检查。 

(1). 
监控数据库对象的空间扩展情况 

根据本周每天的检查情况找到空间扩展很快的数据库对象
,
并采取相应的措施 

-- 
删除历史数据 

-- 
扩表空间 

alter tablespace <name> add datafile 
<file>
’ 
size <size> 

-- 
调整数据对象的存储参数 或者放在合理存储参数的本地管理表空间上

next extent 

pct_increase 

(2)
系统健康检查

检查以下内容

init<sid>.ora 

controlfile 

redo log file 

archiving 

sort area size 

tablespace(system,temporary,tablespace fragment) 

datafiles(autoextend,location) 

object(number of extent,next extent,index) 

rollback segment 

logging &tracing(alert.log,max_dump_file_size,sqlnet)

(3)
检查无效的数据库对象

SELECT owner, object_name, object_type FROM dba_objects 

WHERE status='INVALID'

(4)
检查不起作用的约束

SELECT   owner, constraint_name, table_name, constraint_type, status 

FROM     dba_constraints 

WHERE    status = 'DISABLED' AND constraint_type = 'P'

(5)
检查无效的
trigger

SELECT  owner, trigger_name, table_name, status 

FROM   dba_triggers 

WHERE  status = 'DISABLED' 

(3) . 
每月对表和索引等进行
Analyze,
检查表空间碎片
,
寻找数据库性能调整的机会
,
进行数据库性能调整
,
提出下一步空间管理计划。对
ORACLE
数据库状态进行一次全面检查。 

( 1
如果使用
CBO(
10g
中这部分工作被简化了
)

a nalyze Tables/Indexes/Cluster 

analyze table <name> estimate statistics sample 40 percent; 

(2). 
检查表空间碎片 

根据本月每周的检查分析数据库碎片情况
,
找到相应的解决方法 。( SQL )

(3). 
寻找数据库性能调整的机会 

比较每天对数据库性能的监控报告
,
确定是否有必要对数据库性能进行调整 

(4). 
数据库性能调整 

如有必要
,
进行性能调整 

(5). 
提出下一步空间管理计划 

根据每周的监控
,
提出空间管理的改进方法

其他工作:

1
、做好备份!!!

2
、找环境做灾难测试

3
、应对领导、用户等各个方面的需求变更

4
、根据新的需求设计新的数据库架构方案

5
、为其他部门提供业务或者脚本支持

6
、考虑存储的使用