Virus 版 (精华区)

发信人: seak (江海客), 信区: Virus
标  题: 第二篇、数据恢复的准备知识
发信站: 紫 丁 香 (Wed Nov 24 10:42:25 1999), 转信


第二篇、数据恢复的准备知识

文/江海客 lowpower
————————————————————————————————
声明:
1、您所看到的是《数据恢复与软故障处理基本指南》一文的文本稿,本文
已经在《计算机应用文摘》发表,传统媒体如欲转载请同该杂志社联系,
获得许可方可转载。
2、本文作者seak(哈工大紫丁香站ID)许可本文可转载于任何非商业BBS、
新闻组和WEB站点。但严禁改动、删节或添加或局部抄袭、改头换面用于任
何正式出版物。转载必须完整,包括本声明和原文紫丁香BBS信头 (即:发
信人、标题、发信站三行)。
3、由于《计算机应用文摘》编辑同志对本文的修改、和作者对文章的再次
扩充,等因素,你看到的电子版本部分章节与刊发文章并不一致。同时,
作者本人也保留对文章再次扩充修改和网上重新发布的权利。
4、本文是一篇科普文章,是作者考虑到一般用户的接受能力而写的,对本
领域的专家本文并无价值。作者力图能给广大用户做准确的描述,但由
于作者时间和水平的限制,作者不能保证本文的涉及的观点、处理方法等绝
对正确。欢迎大家就各种问题与我探讨,seak@163.net。
————————————————————————————————

1、 系统工作机理的简单介绍(本节由lowpower缩写)
这一部分在原作中是最重要的一章,考虑到篇幅关系,进行了大量的删节。
①、 DOS(DOS兼容系统)硬盘数据的构成
DOS磁盘系统,可以按照逻辑分区的概念管理物理空间,不同分区可以装载
不同的OS系统。
示意如下:
                 硬盘空间
第一扇区|分区1     |分区2   |分区3   |分区4
主引导扇区|引导扇区|引导扇区|引导扇区|引导扇区|
各分区公用|各个分区相对独立,可安装不同操作系统。


对FAT结构的分区每一分区都有独立的引导记录,FDT表,FAT表等。同时,
系统还有一个最为重要的主引导记录。在0柱0面1扇区,今后我们用CYL代
表柱、SIDE代表面,SEC代表扇区。以下一个FAT结构分区的简图。

保留区- 磁盘参数表、DOS引导记录
控制区-FAT表1、FAT表2根目录区
数据区-数据区

以下简单介绍一下重要的部分:
主引导记录又称主分区表、MBR等等:MBR占一个扇区,在CYL 0、SIDE 0 
、SEC 1,由代码区和数据区构成。其中代码区是一端标准的程序,完成
BIOS自举到OS BOOT之间的工作,为OS启动做最后的准备。标准代码区可
以由FDISK/MBR重建,但对于多系统引导的不标准MBR,将被这一操作破坏
。MBR的数据区记录了分区情况。
系统扇区:CYL 0、SIDE 0 、SEC 1-CYL 0、SIDE 0 、SEC 63,共62个扇
区引导区又称BOOT区:CYL 0、SIDE 1 、SEC 1 这是我们过去称的DOS引
导区。也占一个扇区。
文件分配表又称FAT:是记录文件占用簇的情况和连接关系的地方。一般有
两个FAT表,起到备份的作用。FAT12、FAT16的第一FAT表一般均在0-1-2,
FAT32的第一FAT表在0-1-33。由于FAT表记录文件占用扇区连接的地方,如
果两个FAT表都坏了,后果不堪设想。
由于FAT表的长度与当前分区的大小有关所以FAT2的地址是需要计算的。
根目录区(ROOT、FDT):这里记录了根目录里的目录文件项等,ROOT区
跟在FAT2后面。
数据区:跟在ROOT区后面,这才是数据内容。
其实, MBR、隐含扇区、BOOT区,重建都比较容易。数据恢复的关键在
于恢复数据文件。由于FAT表记录了文件在硬盘上占用扇区的链表,如果
2个FAT表都完全损坏了。那么恢复文件,特别是占用多个不连续扇区文件
就相当困难了。
②、 主引导记录简单说明:
主引导记录是硬盘引导的起点,关于代码区不多说了,其数据区,比较重
要的是2个标志,80H和55AA,80H一般在偏移1BE处,80是分区激活的标志
的标记表示系统可引导,且整个分区表只能有一个80标记。另一个就是结
尾的55 AA标记,用来表示主引导记录是一个有效的记录。另外,各个分区
自身的引导记录,也是以55AA结束,这是我们查找分区的标志。我们后面
在介绍如何主引导记录中,给出了一个完整的分区表的例子,大家可对照
查看。数据区中,用10H字节表示一个分区,最多可表示4个分区,分别从
1BE、1CE、1DE、1EE开始,我们后面给出了分区表项对应地址的含义。大
家可以对应分析一下以下分区的情况。
80  01  01  00  0B  FE  BF  FC  3F  00-00 00 7E 86 BB 00
①      ②      ③       ④            ⑤        ⑥
①:激活标记,80表示可引导分区
②:分区开始的磁头号为01、开始的扇区号为01、开始的柱面号为00,由
于开始的扇区号为2进制6位,而开始的柱面号为2进制10位,因此扇区号所
用字节的高两位要加在柱面号高两位。
③:分区的系统类型FAT32(0B),01是FAT12,04为FAT16,06为BIGDOS,07为NTFS,
其他参见分区类型表。
④:分区结束磁头号254、分区结束扇区号63、分区结束柱面号764
⑤:首扇区的相对扇区号63
⑥:总扇区数12289622
2、常见手工处理工具与DOS外部命令介绍
DEBUG:古老和最为常见的调试跟踪软件,始终捆绑在微软的DOS/WIN9X
操作系统中。有19个子命令。有编写执行汇编指令,直接读写绝对扇区
和内存单元等功能,可以在最艰苦的条件下工作。DOS6.22以下的系统,
DEBUG.EXE在DOS目录下,WIN9X系统中它在WINDOWS\COMMAND目录下,它
也出现在WIN9X所生成的应急盘中。
DISKEDIT:常见16进制编辑软件,字符界面,可以以文件方式和扇区方
式读写逻辑内容,可以读写绝对扇区,可以方便的查找编辑分区表、FAT
表、ROOT区等重要扇区。这一点要比DEBUG更方便。但在一些重要扇区损
坏的情况下,DISKEDIT可能无法启动。DISKEDIT软件可以在著名的Norton
 Utilities软件包中找到。最新的DISKEDIT出现在NU4中。
NDD:常见的FAT文件结构磁盘修复工具,就是著名的NORTON磁盘医生,
可以自动修复分区丢失等情况,可以抢救软盘坏区中的数据,强制读
出后搬移到其他空白扇区。希望大家不要再使用NORTON FOR DOS7或8
的NDD,这个版本由于不支持大分区、FAT32、长文件名等技术,会给
你带来大量的麻烦。建议大家使用Norton Utilities4或更高版本中的
NDD.EXE,这是纯DOS下的工具。在硬盘崩溃或异常的情况下,他可能
可以带给用户以希望。WIN9X下的磁盘医生调用的并不是这个程序,而
是NDD32.EXE.
FDISK:FDISK当然是个危险的命令,很多人非常恐惧,事实上,FDISK
命令的运行并不影响任何分区内的硬盘数据,他对分区的设置操作,
只改变主分区表的数据区。而特别是FDISK异常重要的隐含参数/MBR,
可以重建主分区表的代码区,清除主引导型病毒等。这是非常有用的
操作。DOS6.22以下的系统,FDISK.EXE在DOS目录下,WIN9X系统中
它在WINDOWS\COMMAND目录下,它也出现在WIN9X所生成的应急盘中。
FORMAT:在一些人眼中,FORMAT是最可怕的命令,但他并不是对硬盘
清零,特别值得注意的是,很多文件恢复工具都建议你恢复前先FORMAT
该分区起到保护的饿作用。DOS6.22以下的系统,FORMAT.COM在DOS目录
下,WIN9X系统中它在WINDOWS\COMMAND目录下,它也出现在WIN9X所生
成的应急盘中。
HD-COPY:传统的软盘COPY工具,2.0版本以后加入了强制读的功能,
可以读出一些损坏扇区的内容。
SYS:SYS命令是重建BOOT区的最简洁的手段,也可以杀除BOOT区病毒。
DOS6.22以下的系统,sys.COM在DOS目录下,WIN9X系统中它在WINDOWS
\COMMAND目录下,它也出现在WIN9X所生成的应急盘中。

令我非常遗憾的是,至今我没有发现比较出色的扇区级备份镜象工具
,我曾写过一个HD-MIRROR,但由于错误较多,我提供下载的第二天
就停止了发布,另外fixc的作者noz写过一个clone.exe,但可惜只适
合相同的硬盘。我也曾以为GHOST可以做到这点,事实上,你目前还
不能指望他为你备份一块深度破损的硬盘。。如果有一个有效的能以
按扇区机制(而不是文件机制)压缩备份一块硬盘将之做成一个镜象
文件的话,那么我们的恢复工作就拥有了更多的保证和余地。我们可
以更大胆的做恢复的尝试。
3、 一些自动处理工具或软件包
首先介绍国内的一些免费修复工具
FIXMBR:何公道先生写的一个修复MBR的工具,适合处理逻辑分区丢
失的情况, 有一些可选参数,支持 FAT32、FAT16,不支持NTFS、
LINUX等分区,支持8.4G以上硬盘。可修复CIH发作后的扩展逻辑分区。
VRVFIX:北信源公司的推出的修复硬盘共享工具,适合处理逻辑分
区丢失的情况,处理的基本比较准确。支持FAT32、FAT16,不支持
NTFS、LINUX等分区。也不支持8。4G以上硬盘。
FIXC:国内最早出现的可以修复部分被CIH破坏的C盘的工具,作者是
NOZ,新版本也加入了修复分区信息的功能,支持FAT32、FAT16,有
限支持NTFS,不支持8。4G以上硬盘。目前的版本已经比较完善。
FIXHDPT:TBSOFT工作室的分区信息修复工具。支持FAT32、FAT16
,不支持NTFS和LINUX,不支持8。4G以上硬盘,是历史比较长的工
具之一。
RE(ReapirEasy):本人早期写的分区表修复工具,支持FAT32、FAT16,
有限支持NTFS,不支持8.4G
以上硬盘,和某些BIOS不兼容。其整体水准低于前面列举的工具。
国外一些系统维护的工具目前已经达到了非常强大的程度。
Norton Utilities:历史最悠久的系统维护工具。不仅可以数据恢
复,还可以系统加速和修补内存错误。目前最新的版本是NU 4.5 
FOR 9X、NU2 FOR NT等。
Tiramint:最为出色的灾难恢复工具之一,有NTFS、FAT32、FAT16、
NOVELL4种版本。生成急救软盘,可以对深度破坏的磁盘进行交叉恢复。
4、常用的基本操作
① 读出主引导记录:这是系统级数据恢复可能涉及最多的程序之一。
例:
DEBUG
-a100 ;从此处开始汇编
126C:0100 mov ax,201; 读操作一个扇区
126C:0103 mov bx,300; 送入地址300
126C:0106 mov cx,1 ;0面1扇
126C:0109 mov dx,80 ;80H为硬盘,头为0
126C:010C int 13
126C:010E int 3
126C:010F 
-g=100 ;执行
AX=0050  BX=0300  CX=0001  DX=0080  SP=FFEE  BP=0000  SI=0000  DI=0000  
DS=126C  ES=126C  SS=126C  CS=126C  IP=010E   NV UP EI PL NZ NA PO NC
这里用了I/O中断13,涉及的寄存器含义为
ah,操作方式,02H为读,03H为写
al,送扇区数
bx,送准备装入扇区的内存偏移地址
cx送从哪一道哪一扇区开始,我们一般依靠改换CX来读写不同逻辑
盘某个逻辑扇区。dx,送盘符和头数
INT 3是断点中断,使程序运行到此停止。
② 显示引导区内容:我们把扇区读到某个内存地址并不是目的。而
是为了看到他的内容,在DEBUG中D命令可以方便的查看内存单元的内容。
续前例,如果我们要看到主引导区的内容的话,既然装载到300。
-d300 l200就可以查看了,一个引导区的映象类似如下,可以直观的看
到我们前面所提到的代码区和数据区。是否正常请大家自行分析一下
126C:0300  33 C0 8E D0 BC 00 7C FB-50 07 50 1F FC BE 1B 7C   3.....|.P.P....|
126C:0310  BF 1B 06 50 57 B9 E5 01-F3 A4 CB BE BE 07 B1 04   ...PW...........
126C:0320  38 2C 7C 09 75 15 83 C6-10 E2 F5 CD 18 8B 14 8B   8,|.u...........
126C:0330  EE 83 C6 10 49 74 16 38-2C 74 F6 BE 10 07 4E AC   ....It.8,t....N.
126C:0340  3C 00 74 FA BB 07 00 B4-0E CD 10 EB F2 89 46 25   <.t...........F%
126C:0350  96 8A 46 04 B4 06 3C 0E-74 11 B4 0B 3C 0C 74 05   ..F...<.t...<.t.
126C:0360  3A C4 75 2B 40 C6 46 25-06 75 24 BB AA 55 50 B4   :.u+@.F%.u$..UP.
126C:0370  41 CD 13 58 72 16 81 FB-55 AA 75 10 F6 C1 01 74   A..Xr...U.u....t
126C:0380  0B 8A E0 88 56 24 C7 06-A1 06 EB 1E 88 66 04 BF   ....V$.......f..
126C:0390  0A 00 B8 01 02 8B DC 33-C9 83 FF 05 7F 03 8B 4E   .......3.......N
126C:03A0  25 03 4E 02 CD 13 72 29-BE 46 07 81 3E FE 7D 55   %.N...r).F..>.}U
126C:03B0  AA 74 5A 83 EF 05 7F DA-85 F6 75 83 BE 27 07 EB   .tZ.......u..'..
126C:03C0  8A 98 91 52 99 03 46 08-13 56 0A E8 12 00 5A EB   ...R..F..V....Z.
126C:03D0  D5 4F 74 E4 33 C0 CD 13-EB B8 00 00 00 00 00 00   .Ot.3...........
126C:03E0  56 33 F6 56 56 52 50 06-53 51 BE 10 00 56 8B F4   V3.VVRP.SQ...V..
126C:03F0  50 52 B8 00 42 8A 56 24-CD 13 5A 58 8D 64 10 72   PR..B.V$..ZX.d.r
126C:0400  0A 40 75 01 42 80 C7 02-E2 F7 F8 5E C3 EB 74 49   .@u.B......^..tI
126C:0410  6E 76 61 6C 69 64 20 70-61 72 74 69 74 69 6F 6E   nvalid partition
126C:0420  20 74 61 62 6C 65 00 45-72 72 6F 72 20 6C 6F 61    table.Error loa
126C:0430  64 69 6E 67 20 6F 70 65-72 61 74 69 6E 67 20 73   ding operating s
126C:0440  79 73 74 65 6D 00 4D 69-73 73 69 6E 67 20 6F 70   ystem.Missing op
126C:0450  65 72 61 74 69 6E 67 20-73 79 73 74 65 6D 00 00   erating system..
126C:0460  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................
126C:0470  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................
126C:0480  00 00 00 8B FC 1E 57 8B-F5 CB 00 00 00 00 00 00   ......W.........
126C:0490  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................
126C:04A0  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................
126C:04B0  00 00 00 00 00 00 00 00-00 00 00 00 00 00 80 01   ................
126C:04C0  01 00 0B FE BF FC 3F 00-00 00 7E 86 BB 00 00 00   ......?...~.....
126C:04D0  81 FD 0F FE FF FF BD 86-BB 00 E0 A9 75 00 00 00   ............u...
126C:04E0  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................
126C:04F0  00 00 00 00 00 00 00 00-00 00 00 00 00 00 55 AA   ..............U.
③ 反汇编主引导区内容:判定MBR的代码区是否正常,对于数据区的
基本情况,我们可以通过直观观察得出,但对于存在引导型病毒,或
者引导区出现异常代码的情况,我们可能需要分析MBR中代码区的指令
。这一般要对已经读入内存的引导区进行反汇编。
反汇编用指令U
续前例:
-u300 l15D ;反汇编主引导扇区代码区内容
126C:0300 33C0          XOR AX,AX                              
126C:0302 8ED0          MOV SS,AX                              
…………
126C:045C 65            DB 65                                 
126C:045D 6D            DB 6D
④ 写内存单元,在我们的前例中,主分区类型是0B是FAT32的,假定
这个类型实际是NTFS的,我们该如何修改呢?由于主分区类型的偏移
是4C3H,我们可以用E命令写到内存单元中,从附表中查得NTFS的类型
为07。因此 -e4c3 7再比如说,假定我们想把无效的分区表清零,那么
,我们应当用另一个命令F,这个命令可以用填充一个内存地址范围。
清零分区表的操作就是 -f4be 4ff 00,以下两个操作
也比较常见。
重置80标记,-e4be 80
重置55AA标记,-f4ff 4fe 55 aa
不要忘记了,此时仅仅是改动了内存中的数据,并未写到硬盘上。因
此需要用int 13中断把改写的结果,写回硬盘。
  续前例,
-a100
126C:0100 mov ax,301 ; 写操作一个扇区
-g=100 ;执行
  其实,我们相当于修改了刚才输入的读主引导扇区程序,使程序变为。
126C:0100 mov ax,301 ; 写操作一个扇区
126C:0103 mov bx,300 ;从内存地址300
126C:0106 mov cx,1   ;0面1扇
126C:0109 mov dx,80  ;80H为硬盘,头为0
126C:010C int 13
126C:010E int 3      ;断点
⑤ 绝对磁盘内容的读出与写入
类似操作在FAT32结构硬盘被CIH破坏的修复中比较常见,我们后面将讲
到恢复的基本思路就是用第二FAT表覆盖第一FAT表。那么无疑要读出第
二FAT表的内容,再回写到第一FAT表的位置上。一般的来说,大量连续
扇区的读出写入DISKEDIT进行非常方便,如果用DEBUG做则要写一段子程
序,不过程序的主要技巧就是利用int 25绝对磁盘读中断读出的内容,
而用int 26绝对磁盘写做内容写入。
4、数据可恢复的前提
  有人觉得这个题目说法比较奇特,但数据恢复,作为一个数据再现的
过程,一定要解决两个问题,第一是从哪里恢复的问题,第二是怎么恢
复的问题。解决了这两个问题,我们事实上就把握了数据恢复的全部思
想脉络。而这一部分就是从哪里恢复的问题。
①、 有效而及时的备份中是数据恢复最可靠的来源,在许多人倡导备
份到秒的今天,恐怕不会有人怀疑这点。而有些备份机制则是系统内建
的,比如两份FAT表。
②、 数据的实际有效性的判定是关键,对我们来说,硬盘无法自举、
文件找不到、文件打不开等现象,其实并不与数据丢失画等号。因为此
时往往数据只是从操作系统的角度是一种逻辑丢失,而从物理扇区意义
上,它仍然存在或部分存在。最明显的就是文件删除的例子,事实上,
这只是把文件首字节,改为0E而已。而此时文件体依然存在。
③、 数据损坏过程的可逆性分析:对数据的改变无非两种,取代和变
换,前者是不可逆的,而后者则是可逆的。我们以杀毒为例,对于大多
文件性病毒来说,那些以附加而非代换方式感染的文件型病毒,理想的
杀毒过程就是感染的逆过程。这种分析也常见与重要信息被隐藏搬移或
者被加密的情况,但分析将比较复杂。
④、 数据本身是否是标准信息:有些信息实际是通用或局部通用的,
你无须考虑如何从本机抢救。只要相同或相近的系统版本就可以了,
比如BOOT区、隐含扇区、WINDOWS的DLL文件等等。典型的例子如分区
表的代码区,这是一段标准代码,事实上,它就放在你的FDISK程序里
面,你可以用DEBUG把他提取出来。
⑤、 数据本身是否可以由其他信息统计再生:有些信息尽管丢失了,
也没有备份。但它实际可以从其他数据中间接求得。最典型的就是主
分区表中的分区信息,即使你把他清零也不必害怕,因为你可以从你
几个分区中计算再生。
⑥、 破坏的完成程度:事实上,FDISK、FORMAT都不会彻底破坏数据
,一般只有低格和扇区覆盖操作才会彻底破坏数据。但有时,破坏过
程或者误操作过程会因人工终止、死机等原因不能完成。最明显的就
是CIH病毒的例子,由于CIH是以1024字节为单位覆盖扇区,这当然是
不可逆过程,于是我们最初都认为,破坏是很难恢复的,除非人工终
止。事实上,当病毒覆盖某些扇区时会与9X系统发生冲突,从而造成
死机,使数据得到了保护。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 )|)             ●   |江海客     seak@163.net
\-----/               |之天涯看台 http://seak.163.net(163)
ぺべぺべぺべぺ                    http://personal.yn.cninfo.net/seak(169)           
        问人间沧桑几许;看书生胆气如何
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

※ 来源:.紫 丁 香 bbs.hit.edu.cn.[FROM: bbs.ndc.neu.edu.]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:206.807毫秒