(Post 1/11/2005)
Hầu như bất kỳ database nào
cũng cần được phục hồi (restore) vào một lúc nào đó trong suốt chu kỳ
sống của nó. Là một người Database Administrator bạn phải dự phòng các
biến cố có thể xảy ra và bảo đảm rằng có thể nhanh chóng phục hồi dữ liệu
trong thời gian sớm nhất có thể được…
Chiến lược phục hồi dữ liệu
Có một điều mà chúng ta phải chú ý là hầu như bất kỳ
database nào cũng cần được phục hồi (restore) vào một lúc nào đó trong
suốt chu kỳ sống của nó. Là một người Database Administrator bạn cần phải
giảm tối đa số lần phải phục hồi dữ liệu, luôn theo dõi, kiểm tra thường
xuyên để phát hiện các trục trặc trước khi nó xảy ra. Phải dự phòng các
biến cố có thể xảy ra và bảo đảm rằng có thể nhanh chóng phục hồi dữ liệu
trong thời gian sớm nhất có thể được.
Các dạng biến cố hay tai họa có thể xảy ra là:
- Ðĩa chứa data file hay Transaction Log File hay system file bị
mất
- Server bị hư hỏng
- Những thảm họa tự nhiên như bão lụt, động đất, hỏa hoạn
- Toàn bộ server bị đánh cắp hoặc phá hủy Các thiết bị dùng để backup
- restore bị đánh cắp hay hư hỏng
- Những lỗi do vô ý của user như lỡ tay delete toàn bộ table chẳng
hạn
- Những hành vi mang tính phá hoại của nhân viên như cố ý đưa vào
những thông tin sai lạc.
- Bị hack (nếu server có kết nối với internet).
Bạn phải tự hỏi khi các vấn đề trên xảy ra thì bạn sẽ
làm gì và phải luôn có biện pháp đề phòng cụ thể cho từng trường hợp cụ
thể. Ngoài ra bạn phải xác định thời gian tối thiểu cần phục hồi dữ liệu
và đưa server trở lại hoạt động bình thường.
Các loại Backup
Ðể có thể hiểu các kiểu phục hồi dữ liệu khác nhau bạn
phải biết qua các loại backup trong SQL Server:
- Full Database Backups: Copy tất cả data files
trong một database. Tất cả những user data và database objects như
system tables, indexes, user-defined tables đều được backup.
- Differential Database Backups: Copy những thay
đổi trong tất cả data files kể từ lần full backup gần nhất.
- File or File Group Backups: Copy một data file
đơn hay một file group.
- Differential File or File Group Backups: Tương
tự như differential database backup nhưng chỉ copy những thay đổi
trong data file đơn hay một file group.
- Transaction Log Backups: Ghi nhận một cách thứ
tự tất cả các transactions chứa trong transaction log file kể từ lần
transaction log backup gần nhất. Loại backup này cho phép ta phục
hồi dữ liệu trở ngược lại vào một thời điểm nào đó trong quá khứ mà
vẫn đảm bảo tính đồng nhất (consistent).
Trong lúc backup SQL Server cũng copy tất cả các hoạt
động của database kể cả hoạt động xảy ra trong quá trình backup cho nên
ta có thể backup trong khi SQL đang chạy mà không cần phải ngưng lại.
Các kiểu Restore
- Full Recovery Model: Ðây là model cho phép phục
hồi dữ liệu với ít rủi ro nhất. Nếu một database ở trong mode này
thì tất cả các hoạt động không chỉ insert, update, delete mà kể cả
insert bằng Bulk Insert, hay bcp đều được log vào transaction log
file. Khi có sự cố thì ta có thể phục hồi lại dữ liệu ngược trở lại
tới một thời điểm trong quá khứ. Khi data file bị hư nếu ta có thể
backup được transaction log file thì ta có thể phục hồi database đến
thời điểm transaction gần nhất được commited.
- Bulk-Logged Recovery Model: Ở mode này các hoạt
động mang tính hàng loạt như Bulk Insert, bcp, Create Index, WriteText,
UpdateText chỉ được log minimum vào transaction log file đủ để cho
biết là các hoạt động này có diễn ra mà không log toàn bộ chi tiết
như trong Full Recovery Mode. Các hoạt động khác như Insert, Update,
Delete vẫn được log đầy đủ để dùng cho việc phục hồi sau này.
- Simple Recovery Model: Ở mode này thì Transaction
Log File được truncate thường xuyên và không cần backup. Với mode
này bạn chỉ có thể phục hồi tới thời điểm backup gần nhất mà không
thể phục hồi tới một thời điểm trong quá khứ.
Muốn biết database của bạn đang ở mode nào bạn có thể
Right-click lên một database nào đó trong SQL Server
Enterprise Manager chọn Properties->Options->Recovery
Tuy nhiên có thể tới đây bạn cảm thấy rất khó hiểu về
những điều trình bày ở trên. Chúng ta hãy dùng một ví dụ sau để làm rõ
vấn đề. Chúng ta có một database được áp dụng chiến lược backup như hình
vẽ sau:
Trong ví dụ này ta schedule một Full Database Backup
vào ngày Chủ Nhật và Differential Backup vào các ngày thứ Ba và Thứ Năm.
Transaction Log Backup được schedule hằng ngày. Vào một ngày Thứ Sáu "đen
tối" một sự cố xảy ra đó là đĩa chứa data file của database bị hư
và là một DBA bạn được yêu cầu phải phục hồi dữ liệu và đưa database trở
lại hoạt động bình thường. Bạn phải làm sao?
Trước hết bạn phải backup ngay Transaction Log File (Trong
ví dụ này Transaction Log File được chứa trong một đĩa khác với đĩa chứa
Data File nên không bị hư và vẫn còn hoạt động). Người ta còn gọi file
backup trong trường hợp này là " the tail of the log" (cái đuôi).
Nếu Log File được chứa trên cùng một đĩa với Data file thì bạn có thể
sẽ không backup được "cái đuôi" và như vậy bạn phải dùng đến
log file backup gần nhất. Khi backup "cái đuôi" này bạn cần
phải dùng option NO_TRUNCATE bởi vì thông thường các
Transaction Log Backup sẽ truncate(xoá) những phần không cần dùng đến
trong transaction log file, đó là những transaction đã được commited và
đã được viết vào database (còn gọi là inactive portion of the transaction
log) để giảm kích thước của log file. Tuy nhiên khi backup phần đuôi không
được truncate để đảm bảo tính consistent (nhất quán) của database.
Kế đến bạn phải restore database từ Full Backup File
của ngày Chủ Nhật. Nó sẽ làm 2 chuyện: copy data, log, index... từ đĩa
backup vào Data Files và sau đó sẽ lần lượt thực thi các transaction trong
transaction log. Lưu ý ta phải dùng option WITH NORECOVERY
trong trường hợp này (tức là option thứ 2 "Leave database
nonoperational but able to restore additional transaction logs"
trong Enterprise Manager). Nghĩa là các transaction chưa hoàn tất (incomplete
transaction) sẽ không được roll back. Như vậy database
lúc này sẽ ở trong tình trạng inconsistent và không
thể dùng được. Nếu ta chọn WITH RECOVERY (hay
"Leave database operational. No additional transaction logs
can be restored" trong Enterprise Manager) thì các incomplete
transaction sẽ được roll back và database ở trạng thái consistent
nhưng ta không thể nào restore các transaction log backup được nữa.
Tiếp theo bạn phải restore Differential Backup của ngày
Thứ Năm. Sau đó lần lượt restore các Transaction Log Backup kể từ sau
lần Differential Backup cuối cùng nghĩa là restore Transaction Log Backup
của ngày Thứ Năm và "Cái Ðuôi". Như vậy ta có thể phục hồi data
trở về trạng thái trước khi biến cố xảy ra. Quá trình này gọi là Database
Recovery.
Cũng xin làm rõ cách dùng từ Database Restoration
và Database Recovery trong SQL Server. Hai từ này nếu
dịch ra tiếng Việt đều có nghĩa là phục hồi cơ sở dữ liệu nhưng khi đọc
sách tiếng Anh phải cẩn thận vì nó có nghĩa hơi khác nhau.
Như trong ví dụ trên khi ta restore
database từ một file backup nghĩa là chỉ đơn giản tái tạo lại database
từ những file backup và thực thi lại những transaction đã được commit
nhưng database có thể ở trong trạng thái inconsistent và không sử dụng
được. Nhưng khi nói đến recover nghĩa là ta không chỉ
phục hồi lại data mà còn bảo đảm cho nó ở trạng thái nhất quán dữ liệu
(consistent) và sử dụng được (usable).
Có thể bạn sẽ hỏi consistent là thế
nào? Xin dùng một ví dụ đơn giản để giải thích: xem xét một giao dịch
chuyển tiền $500 từ tài khoản A vào tài khoản B, giả sử số tiền $500 được
trừ khỏi tài khoản A nhưng lại không được cộng vào tài khoản B và nếu
database không được quá trình khôi phục dữ liệu tự động (automatic recovery
process) của SQL rollback thì nó sẽ ở trạng thái inconsistent.
Nếu database ở trạng thái giống như trước khi trừ tiền hoặc sau khi đã
cộng $500 thành công vào account B thì gọi là consistent.
Cho nên việc backup Transaction Log File sẽ giúp cho
việc recovery data tới bất kỳ thời điểm nào trong quá khứ. Ðối với Simple
Recovery Model ta chỉ có thể recover tới lần backup gần nhất mà thôi.
Như vậy khi restore database ta có thể chọn option WITH
RECOVERY để roll back các transaction chưa được commited và database có
thể hoạt động bình thường nhưng ta không thể restore thêm backup file
nào nữa, thường option này được chọn khi restore file backup cuối cùng
trong chuỗi backup. Nếu chọn option WITH NORECOVERY các transaction chưa
được commited sẽ không được roll back do đó SQL Server sẽ không cho phép
ta sử dụng database nhưng ta có thể tiếp tục restore các file backup kế
tiếp, thường option này được chọn khi sau đó ta còn phải restore các file
backup khác.
Không lẽ chỉ có thể chọn một trong hai option trên mà
thôi hay sao? Không hoàn toàn như vậy ta có thể chọn một option trung
lập hơn là option WITH STANDBY (tức là option 3 "Leave database
read-only and able to restore additional transaction logs"
trong Enterprise Manager). Với option này ta sẽ có luôn đặc tính của hai
option trên : các incomplete transaction sẽ được roll back để đảm bảo
database consistent và có thể sử dụng được nhưng chỉ dưới dạng Read-only
mà thôi, đồng thời sau đó ta có thể tiếp tục restore các file backup còn
lại (SQL Server sẽ log các transaction được roll back trong undo log file
và khi ta restore backup file kế tiếp SQL Server sẽ trả lại trạng thái
no recovery từ những gì ghi trên undo file). Người ta dùng option này
khi muốn restore database trở lại một thời điểm nào đó (a point in time)
nhưng không rõ là đó có phải là thời điểm mà họ muốn không, cho nên họ
sẽ restore từng backup file ở dạng Standby và kiểm chứng một số data xem
đó có phải là thời điểm mà họ muốn restore hay không (chẳng hạn như trước
khi bị delete hay trước khi một transaction nào đó được thực thi) trước
khi chuyển sang Recovery option.
Backup dữ liệu
Trong phần này chúng ta sẽ bàn về cách backup database.
Nhưng trước hết chúng ta hãy làm quen với một số thuật ngữ dùng trong
quá trình backup và restore. Có những từ ta sẽ để nguyên tiếng Anh mà
không dịch.
Thuật
Ngữ |
Giải
Thích |
Backup |
Quá trình copy toàn bộ hay một phần của database, transaction
log, file hay file group hình thành một backup set. Backup set được
chứa trên backup media (tape or disk) bằng cách sử dụng một backup
device (tape drive name hay physical filename) |
Backup Device |
Một file vật lý (như C:\SQLBackups\Full.bak) hay tape drive cụ
thể (như \\.\Tape0) dùng để record một backup vào một backup media.
|
Backup File |
File chứa một backup set |
Backup Media |
Disk hay tape được sử dụng để chứa một backup set. Backup media
có thể chứa nhiều backup sets (ví dụ như từ nhiều SQL Server 2000
backups và từ nhiều Windows 2000 backups). |
Backup Set |
Một bộ backup từ một lần backup đơn được chứa trên backup media.
|
Chúng ta có thể tạo một backup device cố định (permanent)
hay tạo ra một backup file mới cho mỗi lần backup. Thông thường chúng
ta sẽ tạo một backup device cố định để có thể dùng đi dùng lại đặc biệt
cho việc tự động hóa công việc backup. Ðể tạo một backup device dùng Enterprise
Manager bạn chọn Management->Backup
rồi Right-click->New Backup Device.
Ngoài ra bạn có thể dùng sp_addumpdevice system stored
procedure như ví dụ sau:
USE Master
Go
Sp_addumpdevice 'disk' , 'FullBackupDevice' , 'E:\SQLBackups\Full.bak'
Ðể backup database bạn có thể dùng Backup Wizard hoặc
click lên trên database muốn backup sau đó Right-click->All
Tasks->Backup Database... sẽ hiện ra window như hình vẽ sau:
Sau đó dựa tùy theo yêu cầu của database mà chọn các
option thích hợp. Ta có thể schedule cho SQL Server backup định kỳ.
Restore dữ liệu
Trước khi restore database ta phải xác định được thứ
tự file cần restore. Các thông tin này được SQL Server chứa trong msdb
database và sẽ cho ta biết backup device nào, ai backup vào thời
điểm nào. Sau đó ta tiến hành restore. Ðể restore bạn Right-click->All
Tasks->Restore database... sẽ thấy window như hình vẽ sau:
Nếu bạn restore từ một instance khác của SQL Server hay
từ một server khác bạn có chọn From device option và
chọn backup device (file backup) tương ứng.
Lưu ý nếu bạn muốn overwrite database có sẵn với data
được backup bạn có thể chọn option Force restore over existing
database như hình vẽ sau:
Bạn có thể chọn leave database operational hay non operational
tùy theo trường hợp như đã giải thích ở trên.
Tóm lại trong bài này chúng ta đã tìm hiểu một chút lý
thuyết về backup và restore database trong SQL Server. Ðể có thể hiểu
rõ hơn bạn cần phải thực tập hay làm thử để có thêm kinh nghiệm.
(theo www.vovisoft.com)
|