ความเสียหายของข้อมูล (Data Corruption)
อย่างที่เราได้พูดถึงไปก่อนหน้านี้ว่า การที่แบ็คอัพไฟล์นั้นมี malware / ransomware ซ่อนตัวอยู่นั้น หรือด้วยเหตุผลอื่นใดเช่นความเสียหายที่เกิดขึ้นจากสื่อที่ใช้เก็บข้อมูล จะทำให้แบ็คอัพไฟล์นั้นเกิดความเสียหาย และแน่นอนว่าเมื่อมีการ restore ก็ไม่สามารถใช้งานได้และมีความเสียหายเกิดขึ้นเพราะระบบไม่สามารถกลับไปทำงานได้เหมือนเดิม และ องค์กรก็จะต้องพบกับฝันร้ายเมื่อทำการ restore ข้อมูลไม่ได้
ตัวอย่างเช่นเรามี Server อยู่ 1 ตัวที่ต้องการจะ restore และ ปรากฏว่าพื้นที่เก็บข้อมูลนั้นเกิดความเสียหายบางส่วน ทำให้แบ็คอัพไฟล์ที่เก็บไปนั้นเกิดความเสียหาย ซึ่งโดยปกติแล้วการทดสอบแบ็คอัพนั้นจะสามารถมองเห็นความเสียหายได้ แต่ถ้าท่านไม่ทำแน่นอนว่า การกู้ข้อมูลคืนหรือการ restore นั้นจะเป็นไปไม่ได้
ภัยธรรมชาติ
ไม่ว่าจะเป็นน้ำท่วม ไฟไหม้ หรือ แผ่นดินไหว นี่คือภัยธรรมชาติที่มีส่วนทำให้ท่านเข้าถึงข้อมูลไม่ได้ หรือว่า การเกิดโรคระบาด เช่น COVID ที่ผ่านมา เพราะก่อนหน้านั้นแน่นอนว่าบริษัทส่วนใหญ่นั้นใช้การเก็บข้อมูลในพื้นที่บริษัท (on-premise) หรือว่า อยู่ใน data center ที่ใกล้บริษัทที่สุด และ ส่วนใหญ่เข้าถึงข้อมูลผ่าน VPN แต่มันก็ไม่ใช้วิธีที่ดีที่สุด เพราะความซับซ้อนของ VPN เอง และ ความล่าช้าของการเข้าถึง ทำให้การเข้าถึงในช่วงโรคระบาดนั้นเป็นไปด้วยความทุลักทุเลไม่น้อย โดยเฉพาะเมื่อต้องการจะกู้ข้อมูลคืน เพราะว่าจะเข้าไปใน office ก็ไม่ได้ และ การเข้าถึงข้อมูลผ่าน VPN บางครั้งก็ช้าเกินไป
ปัญหาของ SaaS
มันเป็นความเข้าใจผิดที่ว่า ผู้ให้บริการ SaaS นั้นเป็นผู้รับผิดชอบเรื่องการสำรองข้อมูลให้กับท่าน และ ท่านไม่จำเป็นจะต้องทำการสำรองข้อมูลอีกแล้ว โดยผลการสำรวจของ 451 research พบว่าองค์กร 50% คิดว่าผู้ให้บริการ SaaS ทำการสำรองข้อมูลให้พวกเขา ในขณะที่ความจริงคือ ขึ้นอยู่กับนโยบายของแต่ละผู้ให้บริการ และ บางรายอาจจะมีการคิดค่าใช้จ่ายเพิ่ม นี่คือสมมติฐานที่ทำให้หลายคนพลาดในเรื่องการสำรองข้อมูล
ยกตัวอย่างง่ายๆ เลยเช่น Microsoft 365 ถ้าพนักงานเกิดทำการลบเอกสารไปสักชิ้นหนึ่ง เมื่อเวลาผ่านไป 1 เดือนท่านก็จะไม่สามารถกู้ข้อมูลคืนได้อีกต่อไป เมื่อถึงเวลาจะใช้งาน ท่านก็ไม่สามารถเข้าถึงเอกสารชิ้นนั้นอีกต่อไปแล้ว
บทที่ 3 สื่อสำหรับการเก็บแบ็คอัพไฟล์และ off-site
หากท่านทำตามกฏ 3-2-1 นั่นหมายความว่าท่านจะต้องมีการเก็บข้อมูลโดยใช้สื่อ 2 ประเภทเป็นอย่างน้อย และ ท่านจะต้องเก็บข้อมูลไว้ off-site ด้วย ซึ่งแน่นอนว่าจะต้องอยู่ห่างกันด้วยระยะทางที่ไกลพอสมควร ไม่ใช่เพียงแค่ตึกฝั่งตรงข้ามถนน เพราะถ้าเกิดภัยธรรมชาติแล้ว จะทำให้สถานที่ทั้งสองเข้าถึงไม่ได้ด้วย
Tape
Magnetic Tape นั้นเป็นสื่อในการเก็บข้อมูลที่มีราคาถูก เมื่อเทียบ ราคา/MB ยกตัวอย่างเช่น IBM magnetic tape storage ซึ่งมีความจุถึง 580TB ต่อหนึ่งม้วน และ ที่สำคัญสามารถเก็บข้อมูลไว้ได้นานเป็นสิบปี ตราบใดที่ท่านไม่เก็บไว้ในที่ความร้อนสูงหรือความชื้นสูง และ แน่นอนว่า การเก็บส่วนใหญ่ก็จะเก็บนอกสถานที่เช่น ธนาคาร ที่รับเก็บ หรือ บริษัทภายนอกที่รับเก็บ เพราะฉะนั้นเราเรียกว่ามันจะมี air gap ระหว่าง production และ ข้อมูลสำรอง เพราะมันไม่ได้ on-line อยู่
แต่พวกมันก็มีข้อเสียคือ การดึงข้อมูลนั้นช้า เมื่อท่านต้องการ restore ทำให้การสำรองข้อมูลลงเทปนั้นเหมาะกับการทำ archive และข้อมูลที่เป็น lower-tier
Hard drive
ฮาร์ดดิกส์นั้นเป็นสื่อที่มีความเสถียร และ มีค่าความเสี่ยงต่อความเสียหายอยู่ที่ 1% ต่อปี แน่นอนว่ามันไม่ได้มีราคาถูกแบบ Tape แต่มันก็ไม่ได้มีราคาแพงมากในปัจจุบัน และ มันสามารถทำ RAID ได้หรือใช้เป็น NAS ได้ เพราะฉะนั้นการกู้คืนจะเร็วมาก แต่อย่างไรก็ตามเนื่องจากมันใช้จานหมุนเพราะฉะนั้นความคงทนก็จะน้อยว่าเทป เช่นการทำหล่นก็อาจจะทำให้ฮาร์ดดิสก์พังได้ทันที
Optical Drive
แผ่น optical เช่น CD,DVD, Blu-Ray ไม่สามารถเก็บข้อมูลในปริมาณเยอะๆ ได้ เช่น Blu-Ray เก็บข้อมูลได้เพียง 50Gb มันสามารถทนต่อสนามแม่เหล็กไฟฟ้าได้ แต่อย่างไรก็ตามมันไม่ได้ทนต่อการขีดข่วน มันสามารถเก็บไว้ได้นาน เป็น 10 ปีเช่นเดียวกัน และเนื่องจากมันสามารถูกเขียนได้เพียงครั้งเดียว มันจึงทนทานต่อ ransomware เพราะไม่สามารถเขียนทับได้
Solid State drive
ถ้าความเร็วคือสิ่งที่คุณต้องการ SSD คือสิ่งที่จะตอบโจทย์ท่านได้ เพราะมันเป็นวงจรอิเล็กทรอนิกส์ที่ไม่มีชิ้นส่วนเคลื่อนไหว แต่ข้อเสียคือราคาแพง มันเหมาะกับการทำแบ็คอัพเพราะว่ากู้ข้อมูลคืนได้รวดเร็ว
Snapshot Storage
ปัจจุบันนี้ Storage Area Network (SAN) นั้นมีคุณสมบัติการทำ snapshot ได้แล้ว เราเรียกว่าเป็นการทำ snapshot ในระดับ hardware ซึ่งมีความเร็วสูงมาก และในบางครั้งนั้นมันอาจจะเร็วกว่า DAS ด้วยซ้ำไป และ ด้วยความเร็วดังกล่าว ทำให้มันไม่กระทบกับ production และ แน่นอนว่า มันก็เร็วในการที่จะ restore ข้อมูลด้วย โดยอุปกรณ์ที่สามารถทำ storage snapshot ได้ส่วนใหญ่จะเป็น SAN ในยุคใหม่ที่เป็น software based SAN
แต่มันก็จะมีข้อเสียอยู่นิดหน่อย เพราะว่า snapshot ที่เราเก็บไว้นั้น มันก็จะเก็บอยู่ที่เดียวกับ production เพราะอยู่ใน chassis ตัวเดียวกัน นั่นหมายถึงถ้าอุปกรณ์พัง มันก็จะทำให้ทั้ง production และ snapshot นั้นหายไปด้วยโดยธรรมชาติ
Deduplication appliance
อุปกรณ์ที่มีคุณสมบัตินี้ สามารถช่วยให้ท่านประหยัดเนื้อที่ในการเก็บข้อมูลได้มากโขอยู่ทีเดียว มันเหมาะกับการเก็บแบ็คอัพไฟล์แบบระยะยาว เนื่องจากเทคนิค deduplication ช่วยให้ประหยัดเนื้อที่แต่ก็มีข้อเสีย เช่นเดียวกับการ zip file นั่นคือการ restore ก็จะใช้เวลานานกว่าไม่ได้ใช้ deduplication นิดหน่อย
The Cloud
Cloud นั้นเราเรียกว่ามันเป็นทั้งสื่อ หรือ medium ในการเก็บข้อมูลรูปแบบหนึ่ง และ ถ้าพูดถึง cloud storage มันมีคุณสมบัติเป็น hyperscale หรือการขยายได้ดี โดยทั่วๆ ไปแล้วจะแบ่งออกเป็น
- Object Storage : Amazon S3 Storage นั้นเป็นตัวอย่างหนึ่งของ object storage ที่มีการใช้งานอย่างแพร่หลาย โดยทำไมถึงเรียกว่า เป็น object นั้นก็เพราะว่า แต่ละส่วนของข้อมูลนั้นเราจะเรียกมันว่าเป็น object โดยมันเป็นการรวมตัวของ metadata และ uuid เข้าด้วยกันใน storage pool ทำให้มันสามารถขยายตัวได้แบบไม่จำกัด มันมีความยืดหยุ่นสูง เพราะฉะนั้นมันเลยทำให้มีคุณสมบัติแบบ immutable และสามารถป้องกัน ransomware ได้ในตัว กรณีที่ท่านเปิดใช้ฟีเจอร์ดังกล่าว
- File Storage : แต่ละส่วนของข้อมูลนั้นจะถูกเก็บไว้ใน file system และโครงสร้างต้นไม้หรือ hierarchy ทำให้มันจัดการได้ง่าย แต่มีข้อจำกัดอยู่หลายอย่าง
- Block Storage : เช่นเดียวกับ DAS หรือ SAN เนื้อที่เก็บข้อมูลชนิดนี้ จะถูกแบ่งออกเป็น block โดยมี address กำกับอยู่ มันเหมาะกับการเก็บข้อมูลจำนวนมาก แต่ก็ไม่ได้เหมาะกับการเก็บแบ็คอัพมากนัก
- Cold Storage : เรากำลังพูดถึงบริการเช่น Amazon Glacier เพราะว่ามันคือการเก็บข้อมูลบนเนื้อที่ที่ราคาถูกกว่า การดึงข้อมูลกลับหรือ restore อาจจะใช้เวลานาน มันเหมาะกับการทำ archive
Cloud นั้นเป็นปลายทางของการเก็บแบ็คอัพที่ได้รับความนิยมเพิ่มขึ้นอย่างรวดเร็ว มันเป็นการเก็บ off-site ที่ดีมากๆ โดยหลายคนก็ใช้ cloud มาแทน tape เพราะเท่ากับว่าท่านก็จะได้เก็บข้อมูลตามกฏ 3-2-1 โดยที่มี off-site ในราคาที่ไม่แพง และ การเข้าถึงข้อมูลก็ทำได้แบบออนไลน์ทันที ไม่ต้องอาศัยนำเทปกลับมาเข้าเครื่องอ่านซึ่งกินเวลามาก
แน่นอนว่ามีข้อดีก็จะต้องมีข้อเสีย การ restore จาก cloud นั้นก็ไม่ใช่เรื่องง่ายซะทีเดียว และ ส่วนใหญ่แล้วเมื่อท่านดึงข้อมูลกลับมา restore นั้นท่านก็จะต้องเสียค่าชาร์จในการใช้ network download (egress fees) ซึ่งผู้ให้บริการส่วนใหญ่คิด แต่ก็มีบางรายไม่คิด และ เนื่องจากข้อมูลเป็นจำนวนมากที่ต้องขนย้ายมา โดยเฉพาะอย่างยิ่ง ถ้า data center ของผู้ให้บริการายนั้นไม่ได้อยู่ในประเทศของคุณเรื่อง latency ก็เป็นเรื่องใหญ่ที่ต้องคิด
เรื่องต่อมาคือ ดึงข้อมูลมา restore แล้วจะขึ้น production ที่ไหน แน่นอนว่า การ restore ไปเป็น vm ใน cloud นั้นย่อมทำได้ ปัจจุบันนั้นทำได้กับผู้ให้บริการบางราย แต่ไม่ใช่ทุกราย และ ต้องอาศัยความรู้พอสมควรเลย
การทำงานร่วมกับ backup provider
ในปัจจุบันมีผู้ให้บริการ backup as a service (BaaS) เกิดขึ้นหลายราย และ หลายรายก็ทำงานร่วมมือกับผู้สร้างโปรแกรมสำรองข้อมูลชั้นนำเช่น Veeam ซึ่งทำให้การ backup & restore ไปยัง cloud นั้นทำได้ง่ายขึ้น
บทที่ 4 แบ็คอัพของคุณนั้นดีพอหรือยัง ?
หากจะพูดถึงเรื่องการปกป้องข้อมูลแล้ว เพียงแค่การ สำรองข้อมูลและการทำ replication นั้นคงจะไม่เพียงพอแน่นอน ถึงแม้ว่าคุณจะทำมันด้วยความถี่เพียงเท่าใดก็ตาม (backup interval) ถึงแม้ว่าท่านจะมั่นใจว่าสิ่งที่ท่านสำรองไปนั้นใช้งานได้ 100% แต่การ restore ข้อมูลกลับมานั้นก็เป็นอีกเรื่องหนึ่ง เพราะอะไรล่ะ ? ก็เพราะว่าสิ่งที่ท่านทำการสำรองไปนั้นมันก็เป็นเพียงข้อมูลแบบหนึ่ง ซึ่งหากไม่ได้ทำการทดสอบอย่างสม่ำเสมอ คุณจะไม่รู้เลยว่าอะไรจะเกิดขึ้นเมื่อท่านทำการ restore แล้วโชคชะตาก็มักเล่นตลกด้วยซิเมื่อเวลาหน้าสิ่วหน้าขวาน
คุณจะไม่มีทางรู้เลยว่า ข้อมูลที่สำรองไปนั้นอาจจะมีอะไรซ่อนอยู่เช่น malware หรือ ransomware หรือมี data corruption ที่อาจจะเกิดจาก disk ก็เป็นไปได้ ซึ่งเมื่อเกิดขึ้นและทำการ backup chain เสียหาย แน่นอนว่า ช่วงของการกู้ข้อมูลคืนก็จะหายไป โดยเฉพาะอย่างวิ่งการใช้ chain ยาวๆ ซึ่งก็หมายถึง retention นั่นเอง
ความหวังอันสูงสุด
การปกป้องข้อมูลในอดีตนั้นเป็นเรื่องที่ง่ายๆ เมื่อบริษัทเวลาทำการ เราก็แค่แบ็คอัพข้อมูลลงเทปหรือดิสก์ หลังจากนั้นก็เก็บเทปไว้สักเดือนก่อนนำไปเก็บไว้ที่อื่น ปัญหาคือ recovery point objective (RPO) หรือท่านรับได้ต่อการสูญเสียข้อมูลย้อนหลังได้นานแค่ไหน
จากการสำรวจของ 451Research พบว่า 57% ของผู้ตอบแบบสอบถาม พวกเขาต้องการให้ได้ข้อมูลอย่างน้อย 1 ชม.ย้อนหลังไป และ 20% บอกว่าแค่หลักนาที หากถามถึง Recovery time objective (RTO) หรือเวลาที่ระบบกลับมาใช้ได้นานแค่ไหน กลุ่มผู้ตอบแบบสอบถามบอกว่า 1 ชม.ก็นานเกินไปแล้ว
เมื่อเวลาเปลี่ยนทุกอย่างย่อมเปลี่ยนไป ปัจจุบันนี้องค์กรและภาคธุรกิจต้องการทั้ง RPO & RTO ที่ต่ำมาก นั่นเป็นเพราะธุรกิจและความเป็นอยู่รอดขององค์กรนั้นคือ การเข้าถึงข้อมูล
แล้วทำไมเราต้องทดสอบแบ็คอัพ ?
เราลองคิดถึงการกระจายเสียงแบบฉุกเฉิน เช่นการแจ้งเตือนซึนามิหรือไม่ เราจำเป็นจะต้องทำการทดสอบระบบกระจายเสียงก็เพราะว่า ในภาวะฉุกเฉินไม่ว่าจะเรื่องอะไร มันเป็นสิ่งสำคัญในการที่จะรับมือกับวิกฤต เช่นเดียวกันนั่นคือ ทำไมเราต้องทดสอบแบ็คอัพของเรา เราทำเพื่อให้แน่ใจว่าสิ่งที่เราแบ็คอัพไปนั้นจะกลับมาช่วยเราได้ทันท่วงที
ท่านจะต้องทำทุกอย่างเพื่อให้แน่ใจว่าข้อมูลที่อยู่ในแบ็คอัพนั้นจะต้องเป็นข้อมูลที่สมบูรณ์ และ แอฟลิเคชั่นนั้นจะต้องกลับมาทำงานอีกครั้งเมื่อเราทำการ restore
โดยหลักการแล้วท่านจะต้องทำการทดสอบแบ็คอัพทุกครั้งหลังจาก backup job ทำงานเสร็จสิ้น และ จะต้องตั้งเวลาทดสอบอย่างสม่ำเสมอโชคดีที่ซอฟต์แวร์สำรองขอมูลสมัยใหม่นั้น ช่วยให้งานทดสอบแบ็คอัพนั้นเป็นเรื่องง่ายและสามารถตั้งเวลาเปิดแบ็คอัพทดสอบล่วงหน้าได้