
Cloudflare กำลังตรวจสอบปัญหาระบบล่ม ที่ส่งผลกระทบต่อบริการต่าง ๆ ทั่วโลก โดยผู้ใช้งานจะพบข้อความ "internal server error" เมื่อพยายามเข้าถึงเว็บไซต์ และแพลตฟอร์มออนไลน์ที่ได้รับผลกระทบ
เครือข่ายของ Cloudflare คือโครงสร้างพื้นฐานของเซิร์ฟเวอร์ และศูนย์ข้อมูลทั่วโลก โดยตั้งอยู่ในกว่า 330 เมือง ครอบคลุมกว่า 120 ประเทศ ให้บริการด้าน content, รักษาความปลอดภัย และเพิ่มประสิทธิภาพการทำงาน
Cloudflare มี capacity ของเครือข่ายทั่วโลกกว่า 449 Tbps และ Cloudflare เชื่อมต่อกับเครือข่ายมากกว่า 13,000 เครือข่าย ซึ่งรวมถึง ISP รายใหญ่ทุกราย, ผู้ให้บริการคลาวด์ และองค์กรธุรกิจทั่วโลก
โดย Cloudflare ได้รับทราบถึงปัญหาที่เกิดขึ้นนี้เป็นครั้งแรกเมื่อราว ๆ 18:18 น. ของวันที่ 18 พฤศจิกายน 2025 ตามเวลาในประเทศไทย โดยมีรายงานว่า support portal ของบริษัทไม่สามารถเข้าใช้งานได้
จากนั้นอีกประมาณครึ่งชม. เวลา 18:48 น. Cloudflare ได้เพิ่มรายงานเหตุการณ์ใหม่เพื่อแจ้งเตือนลูกค้าว่า Cloudflare Global Network ก็กำลังประสบปัญหาเช่นกัน
บริษัทระบุว่า "Cloudflare ได้รับทราบ และกำลังตรวจสอบปัญหาที่ส่งผลกระทบต่อลูกค้าหลายราย ได้แก่ การพบ status code 500 errors บนเว็บไซต์จำนวนมาก, Cloudflare Dashboard และ API ที่ไม่สามารถใช้งานได้ โดยบริษัทกำลังดำเนินการเพื่อรวบรวมผลกระทบทั้งหมด และแก้ไขปัญหา ซึ่งจะมีการอัปเดตเพิ่มเติมในเร็ว ๆ นี้"
แม้ว่า Cloudflare จะยังไม่ได้เปิดเผยข้อมูลเพิ่มเติมเกี่ยวกับขอบเขตของเหตุการณ์นี้ แต่ก็พบว่า Cloudflare nodes ทั่วยุโรปใช้งานไม่ได้ รวมถึง nodes ในบูคาเรสต์, ซูริก, วอร์ซอ, ออสโล, อัมสเตอร์ดัม, เบอร์ลิน, แฟรงก์เฟิร์ต, เวียนนา, สตอกโฮล์ม และฮัมบูร์ก


ในขณะเดียวกัน บริการตรวจสอบการขัดข้อง Downdetector ได้รับรายงานหลายหมื่นรายการนับตั้งแต่เกิดเหตุการณ์ขัดข้อง โดยผู้ใช้ที่ได้รับผลกระทบประสบปัญหาเกี่ยวกับการเชื่อมต่อเซิร์ฟเวอร์, เว็บไซต์ และโฮสต์ติ้ง
แม้อาจจะไม่เกี่ยวข้องกับเหตุการณ์ที่เกิดขึ้นนี้ แต่ผู้ใช้ Downdetector หลายแสนรายก็รายงานปัญหาขณะพยายามใช้งาน และเชื่อมต่อกับบริการออนไลน์ต่าง ๆ เช่น Spotify, Twitter, OpenAI, League of Legends, Valorant, AWS และ Google
ก่อนหน้านี้ในเดือนตุลาคม Cloudflare เคยประสบปัญหาการขัดข้องครั้งใหญ่ที่เกิดจาก DNS failure ซึ่งส่งผลกระทบกับการเชื่อมต่อกับเว็บไซต์ และแพลตฟอร์มออนไลน์หลายล้านแห่งบนแพลตฟอร์ม Amazon Web Services (AWS)
อัปเดต 18 พฤศจิกายน เวลา 19:21 น. ขณะนี้ Cloudflare เริ่มกลับมาใช้งานได้บางส่วน
Cloudflare ระบุว่า "บริการต่าง ๆ เริ่มกลับมาใช้งานได้ตามปกติ แต่ผู้ใช้งานอาจยังคงพบ errors ที่สูงขึ้นกว่าปกติ ขณะที่บริษัทยังคงดำเนินการแก้ไขปัญหาต่อไป"
อัปเดต 18 พฤศจิกายน เวลา 20:13 น. บริการบางส่วนกลับมาใช้งานได้ตามปกติแล้ว ขณะที่ยังคงดำเนินการกับบริการที่เหลือ
Cloudflare ระบุว่า "บริษัทได้ทำการเปลี่ยนแปลงที่ทำให้ Cloudflare Access และ WARP สามารถกลับมาใช้งานได้ตามปกติ และกำลังดำเนินการกู้คืนบริการสำหรับ application services customers ต่อไป"
อัปเดต 19 พฤศจิกายน เวลา 00:44 น. หลังจากเกิดการขัดข้องเป็นเวลาหกชั่วโมง Cloudflare ระบุว่าปัญหาทั้งหมดได้รับการแก้ไขแล้ว
Cloudflare ระบุว่า "ขณะนี้บริการ Cloudflare ทั้งหมดกลับมาทำงานได้ตามปกติ ไม่พบ errors หรือความล่าช้าที่เพิ่มขึ้นอีกในปัจจุบัน"
"ทีมวิศวกรของบริษัทยังคงเฝ้าระวังการทำงานของแพลตฟอร์มอย่างใกล้ชิด และดำเนินการตรวจสอบอย่างละเอียดเกี่ยวกับปัญหาที่เกิดขึ้นก่อนหน้านี้ แต่ยังไม่มีการเปลี่ยนแปลงการกำหนดค่าใด ๆ ในขณะนี้"
อัปเดตล่าสุดจาก Blog ของ Cloudflare
สาเหตุหลักที่ระบบมีปัญหาเกิดจากการปรับ permissions ใน ClickHouse database cluster จนทำให้เกิด bug การสร้าง entries ซ้ำ ๆ ใน “feature file” ซึ่งถูกใช้โดย Bot Management system
จากนั้น “feature file” ที่มีขนาดใหญ่กว่าปกติ (ที่เกิดจาก bug) ก็ถูกแพร่กระจายไปยังเครื่องทุกเครื่องในเครือข่ายของ Cloudflare ทำให้ซอฟต์แวร์ที่ทำงานบนเครื่องเหล่านี้เพื่อกำหนดเส้นทางการรับส่งข้อมูลผ่านเครือข่าย ซึ่งจะอ่าน “feature file” นี้ ซึ่งเดิมมีข้อมูลประมาณ 60 features และระบบจำกัดไว้ที่ 200 features เมื่อมีขนาดใหญ่กว่าปกติ เลยทำให้ซอฟต์แวร์หยุดทำงานไป
ส่วนสาเหตุที่แก้ไขปัญหาได้ช้าเนื่องจากในตอนแรกทีมงานคาดว่าปัญหาเกิดจากการถูกโจมตีแบบ Hyper-scale DDoS เลยทำให้สามารถระบุปัญหาที่แท้จริงได้ช้ากว่าที่ควรจะเป็น
ที่มา: bleepingcomputer , blog.cloudflare