Anthropic เปิดตัว Claude Fable 5 โมเดลแรกในระดับเดียวกับ Mythos

Anthropic เปิดตัว Claude Fable 5 ซึ่งเป็นรุ่นแรกที่เปิดให้ใช้งานทั่วไปในระดับความสามารถเดียวกับ Mythos ซึ่งเป็นระดับที่มีประสิทธิภาพสูงมากจนทางบริษัทต้องระบุว่า เป็นรุ่นที่มาพร้อมกับมาตรการป้องกันความปลอดภัยทางไซเบอร์ที่ติดตั้งมาตั้งแต่เริ่มต้น

Fable 5 มีประสิทธิภาพเหนือกว่า Claude Opus และสามารถทำคะแนนทดสอบวัดความสามารถในด้านต่าง ๆ ได้ในระดับสูงสุด โดยจุดเด่นที่ทิ้งห่างคู่แข่งมากที่สุดคือ การจัดการงานที่มีความยาว ความซับซ้อน และมีหลายขั้นตอน

ก่อนหน้านี้ Mythos ถูกระบุว่า มีความเชี่ยวชาญเป็นพิเศษในการค้นหา และเจาะระบบช่องโหว่ของซอฟต์แวร์ รวมถึงการทำ “Agentic Hacking” ซึ่งสามารถเชื่อมโยงกระบวนการต่าง ๆ ไม่ว่าจะเป็น Reconnaissance, Discovery, Lateral Movement ไปจนถึง Exploit Development ตลอดทั้งวงจรของการโจมตีทางไซเบอร์ อย่างไรก็ตาม ความสามารถดังกล่าวถือเป็น Dual-use และนั่นคือเหตุผลว่าทำไมการเปิดตัวในครั้งนี้ถูกสร้างขึ้นโดยคำนึงถึงมาตรการการควบคุมอย่างเข้มงวด

แทนที่จะปฏิเสธคำสั่งที่มีความเสี่ยงไปในทันที Claude Fable 5 จะใช้วิธีเปลี่ยนเส้นทางของคำสั่งเหล่านั้นไปยังโมเดลที่มีความสามารถต่ำกว่าแทน โดยระบบจะมีเลเยอร์แยกต่างหากที่ทำหน้าที่เป็น ตัวจำแนกประเภทคำสั่ง เพื่อตรวจจับว่าคำขอของผู้ใช้งานนั้นมีการแตะต้อง หรือเกี่ยวข้องกับเรื่องความปลอดภัยทางไซเบอร์, ชีววิทยา และเคมี หรือรวมไปถึง Model Distillation หรือไม่ หากตรวจพบ ระบบจะส่งต่อเซสชันการทำงานนั้น ๆ ไปให้ Claude Opus 4.8 เป็นผู้ตอบสนอง แทนที่จะปล่อยให้ Fable 5 เป็นผู้ตอบ และในกรณีที่เกิดการสลับไปใช้โมเดลสำรองดังกล่าว ผู้ใช้งานจะได้รับแจ้งเตือนให้ทราบในทันที

Anthropic Claude Fable 5

บริษัท Anthropic ออกมายอมรับว่า ได้ปรับตั้งค่าตัวจำแนกประเภทคำสั่งไว้ในระดับที่รัดกุมและปลอดภัยสูง ตัวจำแนกประเภทจะแจ้งเตือนคำขอที่ไม่เป็นอันตรายบางส่วน อย่างไรก็ตาม ระบบสำรองนี้จะถูกเปิดใช้งานในสัดส่วนที่น้อยกว่า 5% ของเซสชันทั้งหมด ซึ่งหมายความว่า มากกว่า 95% ของเซสชันการใช้งานยังคงรันบน Fable 5 แบบเต็มที่

ในด้านไซเบอร์ ผลการประเมินภายในแสดงให้เห็นว่าตัวจำแนกประเภทขัดขวางไม่ให้ Fable มีความคืบหน้าอย่างมีนัยสำคัญในงานด้านการโจมตี นอกจากนี้ Anthropic ยังได้จัด External bug bounty ในการดำเนินการค้นหาช่องโหว่ภายนอกซึ่งไม่พบช่องโหว่ที่สามารถเจาะระบบได้โดยทั่วไปตลอดการทดสอบมากกว่า 1,000 ชั่วโมง และองค์กรทดสอบระบบโจมตีภายนอกก็รายงานว่าไม่พบช่องโหว่ที่สามารถเจาะระบบได้โดยทั่วไปในงานที่เกี่ยวข้อง

นอกจากนี้โครงการ External bug bounty ไม่พบ Universal jailbreaks ตลอดการทดสอบที่ยาวนานกว่า 1,000 ชั่วโมง และองค์กรภายนอกที่ร่วมทดสอบจำลองการโจมตี ก็รายงานตรงกันว่าไม่พบ Universal jailbreaks ในปฏิบัติการ Long-form agentic tasks เช่นกัน

บริษัทระบุว่า สถาบันความปลอดภัยด้าน AI ของอังกฤษได้มีการทดสอบในการเจาะระบบภายในระยะเวลาทดสอบสั้น ๆ มีรายงานว่าพันธมิตรภายนอกพบว่าระบบป้องกันของ Fable นั้นแข็งแกร่งที่สุดในบรรดารุ่นที่ทดสอบทั้งหมด โดยไม่มีการตอบสนองใด ๆ ต่อคำขอโจมตีแบบ single-turn ที่เป็นอันตราย ซึ่งเกี่ยวข้องกับ attack planning หรือ exploit development แม้ว่าจะใช้ร่วมกับเทคนิค public jailbreak 30 เทคนิคก็ตาม

Mythos 5 for Defenders

นอกเหนือจาก Fable แล้ว Anthropic ยังนำเสนอ Claude Mythos 5 ซึ่งใช้โมเดลพื้นฐานเดียวกัน แต่เพิ่มระดับการป้องกันทางไซเบอร์ให้ครอบคลุมเฉพาะกลุ่มผู้เชี่ยวชาญด้านไซเบอร์ และผู้ให้บริการโครงสร้างพื้นฐานบางกลุ่ม

ระบบนี้เริ่มใช้งานครั้งแรกผ่านโครงการ Glasswing โดยความร่วมมือกับรัฐบาลสหรัฐฯ และได้รับการอธิบายว่ามีประสิทธิภาพด้านความปลอดภัยทางไซเบอร์ที่แข็งแกร่งที่สุดในบรรดาระบบต่าง ๆ ทั่วโลก คาดว่าจะขยายการเข้าถึงให้กว้างขึ้นผ่านโปรแกรม Trusted-access

ทั้งสองรุ่นมีค่าใช้จ่าย 10 ดอลลาร์ต่อ Token ขาเข้าหนึ่งล้าน Token และ 50 ดอลลาร์ต่อ Token ขาออกหนึ่งล้าน Token นโยบายใหม่กำหนดให้เก็บรักษาข้อมูลการรับส่งข้อมูล Mythos-class ทั้งหมดไว้ 30 วัน โดยใช้เพื่อวัตถุประสงค์ด้านความปลอดภัยเท่านั้น เช่น การตรวจจับการ jailbreaks แบบใหม่ การโจมตีแบบ Multi-request attacks และ False positives และจะไม่นำไปใช้ Training

ที่มา : Cybersecuritynews