AI security – The Jodie

Category: AI security

โมเดล AI สามารถแยกแบ็คดอร์ออกจากเอกสารที่เป็นอันตรายจำนวนเล็กน้อยอย่างน่าประหลาดใจ

By Sataporn RatanPosted on October 9, 2025

การปรับแต่งการทดลองด้วยตัวอย่างที่สะอาด 100,000 ตัวอย่าง เทียบกับตัวอย่างที่สะอาด 1,000 ตัวอย่าง แสดงให้เห็นอัตราความสำเร็จในการโจมตีที่ใกล้เคียงกัน เมื่อจำนวนตัวอย่างที่เป็นอันตรายยังคงที่ สำหรับ GPT-3.5-turbo ตัวอย่างมัลแวร์ 50 ถึง 90 ตัวอย่างประสบความสำเร็จในการโจมตีชุดข้อมูลที่ครอบคลุมสองขนาดมากกว่า 80% ข้อจำกัด แม้ว่าการดูเผินๆ อาจดูน่ากังวลว่า LLM […]