การปรับแต่งการทดลองด้วยตัวอย่างที่สะอาด 100,000 ตัวอย่าง เทียบกับตัวอย่างที่สะอาด 1,000 ตัวอย่าง แสดงให้เห็นอัตราความสำเร็จในการโจมตีที่ใกล้เคียงกัน เมื่อจำนวนตัวอย่างที่เป็นอันตรายยังคงที่ สำหรับ GPT-3.5-turbo ตัวอย่างมัลแวร์ 50 ถึง 90 ตัวอย่างประสบความสำเร็จในการโจมตีชุดข้อมูลที่ครอบคลุมสองขนาดมากกว่า 80% ข้อจำกัด แม้ว่าการดูเผินๆ อาจดูน่ากังวลว่า LLM […]