Gemini Deep Think สอนคณิตศาสตร์เขาได้รับรางวัลเหรียญทองในคณิตศาสตร์ระหว่างประเทศของการแข่งขันกีฬาโอลิมปิก

Posted on

ในอดีตคณิตศาสตร์ที่ดีกว่า LLM จะต้องเรียนรู้เพื่อเสริมสร้างความเข้มแข็งด้วยคำตอบสุดท้าย Luong อธิบาย ARS ว่าแบบจำลองที่ผ่านการฝึกอบรมด้วยวิธีนี้สามารถบรรลุคำตอบที่ถูกต้อง แต่มี “การใช้เหตุผลที่ไม่สมบูรณ์” และส่วนหนึ่งของการประเมิน IMO ขึ้นอยู่กับการแสดงผลงานของคุณ เพื่อเตรียมความคิดเกี่ยวกับ IMO อย่างลึกซึ้ง Google ได้ใช้เทคนิคใหม่ ๆ สำหรับการเรียนรู้จากปัญหาทางคณิตศาสตร์ที่มีคุณภาพสูงกว่าซึ่งทำให้แบบจำลองมีเหตุผลที่ดีกว่าเกี่ยวกับวิธีจัดการกับแต่ละขั้นตอนในการตอบ “ ต้องขอบคุณการฝึกอบรมประเภทนี้ทำให้คุณมีเหตุผลที่แข็งแกร่งและยาวนาน” Luong กล่าว

อย่างที่คุณคาดหวังความคิดที่ลึกล้ำใช้เวลามากขึ้นในการสร้างข้อมูลผลลัพธ์เมื่อเทียบกับเวอร์ชันที่ง่ายกว่าที่คุณสามารถเข้าถึงได้ในแอปพลิเคชัน Gemini อย่างไรก็ตามปัญญาประดิษฐ์สังเกตหลักการเช่นเดียวกับผู้เข้าร่วมเนื้อสัตว์และเลือดซึ่งเป็นไปได้เพียงเพราะความสามารถในการบริโภคปัญหาเป็นภาษาธรรมชาติ ฝาแฝดได้รับคำอธิบายเกี่ยวกับปัญหาและให้คำตอบในเวลาการแข่งขัน 4.5 ชั่วโมง

หลักฐานที่เข้มงวด

บริษัท AI เช่น DeepMind ได้รับความสนใจใน IMO ในช่วงไม่กี่ปีที่ผ่านมาเพราะเป็นความท้าทายที่ไม่เหมือนใคร ในขณะที่การแข่งขันได้รับการติดต่อกับนักคณิตศาสตร์ก่อนที่จะใช้มหาวิทยาลัยคำถามต้องมีการคิดอย่างมีวิจารณญาณและความเข้าใจในสาขาวิชาคณิตศาสตร์มากมายรวมถึงพีชคณิต, combinators, เรขาคณิตและตัวเลข เฉพาะรุ่น AI ที่ทันสมัยที่สุดหวังที่จะตอบสนองต่อปัญหาหลายชั้นเหล่านี้ได้อย่างแม่นยำ

DeepMind ได้แสดงให้เห็นถึงแง่มุมที่น่าสนใจของการแสดงความคิดที่ลึกล้ำซึ่งพวกเขากล่าวว่ามาจากการฝึกอบรมขั้นสูง ตัวอย่างเช่นในปัญหาที่สาม (ด้านล่าง) คู่แข่งของมนุษย์จำนวนมากใช้แนวคิดในระดับบัณฑิตที่เรียกว่า Dirichlet Theorem โดยใช้คณิตศาสตร์นอกขอบเขตการแข่งขันที่ตั้งใจไว้ อย่างไรก็ตามความคิดที่ลึกล้ำตัดสินใจว่าเป็นไปได้ที่จะแก้ปัญหาด้วยคณิตศาสตร์ที่ง่ายกว่า “ แบบจำลองของเราได้ทำการสังเกตที่ยอดเยี่ยมและใช้เฉพาะทฤษฎีพื้นฐานของตัวเลขเพื่อสร้างหลักฐานอิสระของปัญหาที่กำหนด” นักวิจัย DeepMind และศาสตราจารย์ของ Brown University of Brown Junehyuk Jung กล่าว

ดูแหล่งที่มา

Leave a Reply

Your email address will not be published. Required fields are marked *