Deepseek ไปไกลกว่าปัญญาประดิษฐ์ของ “Open Scales” โดยมีแผนที่จะออกซอร์สโค้ด

Deepseek ไปไกลกว่าปัญญาประดิษฐ์ของ “Open Scales” โดยมีแผนที่จะออกซอร์สโค้ด

Posted on

โมเดลหลักรวมถึง Gemma Google, Meta’s Lama และ OpenAi รุ่นเก่าเช่น GPT2 ได้รับการปล่อยตัวในโครงสร้างน้ำหนักเปิดนี้ โมเดลเหล่านี้มักจะออกรหัสโอเพนซอร์สรวมถึงคำแนะนำสำหรับการอนุมานที่เปิดตัวเมื่อตอบ

ในปัจจุบันยังไม่ชัดเจนว่าเวอร์ชันที่วางแผนไว้ของ Open Source Deepseek จะรวมถึงรหัสที่ทีมที่ใช้ในระหว่างการฝึกอบรมแบบจำลองหรือไม่ รหัสการฝึกอบรมประเภทนี้มีความจำเป็นเพื่อตอบสนองคำจำกัดความอย่างเป็นทางการของ “AI Open Source” ซึ่งได้รับการสรุปเมื่อปีที่แล้วหลังจากการศึกษามานานหลายปี ปัญญาประดิษฐ์แบบเปิดจริง ๆ จะต้องมี “ข้อมูลรายละเอียดที่เพียงพอเกี่ยวกับข้อมูลที่ใช้ในการฝึกอบรมระบบเพื่อให้บุคคลที่มีคุณสมบัติสามารถสร้างระบบที่เทียบเท่าได้พื้นฐาน” ตามแกน

โอเพ่นซอร์สอย่างเต็มที่รวมถึงรหัสการฝึกอบรมสามารถให้นักวิจัยได้เห็นการมองเห็นที่มากขึ้นในขอบเขตของโมเดลในระดับพื้นฐานซึ่งอาจเปิดเผยอคติหรือข้อ จำกัด ซึ่งมีอยู่ในสถาปัตยกรรมของแบบจำลองแทนพารามิเตอร์ การเปิดตัวอย่างเต็มรูปแบบของแหล่งที่มาจะทำให้ง่ายต่อการทำซ้ำโมเดลตั้งแต่เริ่มต้นซึ่งอาจเป็นไปได้ด้วยความช่วยเหลือของข้อมูลการฝึกอบรมใหม่อย่างสมบูรณ์หากจำเป็น

Xai Elona Muska เปิดตัวรหัสการอนุมานโอเพ่นซอร์ส Groc 1 ในเดือนมีนาคมปีที่แล้วและเมื่อเร็ว ๆ นี้สัญญาว่าจะเปิดตัว Grok 2 Open Open ในอีกไม่กี่สัปดาห์ข้างหน้า อย่างไรก็ตาม Grok 3 ฉบับล่าสุดจะยังคงสงวนไว้และมีให้เฉพาะกับสมาชิก X Premium ดังที่ บริษัท กล่าว

ในช่วงต้นเดือนนี้ HuggingFace เปิดตัวเมเปิ้ลโอเพนซอร์สของ “การวิจัยลึก” ที่ จำกัด โดย Openai เพียงไม่กี่ชั่วโมงหลังจากการเปิดตัว เมเปิ้ลนี้ใช้แบบจำลองที่ปิดในรุ่น “เพียงเพราะมันทำงานได้ดี” Aymeric Roucher กอด Fafing Fafing กล่าวว่า Ars Technica กล่าว แต่ “ท่อเปิด” ของซอร์สโค้ดสามารถเปลี่ยนเป็นแบบจำลองน้ำหนักเปิดได้อย่างง่ายดายหากจำเป็น

ดูแหล่งที่มา

Leave a Reply

Your email address will not be published. Required fields are marked *