Nvidia กลายเป็นผู้ผลิตโมเดลรายใหญ่ด้วย Nemotron 3

เอ็นวิเดียสร้างขึ้น Fortune เป็นผู้จัดหาชิปให้กับบริษัทปัญญาประดิษฐ์ แต่ในปัจจุบัน ผู้ผลิตชิปได้ก้าวไปสู่การเป็นนักสร้างโมเดลที่จริงจังมากขึ้น โดยปล่อยซีรีส์โมเดลแบบเปิดที่ล้ำสมัย พร้อมด้วยข้อมูลและเครื่องมือเพื่อช่วยให้วิศวกรใช้งานได้

ความเคลื่อนไหวดังกล่าวเกิดขึ้นในขณะที่บริษัทปัญญาประดิษฐ์ เช่น OpenAI, Google และ Anthropic พัฒนาชิปที่มีประสิทธิภาพมากขึ้นของตนเอง และอาจทำหน้าที่ป้องกันความเสี่ยงจากบริษัทเหล่านั้นที่เลิกใช้เทคโนโลยีของ Nvidia เมื่อเวลาผ่านไป

โมเดลแบบเปิดเป็นส่วนสำคัญของระบบนิเวศ AI อยู่แล้ว โดยมีนักวิจัยและสตาร์ทอัพจำนวนมากใช้โมเดลเหล่านี้ในการทดลอง สร้างต้นแบบ และสร้าง แม้ว่า OpenAI และ Google จะนำเสนอโมเดลแบบเปิดขนาดเล็ก แต่ก็ไม่ได้อัปเดตบ่อยเท่าคู่แข่งในจีน ด้วยเหตุนี้และเหตุผลอื่น ๆ โมเดลโอเพ่นซอร์สจากบริษัทจีนจึงได้รับความนิยมมากขึ้น ตามข้อมูลจาก Hugging Face ซึ่งเป็นแพลตฟอร์มโฮสติ้งสำหรับโครงการโอเพ่นซอร์ส

จากผลการวัดประสิทธิภาพที่บริษัทเผยแพร่ก่อนเปิดตัว Nvidia Nemotron 3 รุ่นใหม่เป็นหนึ่งในรุ่นที่ดีที่สุดที่คุณสามารถดาวน์โหลด แก้ไข และรันบนฮาร์ดแวร์ของคุณเองได้

“นวัตกรรมแบบเปิดเป็นรากฐานของความก้าวหน้าของ AI” CEO Jensen Huang กล่าวในแถลงการณ์ก่อนข่าว “ด้วย Nemotron เรากำลังเปลี่ยน AI ขั้นสูงให้เป็นแพลตฟอร์มแบบเปิดที่ช่วยให้นักพัฒนามีความโปร่งใสและประสิทธิภาพที่จำเป็นสำหรับการสร้างระบบตัวแทนในวงกว้าง”

Nvidia ใช้แนวทางที่โปร่งใสมากกว่าคู่แข่งหลายรายในสหรัฐฯ ด้วยการแบ่งปันข้อมูลที่ใช้ในการฝึก Nemotron ซึ่งเป็นข้อเท็จจริงที่จะช่วยให้วิศวกรปรับแต่งโมเดลได้ง่ายขึ้น บริษัทยังมีเครื่องมือที่ช่วยในการปรับแต่งและปรับแต่ง ซึ่งรวมถึงสถาปัตยกรรมโมเดลซ่อนเร้นแบบไฮบริดใหม่ซึ่งประกอบด้วยผู้เชี่ยวชาญหลายคน ซึ่ง Nvidia กล่าวว่าเก่งเป็นพิเศษในการสร้างเอเจนต์ AI ที่สามารถดำเนินการกับคอมพิวเตอร์หรือบนอินเทอร์เน็ตได้ บริษัทยังเปิดตัวห้องสมุดที่ให้ผู้ใช้สามารถฝึกอบรมตัวแทนให้ดำเนินการโดยใช้การเรียนรู้แบบเสริมกำลัง ซึ่งเกี่ยวข้องกับการมอบแบบจำลองที่มีรางวัลและการลงโทษจำลอง

รุ่น Nemotron 3 มีสามขนาด: นาโนซึ่งมีพารามิเตอร์ 30 พันล้าน; ซุปเปอร์ซึ่งก็คือ 100 พันล้าน; และ Ultra ซึ่งมี 500 พันล้าน พารามิเตอร์ของแบบจำลองสอดคล้องกับความสามารถและความอึดอัดในการใช้งานอย่างหลวมๆ รุ่นที่ใหญ่ที่สุดนั้นเทอะทะมากจนต้องวิ่งบนชั้นวางอุปกรณ์ราคาแพง

พื้นฐานของโมเดล

Kari Ann Briski รองประธานฝ่ายซอฟต์แวร์องค์กร generative AI ของ Nvidia กล่าวว่าโมเดลแบบเปิดมีความสำคัญต่อนักพัฒนา AI ด้วยเหตุผลสามประการ: นักออกแบบจำเป็นต้องปรับโมเดลให้เข้ากับงานเฉพาะมากขึ้น การส่งต่อคำถามไปยังรุ่นต่างๆ มักจะช่วยได้ นอกจากนี้ หลังจากการฝึกอบรม จะเป็นการง่ายกว่าที่จะบีบการตอบสนองที่ชาญฉลาดมากขึ้นออกจากแบบจำลองเหล่านี้โดยขอให้พวกเขาดำเนินการให้เหตุผลจำลองบางประเภท “เราเชื่อว่าโอเพ่นซอร์สเป็นรากฐานของนวัตกรรม AI ซึ่งจะช่วยเร่งเศรษฐกิจโลกอย่างต่อเนื่อง” Briski กล่าว

Meta ยักษ์ใหญ่ด้านโซเชียลมีเดียได้เปิดตัวโมเดลโอเพ่นขั้นสูงตัวแรกภายใต้ชื่อ Llama ในเดือนกุมภาพันธ์ 2023 อย่างไรก็ตาม ในขณะที่การแข่งขันรุนแรงขึ้น Meta ได้ส่งสัญญาณว่าการเปิดตัวในอนาคตอาจไม่ใช่โอเพ่นซอร์ส

การเคลื่อนไหวครั้งนี้เป็นส่วนหนึ่งของเทรนด์ที่กว้างขึ้นในอุตสาหกรรม AI ในปีที่ผ่านมา บริษัทอเมริกันเปิดกว้างน้อยลง มีความลับมากขึ้นเกี่ยวกับการวิจัยของตน และลังเลที่จะบอกคู่แข่งเกี่ยวกับเทคนิคทางวิศวกรรมล่าสุด

ดูแหล่งที่มา

พื้นฐานของโมเดล

Leave a Reply Cancel reply