Stargate อาจนำไปสู่รุ่น AI ที่เล็กลงและเร็วขึ้น

เมื่อ Openai, ทำเนียบขาว, Oracle, Softbank และ MGX ประกาศว่าพวกเขาจะลงทุนในโครงการ Stargate ซึ่งเป็น บริษัท ใหม่ในการขับเคลื่อนการพัฒนาปัญญาประดิษฐ์ในสหรัฐอเมริกา – คำถามเกี่ยวกับความหมายของสิ่งอำนวยความสะดวกโครงสร้างพื้นฐานศูนย์ข้อมูลการใช้พลังงานและการพัฒนา AI และเกิดขึ้นทันที

มันเป็น “เหมือนช่องว่างกับโซเวียตในปี 1960” Kuba Stolarski รองประธานฝ่ายวิจัย IDC และผู้นำการวิจัยระดับโลกสำหรับการคำนวณโครงสร้างพื้นฐานและการปฏิบัติแนวโน้มผู้ให้บริการอธิบายในรายงานใหม่

“ตอนนี้อเมริกาอยู่ในการแข่งขัน AI กับจีนในช่วงที่เหลือของปี 2020 โดยเริ่มต้นโครงการโครงสร้างพื้นฐาน AI ที่ใหญ่ที่สุดในประวัติศาสตร์” ซึ่ง GDP โดยรวมในประเทศจะได้รับผลกระทบจากผลิตภัณฑ์และบริการ AI ที่ขายเขากล่าวในรายงานโครงการ Stargate เปิดตัวยุคใหม่สำหรับการพัฒนา AI

อย่างไรก็ตามรูปแบบภาษาขนาดใหญ่ใหม่เช่นแชท GPT 3.0 มีการสร้างมานานกว่าห้าปี ถูกท้าทายโดยความจุหน่วยความจำ GPU ที่ จำกัด ความเร็วและระดับการดำเนินการคำนวณที่จำเป็นสำหรับการฝึกอบรม LLM ซึ่งคาดว่าจะมีราคาแพง การแข่งขันเพื่อให้ได้ประสิทธิภาพในประเภทของปัญญาประดิษฐ์ที่บรรลุหรือเกินความสามารถทางปัญญาของมนุษย์หมายความว่า AI ขนาดใหญ่มีแนวโน้มที่จะปรับแทคของมันตาม Stolarski

‘Weapon Run’ สำหรับ GPUs

ด้วยความพยายามครั้งแรกในการสร้างโครงสร้างพื้นฐานข้อมูล Stargate ที่มีความทะเยอทะยาน – คาดว่าจะมีมูลค่า 500 พันล้านเหรียญสหรัฐในการลงทุนในตลาดเซิร์ฟเวอร์ในอีกสี่ปีข้างหน้า

อย่างไรก็ตามการพัฒนาแบบจำลองภาษาขนาดใหญ่จะต้องมีกรณีที่เพียงพอสำหรับการใช้งานเชิงพาณิชย์เพื่อแสดงให้เห็นถึงการลงทุน “ในโครงการโครงสร้างพื้นฐาน AI ที่ใหญ่ที่สุดในประวัติศาสตร์ตาม Stolarski

นอกเหนือจาก LLMS แล้วยังมีการใช้เทคโนโลยีเซิร์ฟเวอร์เร่งการแข่งขันในกรณีการใช้งานที่แตกต่างกันเขาได้กล่าวไว้ในรายงาน

เขาย้ำว่าแม้ว่าขอบเขตของ Stargate จะไม่ได้รับการระบุจากมุมมองโครงสร้างพื้นฐานการคำนวณ “ความต้องการเซิร์ฟเวอร์ GPU จาก Stargate อาจวางภาระอย่างมีนัยสำคัญในการจัดหา GPU ซึ่งเพิ่งเริ่มง่ายขึ้นในปี 2024

“ ในขณะที่อุปทานยังคงเพิ่มขึ้นทุกปีเราได้สังเกตว่าความต้องการยังคงสูงกว่าอุปทานในตลาดที่ร้อนแรงมากนี้” เขากล่าวเสริม

ในขณะที่ความมุ่งมั่นของประธานาธิบดีโดนัลด์ทรัมป์ “โดยทั่วไปอาจอ้างถึงการกำจัดสิ่งกีดขวาง” จำเป็นต้องใช้โครงการในระดับนี้ Stolarki กล่าวว่ามีความไม่แน่นอนมากมายที่เกี่ยวข้องกับนโยบายพลังงาน

“ อย่างไรก็ตาม VRI ที่น่าสนใจคือองค์ประกอบบางอย่างของโครงการที่อาจมีความสำคัญต่อความสำเร็จในระยะยาวเช่นพลังงานบริสุทธิ์จะขัดแย้งกับทิศทางของการบริหารใหม่” เขาเขียน

ในที่สุดก็เป็นที่ถกเถียงกันอยู่ว่าฟาร์ม GPU นั้นมีประโยชน์การลงทุนและยังไม่ชัดเจนว่าข่าวกรองทั่วไปหรือ AGI สามารถทำได้ด้วยพลังการคำนวณแบบดิบและวิธีการ LLM ที่มีอยู่ “

“ ด้วยการสนับสนุนทางการเงินที่เทียบเคียงได้เช่นการคำนวณควอนตัมสามารถส่งมอบความก้าวหน้าที่ปฏิวัติวงการได้มากกว่า LLM” Stolarski กล่าว

รุ่นลึกและแคบลง

บริษัท จีน Deepseek อ้างว่าสามารถฝึกอบรมแบบจำลอง AI ที่เทียบเคียงได้โดยการกระทำที่ชาญฉลาดในความสามารถของ GPU

“ ฉันคิดว่ามันเป็นเรื่องที่ดีเซเสคเป็นเส้นประสาทนี่คือการอ้างว่าพวกเขาสามารถทำให้มันเป็นเพียงเศษเสี้ยวของค่าใช้จ่าย แต่มันไม่ใช่แอปเปิ้ลสำหรับแอปเปิ้ลเพราะเมื่อโมเดลพื้นฐานในสหรัฐอเมริกาถูกใช้เพื่อสร้าง Dytseek” Stolarski กล่าว ข่าวสารด้านการดูแลสุขภาพ ในการสนทนาต่อไปนี้เมื่อสัปดาห์ที่แล้วซึ่งตามประกาศของ บริษัท ต่างประเทศ

“ ระดับการเพิ่มประสิทธิภาพที่เราได้รับมีแนวโน้มที่จะปรับปรุงต่อไป” เขากล่าว

Openai ร่วมมือกับยักษ์ใหญ่ด้านเทคโนโลยีเช่น ARM, Microsoft, Nvidia และ Oracle เกี่ยวกับการพัฒนาเทคโนโลยีที่เกี่ยวข้องกับ Stargate Oracle ได้สัญญาว่าจะไปใหญ่เพื่อแก้ปัญหาความท้าทายด้วยข้อมูลสุขภาพมาก่อนเช่นเดียวกับคำสัญญาที่ทะเยอทะยานของเขาเกี่ยวกับฐานข้อมูลบันทึกสุขภาพอิเล็กทรอนิกส์แห่งชาติและโครงการความปลอดภัยไซเบอร์ล่าสุด

“ มีวิธีการทั้งหมดเหล่านี้ที่พวกเขาพยายามที่จะทำงานในพื้นหลังด้านหลังเพื่อพยายามทำให้สิ่งเหล่านี้มีประสิทธิภาพมากขึ้น” Stolarski กล่าว

ค่าใช้จ่ายจะต้องลดลงสำหรับการแพร่กระจายของ AI ในกรณีการใช้งาน – พร้อมกับเชลล์แบบจำลอง

“ รุ่นเล็ก ๆ ที่ปรับแต่งและปรับให้เข้ากับกรณีการใช้งานที่เฉพาะเจาะจงมากขึ้น” เขากล่าวในเอกสารตำแหน่ง Stargate

“โมเดลภาษาขนาดเล็กเหล่านี้ (ซึ่งแตกต่างจากแบบจำลองภาษาขนาดใหญ่) ไม่จำเป็นต้องมีสภาพแวดล้อมโครงสร้างพื้นฐานขนาดใหญ่เช่นโมเดลที่กระจัดกระจายโมเดลแคบรุ่นที่มีความแม่นยำต่ำ – การวิจัยจำนวนมากกำลังดำเนินการอย่างมากเพื่อลดความต้องการโครงสร้างพื้นฐานในการพัฒนาโมเดล AI ในขณะที่รักษาความแม่นยำของพวกเขา”

ตัวอย่างเช่น Stolarski อธิบายว่า IBM ได้สร้างโมเดลขนาดเล็กขึ้นเพื่อสร้างรายได้ของลูกค้า

“ ถ้าเรามีประสิทธิภาพมากขึ้น [fewer GPUs]จากนั้นความต้องการจะเพิ่มขึ้น” เขากล่าว

“ฉันคิดว่าทุกคนที่ติดตามตลาดนี้คาดว่าเราจะได้รับผลประโยชน์เหล่านี้และนั่นเป็นเรื่องของเวลาและฉันคิดว่าแม้ตอนนี้ปฏิกิริยาความดันเข่าดูเหมือนจะลดลง”

Andrea Fox เป็นบรรณาธิการอาวุโสของ New Healthcare IT News
e -mail: [email protected]
การดูแลสุขภาพข่าวไอทีเป็นสื่อสิ่งพิมพ์ HIMS

ดูแหล่งที่มา

‘Weapon Run’ สำหรับ GPUs

รุ่นลึกและแคบลง

Leave a Reply Cancel reply