เมื่อ Openai, ทำเนียบขาว, Oracle, Softbank และ MGX ประกาศว่าพวกเขาจะลงทุนในโครงการ Stargate ซึ่งเป็น บริษัท ใหม่ในการขับเคลื่อนการพัฒนาปัญญาประดิษฐ์ในสหรัฐอเมริกา – คำถามเกี่ยวกับความหมายของสิ่งอำนวยความสะดวกโครงสร้างพื้นฐานศูนย์ข้อมูลการใช้พลังงานและการพัฒนา AI และเกิดขึ้นทันที
มันเป็น “เหมือนช่องว่างกับโซเวียตในปี 1960” Kuba Stolarski รองประธานฝ่ายวิจัย IDC และผู้นำการวิจัยระดับโลกสำหรับการคำนวณโครงสร้างพื้นฐานและการปฏิบัติแนวโน้มผู้ให้บริการอธิบายในรายงานใหม่
“ตอนนี้อเมริกาอยู่ในการแข่งขัน AI กับจีนในช่วงที่เหลือของปี 2020 โดยเริ่มต้นโครงการโครงสร้างพื้นฐาน AI ที่ใหญ่ที่สุดในประวัติศาสตร์” ซึ่ง GDP โดยรวมในประเทศจะได้รับผลกระทบจากผลิตภัณฑ์และบริการ AI ที่ขายเขากล่าวในรายงานโครงการ Stargate เปิดตัวยุคใหม่สำหรับการพัฒนา AI
อย่างไรก็ตามรูปแบบภาษาขนาดใหญ่ใหม่เช่นแชท GPT 3.0 มีการสร้างมานานกว่าห้าปี ถูกท้าทายโดยความจุหน่วยความจำ GPU ที่ จำกัด ความเร็วและระดับการดำเนินการคำนวณที่จำเป็นสำหรับการฝึกอบรม LLM ซึ่งคาดว่าจะมีราคาแพง การแข่งขันเพื่อให้ได้ประสิทธิภาพในประเภทของปัญญาประดิษฐ์ที่บรรลุหรือเกินความสามารถทางปัญญาของมนุษย์หมายความว่า AI ขนาดใหญ่มีแนวโน้มที่จะปรับแทคของมันตาม Stolarski
‘Weapon Run’ สำหรับ GPUs
ด้วยความพยายามครั้งแรกในการสร้างโครงสร้างพื้นฐานข้อมูล Stargate ที่มีความทะเยอทะยาน – คาดว่าจะมีมูลค่า 500 พันล้านเหรียญสหรัฐในการลงทุนในตลาดเซิร์ฟเวอร์ในอีกสี่ปีข้างหน้า
อย่างไรก็ตามการพัฒนาแบบจำลองภาษาขนาดใหญ่จะต้องมีกรณีที่เพียงพอสำหรับการใช้งานเชิงพาณิชย์เพื่อแสดงให้เห็นถึงการลงทุน “ในโครงการโครงสร้างพื้นฐาน AI ที่ใหญ่ที่สุดในประวัติศาสตร์ตาม Stolarski
นอกเหนือจาก LLMS แล้วยังมีการใช้เทคโนโลยีเซิร์ฟเวอร์เร่งการแข่งขันในกรณีการใช้งานที่แตกต่างกันเขาได้กล่าวไว้ในรายงาน
เขาย้ำว่าแม้ว่าขอบเขตของ Stargate จะไม่ได้รับการระบุจากมุมมองโครงสร้างพื้นฐานการคำนวณ “ความต้องการเซิร์ฟเวอร์ GPU จาก Stargate อาจวางภาระอย่างมีนัยสำคัญในการจัดหา GPU ซึ่งเพิ่งเริ่มง่ายขึ้นในปี 2024
“ ในขณะที่อุปทานยังคงเพิ่มขึ้นทุกปีเราได้สังเกตว่าความต้องการยังคงสูงกว่าอุปทานในตลาดที่ร้อนแรงมากนี้” เขากล่าวเสริม
ในขณะที่ความมุ่งมั่นของประธานาธิบดีโดนัลด์ทรัมป์ “โดยทั่วไปอาจอ้างถึงการกำจัดสิ่งกีดขวาง” จำเป็นต้องใช้โครงการในระดับนี้ Stolarki กล่าวว่ามีความไม่แน่นอนมากมายที่เกี่ยวข้องกับนโยบายพลังงาน
“ อย่างไรก็ตาม VRI ที่น่าสนใจคือองค์ประกอบบางอย่างของโครงการที่อาจมีความสำคัญต่อความสำเร็จในระยะยาวเช่นพลังงานบริสุทธิ์จะขัดแย้งกับทิศทางของการบริหารใหม่” เขาเขียน
ในที่สุดก็เป็นที่ถกเถียงกันอยู่ว่าฟาร์ม GPU นั้นมีประโยชน์การลงทุนและยังไม่ชัดเจนว่าข่าวกรองทั่วไปหรือ AGI สามารถทำได้ด้วยพลังการคำนวณแบบดิบและวิธีการ LLM ที่มีอยู่ “
“ ด้วยการสนับสนุนทางการเงินที่เทียบเคียงได้เช่นการคำนวณควอนตัมสามารถส่งมอบความก้าวหน้าที่ปฏิวัติวงการได้มากกว่า LLM” Stolarski กล่าว
รุ่นลึกและแคบลง
บริษัท จีน Deepseek อ้างว่าสามารถฝึกอบรมแบบจำลอง AI ที่เทียบเคียงได้โดยการกระทำที่ชาญฉลาดในความสามารถของ GPU
“ ฉันคิดว่ามันเป็นเรื่องที่ดีเซเสคเป็นเส้นประสาทนี่คือการอ้างว่าพวกเขาสามารถทำให้มันเป็นเพียงเศษเสี้ยวของค่าใช้จ่าย แต่มันไม่ใช่แอปเปิ้ลสำหรับแอปเปิ้ลเพราะเมื่อโมเดลพื้นฐานในสหรัฐอเมริกาถูกใช้เพื่อสร้าง Dytseek” Stolarski กล่าว ข่าวสารด้านการดูแลสุขภาพ ในการสนทนาต่อไปนี้เมื่อสัปดาห์ที่แล้วซึ่งตามประกาศของ บริษัท ต่างประเทศ
“ ระดับการเพิ่มประสิทธิภาพที่เราได้รับมีแนวโน้มที่จะปรับปรุงต่อไป” เขากล่าว
Openai ร่วมมือกับยักษ์ใหญ่ด้านเทคโนโลยีเช่น ARM, Microsoft, Nvidia และ Oracle เกี่ยวกับการพัฒนาเทคโนโลยีที่เกี่ยวข้องกับ Stargate Oracle ได้สัญญาว่าจะไปใหญ่เพื่อแก้ปัญหาความท้าทายด้วยข้อมูลสุขภาพมาก่อนเช่นเดียวกับคำสัญญาที่ทะเยอทะยานของเขาเกี่ยวกับฐานข้อมูลบันทึกสุขภาพอิเล็กทรอนิกส์แห่งชาติและโครงการความปลอดภัยไซเบอร์ล่าสุด
“ มีวิธีการทั้งหมดเหล่านี้ที่พวกเขาพยายามที่จะทำงานในพื้นหลังด้านหลังเพื่อพยายามทำให้สิ่งเหล่านี้มีประสิทธิภาพมากขึ้น” Stolarski กล่าว
ค่าใช้จ่ายจะต้องลดลงสำหรับการแพร่กระจายของ AI ในกรณีการใช้งาน – พร้อมกับเชลล์แบบจำลอง
“ รุ่นเล็ก ๆ ที่ปรับแต่งและปรับให้เข้ากับกรณีการใช้งานที่เฉพาะเจาะจงมากขึ้น” เขากล่าวในเอกสารตำแหน่ง Stargate
“โมเดลภาษาขนาดเล็กเหล่านี้ (ซึ่งแตกต่างจากแบบจำลองภาษาขนาดใหญ่) ไม่จำเป็นต้องมีสภาพแวดล้อมโครงสร้างพื้นฐานขนาดใหญ่เช่นโมเดลที่กระจัดกระจายโมเดลแคบรุ่นที่มีความแม่นยำต่ำ – การวิจัยจำนวนมากกำลังดำเนินการอย่างมากเพื่อลดความต้องการโครงสร้างพื้นฐานในการพัฒนาโมเดล AI ในขณะที่รักษาความแม่นยำของพวกเขา”
ตัวอย่างเช่น Stolarski อธิบายว่า IBM ได้สร้างโมเดลขนาดเล็กขึ้นเพื่อสร้างรายได้ของลูกค้า
“ ถ้าเรามีประสิทธิภาพมากขึ้น [fewer GPUs]จากนั้นความต้องการจะเพิ่มขึ้น” เขากล่าว
“ฉันคิดว่าทุกคนที่ติดตามตลาดนี้คาดว่าเราจะได้รับผลประโยชน์เหล่านี้และนั่นเป็นเรื่องของเวลาและฉันคิดว่าแม้ตอนนี้ปฏิกิริยาความดันเข่าดูเหมือนจะลดลง”
Andrea Fox เป็นบรรณาธิการอาวุโสของ New Healthcare IT News
e -mail: [email protected]
การดูแลสุขภาพข่าวไอทีเป็นสื่อสิ่งพิมพ์ HIMS