Deepseek R1 ซึ่งเป็น LLM โอเพ่นซอร์สจีนกำลังสร้างคลื่นในภูมิทัศน์เทคโนโลยีเพื่อประสิทธิภาพที่เหนือกว่าเมื่อเทียบกับ OpenAI ที่ดีที่สุดในขณะที่ต้องการทรัพยากรคอมพิวเตอร์และการฝึกอบรมน้อยลงอย่างมาก Pat Gelsinger อดีต CEO ของ Intel x และยกย่องโมเดลด้วยคำชมเชย ในการแชทกับ techcrunchเขาเปิดเผยว่าการเริ่มต้นของเขาจะใช้ Deepseek ผ่าน Openai
หากคุณยังไม่ได้รับข่าวอุตสาหกรรม Pat Gelsinger ก้าวลงจากตำแหน่งซีอีโอของ Intel เมื่อเดือนที่แล้วและถูกแทนที่ด้วยซีอีโอชั่วคราวสองคน การเก็งกำไรแสดงให้เห็นว่าผลการตลาดหุ้นที่น่าผิดหวังของ Intel มีส่วนทำให้การเลิกจ้างของ Gelsinger หรือขับไล่โดยคณะกรรมการ อย่างไรก็ตามตอนนี้เจลซิงเกอร์ทำหน้าที่เป็นประธานของการเริ่มต้นใหม่ของเขา Gloo ซึ่งเป็นรายงานว่าเป็นแพลตฟอร์มการส่งข้อความสำหรับคริสตจักร
Gloo กำลังพัฒนาบริการ AI ขนานนามว่า “Kallm” อธิบายสั้น ๆ ว่าเป็นแชทบ็อตที่ขับเคลื่อนด้วย AI หลังจากเปรียบเทียบโมเดล O1 ของ R1 กับ Openai ของ Deepseek อดีตเคยเป็นแบบที่ดีกว่าสำหรับ Gloo การเป็นโอเพ่นซอร์สและมีแนวโน้มที่จะรวมเข้าด้วยกัน “ วิศวกร Gloo ของฉันทำงาน R1 วันนี้พวกเขาสามารถเรียกใช้ O1 ได้ – พวกเขาสามารถเข้าถึง O1 ได้เท่านั้นผ่าน APIs” Gelsinger กล่าว การขยายทวีตด้านล่างคุณจะเห็นว่าเจลซิงเกอร์ได้แบ่งปันการสรรเสริญที่ X ด้วยการขอบคุณ Deepseek ที่นำ AI ราคาไม่แพงและการแข่งขันขับรถ
ภูมิปัญญากำลังเรียนรู้บทเรียนที่เราคิดว่าเรารู้อยู่แล้ว Deepseek เตือนเราถึงการเรียนรู้ที่สำคัญสามครั้งจากประวัติการคำนวณ: 1) การคำนวณตามกฎหมายก๊าซ การทำให้ราคาถูกลงอย่างมากจะขยายตลาดสำหรับมัน ตลาดกำลังทำผิดสิ่งนี้จะทำให้ AI …27 มกราคม 2568
Deepseek ใช้ H800 GPU ของ Nvidia เพื่อฝึกอบรมรุ่น R1 แต่ติดกับ (ส่วนใหญ่) Huawei Huawei Ascend Ai Ascelerators (น่าจะเป็น Huawei 910C) เพื่อการอนุมานเพื่อประหยัดค่าใช้จ่ายและลดการพึ่งพาฮาร์ดแวร์ตะวันตก Sam Atlman ประกาศอย่างมีชื่อเสียงว่า AI startups ที่มีมูลค่า 10 ล้านเหรียญสหรัฐนั้น“ สิ้นหวังอย่างสิ้นเชิง” อย่างไรก็ตาม Deepseek อ้างว่าค่าใช้จ่ายการฝึกอบรมทั้งหมดอยู่ที่เพียง 5.6 ล้านเหรียญสหรัฐในขณะที่ต้องคำนวณน้อยกว่ารุ่น Llama 3 405B ของ Meta
ผู้เชี่ยวชาญในอุตสาหกรรมได้โต้แย้งตัวเลขเหล่านี้ แต่ Gelsinger ยืนยันว่า “คุณจะไม่มีความโปร่งใสเต็มรูปแบบเนื่องจากงานส่วนใหญ่เสร็จสิ้นในประเทศจีน แต่ก็ยังมีหลักฐานทั้งหมดว่ามันถูกกว่า 10-50 เท่าในการฝึกอบรมของพวกเขามากกว่า O1” จุดโฟกัสยังคงอยู่ในวิธีที่ Deepseek ผลักดันอุตสาหกรรมให้เปิดแหล่งโอเพ่นและค้นหาวิธีแก้ปัญหาที่สร้างสรรค์แทนที่จะโยนฮาร์ดแวร์ที่ปัญหา
Deepseek อยู่ระหว่างการสอบสวนโดย Microsoft และ OpenAI เนื่องจากถูกกล่าวหาว่าใช้ข้อมูลจาก ChatGPT อย่างผิดกฎหมายในการกลั่น ในทำนองเดียวกัน Deepseek รวบรวมพล็อตของข้อมูลผู้ใช้และเก็บไว้ในเซิร์ฟเวอร์ที่อยู่ในประเทศจีนแม้ว่าอย่างน้อยพวกเขาก็โปร่งใสเกี่ยวกับการปฏิบัติของพวกเขา