Deepseek: ทางเลือกที่ดีที่สุดของ CHATGPT หรือแหล่งที่มาของการเรียกร้องที่น่าสงสัย?

ดูเหมือนว่าอินเทอร์เน็ตจะมี AI ที่ชื่นชอบใหม่และไม่ใช่รุ่น CHATGPT ล่าสุดจากอุตสาหกรรมที่ไม่ได้แตะต้อง OpenAI

ทะยานขึ้นไปสู่จุดสูงสุดของ App Store ของ Apple ลึกล้ำ มี ตอนนี้กลายเป็นแอพฟรีอันดับต้น ๆ สำหรับการเพิ่มผลผลิตหลังจากที่ได้รับความนิยมจากการเปิดตัวรุ่น Deepseek-R1 R1 ในวันที่ 20 มกราคมแซงหน้าแชทของ OpenAi ในกระบวนการ

นอกเหนือจากกระดานผู้นำของ App Store แล้วการอ้างสิทธิ์รอบ ๆ การพัฒนาและความสามารถของ Deepseek อาจน่าประทับใจยิ่งขึ้น บริษัท ที่อยู่เบื้องหลัง LLM (รูปแบบภาษาขนาดใหญ่) อ้างว่ามีค่าใช้จ่ายน้อยกว่า $ 6 ล้านในการฝึกอบรมแบบจำลอง DeepSeek-V3 และใช้ฮาร์ดแวร์ที่ จำกัด เมื่อเทียบกับโคตรชาวอเมริกันในขณะที่ได้ผลลัพธ์ที่คล้ายกัน

อย่างไรก็ตามในขณะที่ Deepseek ได้รับความนิยมจากผู้ใช้และนักพัฒนาเหมือนกันส่วนใหญ่ต้องขอบคุณการกำหนดราคา API ที่น่าพอใจ แต่สิ่งที่เปล่งประกายไม่ได้เป็นทองคำเมื่อมาถึงแอพนี้ แบบจำลอง

Deepseek: Deepseek คืออะไร?

Deepseek ก่อตั้งขึ้นโดยเหลียงเวนเฟงผู้ประกอบการชาวจีนและผู้ร่วมก่อตั้งกองทุนป้องกันความเสี่ยงสูงซึ่งตั้งอยู่ที่หางโจวเจ้อเจียงประเทศจีน เดิมที Deepseek มีจุดประสงค์เพื่อเป็น AGI (ข่าวกรองทั่วไปประดิษฐ์) ฝ่ายวิจัยของนักบินสูงซึ่งใช้ AI ในอัลกอริทึมการซื้อขายโดยเฉพาะตั้งแต่ปี 2564 อย่างไรก็ตามตั้งแต่เดือนพฤษภาคม 2566 Deepseek ได้ยืนเป็น บริษัท ของตัวเอง กลายเป็นหนึ่งในนักลงทุนหลัก

Deepseek LLM (รูปแบบภาษาขนาดใหญ่) ของ บริษัท เปิดตัวในเดือนพฤศจิกายน 2566 ในฐานะ Coder Deepseek Open-Source และตามมาด้วย Deepseek-V2 ในเดือนพฤษภาคม 2567 บริษัท เปิดตัวรุ่น Deepseek-V3 ล่าสุดในเดือนธันวาคม 2567 ความนิยมด้วยแอพมือถือที่มีการดาวน์โหลดมากกว่า 1.6 ล้านครั้ง

ในขณะที่ Deepseek LLM ส่วนใหญ่คล้ายกับ chatbots ยอดนิยมอื่น ๆ เช่น Google Gemini หรือ Chatgpt แต่รุ่นที่ใช้ฟรีของแอพได้รับความนิยมจากผู้ใช้และการกำหนดราคา API ที่เป็นมิตรกับนักพัฒนาซอฟต์แวร์กำลังผลักดันให้เกิดการสนทนาระดับแนวหน้า

Deepseek: ทำไมถึงสำคัญ?

ตำนานเก่าแก่ไปว่าในระหว่างการแข่งขันอวกาศของปี 1960 นาซ่าใช้เงินหลายล้านดอลลาร์ในการพัฒนาปากกาอวกาศหลังจากที่มันตระหนักว่าทางเลือกจุดบอลไม่สามารถเขียนในสภาพแวดล้อมที่ไม่มีแรงโน้มถ่วงของอวกาศ ในขณะเดียวกันนักบินอวกาศของพวกเขาหลีกเลี่ยงค่าใช้จ่ายและปวดหัวดังกล่าวโดยใช้ดินสอ

ในขณะที่ ไม่มีสิ่งใดที่เป็นจริงมันเป็นคำอุปมาเรื่องความเจริญรุ่งเรืองและการปฏิบัติจริงที่ทำให้เป็นเรื่องราวที่ยอดเยี่ยม

อย่างไรก็ตามการสะท้อนตำนานของปากกาอวกาศ Deepseek ดูเหมือนจะสามารถดึงความสำเร็จที่คล้ายกันในเรื่องต้นทุนและการปฏิบัติจริงผ่านการพัฒนาแบบจำลอง Deepseek-V3 ซึ่งอ้างว่าได้รับการฝึกฝนน้อยกว่า 6 ล้านเหรียญ จากหลายร้อยล้านที่ใช้โดย บริษัท อื่น ๆ ที่ดำเนินการตามผลลัพธ์ที่คล้ายกัน (ในขณะที่บรรลุเป้าหมาย ระดับประสิทธิภาพที่เทียบเคียงได้–

ไม่เพียงแค่นั้น แต่รุ่นล่าสุดของ Deepseek-R1 ได้รับการออกแบบมาเพื่อจำลองความคิดเชิงตรรกะโดยการลดความเร็วของการตอบสนองสำหรับคำตอบที่มีเหตุผลมากขึ้น มันสามารถบรรลุผลลัพธ์เท่ากับ (ถ้าไม่ดีไปกว่า) โมเดล “การใช้เหตุผล” ของ Openai, GPT-O1-แม้ในขณะที่ บริษัท อ้างว่าถูก จำกัด โดยข้อ จำกัด การส่งออกของสหรัฐใน Nvidia GPU ที่ทรงพลังกว่า

Deepseek: ราคาเท่าไหร่?

Deepseek ใช้งานออนไลน์ได้ฟรีผ่านทาง เว็บพอร์ทัล หรือบนมือถือ (กับทั้งสอง Android และแอพ iOS พร้อมใช้งาน)

อย่างไรก็ตามผลกระทบที่การเกิดขึ้นของ Deepseek จะมีค่าใช้จ่ายของ AI สำหรับธุรกิจนักพัฒนาและอื่น ๆ อาจเป็นเรื่องก้าวล้ำที่สุดด้วยรูปแบบราคา API ของ บริษัท ที่ทำให้การแข่งขันออกจากน้ำ

ในขณะที่ openai ปัจจุบันค่าใช้จ่าย $ 15 ต่อล้านโทเค็น (หน่วยของข้อมูลที่แจ้งให้ทราบแบ่งออกเป็นระหว่างการสร้างแบบจำลองการตอบสนองของโมเดล) มีค่าใช้จ่ายเพียง 55 เซนต์ต่อโทเค็นล้านโทเค็นซึ่งเป็นปรากฎการณ์ที่ยอดเยี่ยมสำหรับผู้ใช้ API สูงถึง 96 เปอร์เซ็นต์

ความแตกต่างของค่าใช้จ่ายนี้อาจเป็นการเปลี่ยนแปลงเกมสำหรับผู้ใช้มืออาชีพจำนวนมากที่เกี่ยวข้องกับ AI และมีความเสี่ยงที่สำคัญต่อรายได้ที่อาจเกิดขึ้นของ Openai โดย Deepseek อาจบังคับให้มือของ บริษัท อื่น ๆ ลดราคาให้แข่งขันได้

ผลกระทบของ Deepseek ได้รับความรู้สึกในตลาดแล้ว ชื่อเซมิคอนดักเตอร์หลายตัวกำลังรู้สึกถึงการโจมตีรวมถึง Nvidia หลังจากการเปิดตัวรุ่นล่าสุดของ Deepseek ในวันจันทร์การซื้อขายล่วงหน้าตลาดลดลง 13.8%ขู่ว่าจะกำจัดเงินเกือบ 500 พันล้านเหรียญสหรัฐจากการซื้อขายของ บริษัท อย่างไรก็ตามมันได้ปีนกลับไปที่ 11%

Deepseek: การโต้เถียง

หากทุกอย่าง Deepseek มีให้เสียงที่ดีเกินไปที่จะเป็นจริงนั่นอาจเป็นเพราะการเรียกร้องของ Deepseek บางอย่างอาจเป็นเช่นนั้น

ประสิทธิภาพของโมเดล V3 และ R1 ของ Deepseek ไม่สามารถโต้แย้งได้ ถึงกระนั้นคำถามมากมายยังคงเกี่ยวกับการกำหนดราคาที่แท้จริงของ บริษัท การใช้ฮาร์ดแวร์ค่าใช้จ่ายในการฝึกอบรมและการจัดหาข้อมูลการฝึกอบรม

หลังเป็นเรื่องของการโต้เถียงกันอยู่แล้ว ผู้ใช้หลายคนรายงานว่า Deepseek V3 จะ อ้างถึงตัวเองว่าเป็น chatgptอาจแสดงให้เห็นว่ารุ่นนี้ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลสาธารณะที่สร้างขึ้นโดยโมเดล GPT-4 ของ OpenAI

พูดถึง techcrunchMike Cook นักวิจัยที่ King’s College London มีความเชี่ยวชาญใน AI สนับสนุนการเรียกร้องเหล่านี้โดยระบุว่า “เห็นได้ชัดว่าแบบจำลองกำลังเห็นการตอบสนองดิบจาก Chatgpt”

ปรุงอาหารไฮไลท์ว่านี่อาจไม่ใช่การกระทำโดยเจตนาโดย Deepseek แต่ยังชี้ให้เห็นว่าการฝึกฝนรูปแบบการฝึกอบรมเกี่ยวกับข้อมูลที่สร้างขึ้นโดยรุ่นอื่น ๆ อาจเป็น “แย่มาก” เปรียบเทียบกับ “ถ่ายสำเนาสำเนาสำเนา” ในแง่ที่ว่า คุณภาพของเอาต์พุตจะลดลงทุกครั้ง

นอกจากนี้ยังเป็นไปได้ว่าด้วยการใช้ข้อมูลการฝึกอบรมที่สร้างขึ้น Deepseek จะสืบทอดอคติใด ๆ ของโมเดลดั้งเดิมซึ่งเพิ่มอคติของ Chatbot ซึ่ง บังคับใช้การเซ็นเซอร์อย่างเข้มงวดโดยกฎหมายของพรรคต่อต้านคอมมิวนิสต์แห่งจีน (CCP) เรื่องเล่ารวมถึงเหตุการณ์ของเหตุการณ์จัตุรัสเทียนอันเหมินปี 1989 การประท้วงฮ่องกงความเป็นเจ้าของของไต้หวันการปฏิบัติต่อชาวอุยกูร์ของจีนหรือการยึดครองทิเบต

รูปแบบของการเซ็นเซอร์นี้ลดความเชื่อมั่นในแพลตฟอร์มเท่านั้นและผู้ก่อตั้ง Liang Wenfeng’s ความสัมพันธ์กับ CCP มีเพียงความกังวลที่เพิ่มขึ้นเกี่ยวกับวิธีการใช้ข้อมูลผู้ใช้หรือวิธีการที่เจ้าหน้าที่จีนสามารถใช้แพลตฟอร์มที่ไม่เหมาะสมในอนาคต

เขียน การอัปเดตไบโอเมตริกซ์Anthony Kimery อดีตหัวหน้าบรรณาธิการและผู้ร่วมก่อตั้งของ ความมั่นคงแห่งมาตุภูมิ TodaY เน้นว่าแพลตฟอร์มสามารถ “สนับสนุนแคมเปญที่บิดเบือนข้อมูลที่มุ่งเน้นไปที่สถาบันสหรัฐฯที่ไม่มั่นคง”

การอ้างสิทธิ์ของ Deepseek ว่ามันพัฒนาโมเดลด้วยฮาร์ดแวร์ขั้นสูงที่น้อยกว่าก็ถูกสอบสวนเช่นกัน นักวิเคราะห์ของ Citi Atif Malik กล่าวว่า “ในขณะที่ความสำเร็จของ Deepseek อาจก้าวล้ำเราตั้งคำถามถึงความคิดที่ว่าความสำเร็จของมันทำโดยไม่ต้องใช้ GPU ขั้นสูงเพื่อปรับแต่งและ/หรือสร้าง LLM พื้นฐาน เทคนิค.”

การตั้งคำถามของมาลิกอาจมีน้ำหนักมากขึ้นในขณะที่ Deepseek อ้างว่าโมเดล V3 ได้รับการฝึกฝนโดยใช้ Nvidia H800 GPU ซึ่งเป็นการสัมภาษณ์ล่าสุดกับ Alexandr Wang ผู้ก่อตั้ง Scale AI ของ Scale AI CNBC เห็นซีอีโอของ บริษัท แนะนำว่า “Deepseek มีประมาณห้าหมื่น H100s”

GPU เดียวกันมากที่ถูกบล็อกจากการส่งออกไปยังประเทศจีนโดยการบริหาร Biden ในปี 2023 โดย Wang ดำเนินการต่อ “พวกเขาไม่สามารถพูดคุยได้อย่างชัดเจนเพราะมันขัดกับการควบคุมการส่งออกที่ [the] สหรัฐอเมริกาได้เข้ามาแทนที่ “

มุมมอง

Deepseek ได้รับความนิยมอย่างมากที่จะให้ บริษัท ต่างๆเช่น OpenAi ต้องพิจารณาเมื่อรักษาฐานผู้ใช้ที่มีขนาดใหญ่ในการแข่งขันที่รุนแรง

อย่างไรก็ตามมันยังคงที่จะเห็นได้ว่ากลิ่นรถยนต์ใหม่ยังคงอยู่ในรุ่นล่าสุดของ Deekseek กำลังปิดบังกลิ่นของข้อมูลที่ผิดโดยรอบว่ามันพัฒนาแบบจำลองของมันและการกำหนดราคานั้นยั่งยืนในระยะยาวหรือไม่

เมื่อพิจารณาจากปฏิกิริยาล่าสุดของสหรัฐอเมริกาต่อ Tiktok มันยากที่จะจินตนาการว่า บริษัท อย่าง Deepseek ไปโดยไม่ต้องมีการตรวจสอบอย่างจริงจังนานขึ้นโดยเฉพาะอย่างยิ่งเมื่อโมเดลของ บริษัท เสี่ยง แผนของประธานาธิบดีทรัมป์ เพื่อให้สหรัฐอเมริกาเป็น “เมืองหลวงของโลกแห่ง AI”

ดูแหล่งที่มา

Leave a Reply Cancel reply