ตอนนี้ Grok 3 กับ Xai Elona Muska มีชีวิตอยู่อย่างเป็นทางการแล้วมันถูกจัดเรียงกับคู่แข่งอย่างไร?
เมื่อวันจันทร์ที่ผ่านมา Musk ได้เปิดตัว Family Grok 3 ในการถ่ายทอดสดใน X โฆษณายังรวมถึงรูปแบบของการใช้เหตุผลของ Grok 3 Beta และ Grok 3 Mini Reasoning โมเดลที่มีตัวเลือกการใช้เหตุผลนั้นสูงกว่าแบบจำลองการกำเนิดมาตรฐานเช่น GPT-4 เพราะพวกเขาสามารถ “คิด” ผ่านปัญหาซึ่งทำให้พวกเขามีความอ่อนไหวต่อภาพหลอนน้อยลง
XAI ส่งเสริม Grok 3 เป็นรูปแบบที่ดีที่สุดในตลาดโดยอ้างว่าได้ข้ามคู่แข่งจาก Opeli, Google, Antropic และ Deepek ในการทดสอบเปรียบเทียบที่สำคัญ Grok 3 ได้รับผลลัพธ์ที่ดีภายใต้เท้า “ช็อคโกแลต” บนสนามกีฬา Chatbot ซึ่งทำให้แชทบอทซึ่งกันและกันในการทดสอบประสิทธิภาพของคนตาบอด
ทวีตสามารถลบออกได้
Grok 3 ส่วนใหญ่ติดต่อกับคู่แข่งความสำเร็จที่น่าประทับใจโดยคำนึงถึงการเริ่มต้นของเขา แต่ก็ยังมีข้อ จำกัด บางประการที่ก่อกวนนางแบบชายแดนอื่น ๆ นี่คือสิ่งอื่นที่พูดถึงผู้เชี่ยวชาญ AI เกี่ยวกับ Chatbt ใหม่ในบล็อก
Grok 3 นั้นดีพอ ๆ กับคู่แข่งของเขา แต่ก็ไม่เพียงพอที่จะยกเลิกการสมัครสมาชิก CHATGPT
Andrej Karpathy สมาชิกของผู้ก่อตั้ง Openai และอดีตผู้อำนวยการ AI ที่ Tesla ได้รับการเข้าถึง Grok 3 ที่ตีพิมพ์ใหม่ก่อนและแบ่งปัน “Fast Control Control” อันเป็นผลมาจากแบบจำลอง
จากการทดสอบมาตรฐานบางอย่างของเงื่อนไขที่รุนแรง Carpathians กล่าวว่า Grok 3 ด้วยฟังก์ชั่นการทำงานใหม่ของการค้นหาลึก: “รู้สึกอยู่ที่ไหนสักแห่งรอบ ๆ ดินแดนศิลปะของรุ่น OpenAI ที่แข็งแกร่งที่สุด (O1-Pro, 200 USD/เดือน) และ ดีกว่า Deepseek- Flash เล็กน้อยคิด R1 และ Gemini 2.0 –
ทวีตสามารถลบออกได้
Musk Stans รู้สึกตื่นเต้นที่ Grok 3 ได้ติดต่อกับคู่แข่ง แต่สำหรับผู้ที่กำลังมองหาโมเดลที่ดีที่สุดในตลาดมันอาจไม่เพียงพอที่จะเปลี่ยนอุดมการณ์ที่ไม่แยแส
“ ฉันคิดว่า Grok 3 ปรากฏตัวในความคาดหมาย” ศาสตราจารย์ Wharton Ai Ethan Mollick เขียน “ดังนั้นฉันไม่คิดว่าจะมีการอัพเดทมากมายในแง่ของการคาดการณ์ฉันทามติเกี่ยวกับปัญญาประดิษฐ์: ยังคงเร่งการพัฒนาความเร็วเป็นคูน้ำการคำนวณยังคงเป็นเรื่องสำคัญไม่มีซอสลับที่ชัดเจนเพื่อสร้างแบบจำลองชายแดน และมันฝรั่งทอด “อธิบายข้อได้เปรียบในการแข่งขันที่จำเป็นสำหรับการครอบงำของ AI
ความเร็วเบาสำหรับการฆ่า
ทวีตสามารถลบออกได้
Xai ละเว้นการเปรียบเทียบที่สำคัญของ Grok 3
สกรีนช็อตของแบบจำลองการใช้เหตุผลของ Grok 3 เกิน O3 Mini และ O1 Openai, Deepseek R1 และ Google Gemini 2.0 การคิดแฟลชได้กลายเป็นไวรัสที่ดูเหมือนรูปแบบการให้เหตุผลที่ทันสมัยที่สุด แต่ Opeli กล่าวว่า “ไม่เร็วนัก” ไม่นานหลังจากการแบ่งการทดสอบการเปรียบเทียบสด Live วิศวกรผลิตภัณฑ์ Openai Rex Asabor ได้เผยแพร่แผนภูมิ “อัปเดต” ด้วย O3 ที่เต้น Grok 3 ให้เหตุผลในการทดสอบทางคณิตศาสตร์และวิทยาศาสตร์
ทวีตสามารถลบออกได้
ตามจริงแล้ว O3 ยังไม่ได้รับการเผยแพร่ต่อสาธารณะดังนั้น Xai อาจไม่สามารถเข้าถึงผลลัพธ์เหล่านี้ได้ อย่างไรก็ตามสิ่งนี้ทำหน้าที่ทำให้แฟน ๆ ของ Grok สงบลงซึ่งอ้างว่า Altman และ บริษัท เอง พวกเขาปรุงสุก
อย่างไรก็ตามเรื่องนี้มันเป็นเรื่องใหญ่ที่ Grok 3 เกิดขึ้นอย่างรวดเร็ว
“สิ่งสำคัญที่ควรสังเกตคือ X มาถึงที่นี่อย่างรวดเร็วและไม่ว่าจะเป็นเรื่องนานหรือไม่ รุ่น Grok ได้รับการปรับปรุงอย่างรวดเร็วอย่างมากเนื่องจาก Google และ Opeli เริ่มทำมัน 13 และ 8 ปีก่อนที่จะเป็นรากฐานของ XAI ในปี 2023
ตามที่ Musk Grok 3 ได้รับการฝึกฝน 10 เท่าของกำลังคอมพิวเตอร์ของ Grok 2 จาก 200,000 GPU อย่างน้อยที่สุดในช่วงเวลาสั้น ๆ ก็เสริมสร้างกฎการปรับขนาด: การคำนวณมากขึ้นเท่ากับประสิทธิภาพของโมเดลที่ดีขึ้นดังที่ Mollick ระบุไว้ในโพสต์ที่สาม
ทวีตสามารถลบออกได้
ที่จะบอกว่ายังมีข้อสงสัยว่ารุ่นนี้จะนำไปสู่ความฉลาดที่สูงขึ้นหรือไม่ยกเว้นสิ่งที่เป็นไปได้ในปัจจุบัน นักวิจัย AI และศาสตราจารย์ด้านจิตวิทยาและวิทยาศาสตร์ประสาทแกรี่มาร์คัสยังคงสงสัยว่าพวกเขาจะเกิดขึ้นในระดับของกฎระเบียบ
ทวีตสามารถลบออกได้
Grok 3 ต่อสู้กับข้อ จำกัด เช่นเดียวกับรุ่นอื่น ๆ
เช่นเดียวกับนางแบบอื่น ๆ อารมณ์ขันของเขาค่อนข้างปานกลางและต่อสู้กับรุ่นของภาพ SVG Grok 3 อาจ “ตื่น” เกินไปสำหรับมัสค์และแฟน ๆ ที่ถูกต้องของเขา ในการวิเคราะห์ของเขา Karpathy กล่าวว่า Grok 3 ไม่สามารถหาอะไรได้ดีไปกว่าเรื่องตลกของพ่อของ Punny โดยสังเกตว่า “นี่เป็นปัญหา LLM ทั่วไปที่มีความเป็นไปได้อารมณ์ขันและการล่มสลายของโหมดทั่วไป”
Carpathy ยังขอให้ Grok 3 “สร้าง SVG Pelikan ขี่จักรยาน” เพราะ LLM มักจะพยายามสร้างองค์ประกอบหลายอย่างในภาพสองมิติ “เพราะ LLM ไม่สามารถ” เห็น “เช่นเดียวกับผู้คนดังนั้นจัดระเบียบสิ่งต่าง ๆ ในที่มืด “Grok 3 ได้ดีกับบทกวีนี้และดีกว่าคนอื่น ๆ (RIP Gemini 1.5 Flash) แต่มันก็ไม่ได้สมบูรณ์แบบ
ทวีตสามารถลบออกได้
การทดสอบ Karpathy ครั้งต่อไปคือแนวทาง Grok 3 ในหัวข้อที่ถูกตั้งข้อหาทางการเมืองเพราะ Musk วางตำแหน่ง Grok เป็นทางเลือกแทนแบบจำลองอื่น ๆ ที่ถือว่า “ถูกต้องทางการเมืองมากเกินไป” ในกรณีของ Carpathha Chatbot “สร้างเรียงความ 1 หน้าตามหลักการปฏิเสธที่จะตอบว่าเขาจะได้รับการพิสูจน์อย่างมีจริยธรรมหรือไม่ถ้ามีคนไม่สามารถช่วยคน 1 ล้านคนจากความตาย” ซึ่งหมายถึงเขาว่ามันอาจจะ “อ่อนไหวเกินไป” เพื่อประเด็นขัดแย้งทางจริยธรรมอาจทำให้มัสค์ผิดหวัง
ก่อนหน้านี้โมเดล Grok เอนตัวไปทางซ้ายในประเด็นทางการเมือง แต่มัสค์กล่าวว่ามันเป็นผลิตภัณฑ์ของข้อมูลสาธารณะที่เขาฝึกฝนและสาบานว่า Grok นั้นเป็น “ทางการเมืองที่เป็นกลาง” มากกว่า
แผนสมาชิก X Premium+ – ซึ่งเพิ่งเพิ่มขึ้นเป็น USD 50 ต่อเดือน – เข้าถึงการเข้าถึง Grok 3 ครั้งแรก
หัวข้อ
ปัญญาประดิษฐ์ Elon Musk