Sam Altman ซีอีโอของ Openai เริ่มต้นปีนี้โดยพูดในบล็อกโพสต์ว่าปี 2025 จะ เป็นตัวแทน AIเครื่องมือที่สามารถทำงานโดยอัตโนมัติและดำเนินการในนามของคุณ
ตอนนี้เราเห็นความพยายามครั้งแรกของ Openai
Openai ประกาศเมื่อวันพฤหัสบดีว่ากำลังเปิดตัวตัวอย่างการวิจัยของผู้ประกอบการตัวแทน AI ที่มีวัตถุประสงค์ทั่วไปซึ่งสามารถควบคุมเว็บเบราว์เซอร์และดำเนินการบางอย่างได้อย่างอิสระ ผู้ประกอบการกำลังมาหาผู้ใช้ในสหรัฐอเมริกาในแผนการสมัครสมาชิก Pro $ 200 ของ Chatgpt ก่อน Openai กล่าวว่ามีแผนที่จะม้วนคุณสมบัตินี้ให้กับผู้ใช้มากขึ้นในระดับบวกทีมและระดับองค์กรในที่สุด
-[Operator] จะเป็น [in] ประเทศอื่น ๆ เร็ว ๆ นี้” Sam Altman ซีอีโอของ Openai กล่าวระหว่างการถ่ายทอดสดในวันพฤหัสบดี “ น่าเสียดายที่ยุโรปใช้เวลาสักครู่”
ตัวอย่างการวิจัยเริ่มต้นนี้มีให้ผ่านผู้ดำเนินการ chatgpt.com แต่ในไม่ช้า Openai กล่าวว่าต้องการรวมผู้ให้บริการเข้ากับไคลเอนต์ CHATGPT ทั้งหมด

ผู้ประกอบการสัญญาว่าจะทำงานอัตโนมัติเช่นการจองที่พักท่องเที่ยวการจองร้านอาหารและการช็อปปิ้งออนไลน์ตาม OpenAI มีหลายหมวดหมู่งานที่ผู้ใช้สามารถเลือกภายในอินเทอร์เฟซของผู้ให้บริการรวมถึงการช็อปปิ้งการจัดส่งการรับประทานอาหารและการเดินทางซึ่งทั้งหมดนี้เปิดใช้งานระบบอัตโนมัติประเภทต่าง ๆ
เมื่อผู้ใช้ ChatGPT เปิดใช้งานผู้ให้บริการหน้าต่างเล็ก ๆ จะปรากฏขึ้นแสดงเว็บเบราว์เซอร์เฉพาะที่ตัวแทนใช้เพื่อทำงานให้เสร็จสมบูรณ์พร้อมกับคำอธิบายของการกระทำเฉพาะที่ตัวแทนกำลังดำเนินการอยู่ ผู้ใช้ยังสามารถควบคุมหน้าจอของพวกเขาในขณะที่ผู้ให้บริการทำงานเนื่องจากผู้ให้บริการใช้เบราว์เซอร์เฉพาะของตัวเอง
OpenAI กล่าวว่าผู้ประกอบการใช้พลังงานจากโมเดลตัวแทนที่ใช้คอมพิวเตอร์หรือ CUA ซึ่งรวมความสามารถในการมองเห็นของรุ่น GPT-4O ของ บริษัท เข้ากับความสามารถในการใช้เหตุผลจากโมเดลขั้นสูงของ OpenAI CUA ได้รับการฝึกฝนให้โต้ตอบกับส่วนหน้าของเว็บไซต์ซึ่งหมายความว่าไม่จำเป็นต้องใช้ API ที่หันหน้าเข้าหานักพัฒนาเพื่อเข้าถึงบริการที่แตกต่างกัน
กล่าวอีกนัยหนึ่ง CUA สามารถใช้ปุ่มนำทางเมนูและกรอกแบบฟอร์มบนหน้าเว็บเหมือนมนุษย์
Openai กล่าวว่ามันร่วมมือกับ บริษัท ต่างๆเช่น Doordash, eBay, Instacart, Priceline, StubHub และ Uber เพื่อให้แน่ใจว่าผู้ประกอบการเคารพข้อกำหนดในการบริการของธุรกิจเหล่านี้

“ โมเดล CUA ได้รับการฝึกฝนให้ขอการยืนยันจากผู้ใช้ก่อนที่จะเสร็จสิ้นงานที่มีผลข้างเคียงภายนอกเช่นก่อนที่จะส่งคำสั่งซื้อส่งอีเมล ฯลฯ เพื่อให้ผู้ใช้สามารถตรวจสอบงานของโมเดลได้อีกครั้งก่อนที่มันจะกลายเป็นถาวร” Openai เขียนในวัสดุที่ให้กับ TechCrunch -[It] ได้พิสูจน์แล้วว่ามีประโยชน์ในหลายกรณีและเรามุ่งมั่นที่จะขยายความน่าเชื่อถือนั้นในช่วงที่กว้างขึ้นของงาน”
แต่ Openai เตือน CUA ไม่สมบูรณ์แบบ บริษัท บอกว่า“[doesn’t] คาดหวัง [the] Cua เพื่อดำเนินการอย่างน่าเชื่อถือในทุกสถานการณ์”
“ ในปัจจุบันผู้ประกอบการไม่สามารถจัดการงานที่ซับซ้อนหรือพิเศษได้อย่างน่าเชื่อถือ” OpenAI เพิ่ม ในเอกสารสนับสนุน“ เช่นการสร้างสไลด์โชว์โดยละเอียดการจัดการระบบปฏิทินที่สลับซับซ้อนหรือโต้ตอบกับอินเตอร์เฟสเว็บที่กำหนดเองหรือไม่ได้มาตรฐานสูง
ด้วยความระมัดระวังอย่างมากมาย OpenAI ยังต้องมีการกำกับดูแลงานบางอย่างเช่นธุรกรรมธนาคาร CUA และผู้ประกอบการสามารถทำงานได้ด้วยตนเองเป็นส่วนใหญ่ ผู้ใช้จะต้องเข้าร่วมในการใส่ข้อมูลบัตรเครดิต OpenAI กล่าวว่าผู้ให้บริการไม่ได้รวบรวมหรือผ่านหน้าจอข้อมูลใด ๆ
“ ในเว็บไซต์ที่ละเอียดอ่อนโดยเฉพาะอย่างยิ่งเช่นอีเมลผู้ประกอบการต้องการการดูแลผู้ใช้ที่ใช้งานอยู่เพื่อให้แน่ใจว่าผู้ใช้สามารถตรวจจับและแก้ไขข้อผิดพลาดที่อาจเกิดขึ้นได้โดยตรง” OpenAI กล่าวในสื่อสนับสนุน
สิ่งนี้ จำกัด ประโยชน์ของผู้ประกอบการเพื่อให้แน่ใจ – แต่ยังทำให้มั่นใจได้ว่าตัวแทนไม่เห็นภาพหลอนและพูดใช้จ่ายเงินจำนองของคุณบนเก้าอี้สำเนียง Google ใช้วิธีการที่คล้ายกันกับตัวแทนโครงการ Mariner AI ซึ่งไม่ได้กรอกข้อมูลเช่นหมายเลขบัตรเครดิต
ข้อ จำกัด
ผู้ประกอบการมีข้อ จำกัด บางประการที่น่าสังเกต
มีขีด จำกัด อัตรา-ทั้งรายวันและขึ้นอยู่กับงาน Openai กล่าวว่าผู้ประกอบการสามารถทำงานได้หลายอย่างพร้อมกัน แต่มี “ขีด จำกัด แบบไดนามิก” ในเรื่องนี้ นอกจากนี้ยังมีขีด จำกัด การใช้งานโดยรวมที่รีเซ็ตทุกวัน
ในขั้นตอนการเปิดตัวนี้ผู้ประกอบการจะปฏิเสธที่จะทำงานทันทีด้วยเหตุผลด้านความปลอดภัยเช่นการส่งอีเมล (แม้ว่า CUA จะมีความสามารถในการนี้) และลบเหตุการณ์ปฏิทิน Openai กล่าวว่าสิ่งนี้จะเปลี่ยนแปลงในอนาคต แต่ไม่ให้ ETA
ผู้ประกอบการอาจได้รับ“ ติดอยู่” หากมันทำงานเป็นอินเทอร์เฟซที่ซับซ้อนโดยเฉพาะฟิลด์รหัสผ่านหรือตรวจสอบ CAPTCHA มันจะขอให้ผู้ใช้รับช่วงต่อเมื่อสิ่งนี้เกิดขึ้น Openai กล่าว
อนาคตตัวแทน
Openai ค่อนข้างช้าในการพัฒนาตัวแทน AI เมื่อเทียบกับคู่แข่ง (ดู: ตัวแทนจาก Rabbit, Google และมานุษยวิทยา) ซึ่งอาจมีส่วนเกี่ยวข้องกับความเสี่ยงด้านความปลอดภัยรอบ ๆ เทคโนโลยี
เมื่อระบบ AI สามารถดำเนินการบนเว็บได้มันจะเปิดประตูสู่กรณีการใช้งานที่อันตรายกว่าจากนักแสดงที่ไร้เดียงสา คุณสามารถทำให้เอเจนต์ AI โดยอัตโนมัติเพื่อจัดทำการหลอกลวงฟิชชิ่งหรือการโจมตี DDOS หรือให้พวกเขาคว้าตั๋วเข้าชมคอนเสิร์ตก่อนที่คนอื่นจะทำได้ โดยเฉพาะอย่างยิ่งสำหรับเครื่องมือที่ใช้กันอย่างแพร่หลายเป็น CHATGPT สิ่งสำคัญคือ OpenAI ดำเนินการเพื่อป้องกันการหาประโยชน์เหล่านั้น
Openai ดูเหมือนจะคิดว่าผู้ให้บริการปลอดภัยพอที่จะปล่อยในรูปแบบปัจจุบันอย่างน้อยก็เป็นตัวอย่างการวิจัย
“ ผู้ประกอบการใช้เครื่องมือที่พยายาม จำกัด ความอ่อนแอของโมเดลต่อการแจ้งเตือนที่เป็นอันตรายคำแนะนำที่ซ่อนอยู่และความพยายามฟิชชิ่ง” Openai อธิบาย บนเว็บไซต์ “ ระบบการตรวจสอบหยุดการดำเนินการหากตรวจพบกิจกรรมที่น่าสงสัยในขณะที่ท่ออัตโนมัติและท่อที่ตรวจสอบแล้วมนุษย์จะอัปเดตการป้องกันอย่างต่อเนื่อง”
ผู้ประกอบการเป็นความพยายามที่กล้าหาญที่สุดของ Openai ในการสร้างตัวแทน AI เมื่อสัปดาห์ที่แล้ว OpenAI เปิดตัวงานโดยให้คุณสมบัติระบบอัตโนมัติอย่างง่ายของ Chatgpt เช่นความสามารถในการตั้งค่าการแจ้งเตือนและกำหนดเวลาให้ทำงานในเวลาที่กำหนดทุกวัน
งานให้ผู้ใช้ CHATGPT บางคนคุ้นเคย แต่จำเป็นต้องมีคุณสมบัติในการทำให้ CHATGPT เป็นประโยชน์ในการใช้เป็น Siri หรือ Alexa อย่างไรก็ตามผู้ประกอบการแสดงความสามารถที่ผู้ช่วยเสมือนรุ่นก่อนหน้าไม่สามารถทำได้
ตัวแทน AI ได้รับการแหลมเป็นสิ่งที่ยิ่งใหญ่ต่อไปใน AI หลังจาก CHATGPT: เทคโนโลยีใหม่ที่จะเปลี่ยนวิธีการที่ผู้คนใช้อินเทอร์เน็ตและพีซีของพวกเขา แทนที่จะส่งข้อมูลและประมวลผลข้อมูลตัวแทนสามารถ – ในทางทฤษฎี – ดำเนินการและทำสิ่งต่าง ๆ
ด้วยการเปิดตัวคอนกรีตครั้งแรกของ Openai ในการเข้าร่วมตัวแทนในไม่ช้ามันจะกลายเป็นความชัดเจนว่าวิสัยทัศน์นี้เป็นจริงเพียงใด