ระบบการดูแลสุขภาพของ CHATGPT-4O และ LLMS หลายรูปแบบ

Posted on

อนาคตของการแพทย์นั้นเชื่อมโยงอย่างไม่แน่นอนกับการพัฒนาของปัญญาประดิษฐ์ (AI) อย่างแยกไม่ออก แม้ว่าการปฏิวัติครั้งนี้จะเกิดขึ้นมานานหลายปี แต่ไม่กี่เดือนที่ผ่านมาถือเป็นการเปลี่ยนแปลงครั้งสำคัญเมื่ออัลกอริทึมในที่สุดก็ย้ายออกจากห้องปฏิบัติการพิเศษและเข้าสู่ชีวิตประจำวันของเรา

การปฏิวัติครั้งนี้เร่งตัวขึ้นเมื่อ บริษัท เทคโนโลยีขนาดใหญ่เริ่มเปิดตัวโมเดลภาษาขนาดใหญ่หลายรูปแบบและสัญญาว่าพวกเขาจะเปิดเผยต่อสาธารณชนในไม่ช้า เพลงล่าสุดและอาจจะยิ่งใหญ่ที่สุดคือข้อความของ CHATGPT-4O จาก OpenAI โมเดล 4o อธิบายว่า “Multimodal ธรรมชาติ” ซึ่งเป็นคุณสมบัติที่อ้างสิทธิ์สำหรับ Google Gemini ในการเปิดตัว ในขณะที่คนธรรมดา -นักบวชยังคงขาดการเข้าถึงคุณสมบัติหลายรูปแบบของราศีเมถุน แต่มีความหลากหลายทางหลายส่วนของ 4O แต่มีให้ใช้งานได้อย่าง จำกัด -เพื่อใช้งานบัญชีฟรี

แล้วเรามาที่นี่ได้อย่างไรและทำไมสิ่งนี้จึงสำคัญ? มาดูเส้นทางที่เราเดินทางในช่วง 18 เดือนที่ผ่านมาและดูอนาคตเพื่อให้เราสามารถเข้าใจความหมาย!

การเปิดตัวสาธารณะของแบบจำลองภาษาขนาดใหญ่ (LLMS) เช่นเดียวกับ CHATGPT ซึ่งกลายเป็นการใช้เวลาของผู้บริโภคที่เติบโตเร็วที่สุดได้ประสบความสำเร็จคำราม LLMS เป็นรูปแบบการเรียนรู้ของเครื่องที่ผ่านการฝึกอบรมเกี่ยวกับข้อมูลข้อความจำนวนมากที่ช่วยให้พวกเขาเข้าใจและสร้างข้อความที่เหมือนมนุษย์ตามรูปแบบและโครงสร้างที่พวกเขาได้เรียนรู้ พวกเขาแตกต่างอย่างชัดเจนจากวิธีการเรียนรู้ลึกก่อนหน้านี้ในระดับความสามารถและผลกระทบที่อาจเกิดขึ้น

แบบจำลองภาษาขนาดใหญ่ในไม่ช้าจะหาทางเข้าสู่สภาพแวดล้อมทางคลินิกในชีวิตประจำวันเพียงเพราะการขาดผู้เชี่ยวชาญด้านการดูแลสุขภาพทั่วโลกกลายเป็นเรื่องเยือกเย็นและ AI จะให้งานกับงานที่ไม่ต้องการผู้เชี่ยวชาญทางการแพทย์ที่มีความสามารถ แต่ก่อนที่สิ่งนี้จะเกิดขึ้นได้ก่อนที่เราจะมีกรอบกฎหมายที่แข็งแกร่งเพียงพอในสถานที่เราเห็นแล้วว่าเทคโนโลยีใหม่นี้ใช้ในชีวิตประจำวันอย่างไร

เพื่อให้เข้าใจถึงสิ่งที่อยู่ตรงหน้าเราเรามาสำรวจแนวคิดที่สำคัญอีกประการหนึ่งที่จะมีบทบาทสำคัญในการเปลี่ยนแปลงของยา: ความหลากหลาย

แพทย์และพยาบาลเป็นซูเปอร์คอมพิวเตอร์ Medical AI เป็นเครื่องคิดเลข

ระบบหลายรูปแบบสามารถประมวลผลและตีความข้อมูลอินพุตหลายประเภทเช่นข้อความรูปภาพเสียงและวิดีโอในเวลาเดียวกัน AIS การแพทย์ในปัจจุบันจะประมวลผลข้อมูลประเภทหนึ่งเช่นข้อความหรือภาพรังสี

อย่างไรก็ตามยาของธรรมชาติเป็นหลายรูปแบบเป็นมนุษย์ ในการวินิจฉัยและรักษาผู้ป่วยการดูแลสุขภาพระดับมืออาชีพกำลังฟังผู้ป่วยอ่านไฟล์สุขภาพดูภาพทางการแพทย์และตีความผลลัพธ์ในห้องปฏิบัติการ นี่คือสิ่งที่เกินกว่าที่ AI ทุกคนมีความสามารถในวันนี้

ความแตกต่างระหว่างทั้งสองสามารถเปรียบเทียบกับความแตกต่างระหว่างนักวิ่งและ Pentathlet นักวิ่งที่โดดเด่นในวินัยในขณะที่ pentathlet ต้องเก่งในหลายสาขาที่จะประสบความสำเร็จ

โมเดลภาษาขนาดใหญ่ปัจจุบัน (LLMs) ส่วนใหญ่เป็นนักวิ่งพวกเขาเป็น unimodal ผู้คนในการแพทย์เป็นอาจารย์ของทีม Pentathlon

ปัจจุบันโมเดลภาษาขนาดใหญ่ (LLMs) ส่วนใหญ่เป็น unimodal ซึ่งหมายความว่าพวกเขาสามารถวิเคราะห์ข้อความได้เท่านั้น GPT-4 สามารถวิเคราะห์ภาพและเข้าใจคำสั่งเสียงในแอพโทรศัพท์และทำ chatgpt-4o โมเดลเหล่านี้ยังสามารถสร้างภาพได้ ส่วนที่เหลือของความสามารถหลายรูปแบบยังไม่สามารถใช้ได้กับสมาชิกประจำวัน LLM ที่ใช้กันอย่างแพร่หลายอื่น ๆ เช่นราศีเมถุนของ Google หรือ Claude AI อาจตีความพรอมต์ภาพ (เช่นไดอะแกรม) แต่ยังไม่สามารถสร้างการตอบสนองของภาพได้ ในขณะเดียวกัน Google กำลังทำงานเพื่อบุกเบิกเวทีรูปแบบภาษาขนาดใหญ่ทางการแพทย์ที่มีหลายรุ่นรวมถึงล่าสุด: Med-Gemini

โดยรวมแล้วจากมุมมองของนักวิชาการด้านการแพทย์เป็นที่ชัดเจนว่า LLMs หลายรูปแบบ (M-LMS) ที่มีฟังก์ชั่นเต็มรูปแบบจะมาในไม่ช้าไม่เช่นนั้น AI จะไม่สามารถมีส่วนร่วมอย่างมีนัยสำคัญต่อธรรมชาติของยาและการดูแล ระบบเหล่านี้จะลดภาระงานของภาระงาน แต่ไม่ได้แทนที่ผู้เชี่ยวชาญด้านสุขภาพของมนุษย์

อนาคตคือ m-llms

การพัฒนา M-LLMS จะมีผลกระทบอย่างน้อยสามประการ:

1. AI จะจัดการเนื้อหาหลายประเภทตั้งแต่ภาพไปจนถึงเสียง

M-LLM จะสามารถรักษาและตีความเนื้อหาประเภทต่าง ๆ ซึ่งมีความสำคัญต่อการวิเคราะห์ที่ครอบคลุมด้านการแพทย์ เราสามารถระบุตัวอย่างหลายร้อยตัวอย่างเกี่ยวกับประโยชน์ของระบบดังกล่าว แต่จะกล่าวถึงเพียงไม่กี่ในห้าหมวดหมู่ต่อไปนี้:

  • การวิเคราะห์ข้อความ: M-LLMS จะสามารถจัดการงานด้านการบริหารงานคลินิกการศึกษาและการตลาดจำนวนมากตั้งแต่การปรับปรุงรายการทางการแพทย์อิเล็กทรอนิกส์ไปจนถึงการแก้ปัญหากรณีศึกษา
  • การวิเคราะห์ภาพ: พื้นที่กว้างอีกเรื่องเกี่ยวกับกรณีการใช้งานที่มีศักยภาพตั้งแต่การอ่านบันทึกที่เขียนด้วยลายมือไปจนถึงการวิเคราะห์รังสีวิทยา (จักษุวิทยา, ประสาทวิทยา, พยาธิวิทยา ฯลฯ ) ภาพ
  • การวิเคราะห์เสียง: M-LLMS ในที่สุดจะมีความสามารถในการตรวจสอบโรคเช่นการตรวจสอบเสียงหัวใจและปอดไปสู่ความผิดปกติเพื่อให้แน่ใจว่ามีการตรวจหาก่อน แต่เสียงยังสามารถให้ข้อมูลที่มีค่าในด้านสุขภาพจิตและการฟื้นฟูสมรรถภาพ
  • การวิเคราะห์วิดีโอ: อัลกอริทึมขั้นสูงจะสามารถเป็นแนวทางให้นักศึกษาแพทย์ในการฝึกอบรมการผ่าตัดเสมือนจริงในแง่ของการเล็งอย่างแม่นยำย้ายดำเนินการต่อ แต่วิดีโอยังสามารถใช้ในการตรวจจับเงื่อนไขทางระบบประสาทหรือสนับสนุนผู้ป่วยที่สื่อสารด้วยภาษามือ
  • การวิเคราะห์เอกสารที่ซับซ้อน: ซึ่งจะรวมถึงความช่วยเหลือเกี่ยวกับการทบทวนวรรณกรรมและการวิจัยการวิเคราะห์แนวทางการแพทย์สำหรับการตัดสินใจทางคลินิกและการเข้ารหัสทางคลินิกในรูปแบบอื่น ๆ

2. มันจะทำลายอุปสรรคทางภาษา

M-LLMs เหล่านี้จะอำนวยความสะดวกในการสื่อสารระหว่างผู้ให้บริการด้านการดูแลสุขภาพและผู้ป่วยที่พูดภาษาต่าง ๆ และแปลระหว่างภาษาต่าง ๆ แบบเรียลไทม์ เช่นเดียวกับที่เราได้เห็นว่าการแปลสดทำงานอย่างไรกับ CHATGPT-4O เห็นได้ชัดว่าการกำจัดอุปสรรคทางภาษาที่อาจเกิดขึ้นได้จากการนัดหมายทางการแพทย์
ผู้เชี่ยวชาญ: “คุณช่วยชี้ให้เห็นว่ามันเจ็บที่ไหน”

m-llm (การแปลของผู้ป่วย): “คุณชี้ให้เห็นว่ามันเจ็บที่ไหน”

อดทน ชี้ไปที่ช่องท้อง

m-llm (แปลเป็นผู้เชี่ยวชาญ): “ผู้ป่วยชี้ไปที่หน้าท้อง”

ผู้เชี่ยวชาญ: “ในระดับ 1 ถึง 10 คุณจะให้คะแนนความเจ็บปวดของคุณอย่างไร”

m-llm (การแปลของผู้ป่วย): “ในระดับ 1 ถึง 10 คุณจะมีคุณสมบัติอย่างไร?”

อดทน: “มันคือ 8th”

m-llm (แปลเป็นผู้เชี่ยวชาญ):“ มันเป็น 8

3. ในที่สุดการมาถึงของการทำงานร่วมกันอาจเชื่อมต่อและประสานระบบโรงพยาบาลที่แตกต่างกัน

M-LLM สามารถทำหน้าที่เป็นศูนย์กลางกลางที่อำนวยความสะดวกในการเข้าถึง AIS unimodal ต่าง ๆ ที่ใช้ในโรงพยาบาลเช่นซอฟต์แวร์รังสีซอฟต์แวร์การจัดการประกันภัยเวชระเบียนอิเล็กทรอนิกส์ (EMR) ฯลฯ สถานการณ์ในวันนี้มีดังนี้:

บริษัท ผลิตซอฟต์แวร์สำหรับแผนกรังสีวิทยาที่ใช้รูปแบบเฉพาะของ AI ในการทำงานประจำวัน อัลกอริทึมของ บริษัท อื่นกำลังทำงานร่วมกับเวชระเบียนอิเล็กทรอนิกส์ของโรงพยาบาลและอีกสามคนที่มีส่วนร่วมในการสร้าง AI เพื่อจัดทำรายงานการประกันภัย อย่างไรก็ตามโดยทั่วไปแพทย์จะสามารถเข้าถึงระบบที่เกี่ยวข้องกับสาขาของพวกเขาอย่างเคร่งครัดตัวอย่างเช่นนักรังสีวิทยาสามารถเข้าถึง AI รังสี แต่ผู้เชี่ยวชาญโรคหัวใจไม่ได้ และแน่นอนอัลกอริทึมเหล่านี้ไม่ได้สื่อสารกัน หากแผนกโรคหัวใจใช้อัลกอริทึมที่วิเคราะห์สัญญาณหัวใจและปอดนักเดินอาหารหรือจิตแพทย์น่าจะไม่สามารถเข้าถึงได้ – แม้ว่าการค้นพบของมันจะเป็นประโยชน์สำหรับการวินิจฉัยของพวกเขา

ขั้นตอนที่สำคัญคือเมื่อ M-LM-to last-สามารถเข้าใจภาษาและรูปแบบของแอพพลิเคชั่นซอฟต์แวร์เหล่านี้ทั้งหมดและช่วยให้ผู้คนสื่อสารกับพวกเขา แพทย์โดยเฉลี่ยจะสามารถทำงานกับซอฟต์แวร์ Radiological AI ได้อย่างง่ายดายซอฟต์แวร์ AI ที่จัดการ ECHS และ AI ที่สี่และแปด (ฯลฯ ) AI ที่ใช้ในโรงพยาบาล

ศักยภาพนี้มีความสำคัญมากเพราะความก้าวหน้าดังกล่าวไม่ได้เกิดขึ้นในทางอื่น ไม่มี บริษัท เดียวที่จะมาพร้อมกับซอฟต์แวร์ดังกล่าวเพราะพวกเขาไม่สามารถเข้าถึงข้อมูล AI ที่พัฒนาโดยแต่ละ บริษัท อย่างไรก็ตาม M-LLM จะสามารถสื่อสารกับระบบเหล่านี้เป็นรายบุคคลและในฐานะศูนย์กลางกลางเป็นเครื่องมือที่มีความสำคัญอย่างยิ่งต่อแพทย์

การเปลี่ยนจาก unimodal เป็น Multimodal AI เป็นขั้นตอนที่จำเป็นในการใช้ประโยชน์จากศักยภาพของ AI ในการแพทย์อย่างเต็มที่ ด้วยการพัฒนา M-RLMS ที่สามารถประมวลผลเนื้อหาหลายประเภททำลายอุปสรรคทางภาษาและอำนวยความสะดวกในการเข้าถึงแอปพลิเคชัน AI อื่น ๆ เราสามารถปฏิวัติวิธีที่เราฝึกฝนยา การเดินทางจากการเป็นเครื่องคิดเลขไปจนถึงการจับคู่ซูเปอร์คอมพิวเตอร์ที่เราเรียกว่าแพทย์นั้นท้าทาย แต่เป็นการปฏิวัติที่เกิดขึ้นต่อหน้าต่อตาของเรา

โพสต์บริการสุขภาพสำหรับ chatgpt-4o และ Multimodal LLMs ปรากฏตัวครั้งแรกในนักอนาคตการแพทย์

ดูแหล่งที่มา

Leave a Reply

Your email address will not be published. Required fields are marked *