หมายเหตุของบรรณาธิการ: นี่เป็นเรื่องแรกในซีรีย์สองส่วนเกี่ยวกับการใช้แบบจำลองพื้นฐานในอุตสาหกรรม MedTech เรื่องที่สองจะเผยแพร่ในวันอังคาร
บริษัท หลายแห่งในอุปกรณ์การแพทย์ส่งเสริมการใช้ “โมเดลพื้นฐาน” ซึ่งเป็นปัญญาประดิษฐ์ประเภทหนึ่งที่สามารถปรับให้เข้ากับงานที่หลากหลาย อย่างไรก็ตามยังมีคำถามเกี่ยวกับการใช้เทคโนโลยีในอุตสาหกรรม MedTech
ในปีที่ผ่านมา GE Healthcare ส่งเสริมรูปแบบมูลนิธิวิจัย MRIที่ Philips โฆษณาแผนการ การทำงานร่วมกับ Nvidia เพื่อสร้างแบบจำลองพื้นฐานสำหรับ MRIs และบทคัดย่ออื่น ๆ ในการประชุม Radiological Society of North America เมื่อปีที่แล้วมุ่งเน้นไปที่วิธีการ ประเมินและปรับปรุงรูปแบบพื้นฐาน– สำนักงานคณะกรรมการอาหารและยาได้ปรับปรุงด้วย ฐานข้อมูลของอุปกรณ์การแพทย์ที่เปิดใช้งาน AI เพื่อทราบว่ามันสำรวจวิธีการระบุและการติดฉลากอุปกรณ์ที่มีโมเดลพื้นฐาน
อย่างไรก็ตามคำจำกัดความของสิ่งที่นับว่าเป็นแบบจำลองพื้นฐานนั้นไม่ชัดเจนผู้เชี่ยวชาญกล่าวและเป็นเรื่องยากที่จะรู้ว่าเครื่องมือที่มีอยู่ในปัจจุบันช่วยนักรังสีวิทยาและผู้ป่วยในปัจจุบัน
โมเดลรากฐานคืออะไร?
Magdalini Paschali ปริญญาเอกทางไปรษณีย์เรียนรู้ที่แผนกรังสีวิทยาของ Stanford กล่าวว่าแบบจำลองพื้นฐานมีคุณสมบัติที่สำคัญบางประการ: พวกเขาได้รับการฝึกฝนในชุดข้อมูลขนาดใหญ่ที่ส่วนใหญ่ประกอบด้วยข้อมูลที่ไม่มีเครื่องหมาย พวกเขาสามารถประมวลผลข้อมูลหลายประเภทเช่นรูปภาพข้อความประวัติทางการแพทย์และจีโนม และในที่สุดพวกเขาสามารถจัดการกับงานที่หลากหลายเช่นแบบจำลองที่ตรวจพบโรคที่ไม่เคยเห็นในระหว่างการออกกำลังกาย

Magdalini Paschalal เป็นนักวิชาการระดับปริญญาเอกไปรษณีย์และภาควิชา radilogy ของสแตนฟอร์ด
ได้รับอนุญาตจาก Stanford
Paschali เผยแพร่กระดาษ เมื่อต้นปีที่ผ่านมาในวารสารรังสีวิทยา RSNA ซึ่งต้องการกำหนดเทคโนโลยีให้ชัดเจนยิ่งขึ้น
ในทางปฏิบัติ “ทุกอย่างสามารถนิยามได้ว่าเป็นแบบจำลองพื้นฐาน” Akshay Chaudhari ผู้ช่วยศาสตราจารย์ด้านรังสีวิทยาและวิทยาศาสตร์ข้อมูลชีวการแพทย์ที่ Stanford กล่าว
Chaudhari กล่าวว่าคำว่า “แบบจำลองพื้นฐาน” คือ คิดค้นครั้งแรกที่ Stanford ในปี 2021 ในระบบการดูแลสุขภาพเป็นหนึ่งในเวอร์ชันแรก เปิดตัว Med-Palm ของ Google ในตอนท้ายของปี 2022 รูปแบบภาษาขนาดใหญ่ได้รับการออกแบบมาเพื่อตอบคำถามทางการแพทย์
แบบจำลองพื้นฐานเริ่มมีความโดดเด่นมากขึ้นที่ RSNA ในปี 2023 Chaudhari กล่าว
แบบจำลองการเรียนรู้ลึกแบบดั้งเดิมที่ใช้ในรังสีวิทยาเช่นการตรวจหาโรคปอดบวมมุ่งเน้นไปที่สุขภาพเฉพาะและขึ้นอยู่กับข้อมูลที่ติดฉลาก ตัวอย่างเช่นนักรังสีวิทยาจะทบทวนภาพหมุนเวียนการเกิดโรคปอดบวมหรือเน้นในรายงานข้อความ Nina Kottler รองหัวหน้าเจ้าหน้าที่การแพทย์ของปัญญาประดิษฐ์ทางคลินิกที่ Radiology Partners กล่าว
สำหรับโมเดลพื้นฐานที่ได้รับการฝึกฝนเกี่ยวกับภาพหลายล้านภาพแทนที่จะเป็นหลายพันภาพที่ต้องการข้อมูลที่มีป้ายกำกับมันไม่สามารถใช้งานได้จริง Chaudhari กล่าว
โมเดลรากฐานมีความแม่นยำมากขึ้นหรือไม่?
นักพัฒนาอุปกรณ์การแพทย์บางคนอ้างว่าโมเดลกองทุนมีความแม่นยำมากกว่าโมเดล AI ที่แคบ ตัวอย่างเช่น AIDOC ที่สร้าง triage -software สำหรับรังสีวิทยาโมเดลพื้นฐานกล่าว เครื่องมือ AI ที่แม่นยำยิ่งขึ้น
ผู้เชี่ยวชาญกล่าวว่าความถูกต้องของหน่วยขึ้นอยู่กับวิธีการสร้าง Paschali ของสแตนฟอร์ดกล่าวว่าแบบจำลองพื้นฐานที่ใช้ “นอกกรอบ” โดยไม่มีความเชี่ยวชาญหรือการฝึกอบรมเพิ่มเติมสามารถทำงานได้แย่กว่าเครื่องมือ AI ที่เฉพาะเจาะจงมากขึ้น แต่มันสามารถทำงานได้ดีขึ้นเมื่อเห็นตัวอย่างและบริบท
“สิ่งที่ดีที่สุดที่เราทำได้คือดูข้อความสรุปที่มาจากเอกสารการกวาดล้างขององค์การอาหารและยาและอย่างน้อยในตลาดเรายังไม่ได้เห็นประโยชน์ของโมเดลมูลนิธิเหล่านี้”
Akshay Chaudhari
รองศาสตราจารย์ด้านรังสีวิทยาและวิทยาศาสตร์ข้อมูลชีวการแพทย์ในสแตนฟอร์ด
เนื่องจากโมเดลพื้นฐานได้รับการฝึกฝนในข้อมูลจำนวนมากพวกเขาจึงสามารถใช้ประโยชน์จากการค้นหาเหตุการณ์ที่หายากได้ดีขึ้นเช่นโป่งพองของสมอง Kottler กล่าว
“ เมื่อคุณมีคนเพียงเล็กน้อยเท่านั้นที่มีบางสิ่งบางอย่างการค้นหาสิ่งนั้นเหมือนเข็มในกองหญ้า” Kottler กล่าว “คุณต้องการแบบจำลองที่แม่นยำมากเพื่อให้สามารถทำได้”

Nina Kottler เกี่ยวข้องกับเจ้าหน้าที่การแพทย์ของปัญญาประดิษฐ์ทางคลินิกที่ Radiology Partners
ได้รับอนุญาตจากคู่ค้ารังสีวิทยา
อีกพื้นที่หนึ่งที่โมเดลพื้นฐานสามารถส่องแสงช่วยให้การพัฒนารุ่น AI อื่น ๆ เร็วขึ้น การสร้างโมเดล AI ที่แคบแบบดั้งเดิมอาจใช้เวลาหกเดือนในการทำความสะอาดข้อมูลรู้สึกถึงข้อมูลและตรวจสอบการฝึกอบรม Kottler กล่าว การวนซ้ำที่หลากหลายของรูปแบบพื้นฐานสามารถสร้างได้ภายในไม่กี่สัปดาห์
อย่างไรก็ตามในทางปฏิบัติมันเป็นเรื่องยากที่จะรู้ว่าประโยชน์เหล่านี้ได้แปลเป็นประโยชน์จริงสำหรับผู้ป่วยหรือทีมดูแลของพวกเขา สำหรับโมเดลพื้นฐานที่ได้ตรวจสอบ FDA มีข้อมูลสาธารณะเพียงเล็กน้อยที่สนับสนุนการเรียกร้องขององค์กร Chaudhari ของ Stanford กล่าว
“สิ่งที่ดีที่สุดที่เราทำได้คือดูสรุปที่มาจากเอกสารการกวาดล้างขององค์การอาหารและยา” เขากล่าว “และอย่างน้อยในตลาดเรายังไม่ได้เห็นประโยชน์ของโมเดลมูลนิธิเหล่านี้”
การประเมินแบบจำลองพื้นฐาน
ปัจจุบันโมเดลพื้นฐานที่ได้รับอนุมัติจาก FDA ได้รับการออกแบบมาเพื่อแก้ปัญหางานเฉพาะเช่น idocs ribfracture triage เครื่องมือที่สร้างขึ้นบนรูปแบบพื้นฐานของ บริษัท Aidoc ได้รับการกวาดล้าง 510 (k) สำหรับแบบจำลองโดยใช้เครื่องมือรุ่นเก่ากว่าของเครื่องมือ triage การแตกหักของซี่โครงเป็นภาคแสดง กระบวนการของ 510 (k) กำหนดให้ผู้ผลิตแสดงให้เห็นถึงความเท่าเทียมกันอย่างมีนัยสำคัญระหว่างความสามัคคีและอุปกรณ์ predicat ที่สามารถทำการตลาดในสหรัฐอเมริกา
สำหรับรุ่นที่กว้างขึ้นที่มีภาษาและรูปภาพหรือวิดีโอยังไม่มีแนวทาง Chaudhari กล่าว
โรงพยาบาลบางแห่งมีระบบสำหรับการประเมินโมเดล AI แต่ก็ไม่สมบูรณ์แบบ ตัวอย่างเช่นโรงพยาบาลจะระบุความต้องการเช่นแบบจำลองที่สามารถระบุโรคปอดบวมในการถ่ายภาพรังสีหรือแบบจำลองเพื่อจัดทำรายงาน X -ray
“ จากนั้นพวกเขาก็รวบรวมภาพ 1,000 ภาพในส่วนที่พวกเขารู้จักฉลากและจากนั้นพวกเขาจะจัดการแข่งขันเพื่อดูว่าซัพพลายเออร์รายใดเพิ่มบริการในชุดข้อมูลนั้น” Chaudhari กล่าว “ มันเป็นพื้นฐาน แต่มันเป็นสิ่งที่ดีที่สุดของสิ่งที่เรามีเพราะนั่นเป็นวิธีเดียวที่เราสามารถพิจารณาได้ว่าการแสดงในท้องถิ่นนั้นเหมาะสำหรับงานที่กำหนด”

Akshay Chaudhari เป็นผู้ช่วยศาสตราจารย์ด้านรังสีวิทยาและวิทยาศาสตร์ข้อมูลชีวการแพทย์ที่ Stanford
ได้รับอนุญาตจาก Stanford
สิ่งนี้อาจเป็นไปได้สำหรับศูนย์การแพทย์วิชาการขนาดใหญ่ที่มีทีมวิทยาศาสตร์ข้อมูล แต่ “โรงพยาบาลหลายแห่งจะใช้แบบจำลองและรับข้อมูลคุณภาพที่น่าสงสัยออกมา” Chaudhari กล่าวเสริม
ในการทดสอบแบบจำลองพื้นฐานเพื่อความแม่นยำเป็นสิ่งสำคัญที่จะต้องกำหนดการวัดและงานสำหรับแบบจำลองตามการเรียกร้องเกี่ยวกับสิ่งที่สามารถทำได้ Paschali กล่าว โรงพยาบาลควรทดสอบว่าแบบจำลองทำงานอย่างไรในกลุ่มย่อยที่แตกต่างกันของผู้ป่วยและประเภทสแกนเน็ตที่แตกต่างกัน ในที่สุดโรงพยาบาล “การทดสอบความเครียด” จะต้องเป็นแบบจำลองเพื่อระบุปัญหาที่อาจเกิดขึ้นเช่นโรคที่หายากมาก
“ นั่นเป็นเหตุผลว่าทำไมการทำงานอย่างใกล้ชิดกับนักรังสีวิทยาเพราะพวกเขาสามารถช่วยเราออกแบบการทดสอบความเครียดอย่างละเอียด” Paschali กล่าว “เพราะพวกเขาได้เห็นหลายกรณีและพวกเขารู้ว่าเมื่องานแม้แต่งานก็ยากสำหรับพวกเขา”
ความหวังคือโมเดลพื้นฐานที่ได้รับการฝึกฝนในชุดข้อมูลขนาดใหญ่กว่าซึ่งครอบคลุมเงื่อนไขที่แตกต่างกันประเภทของโรงพยาบาลและเครื่องถ่ายภาพอาจต้องมีการประเมินน้อยกว่าก่อนที่จะใช้
“ ฉันไม่คิดว่าเราจะมาที่นั่นอย่างน้อยก็ไม่มีหลักฐานในโลก” Chaudhari กล่าว “แต่มันถูกล่อลวงโดยสิ่งที่โมเดลรากฐานเหล่านี้สามารถให้ได้”
เป้าหมายอีกประการหนึ่งคือการเพิ่มเวลาของรังสีในช่วงกลางของก การขาดนักรังสีวิทยาอย่างต่อเนื่อง ในสหรัฐอเมริกาและภาพจำนวนมากขึ้น
“ ถ้าเราขอให้พวกเขาตรวจสอบผลลัพธ์เพื่อ Dooplecheck ทุกอย่าง” Chaudhari กล่าว“ จริง ๆ แล้วมันเป็นไปตามสัญญาที่โมเดลเหล่านี้มีหรือไม่?”
