هوش مصنوعی پزشک گوگل از پزشکان بهتر عمل میکند
تاریخ انتشار
چهارشنبه ۱۹ ارديبهشت ۱۴۰۳ ساعت ۱۲:۳۱
آیتیمن- گروه گوگل ریسرچ(Google Research) و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل به نام دیپمایند (DeepMind)، مدل هوش مصنوعی مد-جمینای(Med-Gemini) که خانوادهای از مدلهای پیشرفته هوش مصنوعی متخصص در پزشکی است را شرح دادهاند.
گفته میشود که Med-Gemini از همه مدلهای پیشین سر است.
مدلهای جمینای گوگل نسل جدیدی از مدلهای هوش مصنوعی چندوجهی هستند، به این معنی که میتوانند اطلاعات را از حالتهای مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کنند.
این مدلها در زبان و مکالمه، درک اطلاعات متنوعی که بر روی آنها آموزش دیدهاند و آنچه که «استدلال با زمینه طولانی» یا استدلال از مقادیر زیادی داده مانند ساعتها ویدیو یا دهها ساعت صوت نامیده میشود، مهارت دارند.
هوش مصنوعی Med-Gemini تمام مزایای مدلهای پایه جمینای را دارد، اما آنها را به خوبی تنظیم و متعادل کرده است. محققان این ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در مقاله گنجاندند. در این مقاله ۵۸ صفحهای مطالب زیادی وجود دارد که در این گزارش به بیان چشمگیرترین آنها میپردازیم.
قابلیتهای خودآموزی و جستوجوی وب
رسیدن به یک تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان دانش پزشکی خود را با مجموعهای از اطلاعات مرتبط دیگر مانند علائم بیمار، تاریخچه پزشکی، جراحی و اجتماعی، نتایج آزمایشگاهی و نتایج سایر آزمایشات تحقیقاتی و واکنش بیمار به درمانهای قبلی گردآوری کنند تا درمانهای موجود بهروزرسانی شوند و درمانهای جدیدی معرفی میشوند. همه این موارد بر استدلال بالینی پزشک تأثیر میگذارد.
به همین دلیل است که گوگل با Med-Gemini دسترسی به جستوجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفتهتر فراهم کرده است. این هوش مصنوعی مانند بسیاری از مدلهای زبان بزرگ(LLM) متمرکز بر پزشکی با MedQA که حاوی سؤالات چند گزینهای نماینده سؤالات آزمون مجوز پزشکی ایالات متحده(USMLE) است، آموزش دیده که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شده است.
با این حال، گوگل همچنین دو مجموعه داده جدید را برای مدل خود توسعه داده است. اولی MedQA-R (استدلال) است که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام «زنجیره افکار»(CoTs) گسترش میدهد. دومیMedQA-RS (استدلال و جستوجو) است که دستورالعملهایی را برای استفاده از نتایج جستوجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه میدهد. بدین ترتیب اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته میشود تا یک جستوجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.
هوش مصنوعی Med-Gemini بر روی ۱۴ معیار پزشکی آزمایش شد و عملکرد جدیدی را روی ۱۰ معیار اجرا کرد که از مدل GPT-۴ ساخته شرکت اوپنایآی(OpenAI) پیشی گرفت. این مدل در معیار MedQA با استفاده از استراتژی جستوجوی هدایتشده به دقت ۹۱.۱ درصدی دست یافت و از مدل زبان بزرگ مبتنی بر پزشکی پیشین گوگل موسوم به Med-PaLM ۲ تا ۴.۵ درصد بهتر عمل کرد.
هوش مصنوعی Med-Gemini در هفت معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند حاوی تصاویر موارد چالش برانگیز بالینی که از یک لیست ۱۰تایی تشخیص داده میشود، به طور متوسط از ۴۴.۵ درصد بهتر از GPT-۴ عمل کرد.
محققان میگویند: در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال ما محدود کردن نتایج جستوجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستوجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستوجو و کیفیت استنادها را در نظر نگرفتهایم. علاوه بر این، باید دید که آیا میتوان به مدلهای زبان بزرگ کوچکتر نیز استفاده از جستوجوی وب را آموزش داد؟ ما این اکتشافات را به کارهای آینده واگذار میکنیم.
بازیابی اطلاعات خاص از پروندههای الکترونیکی طولانی
پرونده الکترونیک سلامت(EHR) ممکن است بلندبالا باشد، اما پزشکان باید از محتوای آنها آگاه باشند. آنها گاهی پیچیده هستند، چرا که معمولاً حاوی شباهتهای متنی، املای غلط، کلمات اختصاری و مترادفها هستند که میتوانند هوش مصنوعی را به چالش بکشند.
بنابراین محققان برای آزمایش توانایی Med-Gemini در درک و استدلال از اطلاعات پزشکی بلندبالا و طولانی از یک پایگاه داده بزرگ و در دسترس عموم(Medical Information Mart for Intensive Care) که به مثابه پیدا کردن سوزن در انبار کاه است، استفاده کردند. این پایگاه حاوی دادههای بیماران بستری در بخشهای مراقبتهای ویژه است.
هدف این بود که مدل بتواند یک وضعیت، علامت، یا درمان پزشکی کماستفاده و ظریف را در مجموعه بزرگی از یادداشتهای بالینی بازیابی کند.
دویست نمونه انتخاب شد و هر نمونه شامل مجموعهای از پروندههای این پایگاه از ۴۴ بیمار بستری شده در بخش مراقبتهای ویژه با سابقه پزشکی طولانی بود.
هوش مصنوعی Med-Gemini دو مرحله برای یافتن سوزن در انبار کاه پیش رو داشت. اول اینکه مجبور بود همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی میکرد. دوم اینکه باید ارتباط همه موارد را با هم ارزیابی میکرد، آنها را دستهبندی میکرد و نتیجه میگرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه میکرد. در نهایت این هوش مصنوعی عملکرد خوبی داشت.
محققان میگویند: شاید برجستهترین جنبه Med-Gemini، قابلیتهای پردازش سوابق طولانی باشد، زیرا آنها مرزهای عملکردی جدیدی را باز میکنند و امکانات کاربردی جدیدی را که قبلاً غیرممکن بود برای سیستمهای هوش مصنوعی پزشکی فراهم میکنند. این وظیفه یافتن «سوزن در انبار کاه» منعکس کننده یک چالش در دنیای واقعی است که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیتهای پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از دادههای بیماران نشان میدهد.
گفتوگو با Med-Gemini
در یک آزمایش در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی که خارش دارد، پرسید. این مدل پس از درخواست تصویر، سؤالات مناسب بعدی را پرسید و آن ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد.
همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمیرادیولوژیست بود، عکس رادیوگرافی قفسه سینه یک بیمار را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که بتوان آن را در اختیار بیمار قرار داد.
محققان میگویند: قابلیتهای مکالمه چندوجهی Med-Gemini امیدوارکننده است و چنین قابلیتهایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستمهای هوش مصنوعی را فراهم میکنند.
با این حال، محققان دریافتند که کار بیشتری لازم است.
آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی، از جمله کمک به پزشکان و بیماران است، البته خطرات قابل توجهی نیز به دنبال دارد. در حالی که پتانسیل تحقیقات آینده در این حوزه را برجسته میکنیم، ما تواناییهای مکالمه بالینی را در این کار، همانطور که قبلاً توسط دیگران در تحقیقات اختصاصی در زمینه هوش مصنوعی تشخیصی محاورهای بررسی شده بود، به طور دقیق مورد بررسی قرار ندادهایم.
چشم انداز آینده
محققان اذعان میکنند که کارهای بیشتری برای انجام دادن وجود دارد، اما قابلیتهای اولیه مدل Med-Gemini امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی مسوول، از جمله حفظ حریم خصوصی و انصاف را در سراسر فرآیند توسعه مدل بگنجانند.
محققان میگویند: ملاحظات حریم خصوصی به طور ویژه باید در سیاستها و مقررات مراقبتهای بهداشتی موجود که از اطلاعات بیمار محافظت میکنند، ریشه داشته باشد. انصاف و عدالت حوزه دیگری است که ممکن است نیاز به توجه داشته باشد، زیرا این خطر وجود دارد که سیستمهای هوش مصنوعی در مراقبتهای بهداشتی ممکن است ناخواسته سوگیریها و نابرابریهای تاریخی را منعکس یا تقویت کنند و به طور بالقوه منجر به عملکرد مدل متفاوت و نتایج مضر برای گروههایی شود.
اما در نهایت، مدل Med-Gemini به عنوان یک ابزار خوب در نظر گرفته میشود.
پژوهشگران میگویند: مدلهای زبان بزرگ چندوجهی در حال آغاز دوره جدیدی از امکانات برای سلامت و پزشکی هستند. قابلیتهای نشان داده شده توسط جمینای و Med-Gemini نشاندهنده جهش قابل توجهی در عمق و وسعت فرصتها برای تسریع اکتشافات زیستپزشکی و کمک به ارائه مراقبتهای بهداشتی و تجارب است. با این حال، بسیار مهم است که پیشرفت در قابلیتهای مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستمها همراه باشد. با اولویتبندی هر دو جنبه میتوانیم با مسوولیتپذیری هوش مصنوعی، آیندهای را متصور شویم که در آن قابلیتهای سیستمهای هوش مصنوعی شتابدهندههای معنادار و ایمن در پیشرفت علمیو مراقبت در پزشکی باشند.
مرجع : ايسنا