کد QR مطلبدریافت لینک صفحه با کد QR

مدیرعامل OpenAI:

دوره مدل‌های زبانی بزرگ به پایان رسیده است

29 فروردين 1402 ساعت 12:39

قابلیت‌های خیره کننده ChatGPTموجی از علاقه و سرمایه‌گذاری جدید در هوش مصنوعی را برانگیخته است. اما اواخر هفته گذشته، مدیرعامل OpenAI اعلام کرد که استراتژی تحقیقاتی که این روبات را به وجود آورده، از دور خارج شده و مشخص نیست که پیشرفت‌های آینده در کجا رقم خواهد خورد.



آی‌تی‌من- شرکتOpenAI  با استفاده از الگوریتم‌های یادگیری ماشین که با زبان کار می‌کنند و بزرگ کردن مدل آنها به سطحی باورنکردنی، پیشرفت‌های چشمگیری در هوش مصنوعی رقم زده است. آخرین مورد از این پروژه‌ها، یعنی GPT-4، احتمالاً با استفاده از تریلیون‌ها کلمه متن و هزاران تراشه کامپیوتری قدرتمند آموزش داده شده , این فرآیند بیش از 100 میلیون دلار هزینه داشته است.

اما سم آلمتن، مدیرعامل شرکت، می‌گوید که پیشرفت بیشتر با بزرگتر کردن مدل‌ها حاصل نخواهد شد.

وی در مراسمی‌ که در اواخر هفته گذشته در MIT برگزار شد به حضار گفت: من فکر می‌کنم ما در پایان دوران این مدل‌های غول‌پیکر قرار داریم و توسعه هوش مصنوعی از راه‌های دیگری رقم خواهد خورد.

این اظهارنظر آلتمن حاکی از یک چرخش غیرمنتظره در رقابت برای توسعه و استقرار الگوریتم‌های جدید هوش مصنوعی است. از زمانی که OpenAI روبات چت ChatGPT را در ماه نوامبر راه‌اندازی کرد، مایکروسافت از فناوری زیرساختی آن برای افزودن یک روبات چت به موتور جست‌وجوی Bing استفاده کرده است و Google نیز یک روبات چت به نام Bard راه‌اندازی کرده است. 

در همین حال، استارت‌آپ‌های متعددی از جمله Anthropic، AI21، Cohere، و Character.AI  که دارای بودجه خوبی هستند، منابع عظیمی ‌را برای ایجاد الگوریتم‌های بزرگ‌تر در تلاش برای رقابت با فناوری OpenAI صرف می‌کنند. نسخه اولیه ChatGPT مبتنی بر نسخه ‌ارتقا یافته GPT-3 بود، اما کاربران اکنون می‌توانند به نسخه‌ای که از GPT-4 قدرت می‌گیرد نیز دسترسی داشته باشند.

اظهارات آلتمن نشان می‌دهد که GPT-4 می‌تواند آخرین پیشرفت بزرگی باشد که از استراتژی OpenAI  برای بزرگ‌تر کردن مدل‌ها و ارائه داده‌های بیشتر به آنها سرچشمه می‌گیرد. او نگفت که چه نوع راهبردها یا تکنیک‌های پژوهشی ممکن است جای آن را بگیرند. شرکت OpneAI در اعلام کرده که برآوردهایش حاکی از کاهش بازده با افزایش اندازه مدل است. همچنین به گفته آلتمن، محدودیت‌های فیزیکی برای راه‌اندازی مراکز داده و سرعت ساخت آنها نیز موانعی بر سر راه پیشرفت این استراتژی هستند.

آلتمن همچنین تأیید کرد که شرکت او در حال توسعه GPT-5 نیست. 
 


کد مطلب: 281058

آدرس مطلب :
https://www.itmen.ir/news/281058/دوره-مدل-های-زبانی-بزرگ-پایان-رسیده

ITMen
  https://www.itmen.ir