این روزها همه از هوش مصنوعی صحبت میکنند. همه AI را میخواهند و میدانند که باید روی پروژههای راهانداز و پایلوت در این زمینه سرمایهگذاری کنند. اما همچنان تبدیل این پروژهها به تولید، دشوار است و بسیاری از شرکتها هنوز نتوانستهاند کاملا با این فناوری سازگار شوند.
آیتیمن- اگر شما خودتان تا کنون یکی از این پروژهها را اجرا نکردهاید، حتما واژههای مختلف مرتبط با
هوش مصنوعی را شنیدهاید و ممکن است که بین این واژهها و معانی مختلفشان سردرگم شده باشید. آیا AI همان یادگیری ماشینی است؟ یادگیری ماشینی و یادگیری عمیق چه تفاوتی دارند؟ آیا به همه این فناوریها نیاز داریم؟
گاهی نخستین گامها در شناخت اینکه کدام فناوری مناسب چالشهای سازمان ماست، این است که این واژهها و ترمینولوژی پشت هر فناوری را بشناسیم.
هوش مصنوعی یا Artificial intelligence در واقع عبارتی است که به طور کلی بر مجموعهای از فناوریها اطلاق میشود. در این مطلب به تعدادی از مهمترین این فناوریها نگاهی میاندازیم.
هوش مصنوعی (AI)
اجازه بدهید که مطلب را با تعریفی پایهای از هوش مصنوعی آغاز کنیم. این عبارت برای هر کسی، معنی متفاوتی را به ذهن متبادر میکند؛ از
روباتهایی که قرار است شغل ما را از دستمان دربیاورند بگیر تا دستیارهای صوتی هوشمند الکسا و سیری روی گوشی موبایل و سایر دستگاهها.
اما آنانی که با AI کار میکنند، میدانند که این عبارت، به مجموعهای از فناوریها، شامل یادگیری ماشین، پردازش زبان طبیعی، بینایی کامپیوتری و از این قبیل اطلاق میشود.
از سوی دیگر، هوش مصنوعی را میتوان به دو دسته هوش مصنوعی محدود (narrow AI) یا ضعیف (Weak AI) و هوش مصنوعی عمومی (General AI) تقسیم بندی کرد.
آنچه ما امروزه از آن استفاده میکنیم، هوش مصنوعی محدود است؛ یعنی نوعی هوش مصنوعی که برای انجام یک کار مشخص مناسب است و روی یک وظیفه محدود تمرکز کرده و میتواند مواردی همچون موتورها و سامانههای پیشنهادگر (recommendation engine)، اپلیکیشنهای مسیریاب یا چتباتها را شامل شود.
دستیارهای هوشمند مانند سیری و الکسا، یک مثال خوب از هوش مصنوعی ضعیف هستند؛ چون در یک محدوده از پیش تعیین شده عمل میکنند و اگرچه سیستمهای پیچیده دارای هوش مصنوعی ضعیف هستند، در واقع هوشمندی حقیقی و خودآگاهی ندارند.
اما هوش مصنوعی عمومی یا قوی (Artificial general intelligence) به ماشینی گفته میشود که میتواند هر کاری که انسان قادر به انجام آن است، به انجام برساند. این فناوری هنوز عملیات نشده و آرمانی محسوب میشود.
یادگیری ماشین (Machine Learning)
یادگیری ماشین را میتوان نخستین گام سازمانها در افزودن فناوریهای مرتبط با هوش مصنوعی به سبد آیتیشان قلمداد کرد. به این معنی که با خودکارسازی فرایند ایجاد الگوریتمها و استفاده از دادههای برای «آموزش» این الگوریتمها، میتوان از نیاز به برنامهنویسان انسانی برای نوشتن کد، کاست.
به طور خلاصه، یادگیری ماشین (Machine learning) به تنظیم و اکتشاف شیوهها و الگوریتمهایی میپردازد که بر اساس آنها رایانهها و سامانهها توانایی یادگیری پیدا میکنند.
شما احتمالاً چندین بار در روز از یادگیری ماشین استفاده میکنید، حتی بدون آنکه بدانید. هر بار که شما یک جستوجوی اینترنتی در گوگل انجام میدهید، یادگیری ماشینی انجام میشود چراکه نرمافزار یادگیری ماشینی آنها چگونگی رتبهبندی صفحات وب را درک کردهاست. هنگامی که فیسبوک یا برنامه عکس اپل دوستان و تصاویر شما را میشناسد، این نیز یادگیری ماشین است. هر بار که ایمیل خود را چک میکنید و فیلتر هرزنامه شما را از داشتن مجدد هزاران هرزنامه خلاص میکند نیز به همین دلیل است که کامپیوتر شما آموختهاست که هرزنامهها را از ایمیل غیراِسپم تشخیص دهد. در واقع کاری که انجام میشود، ارایه مثالهایی در قالب دادهها به الگوریتم است. مثال معروف در این زمینه مثال «گربه» است. این که چه چیزی تصویر گربه است و چه چیزی تصویر گربه نیست. آیا میتوان با نمایش نمونههایی از تصاویر گربه و تصاویری که مربوط به گربه نیست، به ماشین یاد داد که گربه را شناسایی کند؟ بله. کامپیوتر با دیدن تمامی این نمونهها، یاد میگیرد که تفاوتها را تشخیص بدهد.
سازمانها روز به روز بیشتر در بهکارگیری یادگیری ماشین کارآزموده میشوند و زمینههای مختلف بسیاری برای استفاده از این فناوری وجود دارد. برای مثال، بیمارستان پروتستان نیویورک از یادگیری ماشین در خدمت امنیت سایبری استفاده میکرد و سپس متوجه شد که از تکنیکهای مشابهی برای مقابله با اعتیاد به مواد مخدر هم استفاده کند.
یادگیری عمیق (Deep Learning)
شاید بپرسید که تفاوت بین یادگیری ماشین و یادگیری عمیق چیست؟
یادگیری عمیق در واقع یادگیری ماشین را چندگام به جلوتر میبرد. یادگیری عمیق از لایههای متعدد یادگیری ماشین به منظور پردازش سیگنالهای حسی مانند صدا و تصویر استفاده میکند. ماشین در این روش هر مفهوم پیچیده را به مفاهیم سادهتری تقسیم میکند و با ادامهٔ این روند به مفاهیم پایهای میرسد که قادر به تصمیمگیری برای آنها است و بدین ترتیب نیازی به نظارت کامل انسان برای مشخص کردن اطلاعات لازم ماشین در هر لحظه نیست. به این لایهها، شبکه عصبی (neural network) میگویند. این نام به این دلیل انتخاب شده که این لایهها، عملکرد مغز انسان را شبیهسازی میکند. به بیان دیگر، یادگیری عمیق با دریافت خروجی اولین تصمیم یادگیری ماشین، آن را به عنوان ورودی به ماشین بعدی تحویل میدهد که به تصمیمگیریهای یادگیری ماشین، لایه میگویند و مجموعهای از این لایهها، یادگیری عمیق را شکل میدهد.
پردازش زبان طبیعی (Natural Language Processing)
ما انسانها، به زبان صفر و یک حرف نمیزنیم؛ اما اگر به کامپیوترها بتوان یاد داد که زبان انسان را درک کنند؛ مزایا و منافع بیشماری در پی خواهد داشت. این هدفی است که پردازش زبان طبیعی (NLP) دنبال میکند. تلاشهای اولیهای در این راه انجام گرفته که میتوان از دستیارهای صوتی هوشمند الکسا، گوگل اسیستنت، کورتانای مایکروسافت و سیری اپل در این زمینه نام برد. اما مشکل اینجاست که زبان انسان، از قواعد ریاضی تبعیت نمیکند.
NLP همچنین در مواردی که میخواهیم با انواع دادههای بدون ساختار کار بکنیم، مفید واقع میشود؛ دادههایی مثل رکوردهای سلامت الکترونیکی، ایمیلها، پیامهای متنی و پستهای شبکههای اجتماعی و در واقع هر چیزی که اجزایی از زبان را در خود داشته باشد.
بینایی کامپیوتری (Computer Vision)
بینایی کامپیوتری یا بینایی ماشین، مربوط به قابلیت تشخیص و شناسایی تصاویر مشابه انسان است. بینایی کامپیوتری شامل روشهای مربوط به دستیابی تصاویر، پردازش، آنالیز و درک محتوای آنها است. به این ترتیب، در بینایی کامپیوتری، نه با پیکسلها به طور مجزا، بلکه با مجموعه پیکسلها به مثابه تصویر شی یا موجودی در دنیای واقعی طرفیم. (مثال گربه را به یاد بیاورید). یکی از عرصههای مهم بهکارگیری بینایی کامپیوتری، فناوری تشخیص چهره (facial recognition) است. امروزه به هر طرف که نگاه کنید، دوربینی به شما زل زده است. این دوربینها تصاویر مردم را ثبت میکنند و به سیستم بینایی کامپیوتری ارسال میکنند که آن سیستم، تصاویر دریافتی را با تصاویری که از قبل در پایگاه دادهاش دارد، مقایسه و فرد را شناسایی میکند.
این فناوری در سالهای اخیر توسعه سریعی داشته و پیادهسازیاش آسانتر شده است. برای مثال، مایکروسافت و آمازون محصولات Face API را برای آژور و Amazon Rekognition را عرضه کردهاند. البته اخیرا ب
ر سر استفاده از فناوریهای تشخیص چهره، بحثهای زیادی در گرفته و گروهی این فناوری را برای استفادههای امنیتی و پلیسی، هنوز نابالغ میدانند.