آزمون تورینگ (Turing test) به عنوان یک رویکرد ساده برای ارزیابی اینکه آیا یک ماشین می تواند هوشی شبیه انسان از خود نشان دهد یا خیر، عمل می کند. به طور خاص، اگر ماشینی بتواند با یک انسان صحبت کند بدون اینکه ماهیت غیرانسانی آن را آشکار کند، در نظر گرفته می شود که هوش انسانی را نشان داده است.
این مفهوم توسط ریاضیدان و پیشگام محاسبات آلن تورینگ در مقاله ای که در سال 1950 منتشر شد معرفی شد و از آن زمان به یک نیروی محرکه کلیدی در اکتشاف و پیشرفت هوش مصنوعی (AI) تبدیل شده است.
این آزمون هوش یک آزمودنی را ارزیابی می کند تا مشخص شود که آیا یک ماشین می تواند رفتار هوشمندانه ای را متقاعدکننده نشان دهد یا خیر. بر اساس معیارهای آزمون، یک برنامه کامپیوتری در صورتی قادر به تفکر تلقی می شود که بتواند انسان را فریب دهد تا آن را به عنوان انسان درک کند.
در حالی که اعتبار آزمون تورینگ به طور جهانی پذیرفته نشده است، دستیابی به موفقیت در این آزمون یک هدف مهم برای توسعه دهندگان در زمینه هوش مصنوعی است.
انطباق های مختلفی از آزمون تورینگ، همراه با روش های مختلف برای طرح سوالات در ارزیابی های هوش مصنوعی جایگزین وجود دارد.
با این حال، آزمون تورینگ بدون محدودیت نیست. این امر مستلزم یک محیط کنترل شده است، فاقد تعریف دقیقی از هوش است، و باید در پاسخ به پیشرفت تکنولوژیک در حال پیشرفت تکامل یابد.
آزمون تورینگ؛ مروری بر تاریخ آن
آلن تورینگ، در حالی که به دنبال رویکردی مؤثرتر برای رمزگشایی ارتباطات رمزگذاری شده آلمانی در طول جنگ جهانی دوم بود، زمینه را برای چندین اصل اساسی علوم کامپیوتر فراهم کرد. پس از پایان جنگ، او توجه خود را به مفهوم هوش مصنوعی معطوف کرد. تورینگ در مقاله مهم خود در سال 1950 این سوال اساسی را مطرح کرد: «آیا ماشین ها می توانند فکر کنند؟» او پیش بینی کرد که رایانه ها فراتر از محدودیت های دوران خود پیشرفت کنند و آزمایشی را ابداع کرد تا ارزیابی کند که آیا رایانه می تواند سطحی از هوش را نشان دهد که به اندازه کافی با یک انسان اشتباه گرفته شود.
این آزمون در یک محیط کنترل شده انجام می شود که در آن قاضی هم با یک شرکت کننده انسانی و هم با یک برنامه کامپیوتری تعامل دارد که هر دو از دید پنهان هستند. قاضی با هر موجود گفتگو می کند و هدفش این است که تشخیص دهد کدام یک انسان است و کدام یک ماشین بر اساس ماهیت پاسخ های آن ها. تورینگ اظهار داشت که اگر قاضی نتواند بین این دو تمایز قائل شود، کامپیوتر به طور موثر هوش انسان مانندی را نشان داده است و در نتیجه توانایی آن برای تفکر را نشان می دهد.
در روزهای اولیه محاسبات، چندین ماشین گزارش شد که با موفقیت انسان را در سناریوهای ساده فریب داده بودند. در سال 1966، جوزف وایزنبام ELIZA را توسعه داد، برنامه ای که می توانست کلمات کلیدی خاصی را بگیرد و جملات منسجمی ایجاد کند. الایزا یکی از اولین کامپیوترهایی بود که ارزیاب های انسانی را متقاعد کرد که انسانیت خود را دارند.
مدت کوتاهی پس از آن، یک چت بات به نام PARRY برای شبیه سازی رفتار یک اسکیزوفرنی پارانوئید ایجاد شد. روانپزشکان وظیفه تجزیه و تحلیل گفتگوها با بیماران واقعی و PARRY را داشتند. وقتی از روانپزشکان خواسته شد بین رونوشت ها تفاوت قائل شوند، تنها در 48 درصد مواقع می توانستند پاسخ های تولید شده توسط رایانه را به درستی شناسایی کنند. منتقدان ELIZA و PARRY استدلال می کنند که این نمونه ها معیارهای کامل آزمون تورینگ را برآورده نمی کنند و شواهد قطعی از هوش واقعی ماشین ارائه نمی دهند.
[irp posts=”19706″ name=”الگوریتم افکار (AoT) استفاده شده در هوش مصنوعی چیست؟”]
آزمون تورینگ در زمینه معاصر
با وجود انتقادها، آزمون تورینگ همچنان به عنوان معیاری برای ارزیابی اثربخشی ابتکارات هوش مصنوعی عمل می کند. تکرار تکامل یافته آزمون تورینگ شامل چندین قاضی انسانی است که با یک انسان و یک ماشین گفتگو می کنند. اگر بیش از 30 درصد از داوران، پس از یک تعامل پنج دقیقه ای، اشتباهاً رایانه را به عنوان یک انسان تشخیص دهند، آزمایش موفقیت آمیز تلقی می شود.
جایزه لوبنر که در سال 1991 توسط مخترع و فعال آمریکایی هیو لوبنر تأسیس شد، یک مسابقه سالانه بر اساس آزمون تورینگ است. این مسابقه دستورالعمل های خاصی را معرفی می کند که هم شرکت کننده انسانی و هم برنامه کامپیوتری را ملزم می کند که در مکالمه 25 دقیقه ای با چهار داور شرکت کنند. رایانه ای که بیشترین تعداد رای و بهترین ارزیابی را از داوران کسب کند برنده اعلام می شود.
در سال 2014، به مناسبت شصتمین سالگرد درگذشت آلن تورینگ، کوین وارویک از دانشگاه ریدینگ یک مسابقه آزمون تورینگ ترتیب داد. در طی این رویداد، یک چت بات به نام یوجین گوستمن که خود را پسری 13 ساله نشان می داد، گزارش شد که با قانع کردن 33 درصد از داوران در مورد انسانیت خود، آزمون تورینگ را پشت سر گذاشته است.
در یک ابتکار تحقیقاتی که در فوریه 2024 انجام شد، چت جی پی تی ChatGPT ادعا شد که آزمون تورینگ را با موفقیت پشت سر گذاشته است. این ارزیابی شامل مقایسه پاسخ های هوش مصنوعی با پاسخ های شرکت کنندگان انسانی (دانش آموزان) به طور تصادفی انتخاب شده در پاسخ به سؤالات خاص، با ارزیابی های مبتنی بر ویژگی های شخصیتی «پنج بزرگ» بود. محققان به این نتیجه رسیدند که هوش مصنوعی و رفتارهای انسانی شباهت های قابل توجهی را نشان می دهند. این یافته غیرمنتظره نیست، زیرا آموزش این برنامه طیف وسیعی از محتوای تولید شده توسط انسان را در بر می گیرد. در نتیجه، خروجی های آن ممکن است شبیه انسان به نظر برسند که منجر به شک و تردید در مورد موفقیت آن در آزمون شود.
تغییرات آزمون تورینگ
انطباق های متعددی از آزمون تورینگ وجود دارد که هدف همگی تشخیص این است که پاسخ دهنده انسان است یا ماشین. هر تغییری از روش های متمایزی در طرح سؤال برای پاسخ دهنده و ارزیابی پاسخ های آن ها استفاده می کند.
-
بازی تقلید
یکی از پیاده سازی های اولیه آزمون تورینگ، بازی تقلید است که معمولاً شامل سه شرکت کننده است. شرکت کننده اول مرد، نفر دوم زن و نفر سوم وظیفه شناسایی جنسیت دو نفر اول را دارد. شرکت کننده مرد اغلب سعی می کند سومین شرکت کننده را گمراه کند، در حالی که شرکت کننده زن عموماً قصد دارد به سومین شرکت کننده در تعیین دقیق هر جنسیت کمک کند.
نسخه های بعدی بازی تقلید به سناریویی رسیده اند که در آن شرکت کنندگان مرد و زن تلاش می کنند تا سومین شرکت کننده را فریب دهند تا هویت های جنسیتی نادرست انجام دهد. در نهایت، هدف از بازی تقلید این است که مشخص شود آیا بازجو می تواند گمراه شود یا خیر.
-
تفسیر استاندارد
یکی دیگر از انواع رایج آزمون تورینگ، نه بر این که آیا رایانه می تواند فریب دهد، بلکه بر توانایی آن در تقلید رفتار انسان تمرکز دارد. در این تفسیر استاندارد، شرکت کننده اول یک کامپیوتر است، در حالی که نفر دوم یک انسان است.
در این سناریو، شرکت کننده سوم به دنبال این است که مشخص کند کدام یک از دو مورد اول انسان و کدام یک ماشین است. بازجو موضوع مورد بررسی نیست. بلکه این کامپیوتر است که تلاش می کند شرکت کننده انسانی را گمراه کند. به عنوان مثال، ممکن است رایانه یک سری سؤالات مربوط به امور مالی شخصی را برای ارزیابی اینکه آیا پاسخ های آن با رفتارهای مورد انتظار در امور مالی رفتاری مطابقت دارد، مطرح می کند.
[irp posts=”9320″ name=”معرفی 7 تا از بهترین توکن های هوش مصنوعی AI”]
رویکردهای مدرن آزمون تورینگ
از زمان آغاز آزمون تورینگ، روش های مختلف معاصر برای افزایش تمایز بین انسان و ماشین پدید آمده اند. این انطباق ها از آزمون تورینگ به طور مداوم در حال اصلاح هستند تا در میان پیشرفت های تکنولوژیکی مداوم باقی بمانند.
آزمون تورینگ معکوس به دنبال این است که یک انسان کامپیوتری را فریب دهد تا فکر کند با یک شرکت کننده انسانی درگیر نیست.
آزمون تورینگ مجموع معیارها را گسترش می دهد تا شامل مهارت های ادراکی و ظرفیت فرد مورد ارزیابی برای تعامل با اشیاء فیزیکی باشد.
آزمون مارکوس از شرکت کنندگان می خواهد که رسانه ها را مشاهده کنند و به سؤالات مربوط به محتوای آن پاسخ دهند.
Lovelace Test 2.0 شامل شرکت کنندگان در خلق هنر می شود و قابلیت های هنری آن ها را ارزیابی می کند.
آزمون حداقل سیگنال هوشمند شرکت کنندگان را به پرسش های باینری، مانند پاسخ های درست/نادرست یا بله/خیر محدود می کند.
محدودیت های آزمون تورینگ
آزمون تورینگ با انتقادهای قابل توجهی مواجه شده است و انطباق های مختلفی برای رفع برخی از محدودیت های ذاتی آن پیشنهاد شده است. با این وجود، شناخت کاستی های آزمون تورینگ و حوزه هایی که ارزیابی آن ممکن است ناکافی باشد، بسیار مهم است:
آزمون تورینگ نیاز به یک تنظیم بسیار کنترل شده برای اجرای آن دارد. شرکت کنندگان باید در طول مدت آزمون از دید یکدیگر دور بمانند، اگرچه باید روش ارتباطی قابل اعتمادی داشته باشند.
آزمون تورینگ ممکن است به عنوان یک معیار معتبر برای سنجش هوش عمل نکند، زیرا سیستم های محاسباتی مختلف به روش های مختلفی طراحی شده اند. در نتیجه، ممکن است محدودیت های اساسی و ذاتی برای آنچه یک کامپیوتر می تواند به دست آورد، وجود داشته باشد.
در حالی که آزمون تورینگ دستخوش تغییراتی می شود، سرعت پیشرفت فناوری حتی سریعتر است. به عنوان مثال، قانون مور افزایش سریع قدرت پردازش را در کنار کاهش قابل توجه هزینه ها نشان می دهد. همانطور که رایانه ها قابلیت های بیشتری را به دست می آورند، روش های ارزیابی سنتی ممکن است منسوخ شوند زیرا این ماشین ها به طور فزاینده ای ویژگی های مشابه انسان را توسعه می دهند.
اگرچه آزمون تورینگ هوش را ارزیابی می کند، اما ممکن است به طور موثر همه انواع هوش را اندازه گیری نکند. برای مثال، یک کامپیوتر ممکن است با تقلید از الگوهای پاسخ انسان، بازجو را با موفقیت فریب دهد. با این حال، این لزوما نشان دهنده هوش هیجانی یا خودآگاهی نیست. ممکن است صرفاً نشان دهد که برنامه نویسی رایانه توسط یک توسعه دهنده بسیار ماهر اجرا شده است.
[irp posts=”12573″ name=”آموزش ترید ارز دیجیتال از صفر تا صد | دوره ارز دیجیتال رایگان”]
نتیجه گیری
آزمون تورینگ به عنوان معیاری برای ارزیابی اینکه آیا یک ماشین می تواند هوشی قابل مقایسه با یک انسان را نشان دهد یا خیر، عمل می کند. انطباق های متعددی از آزمون تورینگ پدیدار شده اند و با پیشرفت فناوری، به ویژه در حوزه هوش مصنوعی، دیدگاه های نوآورانه ای در مورد روش هایی برای ارزیابی هوش در حال توسعه است.
سوالات متداول
آزمون تورینگ اولیه چه بود؟
آزمایش اولیه شامل قاضی بود که پاسخ های یک انسان و رایانه ای را که برای ایجاد پاسخ های شبیه انسان برنامه ریزی شده بود، با هدف فریب دادن قاضی ارزیابی کرد.
آیا هوش مصنوعی آزمون تورینگ را با موفقیت انجام داده است؟
برخی افراد بر این باورند که ChatGPT آزمون تورینگ را با موفقیت به پایان رسانده است.
آزمون تورینگ به روز شده در هوش مصنوعی چیست؟
آزمون تورینگ به طور مداوم در تلاش برای ارزیابی موثرتر توانایی های انسان مانند رایانه ها به روزرسانی می شود. این ارزیابی ها در طول زمان به طور فزاینده ای پیشرفته می شوند.













