موفقیت چشمگیر GPT‑4.5 در آزمون تورینگ؛

کاپیتان وب – در جدیدترین پژوهش منتشرشده توسط دانشگاه کالیفرنیا سن‌دیگو، مدل زبان بزرگ GPT‑۴.۵ توسعه‌یافته توسط OpenAI توانست با نرخ موفقیت ۷۳ درصدی در آزمون تورینگ سربلند بیرون بیاید؛ موفقیتی که نشان از نزدیک‌تر شدن هوش مصنوعی به سطح درک و مکالمه انسانی دارد.

در این مطالعه، شرکت‌کنندگان انسانی در مکالماتی پنج‌دقیقه‌ای شرکت داده شدند و وظیفه داشتند تشخیص دهند آیا طرف گفت‌وگوی آن‌ها انسان است یا یک مدل هوش مصنوعی. در بیش از ۷۳ درصد موارد، مخاطبان تصور کردند که GPT‑۴.۵ یک انسان واقعی است.

همچنین مدل Llama‑۳.۱‑405B متعلق به شرکت Meta نیز عملکرد قابل‌توجهی از خود نشان داد و با نرخ موفقیت ۵۶ درصدی، جایگاه دوم را در این رقابت به‌دست آورد.

نقش «پرسونا» در موفقیت مدل‌ها

نکته جالب‌توجه در این پژوهش، استفاده از «پرسونا» یا شخصیت‌های مجازی برای هر مدل بود؛ قابلیتی که باعث شد مکالمات، طبیعی‌تر و شبیه‌تر به گفت‌وگوهای انسانی به نظر برسند. همین عامل نقش مهمی در فریب مخاطبان و افزایش نرخ موفقیت در آزمون تورینگ ایفا کرده است.

در نقطه مقابل، مدل GPT‑4o که در حال حاضر به‌صورت عمومی در نسخه رایگان چت‌جی‌پی‌تی استفاده می‌شود، تنها در ۲۱ درصد از موارد توانست کاربران را متقاعد کند که انسان است. این تفاوت چشمگیر بار دیگر بر اهمیت بهره‌گیری از طراحی شخصیت و تنظیمات رفتاری پیشرفته برای مدل‌های زبانی تاکید دارد.

آینده‌ای نزدیک‌تر از تصور

نتایج این مطالعه نشان می‌دهد که مدل‌های زبان هوش مصنوعی، با سرعتی بی‌سابقه به مرزهای درک و تعامل انسانی نزدیک می‌شوند. در آینده‌ای نه‌چندان دور، تمایز بین انسان و ماشین در فضای مکالمات دیجیتال، بیش از پیش دشوار خواهد شد؛ موضوعی که فرصت‌ها و چالش‌های جدیدی را در حوزه ارتباطات، آموزش، امنیت و اخلاق به‌وجود می‌آورد.

موفقیت چشمگیر GPT‑۴.۵ در آزمون تورینگ؛ مرز تشخیص انسان و ماشین در حال فروپاشی است

نقش «پرسونا» در موفقیت مدل‌ها

آینده‌ای نزدیک‌تر از تصور

دیدگاهتان را بنویسید لغو پاسخ

دسترسی سریع در شبکه های اجتماعی

کلیه حقوق این سایت متعلق به کاپیتان وب است.