کاپیتان وب – در جدیدترین پژوهش منتشرشده توسط دانشگاه کالیفرنیا سندیگو، مدل زبان بزرگ GPT‑۴.۵ توسعهیافته توسط OpenAI توانست با نرخ موفقیت ۷۳ درصدی در آزمون تورینگ سربلند بیرون بیاید؛ موفقیتی که نشان از نزدیکتر شدن هوش مصنوعی به سطح درک و مکالمه انسانی دارد.
در این مطالعه، شرکتکنندگان انسانی در مکالماتی پنجدقیقهای شرکت داده شدند و وظیفه داشتند تشخیص دهند آیا طرف گفتوگوی آنها انسان است یا یک مدل هوش مصنوعی. در بیش از ۷۳ درصد موارد، مخاطبان تصور کردند که GPT‑۴.۵ یک انسان واقعی است.
همچنین مدل Llama‑۳.۱‑405B متعلق به شرکت Meta نیز عملکرد قابلتوجهی از خود نشان داد و با نرخ موفقیت ۵۶ درصدی، جایگاه دوم را در این رقابت بهدست آورد.
نقش «پرسونا» در موفقیت مدلها
نکته جالبتوجه در این پژوهش، استفاده از «پرسونا» یا شخصیتهای مجازی برای هر مدل بود؛ قابلیتی که باعث شد مکالمات، طبیعیتر و شبیهتر به گفتوگوهای انسانی به نظر برسند. همین عامل نقش مهمی در فریب مخاطبان و افزایش نرخ موفقیت در آزمون تورینگ ایفا کرده است.
در نقطه مقابل، مدل GPT‑4o که در حال حاضر بهصورت عمومی در نسخه رایگان چتجیپیتی استفاده میشود، تنها در ۲۱ درصد از موارد توانست کاربران را متقاعد کند که انسان است. این تفاوت چشمگیر بار دیگر بر اهمیت بهرهگیری از طراحی شخصیت و تنظیمات رفتاری پیشرفته برای مدلهای زبانی تاکید دارد.
آیندهای نزدیکتر از تصور
نتایج این مطالعه نشان میدهد که مدلهای زبان هوش مصنوعی، با سرعتی بیسابقه به مرزهای درک و تعامل انسانی نزدیک میشوند. در آیندهای نهچندان دور، تمایز بین انسان و ماشین در فضای مکالمات دیجیتال، بیش از پیش دشوار خواهد شد؛ موضوعی که فرصتها و چالشهای جدیدی را در حوزه ارتباطات، آموزش، امنیت و اخلاق بهوجود میآورد.