موفقیت نسخه چهارم ChatGPT در آزمون‌های رشته‌های مختلف

GPT-4، آخرین نسخه چت بات هوش مصنوعی ChatGPT، می‌تواند در آزمون‌های دبیرستان و آزمون‌های دانشکده حقوق را با قرار گرفتن در صدک بالای ۹۰ قبول شود و اکنون دارای قابلیت‌های پردازشی جدیدی است که در نسخه قبلی امکان‌پذیر نبود.

بررسی نتایج آزمون‌های نسخه چهارم ChatGPT

ارقام نمرات آزمون GPT-4 در 14 مارس توسط شرکت سازنده‌ی آن یعنی OpenAI به اشتراک گذاشته شد و نشان داد که این چت بات می‌تواند ورودی‌های تصویر، صدا و ویدیو را به متن تبدیل کند و دستورالعمل‌های بسیار ظریف‌تر را خلاقانه‌تر و قابل اعتمادتر مدیریت کند.

OpenAI اضافه کرد: نسخه‌ی جدید، در یک آزمون شبیه سازی شده وکالت با امتیازی نزدیک به 10 درصد از شرکت کنندگان برتر، قبول شده است. جهت مقایسه، گفتنی است که امتیاز GPT-3.5 همتراز با 10 درصد آخر از شرکت کنندگان آزمون بود.

GPT-4 در امتحان LSAT نمره 163 را به دست آورد. LSAT آزمونی است که دانش آموزان کالج جهت پذیرفته شدن در دانشکده حقوق باید آن را با موفقیت پشت سر بگذارند.

ChatGPT
نتایج آزمون GPT-4 و GPT-3.5 در طیف وسیعی از امتحانات اخیر ایالات متحده.

نمره GPT4 آن را در موقعیت خوبی جهت پذیرش در 20 دانشکده حقوق برتر قرار می دهد و تنها چند نمره کمتر از نمرات گزارش شده مورد نیاز برای پذیرش در دانشکده های معتبر مانند هاروارد، استنفورد، پرینستون یا ییل است.

نسخه قبلی ChatGPT در LSAT امتیاز 149 را کسب کرده بود که همتراز با 40 درصد آخر از شرکت کنندگان آزمون بود.

GPT-4 همچنین در آزمون سراسری وکالت امتیاز 298 از 400 را کسب کرد. آزمون سراسری آزمونی است که از دانشجویان تازه فارغ التحصیل شده گرفته می‌شود و در صورت قبولی به آنها اجازه می‌دهد به عنوان وکیل در هر حوزه قضایی ایالات متحده فعالیت کنند.

موفقیت نسخه چهارم ChatGPT در آزمون‌های رشته‌های مختلف
نمرات مورد نیاز جهت پذیرفته شدن در هر حوزه قضایی ایالات متحده.

نسخه قدیمی ChatGPT در این آزمون با مشکل مواجه شد و با امتیاز 213 از 400 در میان 10 درصد آخر از شرکت کنندگان آزمون قرار گرفت.

GPT-4 در آزمون‌های SAT Evidence-based Reading & Writing و SAT Math که از دانش‌آموزان دبیرستانی ایالات متحده برای اندازه‌گیری آمادگی دانشگاهی آنها گرفته شده است، در میان دهک برتر شرکت کنندگان جای گرفت.

این مطلب را حتما بخوانید:  بررسی دلیل افزایش قیمت شیبا اینو نسبت به رقیب دیرینه!

GPT-4 در علوم دیگز نیز سرآمد بود، و موفق شد در میان 50 درصد شرکت کنندگان برتر قرار گیرد. این نسخه در AP Biology در صدک 85 تا 100، شیمی در صدک 71 تا 88 و فیزیک 2 در صدک 66 تا 84 قرار گرفت.

ChatGPT
نتایج آزمون GPT-4 و GPT-3.5 در طیف وسیعی از امتحانات اخیر ایالات متحده.

با این حال، امتیاز آزمون AP Calculus آن نسبتاً متوسط بود و در صدک 43 تا 59 قرار داشت.

یکی دیگر از رشته‌هایی که GPT-4 در آن ضعیف ظاهر شد، امتحانات ادبیات انگلیسی بود که نمرات در بازه‌ی صدک 8 تا 44 را در دو آزمون جداگانه کسب کرد.

OpenAI اعلام داشت که GPT-4 و GPT-3.5 این نتایج را از آزمون های عملی 2022-2023 کسب کرده‌‌اند و به این چت بات هیچ آموزش خاصی در این زمینه‌ها داده نشده است.

ما برای این امتحانات هیچ آموزش خاصی به این چت بات ندادیم. این مدل در امتحانات آزمایشی با معدودی از مشکلات مواجه شد، اما ما معتقدیم که نتایج معرف عملکرد خوب آن است.

این نتایج باعث ترس در جامعه توییتر نیز شد.

نیک آلموند، بنیانگذار FactoryDAO، در 14 مارس در توییتر خود گفت که GPT4 ترسناک خواهد بود و سیستم آموزشی جهانی را دچار فروپاشی خواهد کرد.

کانر گروگان، مدیر سابق Coinbase بیان داشت که یک قرارداد هوشمند اتریوم زنده را در GPT-4 وارد کرده است و چت بات فوراً به چندین «آسیب‌پذیری امنیتی» آن اشاره کرده و نحوه سوء استفاده از کد mighbe را توضیح داده است:

ممیزی‌های قبلی قرارداد هوشمند در ChatGPT نشان داد که نسخه اول آن نیز قادر به شناسایی اشکالات کد نویسی تا حد معقولی بوده است.

این مطلب را حتما بخوانید:  ویتالیک بوترین: چگونه یک استیبل کوین الگوریتمی پایدار ایجاد کنیم؟

روآن چئونگ، بنیانگذار خبرنامه هوش مصنوعی The Rundown، ویدیویی از GPT به اشتراک گذاشت که یک وب سایت جعلی را که روی یک تکه کاغذ به صورت دستی طراحی شده بود را کد نویسی می‌کند.

 

منبع: Cointelegraph

پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *