GPT-4، آخرین نسخه چت بات هوش مصنوعی ChatGPT، میتواند در آزمونهای دبیرستان و آزمونهای دانشکده حقوق را با قرار گرفتن در صدک بالای ۹۰ قبول شود و اکنون دارای قابلیتهای پردازشی جدیدی است که در نسخه قبلی امکانپذیر نبود.
بررسی نتایج آزمونهای نسخه چهارم ChatGPT
ارقام نمرات آزمون GPT-4 در 14 مارس توسط شرکت سازندهی آن یعنی OpenAI به اشتراک گذاشته شد و نشان داد که این چت بات میتواند ورودیهای تصویر، صدا و ویدیو را به متن تبدیل کند و دستورالعملهای بسیار ظریفتر را خلاقانهتر و قابل اعتمادتر مدیریت کند.
OpenAI اضافه کرد: نسخهی جدید، در یک آزمون شبیه سازی شده وکالت با امتیازی نزدیک به 10 درصد از شرکت کنندگان برتر، قبول شده است. جهت مقایسه، گفتنی است که امتیاز GPT-3.5 همتراز با 10 درصد آخر از شرکت کنندگان آزمون بود.
GPT-4 در امتحان LSAT نمره 163 را به دست آورد. LSAT آزمونی است که دانش آموزان کالج جهت پذیرفته شدن در دانشکده حقوق باید آن را با موفقیت پشت سر بگذارند.

نمره GPT4 آن را در موقعیت خوبی جهت پذیرش در 20 دانشکده حقوق برتر قرار می دهد و تنها چند نمره کمتر از نمرات گزارش شده مورد نیاز برای پذیرش در دانشکده های معتبر مانند هاروارد، استنفورد، پرینستون یا ییل است.
نسخه قبلی ChatGPT در LSAT امتیاز 149 را کسب کرده بود که همتراز با 40 درصد آخر از شرکت کنندگان آزمون بود.
GPT-4 همچنین در آزمون سراسری وکالت امتیاز 298 از 400 را کسب کرد. آزمون سراسری آزمونی است که از دانشجویان تازه فارغ التحصیل شده گرفته میشود و در صورت قبولی به آنها اجازه میدهد به عنوان وکیل در هر حوزه قضایی ایالات متحده فعالیت کنند.

نسخه قدیمی ChatGPT در این آزمون با مشکل مواجه شد و با امتیاز 213 از 400 در میان 10 درصد آخر از شرکت کنندگان آزمون قرار گرفت.
GPT-4 در آزمونهای SAT Evidence-based Reading & Writing و SAT Math که از دانشآموزان دبیرستانی ایالات متحده برای اندازهگیری آمادگی دانشگاهی آنها گرفته شده است، در میان دهک برتر شرکت کنندگان جای گرفت.
GPT-4 در علوم دیگز نیز سرآمد بود، و موفق شد در میان 50 درصد شرکت کنندگان برتر قرار گیرد. این نسخه در AP Biology در صدک 85 تا 100، شیمی در صدک 71 تا 88 و فیزیک 2 در صدک 66 تا 84 قرار گرفت.

با این حال، امتیاز آزمون AP Calculus آن نسبتاً متوسط بود و در صدک 43 تا 59 قرار داشت.
یکی دیگر از رشتههایی که GPT-4 در آن ضعیف ظاهر شد، امتحانات ادبیات انگلیسی بود که نمرات در بازهی صدک 8 تا 44 را در دو آزمون جداگانه کسب کرد.
OpenAI اعلام داشت که GPT-4 و GPT-3.5 این نتایج را از آزمون های عملی 2022-2023 کسب کردهاند و به این چت بات هیچ آموزش خاصی در این زمینهها داده نشده است.
ما برای این امتحانات هیچ آموزش خاصی به این چت بات ندادیم. این مدل در امتحانات آزمایشی با معدودی از مشکلات مواجه شد، اما ما معتقدیم که نتایج معرف عملکرد خوب آن است.
این نتایج باعث ترس در جامعه توییتر نیز شد.
نیک آلموند، بنیانگذار FactoryDAO، در 14 مارس در توییتر خود گفت که GPT4 ترسناک خواهد بود و سیستم آموزشی جهانی را دچار فروپاشی خواهد کرد.
Assessment theory was a big chunk of my life for several years. I was banging on about this day coming many years ago. I literally sounded like the resident crank at the time.
But… really this means that anything but invigilated assessment is over from this point on.
— drnick 🗳️² (@DrNickA) March 14, 2023
کانر گروگان، مدیر سابق Coinbase بیان داشت که یک قرارداد هوشمند اتریوم زنده را در GPT-4 وارد کرده است و چت بات فوراً به چندین «آسیبپذیری امنیتی» آن اشاره کرده و نحوه سوء استفاده از کد mighbe را توضیح داده است:
I dumped a live Ethereum contract into GPT-4.
In an instant, it highlighted a number of security vulnerabilities and pointed out surface areas where the contract could be exploited. It then verified a specific way I could exploit the contract pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) March 14, 2023
ممیزیهای قبلی قرارداد هوشمند در ChatGPT نشان داد که نسخه اول آن نیز قادر به شناسایی اشکالات کد نویسی تا حد معقولی بوده است.
روآن چئونگ، بنیانگذار خبرنامه هوش مصنوعی The Rundown، ویدیویی از GPT به اشتراک گذاشت که یک وب سایت جعلی را که روی یک تکه کاغذ به صورت دستی طراحی شده بود را کد نویسی میکند.
I just watched GPT-4 turn a hand-drawn sketch into a functional website.
This is insane. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) March 14, 2023
منبع: Cointelegraph
پاسخ