[ad_1]
به نقل از اصفهانیا
در یک گردهمایی در کالیفرنیا، ۳۰ نفر از برجستهترین ریاضیدانان جهان در یک رویارویی مستقیم، توانمندیهای مدل پیشرفته هوش مصنوعی را در حل مسائل دشوار برسی کردند. نتیجه علتشگفتی و تحسین این افراد شد: مدل دلایلگر ChatGPT توانست مسائل زیاد پیچیده در سطح دکترا را حل کند.
بر پایه گزارش لایو ساینس، در اواسط ماه مه امسال یک اتفاقات علمی بی همتا و محرمانه برگزار شد. ۳۰ نفر از نوابغ ریاضی جهان از سراسر دنیا جمع شدند تا در یک آزمون دو روزه توانمندیهای مدل دلایلگر o4-mini شرکت OpenAI را بسنجند. مقصد مطرح مسائلی می بود که حتی برای یک ریاضیدان حرفهای نیز چالشبرانگیز باشد.
مسائل ریاضی دشوار برای ChatGPT
این رویارویی بخشی از یک پروژه بنچمارک به نام FrontierMath می بود که توسط سازمان غیرانتفاعی Epoch AI و به خواست OpenAI اجرا میشد. مقصد برسی توانایی واقعی هوش مصنوعی در استدلال و حل مسائلی می بود که راهحل آنها پیشتر در اینترنت انتشار نشده و مدل نمیتوانست فقطً با جستجو به جواب برسد. برای جلوگیری از هرگونه تقلب ناخواسته، همه ارتباطات بین ریاضیدانان شرکتکننده از طریق اپلیکیشن امن سیگنال انجام میشد و آنها متعهد به عدم افشای اطلاعات بودند.
در ابتدا، ریاضیدانان با مطرح مسائل پیچیده، در به چالشکشیدن هوش مصنوعی موفق بودند. برای هر قضیهای که چتبات قادر به حل آن نبوده است، طراح سوال یک جایزه ۷ هزار و ۵۰۰ دلاری دریافت میکرد. اما اوضاع تحول کرد.
«کن اونو» (Ken Ono)، ریاضیدان سرشناس از دانشگاه ویرجینیا و یکی از داوران این اتفاقات، روایت میکند که چطور ابتدا از کارکرد بات نومید شده می بود. اما او یک قضیه حلنشده در «نظریه اعداد» را که در سطح دکترا می بود، برای چتبات نقل کرد. اتفاقی که در ۱۰ دقیقه سپس رقم خورد، همه را شگفتزده کرد:
ربات ابتدا دو دقیقه را صرف یافتن و تسلط بر همه مقالات علمی مرتبط با آن حوزه کرد. سپس روی صفحه نوشت که برای یادگیری، ابتدا تصمیم دارد یک نسخه سادهتر از همان قضیه را حل کند. چند دقیقه سپس خبرداد که اکنون آماده حل قضیه مهم و دشوارتر است. پنج دقیقه بعد از آن، o4-mini یک راهحل کاملاً صحیح و در عین حال، به حرف های پروفسور اونو، «گستاخانه» اراعه داد. این هوش مصنوعی در آخر جوابش او گفت: «نیازی نیست به جایی استناد کنم، چون این قضیه را خودم حل کردم.»
پروفسور اونو میگوید: «من همکارانی دارم که به معنی واقعی کلمه انها گفتند این مدلها دارند به سطح نبوغ ریاضی نزدیک خواهد شد.»
مدل o4-mini، برخلاف مدلهای زبانی بزرگ معمولی که فقطً به جستوجو پیشبینی کلمه بعدی می باشند، یک LLM دلایلگر است. این مدلها بر روی مجموعه دادههای تخصصی و با بازخورد انسانی زیاد نیرومندتر آموزش میبینند. این رویکرد به آنها اجازه میدهد تا بهجای تکرار اطلاعات، به فهمیدن عمیقتری از مسائل پیچیده دست یابند و فرایند استدلال خود را مرحله به مرحله نمایش دهند.
دسته بندی مطالب
[ad_2]
ممکن است بپسندید
- 
                
پادکست فارسی از چالشهای دوران بلوغ خود میگوید_اصفهانیا
 - 
                
کنیستر چیست و چه ماموریتای در ماشین دارد؟_اصفهانیا
 - 
                
دانشمندان برای اولینبار از DNA پوست، جنین انسانی ساختند_اصفهانیا
 - 
                
چرا خودروهای تازه تویوتا بر پایه پلتفرمهای قدیمی ساخته خواهد شد؟_اصفهانیا
 - 
                
دیزنی خواستار توقف منفعت گیری از شخصیتهای خود توسط Character.AI شد_اصفهانیا