લગભગ બે અઠવાડિયાની ઘોષણાઓ પછી, OpenAI એ તેની 12-દિવસની OpenAI લાઇવસ્ટ્રીમ શ્રેણીને તેના નેક્સ્ટ જનરેશન ફ્રન્ટિયર મોડલના પૂર્વાવલોકન સાથે શરૂ કરી. “Telefónica (યુરોપમાં O2 સેલ્યુલર નેટવર્કના માલિક)ના અમારા મિત્રો અને OpenAI ની ભવ્ય પરંપરામાં, નામ ખરેખર ખરાબ છે, તેને o3 કહેવામાં આવે છે,” OpenAI CEO સેમ ઓલ્ટમેને YouTube પર જાહેરાત જોનારાઓને કહ્યું. છે.” ,
નવું મોડલ હજુ જાહેર ઉપયોગ માટે તૈયાર નથી. તેના બદલે, OpenAI સૌ પ્રથમ સંશોધકો માટે o3 ઉપલબ્ધ કરાવે છે જેઓ સુરક્ષા પરીક્ષણમાં મદદ ઈચ્છે છે. OpenAI એ o3-mini ના અસ્તિત્વની પણ જાહેરાત કરી. ઓલ્ટમેને જણાવ્યું હતું કે કંપની તે મોડલને “જાન્યુઆરીના અંતની આસપાસ” લોન્ચ કરવાની યોજના ધરાવે છે, જેમાં O3 ટૂંક સમયમાં જોડાશે.
જેમ તમે અપેક્ષા રાખી શકો છો, O3 તેના પુરોગામી કરતાં વધુ સારું પ્રદર્શન આપે છે, પરંતુ O1 કરતાં તે કેટલું સારું છે તે અહીં મુખ્ય હાઇલાઇટ છે. ઉદાહરણ તરીકે, આ વર્ષની યુએસ ઇન્વિટેશનલ મેથેમેટિક્સ પરીક્ષામાં ભાગ લેતી વખતે, o3 એ 96.7 ટકાનો એક્યુરસી સ્કોર હાંસલ કર્યો હતો. તેનાથી વિપરીત, o1 એ વધુ સાધારણ 83.3 ટકા રેટિંગ મેળવ્યું છે. “આનો અર્થ એ છે કે O3 ઘણીવાર માત્ર એક પ્રશ્ન ચૂકી જાય છે,” માર્ક ચેને જણાવ્યું હતું કે, OpenAI ખાતે સંશોધનના વરિષ્ઠ ઉપાધ્યક્ષ. વાસ્તવમાં, O3 એ સામાન્ય બેન્ચમાર્ક સ્યુટ પર એટલું સારું પ્રદર્શન કર્યું કે OpenAI તેના મોડલ્સ આપે છે કે કંપનીને તેની સામે બેન્ચમાર્ક કરવા માટે વધુ પડકારજનક પરીક્ષણો શોધવા પડ્યા હતા.
તેમાંથી એક એઆરસી-એજીઆઈ છે, જે એક બેન્ચમાર્ક છે જે સ્થળ પર જ સમજવા અને શીખવાની AI અલ્ગોરિધમની ક્ષમતાનું પરીક્ષણ કરે છે. પરીક્ષણના નિર્માતાઓ અનુસાર, બિનનફાકારક ARC પ્રાઇઝ, એક AI સિસ્ટમ કે જે ARC-AGI ને સફળતાપૂર્વક હરાવી શકે છે તે “કૃત્રિમ સામાન્ય બુદ્ધિમત્તા તરફ એક મહત્વપૂર્ણ સીમાચિહ્નરૂપ” રજૂ કરશે. 2019 માં તેની રજૂઆત પછી, કોઈપણ AI મોડેલે ARC-AGI ને હરાવ્યું નથી. પરીક્ષણમાં ઇનપુટ-આઉટપુટ પ્રશ્નો હોય છે જે મોટાભાગના લોકો સાહજિક રીતે સમજી શકે છે. ઉદાહરણ તરીકે, ઉપરના ઉદાહરણમાં, સાચો જવાબ ઘેરા વાદળી બ્લોકનો ઉપયોગ કરીને ચાર પોલિઓમિનોમાંથી ચોરસ બનાવવાનો હશે.
તેના લો-કમ્પ્યુટ સેટિંગ પર, o3 એ ટેસ્ટમાં 75.7 ટકા સ્કોર કર્યો. વધારાની પ્રક્રિયા શક્તિ સાથે, મોડેલે 87.5 ટકાનું રેટિંગ પ્રાપ્ત કર્યું. ARC પ્રાઈઝ ફાઉન્ડેશનના પ્રમુખ ગ્રેગ કોમરેડ્સના જણાવ્યા અનુસાર, “માનવ પ્રદર્શન 85 ટકા થ્રેશોલ્ડ પર તુલનાત્મક છે, તેથી તેનાથી ઉપર પહોંચવું એ એક મુખ્ય સીમાચિહ્નરૂપ છે.”
OpenAI એ o3-mini પણ દર્શાવ્યું. નવું મોડલ ત્રણ અલગ-અલગ રિઝનિંગ મોડ્સ પ્રદાન કરવા માટે OpenAI ના તાજેતરમાં જાહેર કરાયેલ એડપ્ટિવ થિંકિંગ ટાઈમ API નો ઉપયોગ કરે છે: નીચા, મધ્યમ અને ઉચ્ચ. વ્યવહારમાં, આ વપરાશકર્તાઓને પ્રતિભાવ આપતા પહેલા સમસ્યા વિશે સોફ્ટવેર કેટલા સમય સુધી “વિચારે છે” તે સમાયોજિત કરવાની મંજૂરી આપે છે. જેમ તમે ઉપરના ગ્રાફ પરથી જોઈ શકો છો, O3-Mini, OpenAI ના વર્તમાન O1 રિઝનિંગ મોડલ સાથે તુલનાત્મક પરિણામો પ્રાપ્ત કરી શકે છે, પરંતુ ગણતરી ખર્ચના અપૂર્ણાંક પર. ઉલ્લેખ કર્યો છે તેમ, O3-મિની O3 પહેલા જાહેર ઉપયોગ માટે બહાર આવશે.
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/ai/openais-next-generation-o3-model-will-arrive-early-next-year-191707632.html?src=rss પર દેખાયો હતો.