લગભગ બે અઠવાડિયાની ઘોષણાઓ પછી, OpenAI એ તેની 12-દિવસની OpenAI લાઇવસ્ટ્રીમ શ્રેણીને તેના નેક્સ્ટ જનરેશન ફ્રન્ટિયર મોડલના પૂર્વાવલોકન સાથે શરૂ કરી. “Telefónica (યુરોપમાં O2 સેલ્યુલર નેટવર્કના માલિક)ના અમારા મિત્રો અને OpenAI ની ભવ્ય પરંપરામાં, નામ ખરેખર ખરાબ છે, તેને o3 કહેવામાં આવે છે,” OpenAI CEO સેમ ઓલ્ટમેને YouTube પર જાહેરાત જોનારાઓને કહ્યું. છે.” ,

નવું મોડલ હજુ જાહેર ઉપયોગ માટે તૈયાર નથી. તેના બદલે, OpenAI સૌ પ્રથમ સંશોધકો માટે o3 ઉપલબ્ધ કરાવે છે જેઓ સુરક્ષા પરીક્ષણમાં મદદ ઈચ્છે છે. OpenAI એ o3-mini ના અસ્તિત્વની પણ જાહેરાત કરી. ઓલ્ટમેને જણાવ્યું હતું કે કંપની તે મોડલને “જાન્યુઆરીના અંતની આસપાસ” લોન્ચ કરવાની યોજના ધરાવે છે, જેમાં O3 ટૂંક સમયમાં જોડાશે.

જેમ તમે અપેક્ષા રાખી શકો છો, O3 તેના પુરોગામી કરતાં વધુ સારું પ્રદર્શન આપે છે, પરંતુ O1 કરતાં તે કેટલું સારું છે તે અહીં મુખ્ય હાઇલાઇટ છે. ઉદાહરણ તરીકે, આ વર્ષની યુએસ ઇન્વિટેશનલ મેથેમેટિક્સ પરીક્ષામાં ભાગ લેતી વખતે, o3 એ 96.7 ટકાનો એક્યુરસી સ્કોર હાંસલ કર્યો હતો. તેનાથી વિપરીત, o1 એ વધુ સાધારણ 83.3 ટકા રેટિંગ મેળવ્યું છે. “આનો અર્થ એ છે કે O3 ઘણીવાર માત્ર એક પ્રશ્ન ચૂકી જાય છે,” માર્ક ચેને જણાવ્યું હતું કે, OpenAI ખાતે સંશોધનના વરિષ્ઠ ઉપાધ્યક્ષ. વાસ્તવમાં, O3 એ સામાન્ય બેન્ચમાર્ક સ્યુટ પર એટલું સારું પ્રદર્શન કર્યું કે OpenAI તેના મોડલ્સ આપે છે કે કંપનીને તેની સામે બેન્ચમાર્ક કરવા માટે વધુ પડકારજનક પરીક્ષણો શોધવા પડ્યા હતા.

ARC AGI

તેમાંથી એક એઆરસી-એજીઆઈ છે, જે એક બેન્ચમાર્ક છે જે સ્થળ પર જ સમજવા અને શીખવાની AI અલ્ગોરિધમની ક્ષમતાનું પરીક્ષણ કરે છે. પરીક્ષણના નિર્માતાઓ અનુસાર, બિનનફાકારક ARC પ્રાઇઝ, એક AI સિસ્ટમ કે જે ARC-AGI ને સફળતાપૂર્વક હરાવી શકે છે તે “કૃત્રિમ સામાન્ય બુદ્ધિમત્તા તરફ એક મહત્વપૂર્ણ સીમાચિહ્નરૂપ” રજૂ કરશે. 2019 માં તેની રજૂઆત પછી, કોઈપણ AI મોડેલે ARC-AGI ને હરાવ્યું નથી. પરીક્ષણમાં ઇનપુટ-આઉટપુટ પ્રશ્નો હોય છે જે મોટાભાગના લોકો સાહજિક રીતે સમજી શકે છે. ઉદાહરણ તરીકે, ઉપરના ઉદાહરણમાં, સાચો જવાબ ઘેરા વાદળી બ્લોકનો ઉપયોગ કરીને ચાર પોલિઓમિનોમાંથી ચોરસ બનાવવાનો હશે.

તેના લો-કમ્પ્યુટ સેટિંગ પર, o3 એ ટેસ્ટમાં 75.7 ટકા સ્કોર કર્યો. વધારાની પ્રક્રિયા શક્તિ સાથે, મોડેલે 87.5 ટકાનું રેટિંગ પ્રાપ્ત કર્યું. ARC પ્રાઈઝ ફાઉન્ડેશનના પ્રમુખ ગ્રેગ કોમરેડ્સના જણાવ્યા અનુસાર, “માનવ પ્રદર્શન 85 ટકા થ્રેશોલ્ડ પર તુલનાત્મક છે, તેથી તેનાથી ઉપર પહોંચવું એ એક મુખ્ય સીમાચિહ્નરૂપ છે.”

o1 ની સામે o3-mini ના પ્રદર્શનની અને તે કામગીરીની કિંમતની સરખામણી કરતો ગ્રાફ.
ઓપનએઆઈ

OpenAI એ o3-mini પણ દર્શાવ્યું. નવું મોડલ ત્રણ અલગ-અલગ રિઝનિંગ મોડ્સ પ્રદાન કરવા માટે OpenAI ના તાજેતરમાં જાહેર કરાયેલ એડપ્ટિવ થિંકિંગ ટાઈમ API નો ઉપયોગ કરે છે: નીચા, મધ્યમ અને ઉચ્ચ. વ્યવહારમાં, આ વપરાશકર્તાઓને પ્રતિભાવ આપતા પહેલા સમસ્યા વિશે સોફ્ટવેર કેટલા સમય સુધી “વિચારે છે” તે સમાયોજિત કરવાની મંજૂરી આપે છે. જેમ તમે ઉપરના ગ્રાફ પરથી જોઈ શકો છો, O3-Mini, OpenAI ના વર્તમાન O1 રિઝનિંગ મોડલ સાથે તુલનાત્મક પરિણામો પ્રાપ્ત કરી શકે છે, પરંતુ ગણતરી ખર્ચના અપૂર્ણાંક પર. ઉલ્લેખ કર્યો છે તેમ, O3-મિની O3 પહેલા જાહેર ઉપયોગ માટે બહાર આવશે.

આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/ai/openais-next-generation-o3-model-will-arrive-early-next-year-191707632.html?src=rss પર દેખાયો હતો.

LEAVE A REPLY

Please enter your comment!
Please enter your name here