Google પાસે ખૂંટોમાં ઉમેરવા માટે બીજું AI ટૂલ છે. Whisk એ Google Labs ઇમેજ જનરેટર છે જે તમને તમારા પ્રોમ્પ્ટ તરીકે હાલની ઇમેજનો ઉપયોગ કરવા દે છે. પરંતુ તેનું આઉટપુટ ફક્ત તમારી સ્ટાર્ટર ઈમેજના “સાર”ને જ કેપ્ચર કરે છે, તેને નવી વિગતો સાથે ફરીથી બનાવતું નથી. તેથી, સ્ત્રોત ઇમેજને સંપાદિત કરવા કરતાં વિચારમંથન અને ઝડપી-ફાયર વિઝ્યુલાઇઝેશન માટે તે વધુ સારું છે.
કંપની વ્હિસ્કને “એક નવા પ્રકારનું સર્જનાત્મક સાધન” તરીકે વર્ણવે છે. ઇનપુટ સ્ક્રીન શૈલી અને થીમના ઇનપુટ સાથે બેર-બોન્સ ઇન્ટરફેસથી શરૂ થાય છે. સરળ પ્રારંભિક ઇન્ટરફેસ તમને ફક્ત ત્રણ પૂર્વવ્યાખ્યાયિત શૈલીઓમાંથી પસંદ કરવા દે છે: સ્ટીકર, દંતવલ્ક પિન અને પ્લુશી. મને શંકા છે કે ગૂગલે શોધી કાઢ્યું છે કે તે ત્રણે રફ-આઉટલાઇન આઉટપુટ માટે મંજૂરી આપી છે જેના માટે તેના વર્તમાન સ્વરૂપમાં પ્રાયોગિક સાધન સૌથી આદર્શ છે.
જેમ તમે ઉપરની છબીમાં જોઈ શકો છો, આનાથી વિલ્ફોર્ડ બ્રિમલી સુંવાળપનો એક નક્કર છબી બનાવવામાં આવી છે. (ગૂગલની શરતો સેલિબ્રિટીઝના ફોટાને પ્રતિબંધિત કરે છે, પરંતુ વિલફોર્ડ રક્ષકોને ચેતવણી આપ્યા વિના ક્વેકર ઓટ્સ સાથે ગેટમાંથી સરકી ગયો.)
વ્હિસ્કમાં વધુ અદ્યતન સંપાદકનો પણ સમાવેશ થાય છે (મુખ્ય સ્ક્રીનમાંથી “શરૂઆતથી શરૂ કરો” પર ક્લિક કરીને જોવા મળે છે). આ મોડમાં, તમે ત્રણ શ્રેણીઓમાં ટેક્સ્ટ અથવા સ્રોત છબીનો ઉપયોગ કરી શકો છો: વિષય, દ્રશ્ય અને શૈલી. અંતિમ સ્પર્શ માટે વધુ ટેક્સ્ટ ઉમેરવા માટે ઇનપુટ બાર પણ છે. જો કે, તેમના વર્તમાન સ્વરૂપમાં, અદ્યતન નિયંત્રણો મારા પ્રશ્નો સાથે મેળ ખાતા પરિણામો ઉત્પન્ન કરતા નથી.
ઉદાહરણ તરીકે, મને ઓનલાઈન મળેલી વોલરસ સુંવાળપનો ઈમેજની શૈલીમાં લાઇટબોક્સ દ્રશ્યમાં સ્વર્ગસ્થ શ્રી બ્રિમલીને જનરેટ કરવાનો મારો પ્રયાસ તપાસો:
વ્હિસ્કીએ લાઇટબૉક્સની ફ્રેમની અંદર ઓટમીલ ખાતા અસ્પષ્ટપણે વિલ્ફોર્ડ બ્રિમલી-એસ્કી અભિનેતા જેવું દ્રશ્ય ઉભું કર્યું. જ્યાં સુધી હું કહી શકું છું, તે વ્યક્તિ વૈભવી નથી. તેથી, તે સ્પષ્ટ છે કે શા માટે Google “ઝડપી વિઝ્યુઅલ એક્સ્પ્લોરેશન” માટે વધુ અને ઉત્પાદન-તૈયાર સામગ્રી માટે ઓછા સાધનનો ઉપયોગ કરવાની ભલામણ કરે છે.
Google સ્વીકારે છે કે Whisk ફક્ત તમારી સ્રોત છબીના “કેટલાક મુખ્ય લક્ષણો” માંથી દોરશે. “ઉદાહરણ તરીકે, જનરેટ કરેલ વિષયની ઊંચાઈ, વજન, હેરસ્ટાઇલ અથવા ત્વચાનો રંગ અલગ હોઈ શકે છે,” કંપની ચેતવણી આપે છે.
વ્હિસ્ક કેવી રીતે હૂડ હેઠળ કામ કરે છે તે સમજવા માટે, તેના વિશે Google ના વર્ણન સિવાય વધુ ન જુઓ. તમે અપલોડ કરો છો તે સ્રોત છબીના વિગતવાર કૅપ્શન લખવા માટે તે જેમિની ભાષાના મોડેલનો ઉપયોગ કરે છે. તે પછી તે વર્ણનને Imagen 3 ઇમેજ જનરેટરમાં ફીડ કરે છે. તેથી, પરિણામ છબી પર આધારિત છે તમારી છબી વિશે જેમિનીના શબ્દો – સ્ત્રોતની છબી જ નહીં.
વ્હિસ્કી ફક્ત યુ.એસ.માં ઉપલબ્ધ છે, ઓછામાં ઓછું હમણાં માટે. તમે પ્રોજેક્ટની Google Labs સાઇટ પર તેને અજમાવી શકો છો.
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/ai/googles-new-ai-tool-whisk-uses-images-as-prompts-210105371.html?src=rss પર દેખાયો હતો.