સર્વમ વિઝન: ભારતીય સ્ટાર્ટઅપે OCR માં વૈશ્વિક AI દિગ્ગજોને પાછળ છોડી દીધા
અત્યાર સુધી, કૃત્રિમ બુદ્ધિમત્તાની દુનિયામાં અમેરિકા અને ચીનનું વર્ચસ્વ માનવામાં આવતું હતું. ભારતને ઘણીવાર ફક્ત AI પ્રતિભાનો મુખ્ય સ્ત્રોત માનવામાં આવતું હતું, મુખ્ય AI સંશોધન અને વિકાસ માટેનું કેન્દ્ર નહીં. પરંતુ બેંગલુરુ સ્થિત સ્ટાર્ટઅપ Sarvam AI ઝડપથી આ ધારણાને બદલી રહ્યું છે.
ભારતમાં સંપૂર્ણપણે વિકસિત તેના સાર્વભૌમ AI મોડેલો સાથે, Sarvam AI હવે ChatGPT, Google Gemini અને Anthropic Cloud જેવા વૈશ્વિક ટેક જાયન્ટ્સને સીધા પડકારવા માટે તૈયાર દેખાય છે.
Sarvam Vision મુખ્ય AI મોડેલોને પાછળ છોડી દે છે
Sarvam AI ના બે ઉત્પાદનો હાલમાં સમાચારમાં છે – Sarvam Vision અને Bulbul.
Sarvam Vision એ એક અદ્યતન OCR (ઓપ્ટિકલ કેરેક્ટર રેકગ્નિશન) આધારિત AI મોડેલ છે જેણે ઘણા મુખ્ય બેન્ચમાર્ક પર વિશ્વના અગ્રણી AI મોડેલોને પાછળ છોડી દીધા છે. AI નિષ્ણાતો અને વપરાશકર્તાઓ બંને તેની ચોકસાઈ અને પ્રદર્શનથી પ્રભાવિત છે.
બેન્ચમાર્ક સ્કોર્સે વૈશ્વિક ધ્યાન ખેંચ્યું
સર્વમ એઆઈના સહ-સ્થાપક પ્રત્યુષ કુમારે X પર પોસ્ટ્સ દ્વારા આ સિદ્ધિઓ શેર કરી. કંપનીના જણાવ્યા અનુસાર, સર્વમ વિઝને OmniOCR-Bench પર 84.3 ટકા ચોકસાઈ પ્રાપ્ત કરી, જે Gemini 3 Pro અને DeepSeek OCR v2 જેવા મોડેલો કરતા વધુ સારી છે.
બીજી બાજુ, ChatGPTનો OCR સ્કોર આ બેન્ચમાર્ક્સ પર નોંધપાત્ર રીતે પાછળ રહ્યો.
વધુમાં, સર્વમ વિઝને OmniDocBench v1.5 પર 93.28 ટકાની પ્રભાવશાળી ચોકસાઈ પ્રાપ્ત કરી. નોંધનીય છે કે, જટિલ દસ્તાવેજ લેઆઉટ, ટેકનિકલ કોષ્ટકો અને ગાણિતિક સૂત્રો જેવા પડકારજનક વિભાગોમાં પણ તેનું પ્રદર્શન મજબૂત હતું, જ્યાં પરંપરાગત OCR સિસ્ટમો ઘણીવાર ઓછી પડે છે.
ટીકાથી પ્રશંસા સુધી
શરૂઆતમાં, સર્વમ એઆઈને ભારતીય ભાષા મોડેલો સુધી મર્યાદિત હોવા બદલ ટીકાનો સામનો કરવો પડ્યો હતો. પરંતુ હવે, તે શંકા પ્રશંસામાં ફેરવાઈ રહી હોય તેવું લાગે છે.
ટેક કોમેન્ટેટર ડીડી દાસે પણ સ્વીકાર્યું કે તેમણે સર્વમને ઓછો અંદાજ આપ્યો હતો. તેમના મતે, સર્વમના OCR અને સ્પીચ મોડેલો ભારતીય ભાષાઓ માટે અત્યંત પ્રભાવશાળી છે અને તે ખાલી જગ્યાને ભરે છે જેને મોટી વૈશ્વિક AI લેબ્સ લાંબા સમયથી અવગણી રહી છે.
વપરાશકર્તા પ્રતિસાદ પણ આ તરફ નિર્દેશ કરે છે. સર્વમના ટૂલ્સનો ઉપયોગ કર્યા પછી ઘણા લોકોએ આઉટપુટ વિશે આશ્ચર્ય અને ઉત્સાહ બંને વ્યક્ત કર્યા છે.
બુલબુલ V3: ભારતીય ભાષાઓ માટે એક શક્તિશાળી AI વોઇસ મોડેલ
OCR ઉપરાંત, સર્વમ AI એ તેનું નવું ટેક્સ્ટ-ટુ-સ્પીચ મોડેલ, બુલબુલ V3 પણ લોન્ચ કર્યું છે. આ AI વોઇસ ટૂલ ભારતીય ભાષાઓમાં કુદરતી અને અભિવ્યક્ત અવાજો બનાવવા પર ધ્યાન કેન્દ્રિત કરે છે.
બુલબુલ V3 નો ખ્યાલ ElevenLabs જેવા આંતરરાષ્ટ્રીય AI વોઇસ પ્લેટફોર્મ જેવો જ છે, પરંતુ તેને ભારત-વિશિષ્ટ જરૂરિયાતોને ધ્યાનમાં રાખીને ડિઝાઇન કરવામાં આવ્યો છે.
હાલમાં, બુલબુલ V3 11 ભારતીય ભાષાઓમાં 35 થી વધુ વોઇસ વિકલ્પો પ્રદાન કરે છે. કંપની ટૂંક સમયમાં તેને 22 ભારતીય ભાષાઓમાં વિસ્તૃત કરવાનું લક્ષ્ય રાખે છે.
