ऑफिस और रोजाना के कामकाज (Work Tasks) के लिए कौन सा आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट सबसे ज्यादा भरोसेमंद है? इस सवाल का जवाब देने के लिए अमेरिका की डिजिटल मार्केटिंग एजेंसी 'लीगल गार्जियन डिजिटल' (Legal Guardian Digital) ने एक नया सर्वे और रिसर्च रिपोर्ट जारी की है। इस रिपोर्ट के नतीजे काफी हैरान करने वाले हैं। रोजाना के ऑफिशियल कामों की सटीकता के मामले में Perplexity AI ने बाजी मारते हुए पहला स्थान हासिल किया है, जबकि दुनिया का सबसे लोकप्रिय चैटबॉट ChatGPT छठे स्थान पर खिसक गया है।
इस स्टडी में चैटबॉट्स के मतिभ्रम दर (Hallucination Rate - यानी गलत या मनगढ़ंत जानकारी देने की आदत), ग्राहकों की संतुष्टि, जवाबों की निरंतरता (Consistency) और अपटाइम विश्वसनीयता (Uptime Reliability - बिना क्रैश हुए चलते रहना) जैसे कड़े मानकों पर जांच की गई थी।
रिपोर्ट के मुख्य आंकड़े और रैंकिंग
यह रिपोर्ट ऐसे समय में आई है जब वर्कस्पेस में AI का इस्तेमाल तेजी से बढ़ा है। आंकड़ों के मुताबिक, वर्तमान में हर चार में से एक अमेरिकी कर्मचारी नियमित रूप से AI टूल्स का उपयोग कर रहा है। विभिन्न चैटबॉट्स का प्रदर्शन और उनकी रैंकिंग इस प्रकार रही:
- नंबर 1: Perplexity AI: इस चैटबॉट की हैलुसिनेशन (गलत जानकारी देने की) दर सबसे कम 13% दर्ज की गई, जबकि पूरी इंडस्ट्री का औसत 22% है। टेस्टिंग के दौरान इसका अपटाइम 100% रहा, यानी यह एक बार भी डाउन या क्रैश नहीं हुआ। 100 में से इसे 85 का ओवरऑल रिलाइबिलिटी स्कोर मिला।
- नंबर 2: Grok: एलन मस्क का यह AI चैटबॉट 15% हैलुसिनेशन रेट और 100% अपटाइम के साथ दूसरे स्थान पर रहा। इसका ओवरऑल स्कोर 79 रहा।
- नंबर 3: DeepSeek: चीनी AI चैटबॉट डीपसीक 14% हैलुसिनेशन रेट और 76 ओवरऑल स्कोर के साथ तीसरे नंबर पर रहा।
- नंबर 6: ChatGPT: दुनिया भर में सबसे ज्यादा इस्तेमाल होने के बावजूद चैटबॉट रिलाइबिलिटी इंडेक्स में चैटजीपीटी छठे स्थान पर रहा। रिपोर्ट के मुताबिक, चैटजीपीटी लगभग 30% मामलों में गलत या भ्रामक जानकारी जनरेट करता है, जो कि डीपसीक की तुलना में दोगुनी त्रुटि दर (Error Rate) है। हालांकि, कस्टमर रेटिंग के मामले में यह अभी भी 5 में से 4.7 अंकों के साथ काफी आगे है। इसका ओवरऑल स्कोर 50 रहा।
- अन्य रैंकिंग: एंथ्रोपिक का Claude सातवें, गूगल का Gemini आठवें और मेटा का Meta AI नौवें स्थान पर रहा। क्लाउड के साथ कॉम्पिटिटर्स की तुलना में आउटेज (सर्वर डाउन होने) की समस्या ज्यादा देखी गई।
कीमत में अंतर:
विश्वसनीयता के साथ-साथ इन टूल्स की कीमतों में भी बड़ा अंतर है। टॉप पर रहने वाले Perplexity AI की कीमत जहां $40 (लगभग 3,300 रुपये) प्रति महीना है, वहीं Grok की कीमत $30 प्रति महीना है। इसके विपरीत, तीसरे स्थान पर रहने वाला DeepSeek पूरी तरह मुफ्त (Free) है।
लोकप्रियता बनाम विश्वसनीयता
लीगल गार्जियन डिजिटल के सीईओ ऑस्टिन हंट (Austin Hunt) ने इस रिपोर्ट पर टिप्पणी करते हुए कहा:
"आमतौर पर लोग मान लेते हैं कि ChatGPT सबसे ज्यादा भरोसेमंद है क्योंकि यह बहुत लोकप्रिय है और मार्केट में सबसे पहले आया था। लेकिन जब बात काम के दौरान डेटा की सटीकता (Reliability) और लगातार सर्विस उपलब्ध रहने (Uptime) की आती है, तो Perplexity और Grok जैसे छोटे व फोकस्ड AI प्लेटफॉर्म्स बहुत बेहतर प्रदर्शन कर रहे हैं।"
विशेषज्ञों का कहना है कि Perplexity की इस सफलता के पीछे उसका 'आंसर इंजन' मॉडल है, जो इंटरनेट से रियल-टाइम जानकारी जुटाकर उसके सोर्स (Citations) भी साथ में दिखाता है, जिससे गलतियां होने की गुंजाइश बेहद कम हो जाती है।