ডিপসিকের ডিএসপার্ক: এআই মডেলের গতি বাড়ানোর নতুন ফ্রেমওয়ার্ক
যুক্তরাষ্ট্রের রপ্তানি নিষেধাজ্ঞার কারণে এনভিডিয়ার উন্নত এআই চিপের নাগাল না পেয়ে চীনা এআই স্টার্টআপ ডিপসিক একটি নতুন সমাধান নিয়ে এসেছে। প্রতিষ্ঠানটি দাবি করেছে, তারা এমন একটি প্রযুক্তি তৈরি করেছে যা অত্যাধুনিক চিপ ছাড়াই এআই মডেলের গতি উল্লেখযোগ্যভাবে বাড়াতে পারে। সম্প্রতি নিজেদের ভি৪ মডেল পরিবারের জন্য ‘ডিএসপার্ক’ নামের একটি নতুন ফ্রেমওয়ার্ক উন্মুক্ত করেছে ডিপসিক।
ডিপসিকের দাবি, ডিএসপার্ক প্রযুক্তির মাধ্যমে এআই মডেলের প্রতিক্রিয়ার গতি সর্বোচ্চ ৮৫ শতাংশ পর্যন্ত বাড়ানো সম্ভব। অর্থাৎ আগে একটি জিপিইউ যদি ১০০ ব্যবহারকারীর প্রশ্নের উত্তর দিতে পারত, এখন একই হার্ডওয়্যার প্রায় ১৮৫টি প্রশ্নের উত্তর দিতে পারবে। ডিপসিকের তথ্য অনুযায়ী, ডিএসপার্ক মূলত এআই ইনফারেন্সের গতি বাড়ানোর জন্য তৈরি করা হয়েছে। ব্যবহারকারীর প্রশ্নের উত্তর তৈরি করতে এআই মডেলের যে সময় লাগে, সেটিই ইনফারেন্স নামে পরিচিত। বর্তমানে বৃহৎ পরিসরে এআই সেবা পরিচালনার ক্ষেত্রে এই ধাপ অন্যতম বড় চ্যালেঞ্জ।
স্পেকুলেটিভ ডিকোডিং পদ্ধতি
সাধারণত এআই মডেলগুলো একবারে একটি টোকেন তৈরি করে। দীর্ঘ উত্তর তৈরির ক্ষেত্রে এ প্রক্রিয়া ধীর হয়ে পড়ে এবং জিপিইউর ওপর বাড়তি চাপ সৃষ্টি করে। টোকেন হলো এআই মডেলের তথ্য প্রক্রিয়াকরণের মৌলিক একক। একটি মডেল যত বেশি তথ্য তৈরি বা বিশ্লেষণ করবে, তত বেশি টোকেন ব্যবহার হবে। এই সীমাবদ্ধতা কাটিয়ে উঠতে ডিএসপার্কে ব্যবহার করা হয়েছে ‘স্পেকুলেটিভ ডিকোডিং’ পদ্ধতি।
এতে একটি ছোট ও তুলনামূলক হালকা মডেল প্রথমে সম্ভাব্য উত্তর দ্রুত তৈরি করে। এরপর মূল বা বড় মডেল সেই উত্তরগুলো একসঙ্গে যাচাই করে। অর্থাৎ উত্তর তৈরির প্রাথমিক কাজটি করে ছোট মডেল, আর বড় মডেল নিশ্চিত করে উত্তরটি সঠিক কি না। ছোট মডেলের তৈরি করা উত্তর সঠিক হলে সিস্টেম সরাসরি পরবর্তী ধাপে চলে যায়। আর ভুল হলে প্রচলিত পদ্ধতিতে ফিরে গিয়ে নতুন করে উত্তর তৈরি করা হয়। ডিপসিকের দাবি, অধিকাংশ টোকেনই তুলনামূলক সহজে অনুমান করা যায়। ফলে অনেক ক্ষেত্রেই পুরো উত্তর নতুন করে তৈরি করতে হয় না, আর তাতেই উল্লেখযোগ্যভাবে কমে আসে প্রতিক্রিয়া তৈরির সময়।
সেমি–অটোরিগ্রেসিভ জেনারেশন প্রযুক্তি
পুরো প্রক্রিয়াটি জিপিইউতেই সম্পন্ন হয়, কোনো কাজ সিপিইউয়ে স্থানান্তর করা হয় না। এ ছাড়া ডিএসপার্কে ‘সেমি–অটোরিগ্রেসিভ জেনারেশন’ প্রযুক্তিও ব্যবহার করা হয়েছে। এতে একবারে একটি টোকেনের পরিবর্তে একসঙ্গে কয়েকটি টোকেন তৈরি করা যায়, ফলে উত্তর তৈরির গতি আরও বাড়ে।
ডিপসিক ও পিকিং বিশ্ববিদ্যালয়ের যৌথ উদ্যোগে পরিচালিত এ গবেষণার ফলাফল উন্মুক্ত করা হয়েছে। প্রতিষ্ঠানটি গিটহাব ও হাগিং ফেসে ডিএসপার্কের গবেষণাপত্র ও প্রযুক্তিগত তথ্য প্রকাশ করেছে। তবে ডিপসিকের মতে, ডিএসপার্ক কোনো এআই মডেলের মৌলিক সক্ষমতা বাড়ায় না। অতিরিক্ত কম্পিউটিং অবকাঠামোয় বড় বিনিয়োগ ছাড়াই বিদ্যমান হার্ডওয়্যার থেকে আরও ভালো কর্মক্ষমতা পাওয়ার সুযোগ তৈরি করতে পারে।
অন্যান্য এআই মডেলেও ব্যবহারের সম্ভাবনা
প্রতিষ্ঠানটি গুগল ডিপমাইন্ডের জেমা ও আলিবাবার কিউওয়েনসহ কয়েকটি উন্মুক্ত এআই মডেলে এ প্রযুক্তি পরীক্ষা করেছে। ফলে প্রযুক্তিটির সুবিধা শুধু ডিপসিকের মডেলেই সীমাবদ্ধ থাকবে না, অন্যান্য এআই মডেলেও এটি ব্যবহার করা যেতে পারে বলে ধারণা করা হচ্ছে। এমন সময়ে ডিপসিকের এ ঘোষণা এল, যখন বিশ্বের বড় প্রযুক্তিপ্রতিষ্ঠানগুলো ডেটা সেন্টারের কম্পিউটিং সক্ষমতা বাড়াতে বিলিয়ন বিলিয়ন ডলার বিনিয়োগ করছে। অন্যদিকে ব্যয় নিয়ন্ত্রণে রাখতে উবার ও ওয়ালমার্টের মতো কিছু প্রতিষ্ঠান কর্মীদের এআই টোকেন ব্যবহারের ওপর সীমাবদ্ধতাও আরোপ করেছে।
ভি৪ মডেল পরিবার
চলতি বছরের এপ্রিলে ডিপসিক ‘ভি৪ প্রিভিউ’ উন্মুক্ত করে। এক মিলিয়ন কনটেক্সট ইনপুট ব্যবস্থাপনায় মডেলটিকে তুলনামূলক সাশ্রয়ী বিকল্প হিসেবে উপস্থাপন করা হয়। প্রতিষ্ঠানটির তথ্যমতে, ভি৪–প্রো সংস্করণটি বেশি কর্মক্ষমতার জন্য তৈরি করা হয়েছে, আর ভি৪–ফ্ল্যাশ সংস্করণটি দ্রুত ও কম খরচে ব্যবহারের উপযোগী করে তৈরি করা হয়েছে।
অবশ্য এআইয়ের প্রতিক্রিয়ার গতি বাড়ানোর প্রতিযোগিতায় ডিপসিক একা নয়। চলতি মাসের শুরুতে শাওমির এআই দল জানিয়েছে, তাদের মিমো–ভি২.৫–প্রো–আলট্রাস্পিড মডেলের আউটপুট গতি প্রতি সেকেন্ডে এক হাজারের বেশি টোকেনে উন্নীত করা হয়েছে, যা বর্তমানে এআই–শিল্পের দ্রুততম গতিগুলোর একটি।



