বিশ্বের বিভিন্ন লাইব্রেরি ও আর্কাইভে ছড়িয়ে থাকা বহু ঐতিহাসিক নথি ও বার্তা সংকেতলিপির আড়ালে আজও দুর্বোধ্য হয়ে আছে। কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তির সহায়তায় ইতিহাসবিদেরা এখন সেই রহস্যময় লেখাগুলোর পাঠোদ্ধারের ক্ষেত্রে নতুন অগ্রগতি অর্জন করেছেন। খবর বিবিসি।
প্রতিবেদনে বলা হয়েছে, ভ্যাটিকান লাইব্রেরির আর্কাইভে কয়েক শতাব্দী ধরে পড়ে ছিল হাতে লেখা এক রহস্যময় বই। অদ্ভুত সব প্রতীক ও চিহ্নে ভরা বইটির পাতাগুলো প্রায় ৪০০ বছরের বেশি সময় ধরে অপঠিত ছিল। ধারণা করা হয়, এতে ‘মানবদেহের নানা রোগের চিকিৎসা’-সংক্রান্ত গোপন তথ্য লিপিবদ্ধ ছিল। সে সময় এ ধরনের চিকিৎসাপদ্ধতি গোপন রাখা হতো, কারণ এগুলো নিয়ে সন্দেহ বা জাদুবিদ্যার অভিযোগ উঠতে পারত।
‘বর্গ সাইফার’ নামে পরিচিত ৪০৮ পৃষ্ঠার এই পাণ্ডুলিপি মূলত দুর্বোধ্য। এতে ৩৪টি অচেনা প্রতীক, কিছু রোমান বর্ণ এবং আরবিতে লেখা একটি প্রচ্ছদ ছিল। এটির পাঠোদ্ধারের কোনো সংকেত দেওয়া ছিল না। অনেক পুরনো হওয়ায় পাণ্ডুলিপির কিছু পৃষ্ঠাও ক্ষতিগ্রস্ত হয়েছিল, যা পাঠোদ্ধারের কাজকে আরও কঠিন করে তোলে।
তবে মেশিন লার্নিংভিত্তিক এআইয়ের সহায়তায় গবেষকেরা সংকেত ভাঙতে সক্ষম হন। তাঁরা আবিষ্কার করেন, এতে নানা অদ্ভুত চিকিৎসাপদ্ধতির বর্ণনা রয়েছে। যেমন—ডায়রিয়া সারাতে কয়েক গ্লাস উৎকৃষ্ট লাল পানীয় পান করা কিংবা ময়দার খামিরে জয়ফল গাঁজন করার মতো উপায়।
সুইডেনের স্টকহোম বিশ্ববিদ্যালয়ের কম্পিউটেশনাল লিংগুইস্টিকসের অধ্যাপক বিয়াটা মেগিয়েসি বলেন, ‘এটি গোয়েন্দা কাজের মতো। প্রতিটি প্রতীক, ধরন ও আংশিক সমাধান আমাদের হারিয়ে যাওয়া এক ঐতিহাসিক জগতের গোপন তথ্যের কাছে নিয়ে যেতে পারে।’ তবে এআইয়ের সহায়তা থাকলেও সংকেত উন্মোচনের কাজ ছিল দীর্ঘ ও শ্রমসাধ্য।
এখন মেগিয়েসি ও তাঁর সহকর্মীরা ঐতিহাসিক সংকেতলিপির অর্থ উদঘাটনে এআই ব্যবহারের বড় একটি উদ্যোগের নেতৃত্ব দিচ্ছেন। এর মাধ্যমে অতীতে সাংকেতিকভাবে লেখা বিপুল তথ্য উন্মোচনের সম্ভাবনা তৈরি হয়েছে।
কিছু হিসাব অনুযায়ী, বিশ্বজুড়ে আর্কাইভ ও লাইব্রেরিতে থাকা প্রায় ১ শতাংশ উপাদান আংশিক বা পুরোপুরি সংকেতলিপিতে লেখা। এর মধ্যে প্রাচীন গ্রিস ও রোমের সময়কার সংকেতও রয়েছে।
গোপন সংকেতে লুকানো ইতিহাস
এসব ঐতিহাসিক সংকেতলিপিতে কূটনৈতিক তথ্য, গোপন সংগঠনের আচার, চিকিৎসাবিষয়ক জ্ঞান, প্রেমের সম্পর্ক কিংবা দৈনন্দিন ব্যক্তিগত তথ্য লুকিয়ে আছে। ইতিহাসের প্রচলিত বর্ণনায় অনুপস্থিত বহু তথ্য এর মধ্যে রয়েছে। কিছু ক্ষেত্রে এসব নথির পাঠোদ্ধার কোনও বিখ্যাত ব্যক্তি বা পুরো একটি যুগ সম্পর্কে প্রচলিত ধারণাই বদলে দিতে পারে।
সম্প্রতি এমনই একটি উদাহরণ পাওয়া যায় স্কটল্যান্ডের রানি মেরির সাংকেতিক চিঠিগুলোতে। ইংল্যান্ডে দীর্ঘ বন্দিজীবনের সময় লেখা এসব চিঠি থেকে জানা যায়, তিনি সিংহাসন পুনরুদ্ধারের ষড়যন্ত্রে জড়িত ছিলেন এবং তাঁর ছেলে স্কটল্যান্ডের ষষ্ঠ জেমস, পরবর্তী সময়ে ইংল্যান্ডের প্রথম জেমসের সঙ্গে তাঁর সম্পর্ক ছিল টানাপড়েনপূর্ণ।
ঐতিহাসিক সংকেতলিপির কিছু তুলনামূলক সহজ। যেমন বর্গ সাইফারে প্রতিটি প্রতীকের বদলে একটি করে রোমান বর্ণ ব্যবহার করা হয়েছিল। তবে অনেক সংকেত অত্যন্ত জটিল। কোথাও মূল ভাষাই অজানা, আবার কোথাও বিভ্রান্ত করতে ইচ্ছাকৃতভাবে অর্থহীন প্রতীক যোগ করা হয়েছে। একই অক্ষরের জন্য একাধিক প্রতীক ব্যবহারের ঘটনাও আছে।
ফলে অল্প কিছু লেখা উদ্ধার করতেও দীর্ঘ সময় ধরে নানা পরীক্ষা-নিরীক্ষা করতে হয়। ফ্রান্সের ন্যান্সিতে অবস্থিত ফরাসি ন্যাশনাল ইনস্টিটিউট ফর কম্পিউটার সায়েন্স রিসার্চের ক্রিপ্টোলজিস্ট সিসিল পিয়েরো ও তাঁর সহকর্মীরা পঞ্চদশ শতকের একটি চিঠির পাঠোদ্ধারে ৬ মাস সময় নিয়েছিলেন। পবিত্র রোমান সম্রাট ও স্পেনের রাজা পঞ্চম চার্লসের লেখা ওই তিন পৃষ্ঠার চিঠিতে ১২০ ধরনের সংকেতচিহ্ন ছিল। পাঠোদ্ধারের পর জানা যায়, তাঁকে হত্যার ষড়যন্ত্র নিয়ে তিনি আতঙ্কিত ছিলেন।
এআই যেভাবে গতি বাড়াচ্ছে
সংকেত বিশ্লেষণের আগে গবেষকদের প্রথমে হাতে লেখা নথি ডিজিটাল রূপে রূপান্তর করতে হয়, যাতে তা সফটওয়্যারে বিশ্লেষণ করা যায়। কিন্তু অস্পষ্ট হাতের লেখা ও মলিন কালি কাজকে কঠিন করে তোলে।
সিসিল পিয়েরো জানান, অচেনা প্রতীকযুক্ত মাত্র দুই পৃষ্ঠার একটি চিঠি অনুলিখন করতেই তাঁর পুরো এক দিন লেগে যায়।
এখন এআই সেই কাজ দ্রুততর করছে। নরওয়ের অসলো বিশ্ববিদ্যালয়ের জার্মান ভাষাতত্ত্বের অধ্যাপক মিশেল ওয়ালডিসপুল ও তাঁর সহকর্মীরা সম্প্রতি ‘ট্রান্সক্রিবাস’ নামের একটি অনলাইন এআই প্ল্যাটফর্ম ব্যবহার করে ১৬৩৭ সালের একটি গোপন চিঠির অনুলিখন করেন। ৩০ বছরের যুদ্ধ চলাকালে সুইডিশ চ্যান্সেলর অ্যাক্সেল অক্সেনস্টিয়ার্নাকে ওই চিঠি লিখেছিলেন অভিজাত ব্যক্তি সিগিসমুন্ড হেউসনার ফন ওয়ান্ডারস্লেবেন।
বিভিন্ন ভাষা, লিপি ও শতাব্দীব্যাপী হাতের লেখার ধরনে প্রশিক্ষিত এই প্ল্যাটফর্ম নথির ছবি আপলোডের পর প্রথমে লেখার ব্লক ও লাইন শনাক্ত করে। এরপর প্রতিটি অক্ষর বিশ্লেষণ করে সেটিকে ডিজিটাল লেখায় রূপান্তর করে।
যদিও কিছু জায়গায় হাতে সংশোধন প্রয়োজন হয়েছিল, তবু চিঠিটি আংশিকভাবে সংখ্যাভিত্তিক সংকেতে লেখা এবং পরিষ্কারভাবে আলাদা করা থাকায় এআই ভালো ফল দেয়। তবে অদ্ভুত প্রতীক, জ্যোতিষশাস্ত্রের চিহ্ন বা অস্বাভাবিকভাবে লেখা সংখ্যার ক্ষেত্রে বর্তমান এআই প্ল্যাটফর্মগুলো এখনও দুর্বল।
এ কারণে মেগিয়েসি, ওয়ালডিসপুল ও তাঁদের সহকর্মীরা ‘ডেস্ক্রিপ্ট’ প্রকল্পের আওতায় নতুন একটি এআই টুল তৈরি করছেন। এটি দুর্বোধ্য প্রতীক বা লিপিযুক্ত হাতে লেখা ঐতিহাসিক নথিকে মেশিন-পাঠযোগ্য রূপে রূপান্তর করতে পারবে।
মেগিয়েসি বলেন, ‘আমরা এমন একটি মডেল তৈরি করছি, যেগুলো বিভিন্ন লিপি, বর্ণমালা ও প্রতীক ব্যবস্থার ওপর প্রশিক্ষিত ও পরীক্ষিত।’
মানুষ ও যন্ত্রের যৌথ কাজ
গোপন নথি ডিজিটাল রূপে রূপান্তরের পর শুরু হয় প্রকৃত বিশ্লেষণ। বর্তমানে ক্রিপ্টোলজিস্টরা বিশেষ সফটওয়্যার ব্যবহার করেন, যা বিভিন্ন অ্যালগরিদমের মাধ্যমে সংকেতের ধরন শনাক্ত ও ভাঙার চেষ্টা করে। সহজ সংকেতের ক্ষেত্রে প্রতীকের ব্যবহারের হার বিশ্লেষণ করে ভাষার অক্ষরের সঙ্গে মিল খোঁজা হয়। যেমন ইংরেজিতে সবচেয়ে বেশি ব্যবহৃত অক্ষর ‘ই’, আর কম ব্যবহৃত অক্ষর ‘জেড’, ‘কিউ’ ও ‘এক্স’।
কিন্তু ওয়ান্ডারস্লেবেনের চিঠিতে ‘ই’ অক্ষরের জন্য আটটি পর্যন্ত ভিন্ন প্রতীক ব্যবহৃত হয়েছিল। ফলে ওয়ালডিসপুলের পুরোনো জার্মান ভাষাজ্ঞান এবং সফটওয়্যারের সহায়তায় ধাপে ধাপে সংকেত ভাঙতে হয়।
তিনি বলেন, ‘এটি ছিল যন্ত্র ও মানুষের মধ্যে বারবার সমন্বয়ের প্রক্রিয়া। হয়তো একসময় এআই একাই পুরো কাজ করতে পারবে।’
পাঠোদ্ধারের পর জানা যায়, ওয়ান্ডারস্লেবেন সুইডেনের মিত্রপক্ষের ভেতরে ষড়যন্ত্রের সতর্কবার্তা পাঠাচ্ছিলেন। তিনি জানান, মিত্রদের মধ্যে ষড়যন্ত্রের খবর পেয়ে তাঁকে কৌশলগতভাবে পিছু হটতে হয়েছিল।
সংকেত ভাঙায় নতুন সম্ভাবনা
মেগিয়েসি ও তাঁর দল এখন এমন পদ্ধতি নিয়ে কাজ করছেন, যেখানে আলাদা অনুলিখন ছাড়াই কেবল ছবির বিশ্লেষণের মাধ্যমে সংকেত পাঠোদ্ধার করা যাবে। তাঁরা সম্প্রতি দেখিয়েছেন, প্রতিটি অক্ষরের বদলে একটি প্রতীক ব্যবহৃত সহজ সংকেতের ক্ষেত্রে এই পদ্ধতি কার্যকর হতে পারে।
তাঁরা ‘কোপিয়ালে সাইফার’ নামে ১০৫ পৃষ্ঠার একটি পাণ্ডুলিপিতে পদ্ধতিটি প্রয়োগ করেন। এতে অষ্টাদশ শতকের একটি জার্মান গোপন সংগঠনের আচার, নিয়ম ও আদর্শ বর্ণনা করা হয়েছিল। সাধারণ হাতের লেখা, সংকেতের নির্দিষ্ট লাইন ও তার ডিকোড করা জার্মান পাঠ দিয়ে এআইকে প্রশিক্ষণ দেওয়ার পর এটি আগে না দেখা অংশও সফলভাবে পাঠোদ্ধার করতে সক্ষম হয়।
বিশেষ করে যেসব সংকেতের মূল ভাষা অজানা, সেখানে এ ধরনের ব্যবস্থা কার্যকর হতে পারে।
মেগিয়েসি বলেন, “এটি বিরল ও অপ্রচলিত লেখনপদ্ধতি নিয়ে নতুন সম্ভাবনা তৈরি করছে। আমাদের চূড়ান্ত লক্ষ্য হলো অনুলিখন ও পাঠোদ্ধারকে এক ধাপে একত্র করা।”
ওয়ালডিসপুল ও তাঁর সহকর্মীরা এখন পুরোনো আর্কাইভ ঘেঁটে বিভিন্ন সংকেতলিপির সংগ্রহ তৈরি করছেন, যা এআই প্রশিক্ষণের জন্য গুরুত্বপূর্ণ হবে। কারণ চ্যাটজিপিটির মতো এআই চ্যাটবটের ভিত্তিতে থাকা বড় ভাষা মডেলগুলোকে ট্রিলিয়ন শব্দ দিয়ে প্রশিক্ষণ দেওয়া হয়। কিন্তু সংকেত বিশ্লেষণের জন্য তেমন বিপুল ডেটা পাওয়া কঠিন।
তাঁদের সংগ্রহে উনিশ শতকের শেষ ভাগ থেকে বিংশ শতকের শুরুর দিকের প্রায় ৪০০টি সাংকেতিক পোস্টকার্ড রয়েছে। যেগুলোর কিছু অংশ বিশ্লেষণ করে জানা গেছে, সেগুলোর কিছু ছিল জার্মান ভাষায় লেখা প্রেমপত্র।
মেগিয়েসির দল তাঁদের গবেষণার ভিত্তিতে একটি এআই চ্যাটবট তৈরি করেছে, যা একই সঙ্গে অনুলিখন ও ডিক্রিপশন করতে পারে। এতে ঐতিহাসিক বিভিন্ন সময়ের পাঠ দিয়ে প্রশিক্ষিত বড় ভাষা মডেল, সংকেত বিশ্লেষণের অ্যালগরিদম এবং হাতের লেখা শনাক্তকারী প্রযুক্তি একত্র করা হয়েছে। বিশেষজ্ঞদের সংশোধন থেকে এটি নিজেও শিখতে পারবে।
গবেষকদের লক্ষ্য হলো, গবেষক বা সাধারণ মানুষ যেন কোনও ঐতিহাসিক সাংকেতিক লেখা দিয়ে সহজেই তার পাঠোদ্ধার পেতে পারেন।
বর্গ সাইফারে এই এআই চ্যাটবট পরীক্ষা করে দেখা গেছে, এটি ৫০০ প্রতীকের একটি অংশ ২৯ মিনিটের কিছু বেশি সময়ে অনুবাদ ও ডিকোড করতে পারে। এমনকি ইংরেজি অনুবাদও দিয়েছে। পাশাপাশি কেন সমাধানটি গ্রহণযোগ্য, তার ব্যাখ্যাও দিয়েছে। গবেষকদের মতে, এতে এআইয়ের ‘হ্যালুসিনেশন’ বা ভুল ব্যাখ্যার ঝুঁকি কমে।
দলটি সম্প্রতি আরও দুটি ভিন্ন সময়, ভাষা ও জটিলতার সংকেতেও সিস্টেমটি পরীক্ষা করেছে। সেগুলোও দ্রুত পাঠোদ্ধার করতে সক্ষম হয়েছে।
মেগিয়েসি বলেন, ‘এআই সবচেয়ে বেশি সহায়তা করে ব্যাপক পরিসরে কাজ করা, দ্রুততা, ধরন শনাক্ত করা এবং বিভিন্ন কাজ একত্র করার ক্ষেত্রে।’
গবেষকদের মতে, এ ধরনের এআই প্রযুক্তি দীর্ঘদিন ধরে অমীমাংসিত ঐতিহাসিক সংকেত ভাঙতে গুরুত্বপূর্ণ ভূমিকা রাখতে পারে। একই সঙ্গে এমন প্রাচীন লেখাও পড়তে সহায়তা করবে, যেগুলোর বর্ণমালা আজ আর কেউ পড়তে পারে না। উদাহরণ হিসেবে ক্রিট দ্বীপে পাওয়া চার হাজার বছরের পুরোনো ফাইস্টোস ডিস্ক এবং প্রাচীন গ্রিক ভাষা ‘লিনিয়ার বি’ এখনও অপাঠিত রয়ে গেছে।
মেগিয়েসি বলেন, ‘আমাকে সবচেয়ে বেশি উচ্ছ্বসিত করে শুধু একটি ঐতিহাসিক রহস্য সমাধানের সম্ভাবনা নয়, বরং এমন পদ্ধতি তৈরি করা যা বহু ধরনের গবেষণায় সহায়তা করতে পারে।’



