উন্নয়নশীল বিশ্বে কৃত্রিম বুদ্ধিমত্তা—১২ || ড. আনিস রহমান

স্বল্পসম্পদ ভাষা ডিজিটাল অন্তর্ভুক্তি: কৃত্রিম বুদ্ধিমত্তার মাধ্যমে ভাষাগত বৈষম্য দূরীকরণ

. তথ্যের অপ্রতুলতা দূরীকরণে সিন্থেটিক ডেটা ক্রাউডসোর্সিং

স্বল্পসম্পদ ভাষার প্রধান সীমাবদ্ধতা হলো ডেটার অভাব। এই অভাব পূরণে গবেষকরা এখন কেবল প্রাকৃতিক তথ্যের ওপর নির্ভর না করে সিন্থেটিক ডেটা তৈরির দিকে মনোযোগ দিচ্ছেন। সিন্থেটিক ডেটা হলো কৃত্রিমভাবে তৈরি তথ্য যা একটি শক্তিশালী এআই মডেল ব্যবহার করে অন্য একটি মডেলের প্রশিক্ষণের জন্য তৈরি করা হয়। যেমন ইংরেজিতে থাকা লক্ষ লক্ষ চিকিৎসাবিজ্ঞান সংক্রান্ত তথ্যকে উন্নত অনুবাদ ব্যবস্থার মাধ্যমে বাংলায় রূপান্তর করে একটি বিশাল বাংলা মেডিকেল ডেটাসেট তৈরি করা সম্ভব। এছাড়াব্যাকট্রান্সলেশনপদ্ধতির মাধ্যমে একটি বাক্যকে প্রথমে টার্গেট ভাষায় অনুবাদ করা হয় এবং পুনরায় সেই বাক্যকে সোর্স ভাষায় ফিরিয়ে আনা হয়। যদি অর্থের পরিবর্তন না ঘটে, তবে সেই ডেটাটি প্রশিক্ষণ সেটে যুক্ত করা হয়।

ডেটা সংগ্রহের আর একটি গুরুত্বপূর্ণ মাধ্যম হলো ক্রাউডসোর্সিং বা জনবল ব্যবহার করে তথ্য সংগ্রহ। মজিলা কমন ভয়েসের মতো বিশ্বব্যাপী স্বীকৃত প্ল্যাটফর্মে সাধারণ মানুষ স্বেচ্ছায় তাদের কণ্ঠস্বর রেকর্ড করে এবং অন্যের রেকর্ড করা অডিও যাচাই করে। বাংলা কমন ভয়েস প্রকল্পে পর্যন্ত শত শত ঘণ্টার অডিও ডেটা সংগ্রহ করা হয়েছে যা বাংলা স্পিচটুটেক্সট মডেল তৈরির জন্য একটি অমূল্য সম্পদ। বাংলাদেশেবাঙালি এআইনামক অলাভজনক সংস্থাগুলো এআই গবেষণাকে সর্বজনীন করার জন্য কাজ করছে। তারা নিয়মিতভাবে বিভিন্ন প্রতিযোগিতার আয়োজন করে যার মাধ্যমে হাতের লেখা চেনার ডেটা, আঞ্চলিক ভাষার অডিও ডেটা এবং ব্যাকরণগত ভুল শনাক্ত করার ডেটাসেট তৈরি করা হচ্ছে। এই ধরনের উদ্যোগগুলো প্রমাণ করে যে সরকারি বেসরকারি যৌথ প্রচেষ্টার মাধ্যমে স্বল্পসম্পদ ভাষার বাধা অতিক্রম করা সম্ভব।

. ক্ষুদ্র জাতিসত্তার ভাষা এবং ডিজিটাল সুরক্ষা: একটি মানবিক চ্যালেঞ্জ

বাংলাদেশে বসবাসরত ক্ষুদ্র জাতিসত্তার মানুষরা প্রায়ই প্রযুক্তির সুবিধা থেকে সবচেয়ে বেশি বঞ্চিত হয়। চাকমা, মারমা, গারো, ত্রিপুরা এবং সাঁওতালি ভাষাগুলো বিলুপ্তির ঝুঁকিতে রয়েছে। কারণ এই ভাষাগুলোর ডিজিটাল উপস্থিতি প্রায় নেই বললেই চলে। এই সংকটের সমাধানে বিভিন্ন গবেষণামূলক প্রজেক্ট এক যুগান্তকারী পদক্ষেপ হিসেবে আবির্ভূত হয়েছে। এই প্রজেক্টগুলোতে চাকমা বা মারমা ভাষার বাক্যগুলোকে বাংলা লিপিতে প্রতিবর্ণীকরণ করা হয়েছে এবং সেগুলোর প্রমিত বাংলা ইংরেজি অনুবাদ প্রদান করা হয়েছে। যদিও সংখ্যার দিক থেকে এই ডেটাগুলো কম মনে হতে পারে, কিন্তু স্বল্পসম্পদ ভাষার গবেষণায় এটি একটি বিশাল ভিত্তি।

ক্ষুদ্র জাতিসত্তার মানুষরা যখন সামাজিক যোগাযোগ মাধ্যমে তাদের নিজের ভাষায় লেখেন, তখন তারা প্রায়ই বাংলা লিপি ব্যবহার করেন। তাই এই প্রতিবর্ণীকরণ প্রক্রিয়াটি তাদের ডিজিটাল অন্তর্ভুক্তিতে অত্যন্ত কার্যকর। বিভিন্ন প্রজেক্ট লোককাহিনী, মৌখিক বর্ণনা এবং ঐতিহ্যবাহী গান থেকে তথ্য সংগ্রহ করে হাজার হাজার সারিবদ্ধ বাক্য তৈরি করেছে। এই প্রজেক্টগুলোর একটি মানবিক দিক হলো এটি সরাসরি জাতিসত্তার মানুষের অংশগ্রহণে পরিচালিত হয়। এর ফলে শব্দের সঠিক উচ্চারণ এবং সাংস্কৃতিক ভাবধারা সংরক্ষিত থাকে। যখন একজন চাকমা শিশু তার নিজের ভাষায় অনলাইন ক্লাসের সুযোগ পাবে বা কোনো বৃদ্ধ তার নিজের ভাষায় চিকিৎসকের নির্দেশাবলী শুনতে পারবে, তখনই ডিজিটাল অন্তর্ভুক্তির প্রকৃত সাফল্য আসবে। সরকার বর্তমানে প্রতিটি ক্ষুদ্র জাতিসত্তার ভাষা সংরক্ষণের জন্য হাজার হাজার মৌখিক মিনিট সংগ্রহের কাজ শুরু করেছে যাতে তাদের ভাষাকে সাইবার স্পেসে বাঁচিয়ে রাখা যায়।

. ভয়েসভিত্তিক এআই ডিজিটাল সাক্ষরতার বিকল্প সমাধান

বাংলাদেশের প্রেক্ষাপটে একটি বড় চ্যালেঞ্জ হলো ডিজিটাল সাক্ষরতার অভাব। অনেক মানুষ স্মার্টফোন বা অ্যাপ ব্যবহার করতে স্বাচ্ছন্দ্য বোধ করেন না। এই সমস্যা সমাধানের জন্য ভয়েসভিত্তিক এআই বা কথোপকথনমূলক ইঞ্জিন এক বৈপ্লবিক সমাধান হিসেবে আবির্ভূত হয়েছে। এই ভয়েস সার্ভিসগুলো ইন্টারনেটের প্রয়োজন ছাড়াই যেকোনো সাধারণ বা ফিচার ফোন থেকে ব্যবহার করা যায়। ব্যবহারকারীকে কেবল ফোনে কথা বলতে হয় এবং এআই তার কথা শুনে যথাযথ উত্তর বা সেবা প্রদান করে। এটি মাইক্রোফাইনান্স সেক্টরের কোটি কোটি গ্রাহককে লেনদেনের তথ্য জানতে সাহায্য করছে।

ভয়েসভিত্তিক এআই ব্যবহারের ফলে একজন নিরক্ষর মানুষও ব্যাংকিং সুবিধা নিতে পারছেন। তিনি ফোনের ওপাশে থাকা এআইকে তার ব্যালেন্স সম্পর্কে জিজ্ঞেস করতে পারেন এবং এআই তৎক্ষণাৎ তার ভয়েস চিনে সঠিক তথ্য জানিয়ে দেয়। এর ফলে মানুষকে প্রযুক্তির ব্যবহার শেখার প্রয়োজন হচ্ছে না, বরং প্রযুক্তি মানুষের ব্যবহারের উপযোগী হয়ে উঠছে। স্পিচ প্রযুক্তির আধুনিকায়নে এমন সব ফ্রেমওয়ার্ক তৈরি হচ্ছে যা খুব অল্প ডেটা ব্যবহার করে একজন স্পিকারের কণ্ঠস্বর নকল করে কথা বলতে পারে। এটি দৃষ্টিপ্রতিবন্ধী ব্যক্তিদের জন্য বই পড়ে শোনানো বা সংবাদ পাঠ করার কাজে ব্যবহার করা যেতে পারে। এভাবে ভয়েস টেকনোলজি ডিজিটাল ডিভাইড দূর করতে একটি জাদুর কাঠির মতো কাজ করছে।

. এনএলপি গবেষণার ভবিষ্যৎ এবং সামাজিক প্রভাব

বাংলা আঞ্চলিক ভাষার এনএলপি গবেষণা এখন আর কেবল অনুবাদ বা টাইপিংয়ের মধ্যে সীমাবদ্ধ নেই। সেন্টিমেন্ট অ্যানালাইসিস বা মানুষের আবেগ বোঝার প্রযুক্তিও এখন আঞ্চলিক ভাষায় কাজ করছে। গবেষকরা এখন এমন হাইব্রিড মডেল ব্যবহার করছেন যা চাটগাঁইয়া বা সিলেটের ভাষার আবেগ শনাক্তকরণে বেশ নির্ভুল ফলাফল দিচ্ছে। এছাড়া মাল্টিমোডেল এআই ব্যবহারের সম্ভাবনা বাড়ছে। এটি এমন এক প্রযুক্তি যা একই সাথে টেক্সট, অডিও এবং ছবি প্রসেস করতে পারে। গ্রামীণ মানুষের জন্য এটি অত্যন্ত কার্যকরী হতে পারে, যেখানে একজন মানুষ কোনো সরকারি ফরমের ছবি তুলে সেটি এআইএর কাছে পাঠাতে পারেন এবং এআই তাকে তার নিজের ভাষায় বুঝিয়ে দিতে পারে ফরমটি কীভাবে পূরণ করতে হবে।

ভবিষ্যৎ এনএলপি প্রযুক্তিতে নৈতিকতা স্বচ্ছতার ওপরও জোর দেওয়া হচ্ছে। কৃত্রিম বুদ্ধিমত্তার নৈতিক ব্যবহার এবং মানবাধিকার সুরক্ষার গাইডলাইন প্রণয়ন করা হচ্ছে। ডেটা প্রাইভেসি এবং সাইবার নিরাপত্তা নিশ্চিত করে যদি এআই প্রযুক্তিতে বাংলার উপভাষা এবং ক্ষুদ্র জাতিসত্তার ভাষাগুলোকে অন্তর্ভুক্ত করা যায়, তবেই একটি বৈষম্যহীন ডিজিটাল সমাজ গড়া সম্ভব হবে। প্রযুক্তির লক্ষ্য হওয়া উচিত এমন এক পৃথিবী গড়ে তোলা যেখানে কোনো মানুষ তার ভাষার কারণে বৈষম্যের শিকার হবে না এবং ইন্টারনেটের দুনিয়ায় প্রতিটি স্বর সমানভাবে শ্রুত হবে।

বাংলা এবং এর আঞ্চলিক উপভাষাগুলোর জন্য ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (ঘখচ) গবেষণার বর্তমান গতিপথ নির্দেশ করছে যে, আমরা কেবল তথ্যের অনুবাদের যুগ পার করছি না, বরং এমন এক ডিজিটাল বাস্তুসংস্থান তৈরি করছি যেখানে কৃত্রিম বুদ্ধিমত্তা মানুষের সাংস্কৃতিক আবেগীয় সূক্ষ¥তা উপলব্ধি করতে সক্ষম। 

Related Posts