এআইকে সমৃদ্ধ করতে লাইব্রেরির দুয়ার খোলা, বইয়ের ভাণ্ডার থেকে শিখবে প্রযুক্তি!

নতুন খবর: এআই চ্যাটবটদের জ্ঞানভাণ্ডার বাড়াতে লাইব্রেরির দুয়ার

বিশ্বজুড়ে আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই) বা কৃত্রিম বুদ্ধিমত্তার দৌড় চলছে। উন্নত প্রযুক্তির এই যুগে, এআই চ্যাটবটগুলো মানুষের সাথে যোগাযোগের নতুন দিগন্ত উন্মোচন করছে।

কিন্তু এই চ্যাটবটগুলোকে প্রশিক্ষিত করতে প্রয়োজন বিশাল তথ্যভাণ্ডার। আর সেই কাজটি আরও ভালোভাবে করার জন্য এবার লাইব্রেরির দুয়ারে কড়া নাড়ছে প্রযুক্তি প্রতিষ্ঠানগুলো।

সম্প্রতি, হার্ভার্ড বিশ্ববিদ্যালয় তাদের সংগ্রহে থাকা বহু পুরাতন বই এবং নথিপত্র এআই গবেষকদের জন্য উন্মুক্ত করেছে। পঞ্চদশ শতাব্দের শুরুর দিকের বই থেকে শুরু করে বিভিন্ন ভাষার প্রায় এক মিলিয়ন বইয়ের বিশাল সংগ্রহ রয়েছে তাদের কাছে।

শুধু তাই নয়, বোস্টন পাবলিক লাইব্রেরির পুরাতন সংবাদপত্র এবং সরকারি নথিপত্রও খুব শীঘ্রই এআই প্রশিক্ষণের কাজে ব্যবহার করা হবে।

এআই তৈরির দৌড়ে লাইব্রেরিগুলোর এই পদক্ষেপ নিঃসন্দেহে গুরুত্বপূর্ণ। কারণ, আধুনিক এআই মূলত ইন্টারনেট থেকে পাওয়া তথ্যের ওপর নির্ভর করে তৈরি করা হয়।

কিন্তু ইন্টারনেটের তথ্যের সীমাবদ্ধতা রয়েছে। এখানে সব ধরনের ঐতিহাসিক, সাংস্কৃতিক এবং ভাষাগত তথ্যের অভাব রয়েছে। তাই লাইব্রেরির পুরনো বইগুলো এআইকে আরও সমৃদ্ধ করবে।

মাইক্রোসফটের ডেপুটি জেনারেল কাউন্সেল বার্টন ডেভিস জানান, কপিরাইট সংক্রান্ত জটিলতা এড়াতে পাবলিক ডোমেইনে থাকা ডেটা ব্যবহার করা এখন সবচেয়ে নিরাপদ।

কারণ, লাইব্রেরিতে থাকা এই বিপুল ডেটা ঐতিহাসিক, সাংস্কৃতিক ও ভাষাগত দিক থেকে অত্যন্ত গুরুত্বপূর্ণ।

হার্ভার্ড বিশ্ববিদ্যালয়ের ‘ইনস্টিটিউশনাল ডেটা ইনিশিয়েটিভ’ নামক একটি গবেষণা প্রকল্পের মাধ্যমে বিশ্বের বিভিন্ন লাইব্রেরির ঐতিহাসিক সংগ্রহগুলো এআই উপযোগী করে তোলার কাজ চলছে।

এই কাজে মাইক্রোসফট এবং ওপেনএআইয়ের মতো প্রতিষ্ঠানগুলো আর্থিক সহায়তা করছে। হার্ভার্ড ল স্কুল লাইব্রেরি ইনোভেশন ল্যাবের গবেষণা ব্যবস্থাপক অ্যারিস্টানা স্করটাস বলেছেন, “আমরা চাই, বর্তমান এআই যুগে এই ক্ষমতা আবারও এই প্রতিষ্ঠানগুলোর হাতে ফিরে আসুক।

কারণ, লাইব্রেরিয়ানরাই সবসময় তথ্যের সংরক্ষক।

হার্ভার্ডের প্রকাশিত ‘ইনস্টিটিউশনাল বুকস ১.০’ ডেটাসেটে প্রায় ৩৯ কোটি ৪০ লক্ষ স্ক্যান করা পৃষ্ঠা রয়েছে।

এর মধ্যে কোরীয় চিত্রশিল্পীর হাতে লেখা একটি বইও রয়েছে, যেখানে ফুল ও গাছপালা চাষের কথা উল্লেখ করা হয়েছে। এছাড়াও, উনিশ শতকের সাহিত্য, দর্শন, আইন ও কৃষিকাজ বিষয়ক অনেক গুরুত্বপূর্ণ নথিও রয়েছে।

এই ডেটা উন্নত এআই সিস্টেম তৈরি করতে সহায়ক হবে।

হার্ভার্ডের বার্কম্যান ক্লেইন সেন্টার ফর ইন্টারনেট অ্যান্ড সোসাইটির প্রধান প্রযুক্তিবিদ এবং ডেটা ইনিশিয়েটিভের নির্বাহী পরিচালক গ্রেগ লেপার্ট বলেন, “এআই প্রশিক্ষণে ব্যবহৃত অনেক ডেটা আসল উৎস থেকে আসে না।

এই সংগ্রহটি সেইসব প্রতিষ্ঠানের স্ক্যান করা আসল কপি থেকে নেওয়া হয়েছে, যারা মূলত এই বইগুলো সংগ্রহ করেছিল।

বর্তমানে, উন্নত এআই সিস্টেমগুলোতে প্রচুর পরিমাণে ডেটা সরবরাহ করা হচ্ছে।

উদাহরণস্বরূপ, মেটা তাদের সর্বশেষ এআই মডেল তৈরি করতে টেক্সট, ছবি ও ভিডিও থেকে ৩০ ট্রিলিয়নের বেশি ডেটা ব্যবহার করেছে।

তবে, লাইব্রেরির এই ডেটা ব্যবহারের কিছু সীমাবদ্ধতাও রয়েছে।

পুরাতন ডেটা সেটে বিতর্কিত বিষয়বস্তু, যেমন—বৈজ্ঞানিক ভুল ধারণা এবং বর্ণবাদী লেখা থাকতে পারে। হার্ভার্ডের লাইব্রেরি ইনোভেশন ল্যাবের সমন্বয়কারী ক্রিস্টি মুক্ক সতর্ক করে বলেন, এই ডেটা ব্যবহারের ঝুঁকি কমাতে গাইডলাইন তৈরি করা হচ্ছে, যাতে গবেষকরা দায়িত্বের সাথে এআই তৈরি করতে পারেন।

এই ডেটা বর্তমানে ‘হাগিং ফেস’ প্ল্যাটফর্মে শেয়ার করা হচ্ছে, যেখানে যে কেউ ডেটাসেট এবং ওপেন-সোর্স এআই মডেল ডাউনলোড করতে পারে।

হার্ভার্ডের সংগ্রহটি ভাষার দিক থেকেও বেশ বৈচিত্র্যপূর্ণ। এখানে ইংরেজি ভাষার বইয়ের সংখ্যা অর্ধেকের কম, তবে জার্মান, ফরাসি, ইতালীয়, স্প্যানিশ ও ল্যাটিনের মতো ইউরোপীয় ভাষাগুলো প্রধান্য বিস্তার করে আছে।

বিশেষজ্ঞরা মনে করেন, উনিশ শতকের চিন্তাভাবনার উপর ভিত্তি করে তৈরি এই ডেটা, মানুষের মতো পরিকল্পনা ও যুক্তিবোধ সম্পন্ন এআই তৈরি করতে সহায়ক হবে।

তথ্য সূত্র: অ্যাসোসিয়েটেড প্রেস

Leave a Reply

Your email address will not be published. Required fields are marked *