এপ্রিল, ১৯৫০। কম্পিউটার ল্যাব, ম্যানচেস্টার বিশ্ববিদ্যালয়, ইংল্যান্ড।
ফুরফুরে মেজাজে ব্রিটিশ গণিতবিদ ও কম্পিউটার প্রকৌশলী এলান টুরিং কম্পিউটারের চিন্তন ক্ষমতা নিয়ে সহকর্মীদের সঙ্গে আলোচনা করছিলেন। আলোচনার বিষয়- কম্পিউটার কী কখনো নিজস্ব চিন্তাশক্তি প্রয়োগ করে মানুষের বিকল্প (বট) হিসেবে কাজ করতে পারবে? এমন প্রশ্নের উত্তর খুঁজতে তাঁরা দারস্থ হন একটি চমকপ্রদ গেইমের। গবেষণার কাজের ফাঁকে, অবসর সময়ে টুরিং নিজেই তৈরি করেন এই গেইম। গেইমের নাম- দ্য ইমিটেশন গেইম। এটি মূলত একধরণের পরীক্ষণ। এর লক্ষ্য, রোবট কতটা বুদ্ধিমান হয়ে উঠেছে, তা পরীক্ষা করা।
শুরুটা যেভাবে
গেইমের বিষয়বস্তু অনেকটা এরকম- দু’টি ভিন্ন রুমের একটিতে মানুষ ও অন্যটিতে রাখা হবে একটি কম্পিউটার। যদিও কোন রুমে কে আছে সেটি পরীক্ষকের কাছে থাকবে গোপন। পরীক্ষক লিখিত আকারে সংক্ষিপ্ত প্রশ্ন করার মাধ্যমে চিহ্নিত করবেন মানুষ ও কম্পিউটারের অবস্থান। প্রশ্ন সাপেক্ষে, কম্পিউটার যদি মানুষের মতো চিন্তা করে উত্তর দিতে পারে তবেই ধরে নিতে হবে কম্পিউটারও মানুষের মতো চিন্তাশীল। তবে, এর ফলে যা হবে, ব্যাপক হারে বৃদ্ধি পাবে কম্পিউটার বটের অনৈতিক ব্যবহার। সৃষ্টি হবে স্প্যাম ঝঞ্জাট ও ওয়েবসাইট ডাউন সমস্যার। একপর্যায়ে টুরিং শুরু করলেন তার গেইম। প্রশ্নবাণে বিদ্ধ হলো কম্পিউটার ও মানব মস্তিষ্ক।
গেইমের ফলাফল কী হয়েছিল তা অবশ্য সেসময় গোপন রাখা হয়েছিল। তবে, কিছুদিন পর টুরিং তার এক গবেষণাকর্মের মাধ্যমে তুলে ধরেন এ পরীক্ষণের ফলাফল। গবেষণার শিরোনাম ছিল ‘Computing Machinery & Intelligence’। এটি প্রকাশের পর বিজ্ঞানী মহলে সৃষ্টি হয় এক সাড়াজাগানো আলোড়ন। সাইন্স ফিকশনের মতো বিস্ময়াভিভূত হয়ে পড়েন সবাই। ফলে, মাত্র কয়েক দশকের ব্যবধানে এরই হাত ধরে কম্পিউটার নিরাপত্তা ব্যবস্থায় আসে আমূল পরিবর্তন।
ঘটনার সূত্রপাত
২০০০ সালের শুরুর কথা। ইন্টারনেট সার্চ ইঞ্জিন ও ইমেইল সেবা প্রদানকারী প্রতিষ্ঠান ইয়াহু তাদের অনলাইন চ্যাট রুমে দেখতে পান কিছু অপরিচিত স্প্যাম লিংক। প্রতিষ্ঠানের নিজস্ব ব্যবহারকারীগণ এসব স্প্যাম লিংকে প্রবেশ করা মাত্র হারিয়ে ফেলতে লাগলেন নিজেদের প্রাইভেসি। ওয়েবসাইটে ধীরে ধীরে এসব স্প্যামের মাত্রা এতটাই বেড়ে যায় যে ধ্বসে পড়ে কোম্পানির সার্ভার। মূলত ওয়েবসাইটে অবাধ প্রবেশাধিকার থাকায় কিছু অসৎ ব্যক্তি কম্পিউটার বটের সাহায্যে করছিলেন এসব অনৈতিক কাজ, যার নাম ব্রুটফোর্স অ্যাটাক।
ব্রুটফোর্স অ্যাটাক কী?
মনে করুন, কোনো নির্দিষ্ট সার্ভার ১ সেকেন্ডে ৫০০ ক্লিক বা নিবন্ধন করার সক্ষমতা রাখে। এখন কেউ যদি কোনোভাবে সেই ওয়েবসাইটে ১ সেকেন্ডে ৫০ হাজার ক্লিক বা নিবন্ধন করতে চায়? হ্যাঁ, স্বাভাবিকভাবেই সার্ভার চাপ সামলাতে না পেরে অচল হয়ে যাবে। আর এমনটিই করে থাকে সাইবার ক্রিমিনালরা। নানারকম কম্পিউটার বট ও সফটওয়্যার ব্যবহার করে করা হয় এসব কাজ। অচল করে দেওয়া হয় ওয়েবসাইটের সার্ভার।
আর তাই এর সমাধানে সাইটে কম্পিউটার বটের অবাধ বিচরণ রোধের প্রয়োজনীয়তা দেখা দেয়। চিহ্নিত করতে হয় মানুষ ও কম্পিউটার বটের আচরণগত পার্থক্য৷ এরূপ পরিস্থিতিতে কোম্পানির উর্ধ্বতন কর্মকতাগণ যোগাযোগ করেন কার্নেগি মেলন বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞান বিভাগের সঙ্গে। সেসময় মেলন বিশ্ববিদ্যালয়ের এ বিভাগে কর্মরত ছিলেন একজন জ্ঞানী, গুণী ও বিজ্ঞ প্রফেসর। নাম তাঁর ম্যানুয়েল ব্লাম। ব্লামের গবেষণা সহযোগী হিসেবে তখন কাজ করছিলেন একদল মেধাবী শিক্ষার্থীও। তাদের একজন লুইস ভন এন।
প্রফেসর ব্লাম সদ্য তৈরি হওয়া ইয়াহুর এই সমস্যা সমাধানের কাজ অর্পণ করেন তরুণ এই গবেষকদের। তুখোড় মেধাবী লুইস হন এই টিমের প্রধান। ব্লামের সহযোগিতায় শুরু হলো গবেষণা কাজ। কিছুদিন যেতে না যেতেই তারা তৈরিও করে ফেললেন চমৎকার এক কম্পিউটার প্রোগ্রাম। সৃষ্টি করলেন ইন্টারনেটের বর্তমান বিরক্তিকর ‘ক্যাপচা’র৷ যদিও বর্তমানে এটি বিরক্তিকর মনে হলেও ইন্টারনেটের নিরাপদ ব্যবহারে এর রয়েছে অসামান্য অবদান।
ক্যাপচা কী?
নিবন্ধন কিংবা জরুরি কোনো কাজে ওয়েবসাইটে ঢুকতেই মোবাইল কিংবা কম্পিউটার স্ক্রিনে ভেসে ওঠে গুটিকতক ছবি, ইংরেজি আঁকাবাকা ছোট-বড় অক্ষর, গাণিতিক অঙ্কসহ আরও নানান চিহ্ন! ওয়েবসাইটের ইচ্ছে- এই চিহ্নগুলো সঠিকভাবে চিহ্নিত করতে সক্ষম হলেই কেবল আপনি প্রবেশ করতে পারবেন মূল সাইটে, সাবমিট করতে পারবেন পূরণকৃত নিবন্ধন, সমাধান করতে পারবেন অসমাপ্ত কাজ।
কিন্তু প্রশ্ন হচ্ছে, প্রযুক্তির এই দ্রুততার যুগে এমন বেরসিক বাগড়া দিয়ে দেরি করানোর প্রয়োজনটাই কী? হ্যাঁ, প্রয়োজন অবশ্য আছে। এটিই মূলত কার্নেগির গবেষকদের তৈরি করা সেই নিরাপত্তামূলক ক্যাপচা পরীক্ষা, যার মাধ্যমে চিহ্নিত করা হয় কম্পিউটার বট ও জলজ্যান্ত মানুষের আচরণগত পার্থক্য। প্রদান করা হয় ওয়েবসাইটের অনিয়ন্ত্রিত স্প্যাম সুরক্ষা।
ক্যাপচার প্রকারভেদ
২০০০ সালে বিশ্ববিদ্যালয়ের ছোট্ট এক গবেষণাগারে যাত্রা শুরু করা ক্যাপচা সময়ের পরিক্রমায় বিভিন্ন সময় বিভিন্নভাবে বিবর্তিত হয়েছে। পরিবর্তিত হয়েছে ক্যাপচার প্রোগ্রামিং কাঠামো। আবির্ভাব ঘটেছে নতুন নতুন ক্যাপচার। বর্তমানে ওয়েবসাইটে প্রবেশ করলেই চোখে পড়ে চার ধরণের ক্যাপচা ব্যবস্থা-
• বর্ণ-সংখ্যা ক্যাপচা
• ছবি চিহ্নিতকরণ ক্যাপচা
• অডিও রেকর্ড ক্যাপচা
• টিকমার্ক ক্যাপচা
বর্ণ-সংখ্যা ক্যাপচা
বলা হয় এই বর্ণ-সংখ্যা ক্যাপচাই ক্যাপচার প্রাথমিক সংস্করণ। ইন্টারনেট ব্যবস্থায় গুরুত্বপূর্ণ ওয়েবসাইটসমূহ এর মাধ্যমেই প্রথমবারের মতে ক্যাপচার সঙ্গে পরিচিত হয়। এলোমেলো-আঁকাবাকা বর্ণ, সংখ্যা ইত্যাদি চিহ্নিত করতে হয় এখানে। সাধারণত লেখাগুলো খুবই জটিলভাবে সাজানো থাকে, সেজন্য ব্যবহারকারীকে এটি পূরণ করতে অবলম্বন করতে হয় সতর্কতা। এদের কিছুকিছু ক্যাপচা আবার বিভিন্ন রংয়েরও হয়ে থাকে। উপর দিয়ে টানা থাকে ঝাপসা ও বিদঘুটে সব লাইন।
ছবি চিহ্নিতকরণ ক্যাপচা
আপনারা অনেকেই হয়তো ইতোমধ্যে এর সাথে পরিচিত হয়ে গেছেন, তাই না? হ্যাঁ, এ ধরণের ক্যাপচায় দেখা মিলে অনেকগুলো ছবির সমাহার। পাওয়া যায় বিচিত্র সব ট্রাফিক লাইট, জেব্রা ক্রসিং, বাইসাইকেল ইত্যাদির মতো আরও নানান ছবি। এদের ভেতর থেকে সমজাতীয় ছবিগুলো চিহ্নিত করতে হয়। এরকম ক্যাপচা দৃষ্টিসম্পন্ন মানুষদের জন্য অত্যন্ত সহজবোধ্য।
অডিও রেকর্ড ক্যাপচা
চোখে কম দেখা মানুষদের কথা চিন্তা করে ক্যাপচা টিম নিয়ে এসেছিল এমন অনন্য সংস্করণ। এর আগমনে ক্যাপচার ইতিহাসে সংযোজিত হয় এক দারুণ পরিবর্তন। তৈরি হয় অডিও ক্যাপচা। ওয়েবসাইটে প্রদত্ত নির্দিষ্ট রেকর্ড চালানোর মাধ্যমে শুনতে হয় বিভিন্ন বর্ণ-সংখ্যার নাম। অতঃপর, এগুলোর মাধ্যমেই পূরণ করতে হয় নির্ধারিত স্থান। এখানে অডিওর সাথে আলাদা শব্দ যুক্ত থাকে বলে কম্পিউটার বট থেকে এটিও অনেকবেশি নিরাপদ।
টিকমার্ক ক্যাপচা
২০০৯ সাল। গুগল কর্তৃক ক্যাপচা কিনে নেওয়ার পর নিজস্ব প্রোগ্রামারদের সহযোগিতায় তৈরি হয় এই সাদামাটা ক্যাপচা। এর নাম নো-ক্যাপচা রি-ক্যাপচা৷ এটি একটি চেকবক্স, যার পাশে লেখা থাকে ‘I’m not a robot’। এটি একদিকে যেমন সহজভাবে ব্যবহারযোগ্য, অন্যদিকে কম্পিউটার বটের কাছে এটি খুবই জটিল ও দুরূহ। কেননা, এই ক্যাপচায় টিকমার্ক দেওয়ার জন্য ব্যবহার করতে হয় কম্পিউটার কার্সর। মোবাইলফোন ব্যবহারকারীদের আঙুলের স্পর্শ।
কম্পিউটার বট কেন ক্যাপচা শনাক্ত করতে পারে না?
ক্যাপচার প্রকারভেদ তো জানা গেলো, তাই না? কিন্তু, এখন প্রশ্ন হলো, কম্পিউটার বট কেনই বা ক্যাপচা শনাক্ত করতে পারে না?
আসলে ক্যাপচা এমন এক পদ্ধতি যা স্বয়ংক্রিয় কোনো যন্ত্রের পক্ষে সমাধান করা সম্ভব নয়। কেননা, এগুলো সমাধানে প্রয়োজন ভিজুয়্যাল ক্ষমতা, পঠন দক্ষতা ও মানব আচরণগত ভারসাম্যতা। যা কোনো কম্পিউটার বটের ভেতর পুরোপুরি অনুপস্থিত। এছাড়াও, ক্যাপচা পূরণে বিভিন্ন সময় বিভিন্ন রকম নির্দেশনা পড়ার প্রয়োজন পড়ে। কিন্তু কম্পিউটার বট কেবল প্রোগ্রাম অনুযায়ী কার্য সমাধানে সক্ষম। নিজস্ব কেনো চিন্তা-চেতনা নেই তাদের। নেই দৃষ্টিশক্তিও। আর এখানেই একজন মানুষ ও কম্পিউটার বটের পার্থক্য।
এছাড়াও, কম্পিউটার বট কোনো কিছু সম্পর্কে ধারণা নিতে ব্যবহার করে তার অপটিক্যাল ক্যারেকটার রিকগনিশন সফটওয়্যার। এই সফটওয়্যার চিহ্নগুলোকে স্ক্যান করে নিজের ডেটাবেজে থাকা বিভিন্ন অক্ষর, অঙ্ক ও চিহ্নের সঙ্গে মেলাতে চেষ্টা করে।
এর মাধ্যমে বুঝতে চেষ্টা করে কোনটি কী অক্ষর বা অঙ্ক। কিন্তু ক্যাপচায় চিহ্নগুলো এলোমেলো, আঁকাবাঁকা ও পেঁচিয়ে লেখা থাকে বলে কম্পিউটার সফটওয়্যারের ডেটাবেজের তথ্যের সঙ্গে এসব মিলাতে পারে না। ফলে কম্পিউটার বট এসব চিহ্ন পড়তে পারে না।
আবার, কম্পিউটার বট যদি স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে এসব কার্য সমাধান করেও ফেলে তখন সামনে আসবে নতুন ক্যাপচা। ব্যবহারকারী সত্যিই মানুষ কি-না তা যাচাইয়ের জন্য নিয়ে যাওয়া হবে পরবর্তী ধাপে। এখানে পুনরায় লেখা কিংবা ছবি ক্যাপচা পূরণ করতে হতে পারে। তারপরও যদি মানুষ মনে না হয়, তখন গুগল ব্যবহারকারীর আইপি ঠিকানা চেক করে। এছাড়াও আরও নানান প্রযুক্তি ব্যবহারের মাধ্যমে গুগল নিশ্চিত হয় মানবীয় কার্যকলাপ। যদিও এসব প্রযুক্তি গুগলের একান্ত গোপনীয় বিষয়।
রি-ক্যাপচার আত্মপ্রকাশ
বর্তমানে প্রতি মুহূর্তে মিলিয়ন মিলিয়ন মানুষ পূরণ করছে এই ক্যাপচা। এর সমাধানও চলছে সমানতালে, আপন নিয়মে। কিন্তু কথায় আছে, আবিষ্কারের কোনো শেষ নেই। আর হয়েছেও তাই!
ক্যাপচা আবিষ্কারের কিছুকাল পর লুইসের মাথায় খেলে যায় তেমনই নতুন ভাবনা। তিনি ভাবলেন, প্রতি মুহূর্তে ব্যবহারকারীদের জন্য এসব আঁকাবাকা ক্যাপচা প্রোগ্রামিংয়ের প্রয়োজন কী! বিপরীতে, পুরোনো বই থেকে অপঠনযোগ্য-অস্পষ্ট শব্দ ব্যবহার করলে কেমন হয়? এতে করে বইসমূহও স্ক্যান করে ডিজিটাল লাইব্রেরিতে নতুন রূপে সংরক্ষণের সুযোগ হবে। হারিয়ে যাওয়ার হাত থেকে বাঁচবে প্রাচীনতম লিখনশৈলী।
আর তাই শুরু হলো পুরনো গাদা গাদা বই সংগ্রহ। অপটিক্যাল ক্যারেকটার রিকগনিশন (OCR)-এর মাধ্যমে হতে লাগলো স্ক্যানও। কিন্তু বিপত্তি বাঁধলো কিছুকিছু শব্দ নিয়ে। শব্দগুলো এতোটাই ঝাপসা ছিল যে এগুলোকে স্ক্যান করা যাচ্ছিল না। আর এই সুযোগের সদ্ব্যবহার করলেন লুইস। ঝাপসা শব্দগুলোকে ছবি আকারে ব্যবহার করতে লাগলেন ক্যাপচা কোডে। কিন্তু কিভাবে?
আসলে ব্যবহারকারীকে বর্তমান রি-ক্যাপচা কোডে দু’টি শব্দ লিখতে বলা হয়, যেখানে একটি কম ঝাপসা ও অন্যটি অধিকতর ঝাপসা। ব্যবহারকারী যদি কম ঝাপসা শব্দটি সঠিকভাবে লিখার পর ঝাপসা শব্দটিও লিখতে পারেন, তখন ধরে নেওয়া হয় দ্বিতীয় শব্দটিও সঠিক লেখা হয়েছে। এবার প্রথম ব্যবহারকারীর দ্বিতীয় কোডটি দ্বিতীয় ব্যবহারকারীকে প্রথম কোড হিসেবে দেওয়া হয়। এবার সে ও যদি এটি একইভাবে লিখে তাহলে এটি প্রতিস্থাপিত হয় ডিজিটাল গ্রন্থে।
এভাবে ক্যাপচা টিম ওয়েবসাইট ব্যবহারকারীদের মাধ্যমে শুরু করে পুরনো বই বিনামূল্যে স্ক্যানের এক অন্যরকম যাত্রা। প্রতিদিন প্রায় ২০০ মিলিয়ন শব্দ যোগ হতে থাকে ক্যাপচা ভান্ডারে। মনের অজান্তেই লুইস তার আইডিয়ার মাধ্যমে সেসব মানুষদের কর্মপ্রচেষ্টাকে নতুনত্ব দিয়েছেন, যারা ভাবেনও নি তাদের লেখা বই অনলাইন লাইব্রেরিতে সংযুক্ত হবে। যা কি-না পরবর্তীতে কাজে আসবে, হাজার বছরও পরে!
গুগলের ভাবনা
২০০৯ সালে ক্যাপচা টিমের দারুণ এই কর্মযজ্ঞ দৃষ্টি কাড়লো গুগল কর্তৃপক্ষের। নিজেদের তথ্য ভান্ডার ও অনলাইন লাইব্রেরি সমৃদ্ধকরণে তারা ক্যাপচাকে বাছাই করে। কিনে নেয় চড়া মূল্যে, ডলারের বিনিময়ে। ফ্রিতে ব্যবহার করতে দেয় নিজের সার্চ ইঞ্জিন ব্যবহারকারীদের। এভাবে ২০১৯ সাল পর্যন্ত মাত্র দশ বছরের ব্যবধানে প্রায় ৪০ মিলিয়ন বই ডিজিটালে রূপান্তর করতে সক্ষম হয়েছে গুগল।
ওয়েবসাইটের ভবিষ্যৎ নিরাপত্তা
প্রতি মুহূর্তে পরিবর্তিত হচ্ছে ওয়েবসাইটে প্রবেশের স্প্যাম এক্সেস কৌশল। গ্রহণ করা হচ্ছে নানাবিধ ভয়াবহ পরিকল্পনা। যেমন- ২০১৪ সালে গুগলের চোখে ধরা পড়া বর্ণ-সংখ্যা ও ছবি চিহ্নিতকরণ ক্যাপচা কৃত্রিম বুদ্ধিমত্তার মাধ্যমে সমাধান করা যাচ্ছিল। এর ফলে নব উদ্ভাবনের তাড়নায় আবির্ভূত হয় বর্তমান নো-ক্যাপচা, সৃষ্টি হয় টিকমার্ক ক্যাপচার। আর তাই ভবিষ্যতের সঙ্গে সামঞ্জস্য রেখে নতুন নতুন ক্যাপচা আবিষ্কারের সম্ভাবনা, এখন আর বলার অপেক্ষা রাখে না। একসময় হয়তো কৃত্রিম বুদ্ধিমত্তা বর্তমান ক্যাপচাদেরও চোখ ফাঁকি দিতে সক্ষম হবে। আর তখনই নতুন রূপে আবির্ভূত হবে নতুন প্রোগ্রাম, ইন্টারনেটে বিস্তৃত হবে ক্যাপচার অবদান।
References:
- Captcha – Britannica
- A brief history of CAPTCHA – Medium
- History of CAPTCHA: The Origin Story – Geetest
- History & Evolution of CAPTCHA – Masai School
- The Surprisingly Devious History of CAPTCHA – Mental Floss
- CAPTCHA: The story behind those squiggly computer letters – Physics Org.
Leave a Reply