ক্যাপচার ইতিহাস: নিরাপত্তার সহজ ধাপ

এপ্রিল, ১৯৫০। কম্পিউটার ল্যাব, ম্যানচেস্টার বিশ্ববিদ্যালয়, ইংল্যান্ড।

ফুরফুরে মেজাজে ব্রিটিশ গণিতবিদ ও কম্পিউটার প্রকৌশলী এলান টুরিং কম্পিউটারের চিন্তন ক্ষমতা নিয়ে সহকর্মীদের সঙ্গে আলোচনা করছিলেন। আলোচনার বিষয়- কম্পিউটার কী কখনো নিজস্ব চিন্তাশক্তি প্রয়োগ করে মানুষের বিকল্প (বট) হিসেবে কাজ করতে পারবে? এমন প্রশ্নের উত্তর খুঁজতে তাঁরা দারস্থ হন একটি চমকপ্রদ গেইমের। গবেষণার কাজের ফাঁকে, অবসর সময়ে টুরিং নিজেই তৈরি করেন এই গেইম। গেইমের নাম- দ্য ইমিটেশন গেইম। এটি মূলত একধরণের পরীক্ষণ। এর লক্ষ্য, রোবট কতটা বুদ্ধিমান হয়ে উঠেছে, তা পরীক্ষা করা।

গেইম তৈরির কাজ; Image Source: P.G. AI

শুরুটা যেভাবে

গেইমের বিষয়বস্তু অনেকটা এরকম- দু’টি ভিন্ন রুমের একটিতে মানুষ ও অন্যটিতে রাখা হবে একটি কম্পিউটার। যদিও কোন রুমে কে আছে সেটি পরীক্ষকের কাছে থাকবে গোপন। পরীক্ষক লিখিত আকারে সংক্ষিপ্ত প্রশ্ন করার মাধ্যমে চিহ্নিত করবেন মানুষ ও কম্পিউটারের অবস্থান। প্রশ্ন সাপেক্ষে, কম্পিউটার যদি মানুষের মতো চিন্তা করে উত্তর দিতে পারে তবেই ধরে নিতে হবে কম্পিউটারও মানুষের মতো চিন্তাশীল। তবে, এর ফলে যা হবে, ব্যাপক হারে বৃদ্ধি পাবে কম্পিউটার বটের অনৈতিক ব্যবহার। সৃষ্টি হবে স্প্যাম ঝঞ্জাট ও ওয়েবসাইট ডাউন সমস্যার। একপর্যায়ে টুরিং শুরু করলেন তার গেইম। প্রশ্নবাণে বিদ্ধ হলো কম্পিউটার ও মানব মস্তিষ্ক।

গেইমের ফলাফল কী হয়েছিল তা অবশ্য সেসময় গোপন রাখা হয়েছিল। তবে, কিছুদিন পর টুরিং তার এক গবেষণাকর্মের মাধ্যমে তুলে ধরেন এ পরীক্ষণের ফলাফল। গবেষণার শিরোনাম ছিল ‘Computing Machinery & Intelligence’। এটি প্রকাশের পর বিজ্ঞানী মহলে সৃষ্টি হয় এক সাড়াজাগানো আলোড়ন। সাইন্স ফিকশনের মতো বিস্ময়াভিভূত হয়ে পড়েন সবাই। ফলে, মাত্র কয়েক দশকের ব্যবধানে এরই হাত ধরে কম্পিউটার নিরাপত্তা ব্যবস্থায় আসে আমূল পরিবর্তন।

টুরিংয়ের গবেষণাকর্ম; Image Source: P.G. AI

ঘটনার সূত্রপাত

২০০০ সালের শুরুর কথা। ইন্টারনেট সার্চ ইঞ্জিন ও ইমেইল সেবা প্রদানকারী প্রতিষ্ঠান ইয়াহু তাদের অনলাইন চ্যাট রুমে দেখতে পান কিছু অপরিচিত স্প্যাম লিংক। প্রতিষ্ঠানের নিজস্ব ব্যবহারকারীগণ এসব স্প্যাম লিংকে প্রবেশ করা মাত্র হারিয়ে ফেলতে লাগলেন নিজেদের প্রাইভেসি। ওয়েবসাইটে ধীরে ধীরে এসব স্প্যামের মাত্রা এতটাই বেড়ে যায় যে ধ্বসে পড়ে কোম্পানির সার্ভার। মূলত ওয়েবসাইটে অবাধ প্রবেশাধিকার থাকায় কিছু অসৎ ব্যক্তি কম্পিউটার বটের সাহায্যে করছিলেন এসব অনৈতিক কাজ, যার নাম ব্রুটফোর্স অ্যাটাক।

ব্রুটফোর্স অ্যাটাক কী?

মনে করুন, কোনো নির্দিষ্ট সার্ভার ১ সেকেন্ডে ৫০০ ক্লিক বা নিবন্ধন করার সক্ষমতা রাখে। এখন কেউ যদি কোনোভাবে সেই ওয়েবসাইটে ১ সেকেন্ডে ৫০ হাজার ক্লিক বা নিবন্ধন করতে চায়? হ্যাঁ, স্বাভাবিকভাবেই সার্ভার চাপ সামলাতে না পেরে অচল হয়ে যাবে। আর এমনটিই করে থাকে সাইবার ক্রিমিনালরা। নানারকম কম্পিউটার বট ও সফটওয়্যার ব্যবহার করে করা হয় এসব কাজ। অচল করে দেওয়া হয় ওয়েবসাইটের সার্ভার।

ব্রুটফোর্স অ্যাটাক; Image Source: Masai

আর তাই এর সমাধানে সাইটে কম্পিউটার বটের অবাধ বিচরণ রোধের প্রয়োজনীয়তা দেখা দেয়। চিহ্নিত করতে হয় মানুষ ও কম্পিউটার বটের আচরণগত পার্থক্য৷ এরূপ পরিস্থিতিতে কোম্পানির উর্ধ্বতন কর্মকতাগণ যোগাযোগ করেন কার্নেগি মেলন বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞান বিভাগের সঙ্গে। সেসময় মেলন বিশ্ববিদ্যালয়ের এ বিভাগে কর্মরত ছিলেন একজন জ্ঞানী, গুণী ও বিজ্ঞ প্রফেসর। নাম তাঁর ম্যানুয়েল ব্লাম। ব্লামের গবেষণা সহযোগী হিসেবে তখন কাজ করছিলেন একদল মেধাবী শিক্ষার্থীও। তাদের একজন লুইস ভন এন।

প্রফেসর ব্লাম সদ্য তৈরি হওয়া ইয়াহুর এই সমস্যা সমাধানের কাজ অর্পণ করেন তরুণ এই গবেষকদের। তুখোড় মেধাবী লুইস হন এই টিমের প্রধান। ব্লামের সহযোগিতায় শুরু হলো গবেষণা কাজ। কিছুদিন যেতে না যেতেই তারা তৈরিও করে ফেললেন চমৎকার এক কম্পিউটার প্রোগ্রাম। সৃষ্টি করলেন ইন্টারনেটের বর্তমান বিরক্তিকর ‘ক্যাপচা’র৷ যদিও বর্তমানে এটি বিরক্তিকর মনে হলেও ইন্টারনেটের নিরাপদ ব্যবহারে এর রয়েছে অসামান্য অবদান।

গবেষণা সহযোগীদের দল; Image Source: P.G. AI

ক্যাপচা কী?

নিবন্ধন কিংবা জরুরি কোনো কাজে ওয়েবসাইটে ঢুকতেই মোবাইল কিংবা কম্পিউটার স্ক্রিনে ভেসে ওঠে গুটিকতক ছবি, ইংরেজি আঁকাবাকা ছোট-বড় অক্ষর, গাণিতিক অঙ্কসহ আরও নানান চিহ্ন! ওয়েবসাইটের ইচ্ছে- এই চিহ্নগুলো সঠিকভাবে চিহ্নিত করতে সক্ষম হলেই কেবল আপনি প্রবেশ করতে পারবেন মূল সাইটে, সাবমিট করতে পারবেন পূরণকৃত নিবন্ধন, সমাধান করতে পারবেন অসমাপ্ত কাজ।

কিন্তু প্রশ্ন হচ্ছে, প্রযুক্তির এই দ্রুততার যুগে এমন বেরসিক বাগড়া দিয়ে দেরি করানোর প্রয়োজনটাই কী? হ্যাঁ, প্রয়োজন অবশ্য আছে। এটিই মূলত কার্নেগির গবেষকদের তৈরি করা সেই নিরাপত্তামূলক ক্যাপচা পরীক্ষা, যার মাধ্যমে চিহ্নিত করা হয় কম্পিউটার বট ও জলজ্যান্ত মানুষের আচরণগত পার্থক্য। প্রদান করা হয় ওয়েবসাইটের অনিয়ন্ত্রিত স্প্যাম সুরক্ষা।

হরেকরকম ক্যাপচা; Image Source: Masai

ক্যাপচার প্রকারভেদ

২০০০ সালে বিশ্ববিদ্যালয়ের ছোট্ট এক গবেষণাগারে যাত্রা শুরু করা ক্যাপচা সময়ের পরিক্রমায় বিভিন্ন সময় বিভিন্নভাবে বিবর্তিত হয়েছে। পরিবর্তিত হয়েছে ক্যাপচার প্রোগ্রামিং কাঠামো। আবির্ভাব ঘটেছে নতুন নতুন ক্যাপচার। বর্তমানে ওয়েবসাইটে প্রবেশ করলেই চোখে পড়ে চার ধরণের ক্যাপচা ব্যবস্থা-

• বর্ণ-সংখ্যা ক্যাপচা
• ছবি চিহ্নিতকরণ ক্যাপচা
• অডিও রেকর্ড ক্যাপচা
• টিকমার্ক ক্যাপচা

বর্ণ-সংখ্যা ক্যাপচা

বলা হয় এই বর্ণ-সংখ্যা ক্যাপচাই ক্যাপচার প্রাথমিক সংস্করণ। ইন্টারনেট ব্যবস্থায় গুরুত্বপূর্ণ ওয়েবসাইটসমূহ এর মাধ্যমেই প্রথমবারের মতে ক্যাপচার সঙ্গে পরিচিত হয়। এলোমেলো-আঁকাবাকা বর্ণ, সংখ্যা ইত্যাদি চিহ্নিত করতে হয় এখানে। সাধারণত লেখাগুলো খুবই জটিলভাবে সাজানো থাকে, সেজন্য ব্যবহারকারীকে এটি পূরণ করতে অবলম্বন করতে হয় সতর্কতা। এদের কিছুকিছু ক্যাপচা আবার বিভিন্ন রংয়েরও হয়ে থাকে। উপর দিয়ে টানা থাকে ঝাপসা ও বিদঘুটে সব লাইন।

ছবি চিহ্নিতকরণ ক্যাপচা

আপনারা অনেকেই হয়তো ইতোমধ্যে এর সাথে পরিচিত হয়ে গেছেন, তাই না? হ্যাঁ, এ ধরণের ক্যাপচায় দেখা মিলে অনেকগুলো ছবির সমাহার। পাওয়া যায় বিচিত্র সব ট্রাফিক লাইট, জেব্রা ক্রসিং, বাইসাইকেল ইত্যাদির মতো আরও নানান ছবি। এদের ভেতর থেকে সমজাতীয় ছবিগুলো চিহ্নিত করতে হয়। এরকম ক্যাপচা দৃষ্টিসম্পন্ন মানুষদের জন্য অত্যন্ত সহজবোধ্য।

ছবি চিহ্নিতকরণ ক্যাপচা; Image Source: Physics Org

অডিও রেকর্ড ক্যাপচা

চোখে কম দেখা মানুষদের কথা চিন্তা করে ক্যাপচা টিম নিয়ে এসেছিল এমন অনন্য সংস্করণ। এর আগমনে ক্যাপচার ইতিহাসে সংযোজিত হয় এক দারুণ পরিবর্তন। তৈরি হয় অডিও ক্যাপচা। ওয়েবসাইটে প্রদত্ত নির্দিষ্ট রেকর্ড চালানোর মাধ্যমে শুনতে হয় বিভিন্ন বর্ণ-সংখ্যার নাম। অতঃপর, এগুলোর মাধ্যমেই পূরণ করতে হয় নির্ধারিত স্থান। এখানে অডিওর সাথে আলাদা শব্দ যুক্ত থাকে বলে কম্পিউটার বট থেকে এটিও অনেকবেশি নিরাপদ।

টিকমার্ক ক্যাপচা

২০০৯ সাল। গুগল কর্তৃক ক্যাপচা কিনে নেওয়ার পর নিজস্ব প্রোগ্রামারদের সহযোগিতায় তৈরি হয় এই সাদামাটা ক্যাপচা। এর নাম নো-ক্যাপচা রি-ক্যাপচা৷ এটি একটি চেকবক্স, যার পাশে লেখা থাকে ‘I’m not a robot’। এটি একদিকে যেমন সহজভাবে ব্যবহারযোগ্য, অন্যদিকে কম্পিউটার বটের কাছে এটি খুবই জটিল ও দুরূহ। কেননা, এই ক্যাপচায় টিকমার্ক দেওয়ার জন্য ব্যবহার করতে হয় কম্পিউটার কার্সর। মোবাইলফোন ব্যবহারকারীদের আঙুলের স্পর্শ।

টিকমার্ক ক্যাপচা; Image Source: Masai

কম্পিউটার বট কেন ক্যাপচা শনাক্ত করতে পারে না?

ক্যাপচার প্রকারভেদ তো জানা গেলো, তাই না? কিন্তু, এখন প্রশ্ন হলো, কম্পিউটার বট কেনই বা ক্যাপচা শনাক্ত করতে পারে না?

আসলে ক্যাপচা এমন এক পদ্ধতি যা স্বয়ংক্রিয় কোনো যন্ত্রের পক্ষে সমাধান করা সম্ভব নয়। কেননা, এগুলো সমাধানে প্রয়োজন ভিজুয়্যাল ক্ষমতা, পঠন দক্ষতা ও মানব আচরণগত ভারসাম্যতা। যা কোনো কম্পিউটার বটের ভেতর পুরোপুরি অনুপস্থিত। এছাড়াও, ক্যাপচা পূরণে বিভিন্ন সময় বিভিন্ন রকম নির্দেশনা পড়ার প্রয়োজন পড়ে। কিন্তু কম্পিউটার বট কেবল প্রোগ্রাম অনুযায়ী কার্য সমাধানে সক্ষম। নিজস্ব কেনো চিন্তা-চেতনা নেই তাদের। নেই দৃষ্টিশক্তিও। আর এখানেই একজন মানুষ ও কম্পিউটার বটের পার্থক্য।

এছাড়াও, কম্পিউটার বট কোনো কিছু সম্পর্কে ধারণা নিতে ব্যবহার করে তার অপটিক্যাল ক্যারেকটার রিকগনিশন সফটওয়্যার। এই সফটওয়্যার চিহ্নগুলোকে স্ক্যান করে নিজের ডেটাবেজে থাকা বিভিন্ন অক্ষর, অঙ্ক ও চিহ্নের সঙ্গে মেলাতে চেষ্টা করে।
এর মাধ্যমে বুঝতে চেষ্টা করে কোনটি কী অক্ষর বা অঙ্ক। কিন্তু ক্যাপচায় চিহ্নগুলো এলোমেলো, আঁকাবাঁকা ও পেঁচিয়ে লেখা থাকে বলে কম্পিউটার সফটওয়্যারের ডেটাবেজের তথ্যের সঙ্গে এসব মিলাতে পারে না। ফলে কম্পিউটার বট এসব চিহ্ন পড়তে পারে না।

আবার, কম্পিউটার বট যদি স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে এসব কার্য সমাধান করেও ফেলে তখন সামনে আসবে নতুন ক্যাপচা। ব্যবহারকারী সত্যিই মানুষ কি-না তা যাচাইয়ের জন্য নিয়ে যাওয়া হবে পরবর্তী ধাপে। এখানে পুনরায় লেখা কিংবা ছবি ক্যাপচা পূরণ করতে হতে পারে। তারপরও যদি মানুষ মনে না হয়, তখন গুগল ব্যবহারকারীর আইপি ঠিকানা চেক করে। এছাড়াও আরও নানান প্রযুক্তি ব্যবহারের মাধ্যমে গুগল নিশ্চিত হয় মানবীয় কার্যকলাপ। যদিও এসব প্রযুক্তি গুগলের একান্ত গোপনীয় বিষয়।

কম্পিউটার বটের ক্যাপচা শনাক্তকরণ; Image Source: P.G. AI

রি-ক্যাপচার আত্মপ্রকাশ

বর্তমানে প্রতি মুহূর্তে মিলিয়ন মিলিয়ন মানুষ পূরণ করছে এই ক্যাপচা। এর সমাধানও চলছে সমানতালে, আপন নিয়মে। কিন্তু কথায় আছে, আবিষ্কারের কোনো শেষ নেই। আর হয়েছেও তাই!

ক্যাপচা আবিষ্কারের কিছুকাল পর লুইসের মাথায় খেলে যায় তেমনই নতুন ভাবনা। তিনি ভাবলেন, প্রতি মুহূর্তে ব্যবহারকারীদের জন্য এসব আঁকাবাকা ক্যাপচা প্রোগ্রামিংয়ের প্রয়োজন কী! বিপরীতে, পুরোনো বই থেকে অপঠনযোগ্য-অস্পষ্ট শব্দ ব্যবহার করলে কেমন হয়? এতে করে বইসমূহও স্ক্যান করে ডিজিটাল লাইব্রেরিতে নতুন রূপে সংরক্ষণের সুযোগ হবে। হারিয়ে যাওয়ার হাত থেকে বাঁচবে প্রাচীনতম লিখনশৈলী।

আর তাই শুরু হলো পুরনো গাদা গাদা বই সংগ্রহ। অপটিক্যাল ক্যারেকটার রিকগনিশন (OCR)-এর মাধ্যমে হতে লাগলো স্ক্যানও। কিন্তু বিপত্তি বাঁধলো কিছুকিছু শব্দ নিয়ে। শব্দগুলো এতোটাই ঝাপসা ছিল যে এগুলোকে স্ক্যান করা যাচ্ছিল না। আর এই সুযোগের সদ্ব্যবহার করলেন লুইস। ঝাপসা শব্দগুলোকে ছবি আকারে ব্যবহার করতে লাগলেন ক্যাপচা কোডে। কিন্তু কিভাবে?

রি-ক্যাপচা; Image Source: Physics Org

আসলে ব্যবহারকারীকে বর্তমান রি-ক্যাপচা কোডে দু’টি শব্দ লিখতে বলা হয়, যেখানে একটি কম ঝাপসা ও অন্যটি অধিকতর ঝাপসা। ব্যবহারকারী যদি কম ঝাপসা শব্দটি সঠিকভাবে লিখার পর ঝাপসা শব্দটিও লিখতে পারেন, তখন ধরে নেওয়া হয় দ্বিতীয় শব্দটিও সঠিক লেখা হয়েছে। এবার প্রথম ব্যবহারকারীর দ্বিতীয় কোডটি দ্বিতীয় ব্যবহারকারীকে প্রথম কোড হিসেবে দেওয়া হয়। এবার সে ও যদি এটি একইভাবে লিখে তাহলে এটি প্রতিস্থাপিত হয় ডিজিটাল গ্রন্থে।

এভাবে ক্যাপচা টিম ওয়েবসাইট ব্যবহারকারীদের মাধ্যমে শুরু করে পুরনো বই বিনামূল্যে স্ক্যানের এক অন্যরকম যাত্রা। প্রতিদিন প্রায় ২০০ মিলিয়ন শব্দ যোগ হতে থাকে ক্যাপচা ভান্ডারে। মনের অজান্তেই লুইস তার আইডিয়ার মাধ্যমে সেসব মানুষদের কর্মপ্রচেষ্টাকে নতুনত্ব দিয়েছেন, যারা ভাবেনও নি তাদের লেখা বই অনলাইন লাইব্রেরিতে সংযুক্ত হবে। যা কি-না পরবর্তীতে কাজে আসবে, হাজার বছরও পরে!

গুগলের ভাবনা

২০০৯ সালে ক্যাপচা টিমের দারুণ এই কর্মযজ্ঞ দৃষ্টি কাড়লো গুগল কর্তৃপক্ষের। নিজেদের তথ্য ভান্ডার ও অনলাইন লাইব্রেরি সমৃদ্ধকরণে তারা ক্যাপচাকে বাছাই করে। কিনে নেয় চড়া মূল্যে, ডলারের বিনিময়ে। ফ্রিতে ব্যবহার করতে দেয় নিজের সার্চ ইঞ্জিন ব্যবহারকারীদের। এভাবে ২০১৯ সাল পর্যন্ত মাত্র দশ বছরের ব্যবধানে প্রায় ৪০ মিলিয়ন বই ডিজিটালে রূপান্তর করতে সক্ষম হয়েছে গুগল।

স্মার্ট গুগল; Image Source: Masai

ওয়েবসাইটের ভবিষ্যৎ নিরাপত্তা

প্রতি মুহূর্তে পরিবর্তিত হচ্ছে ওয়েবসাইটে প্রবেশের স্প্যাম এক্সেস কৌশল। গ্রহণ করা হচ্ছে নানাবিধ ভয়াবহ পরিকল্পনা। যেমন- ২০১৪ সালে গুগলের চোখে ধরা পড়া বর্ণ-সংখ্যা ও ছবি চিহ্নিতকরণ ক্যাপচা কৃত্রিম বুদ্ধিমত্তার মাধ্যমে সমাধান করা যাচ্ছিল। এর ফলে নব উদ্ভাবনের তাড়নায় আবির্ভূত হয় বর্তমান নো-ক্যাপচা, সৃষ্টি হয় টিকমার্ক ক্যাপচার। আর তাই ভবিষ্যতের সঙ্গে সামঞ্জস্য রেখে নতুন নতুন ক্যাপচা আবিষ্কারের সম্ভাবনা, এখন আর বলার অপেক্ষা রাখে না। একসময় হয়তো কৃত্রিম বুদ্ধিমত্তা বর্তমান ক্যাপচাদেরও চোখ ফাঁকি দিতে সক্ষম হবে। আর তখনই নতুন রূপে আবির্ভূত হবে নতুন প্রোগ্রাম, ইন্টারনেটে বিস্তৃত হবে ক্যাপচার অবদান।

References: