বায়োইনফরমেটিক্স নিয়ে অনেকেই আগ্রহী, অনেকেই বিভিন্ন ধরনের প্রজেক্ট করে পেপার পাবলিশ করতে চায়। বায়োইনফরমেটিক্স নিয়ে কাজ করার জন্য নানা ধরনের টিউটোরিয়ালও রয়েছে ইন্টারনেটে। অনেকক্ষেত্রেই এই টিউটোরিয়ালগুলো টেকনিক্যাল হয়ে যায়। টেকনিক শেখা গুরুত্বপূর্ণ। কিন্তু একই সাথে গুরুত্বপূর্ণ গবেষণার বিভিন্ন দিক নিয়ে ভাবতে শেখা, প্রশ্ন করতে শেখা। বায়োইনফরমেটিক্সের জটিল সফটওয়্যার ও প্রোগ্রাম শিখতে গিয়ে, ডেটা বিশ্লেষণ করতে গিয়ে অনেক সময় সে মৌলিক প্রশ্নগুলো নিয়ে ভাবার কাজটা হারিয়ে যায়।
যে কোন বায়োইনফরমেটিক্স প্রজেক্টে অনেক ধরণের কাজ থাকে। অনেক সময় একটা ছোট প্রশ্নের উত্তর খুঁজে পেতে হিমশিম খেতে হয়। আবার সে প্রশ্নের উত্তর পাওয়ার পর ভিন্ন প্রশ্ন এসে আমাদের অপ্রস্তুত করে দেয়। যেন রহস্যের শেষ নেই। বাস্তবে জিলাপীর প্যাঁচের মতো প্যাঁচালো প্রশ্নের উত্তর খোঁজা, ও নিত্যনতুন বিশ্লেষণ করা জটিল ও সময়সাধ্য কাজ। একটি সত্যিকার প্রজেক্টের খানিকটা স্বাদ পাওয়া এই টিউটেরিয়ালের অন্যতম লক্ষ্য।
এই টিউটোরিয়ালে ডিএনএ সিকোয়েন্সের ডেটা পাওয়ার পর সেগুলো জোড়া লাগানো (এসেম্বলি), জিন সনাক্তকরণ, প্রোটিন নির্ণয়, প্রোটিনটি কোষের কোথায় কাজ করে, জিনোম ব্রাউজার নিয়ে নাড়াচাড়া করা, ডিএনএ তে ট্রান্সক্রিপশন ফ্যাক্টর বসার স্থান বের করা, ফাইলোজেনেটিক ট্রি ইত্যাদি বিষয়ের সাথে আপনাকে পরিচিত করিয়ে দেয়া হবে।
আমি যখন পিএইচডি শুরু করি, তখন প্রফেসর ড. জুডালসনের একটি কোর্স করতে হয়েছিলো, Advances in Bioinformatics and Genomics। সেখানকার একটি এসাইনমেন্টের ভিত্তিতে আমি এই টিউটোরিয়ালটি অনুবাদ করেছি বাংলাদেশের মাইক্রোবায়োলজি, বায়োকেমিস্ট্রি, জেনেটিক ইঞ্জিনিয়ারিং, বোটনি, জুওলজি ইত্যাদি বিভাগসমূহের শিক্ষার্থীদের জন্য। আশা করি, বায়োইনফরমেটিক্সে আগ্রহীদের এই টিউটোরিয়ালটি কাজে আসবে।

ধাপ ১: সিকোয়েন্স এসেম্বলি
- এই প্রজেক্টে আপনাকে একটি অজানা জিনোমের প্লাজমিড লাইব্রেরি থেকে করা ডিএনএ-সিকোয়েন্সের রিড (read) দেয়া হবে।
- যে ফাইলটিতে এ সিকোয়েন্সগুলো আছে তার নাম হলো plasmid_library_sequences.txt। এটি fasta ফরম্যাটের ফাইল।
- ফাইলটি ডাউনলোড করুন এই লিঙ্ক থেকে: https://goo.gl/G1QKA7
- এ সিকোয়েন্সগুলোকে থেকে ভেক্টরের অংশগুলো বাদ দেয়া হয়েছে। এছাড়া খারাপ সিকোয়েন্সগুলোও বাদ দেয়া হয়েছে। তবুও কিছু কিছু সিকোয়েন্সে ’N’ রয়ে গেছে সিকোয়েন্সিং প্রক্রিয়ার অস্পষ্ট বেস কলের (base call) জন্য।
- ক্লোনগুলোর নাম খেয়াল করে দেখুন: অধিকাংশেরই প্লাজমিডের ডান ও বাম অংশের রিড রয়েছে (F ও R)।
আপনি plasmid_library_sequences.txt ফাইলে থাকা রিডগুলো জোড়া লাগাতে CAP সিকোয়েন্স এসেম্বলি প্রোগ্রাম ব্যবহার করবেন। একটি সত্যিকারের জিনোম প্রজেক্টে একজন অভিজ্ঞ গবেষক যে ধরণের প্রোগ্রাম ব্যবহার করেন, CAP তেমন কিছু নয়। তবে আমাদের মেন্টরিং কর্মসূচীর প্রাথমিক পর্যায়ের জীববিজ্ঞান-পড়ুয়া একজন সাধারণ শিক্ষার্থীর জন্য এটি সহজ একটি প্রোগ্রাম। এ ফাইলে থাকা সিকোয়েন্সগুলো স্যঙারের প্রক্রিয়ায় সিকোয়েন্সিং করা হয়েছিলো।
অন্তর্জালে বেশ কয়েকটি ওয়েবসাইটে CAP পাওয়া যাবে। এদের মধ্যে কয়েকটি নিচে দেয়া হলো। আমাদের এই কর্মসূচীতে একই প্রোগ্রামের জন্য প্রায়ই একাধিক ওয়েবসাইট দেয়া হবে। আপনাকে যে কোন একটি ব্যবহার করতে হবে। বিকল্প ওয়েবসাইট দেয়ার কারণ হলো যদি কোন সার্ভার কাজ করা বন্ধ করে দেয়।
http://doua.prabi.fr/software/cap3
http://bio-webout.ifom.eu/cap/
এ সাইটগুলো অনুরূপভাবে কাজ করে। তবে এদের ফলাফল ভিন্ন হতে পারে।
প্রদত্ত ফাইল থেকে সিকোয়েন্সগুলো সার্চ-উইন্ডোতে কপি করুন। কিংবা আপলোডও করতে পারেন। তারপর সিকোয়েন্সগুলো assemble করুন। প্রাপ্ত ফলাফল বিশ্লেষণ করতে নিচের প্রশ্নগুলো মাথায় রাখুন। এই প্রশ্নগুলো দিয়েই রিপোর্ট তৈরি করতে হবে।
ভাবনার খোরাক
১(ক). আপনি কি এসেম্বলি থেকে একটি দীর্ঘ কন্টিগ (contig) পেয়েছেন? যদি একটি কন্টিগ না পেয়ে থাকেন, তাহলে কি কি বিষয় দিয়ে তা ব্যাখ্যা করা যায়?
১(খ). এই কন্টিগগুলো জোড়া লাগানোর কোন উপায় রয়েছে? অথবা কোন কন্টিগের পরে কোন কন্টিগ বসবে তার অনুক্রম বের করার জন্য কোন পদ্ধতি কি খুঁজে পাচ্ছেন? (ইঙ্গিত: সিকোয়েন্সের F বা R থেকে কোন সূত্র পাওয়া যায়?)
১(গ). যখন সিকোয়েন্সের মাঝে ’N’ (অসনাক্তকৃত বেস) আসে, বা একাধিক সিকোয়েন্সের মধ্যে যখন অমিল থাকে, তখন CAP প্রোগ্রামটি কি করে?
প্রশ্নগুলো নিয়ে ভাবুন, বারবার। খাতা-কলমের মাধ্যমে ভাবুন। ভাবনা লিখে রাখুন।
যদি মনে হয় অনেক কিছুই বুঝছি না, জানি না ইত্যাদি, তাহলে আপনাকে প্রথমেই যা করতে হবে তা হলো Google Search। এছাড়া Theory of partial ignorance প্রক্রিয়া অনুসরণ করতে বলবো। Theory of partial ignorance সম্পর্কে জানা যাবে এখানে: http://wp.me/p91Qzw-b
সমমনা কয়েকজন একসাথে গ্রুপে কাজ করা শেখার জন্য খুব সহায়ক হতে পারে। পাশাপাশি এ বিষয়ে কোন জিজ্ঞাসা থাকলে ফেসবুকে বায়ো-বায়ো-১ বায়োইনফরমেটিক্স ডিসকাশন ফোরামের সাহায্য নিতে পারেন: https://www.fb.com/groups/biobio1/

ইনসাইডার হলো বিজ্ঞান ব্লগের একটি সদস্য প্রোগ্রাম। বিজ্ঞান ব্লগে প্রতি মাসে কিছু বিশেষ প্রবন্ধ প্রকাশিত হবে। এগুলো লিখছেন আরাফাত রহমান ও সুজয় কুমার দাশ। এই লেখাগুলো কেবল মাত্র লগইন করে পড়া যাবে। আপনি যদি বিজ্ঞান ব্লগের ইনসাইডার হতে চান, তাহলে এই পেজে গিয়ে আমাদের বার্তা দিন। বার্তা পাওয়ার পর আপনার সাথে ইমেইলে যোগাযোগ করা হবে।
এতদুর পড়ে ফেলার জন্য আপনাকে অভিনন্দন। আশা করছি, এই টিউটোরিয়াল শেষে আপনারা একটি ‘ম্যাপ’ বা মানচিত্র পাবেন, যার মাধ্যমে ধারণা পাওয়া যায় যে একটি বায়োইনফরমেটিক্স প্রজেক্টে কত রকমের ভিন্ন ভিন্ন বিশ্লেষণ প্রক্রিয়ার মাধ্যমে যেতে হয়। যে কোন প্রশ্নের জন্য নিচে মন্তব্য করুন! শুভেচ্ছা!
আমি কার্ল জিমারের গেম অব জিনোমস অনুবাদ করছি। বায়োইনফরমেটিক্সে আগ্রহী হয়ে থাকলে এটা পড়তে পারেন। এছাড়া UPL থেকে আমার বই ‘জেনেটিক্স – বংশগতিবিদ্যার সহজপাঠ’ বের হয়েছে, সেটা ছোট যারা জেনেটিক্স নিয়ে জানতে চায়, তাদেরকে উপহার দিতে পারেন!
Leave a Reply