টিউটোরিয়াল: বায়োইনফরমেটিক্স প্রজেক্টে কিভাবে ভাবতে হয়

লেখাটি , বিভাগে প্রকাশিত

বায়োইনফরমেটিক্স নিয়ে অনেকেই আগ্রহী, অনেকেই বিভিন্ন ধরনের প্রজেক্ট করে পেপার পাবলিশ করতে চায়। বায়োইনফরমেটিক্স নিয়ে কাজ করার জন্য নানা ধরনের টিউটোরিয়ালও রয়েছে ইন্টারনেটে। অনেকক্ষেত্রেই এই টিউটোরিয়ালগুলো টেকনিক্যাল হয়ে যায়। টেকনিক শেখা গুরুত্বপূর্ণ। কিন্তু একই সাথে গুরুত্বপূর্ণ গবেষণার বিভিন্ন দিক নিয়ে ভাবতে শেখা, প্রশ্ন করতে শেখা। বায়োইনফরমেটিক্সের জটিল সফটওয়্যার ও প্রোগ্রাম শিখতে গিয়ে, ডেটা বিশ্লেষণ করতে গিয়ে অনেক সময় সে মৌলিক প্রশ্নগুলো নিয়ে ভাবার কাজটা হারিয়ে যায়।

যে কোন বায়োইনফরমেটিক্স প্রজেক্টে অনেক ধরণের কাজ থাকে। অনেক সময় একটা ছোট প্রশ্নের উত্তর খুঁজে পেতে হিমশিম খেতে হয়। আবার সে প্রশ্নের উত্তর পাওয়ার পর ভিন্ন প্রশ্ন এসে আমাদের অপ্রস্তুত করে দেয়। যেন রহস্যের শেষ নেই। বাস্তবে জিলাপীর প্যাঁচের মতো প্যাঁচালো প্রশ্নের উত্তর খোঁজা, ও নিত্যনতুন বিশ্লেষণ করা জটিল ও সময়সাধ্য কাজ। একটি সত্যিকার প্রজেক্টের খানিকটা স্বাদ পাওয়া এই টিউটেরিয়ালের অন্যতম লক্ষ্য।

এই টিউটোরিয়ালে ডিএনএ সিকোয়েন্সের ডেটা পাওয়ার পর সেগুলো জোড়া লাগানো (এসেম্বলি), জিন সনাক্তকরণ, প্রোটিন নির্ণয়, প্রোটিনটি কোষের কোথায় কাজ করে, জিনোম ব্রাউজার নিয়ে নাড়াচাড়া করা, ডিএনএ তে ট্রান্সক্রিপশন ফ্যাক্টর বসার স্থান বের করা, ফাইলোজেনেটিক ট্রি ইত্যাদি বিষয়ের সাথে আপনাকে পরিচিত করিয়ে দেয়া হবে।

আমি যখন পিএইচডি শুরু করি, তখন প্রফেসর ড. জুডালসনের একটি কোর্স করতে হয়েছিলো, Advances in Bioinformatics and Genomics। সেখানকার একটি এসাইনমেন্টের ভিত্তিতে আমি এই টিউটোরিয়ালটি অনুবাদ করেছি বাংলাদেশের মাইক্রোবায়োলজি, বায়োকেমিস্ট্রি, জেনেটিক ইঞ্জিনিয়ারিং, বোটনি, জুওলজি ইত্যাদি বিভাগসমূহের শিক্ষার্থীদের জন্য। আশা করি, বায়োইনফরমেটিক্সে আগ্রহীদের এই টিউটোরিয়ালটি কাজে আসবে।

সিকোয়েন্স এসেম্বলির মূল ধারণা।

ধাপ ১: সিকোয়েন্স এসেম্বলি

  •   এই প্রজেক্টে আপনাকে একটি অজানা জিনোমের প্লাজমিড লাইব্রেরি থেকে করা ডিএনএ-সিকোয়েন্সের রিড (read) দেয়া হবে। 
  •   যে ফাইলটিতে এ সিকোয়েন্সগুলো আছে তার নাম হলো plasmid_library_sequences.txt। এটি fasta ফরম্যাটের ফাইল।
  •   ফাইলটি ডাউনলোড করুন এই লিঙ্ক থেকে: https://goo.gl/G1QKA7
  •   এ সিকোয়েন্সগুলোকে থেকে ভেক্টরের অংশগুলো বাদ দেয়া হয়েছে। এছাড়া খারাপ সিকোয়েন্সগুলোও বাদ দেয়া হয়েছে। তবুও কিছু কিছু সিকোয়েন্সে ’N’ রয়ে গেছে সিকোয়েন্সিং প্রক্রিয়ার অস্পষ্ট বেস কলের (base call) জন্য।
  •   ক্লোনগুলোর নাম খেয়াল করে দেখুন: অধিকাংশেরই প্লাজমিডের ডান ও বাম অংশের রিড রয়েছে (F ও R)।

আপনি plasmid_library_sequences.txt ফাইলে থাকা রিডগুলো জোড়া লাগাতে CAP সিকোয়েন্স এসেম্বলি প্রোগ্রাম ব্যবহার করবেন। একটি সত্যিকারের জিনোম প্রজেক্টে একজন অভিজ্ঞ গবেষক যে ধরণের প্রোগ্রাম ব্যবহার করেন, CAP তেমন কিছু নয়। তবে আমাদের মেন্টরিং কর্মসূচীর প্রাথমিক পর্যায়ের জীববিজ্ঞান-পড়ুয়া একজন সাধারণ শিক্ষার্থীর জন্য এটি সহজ একটি প্রোগ্রাম। এ ফাইলে থাকা সিকোয়েন্সগুলো স্যঙারের প্রক্রিয়ায় সিকোয়েন্সিং করা হয়েছিলো।


অন্তর্জালে বেশ কয়েকটি ওয়েবসাইটে CAP পাওয়া যাবে। এদের মধ্যে কয়েকটি নিচে দেয়া হলো। আমাদের এই কর্মসূচীতে একই প্রোগ্রামের জন্য প্রায়ই একাধিক ওয়েবসাইট দেয়া হবে। আপনাকে যে কোন একটি ব্যবহার করতে হবে। বিকল্প ওয়েবসাইট দেয়ার কারণ হলো যদি কোন সার্ভার কাজ করা বন্ধ করে দেয়।

http://doua.prabi.fr/software/cap3
http://bio-webout.ifom.eu/cap/

এ সাইটগুলো অনুরূপভাবে কাজ করে। তবে এদের ফলাফল ভিন্ন হতে পারে।

প্রদত্ত ফাইল থেকে সিকোয়েন্সগুলো সার্চ-উইন্ডোতে কপি করুন। কিংবা আপলোডও করতে পারেন। তারপর সিকোয়েন্সগুলো assemble করুন। প্রাপ্ত ফলাফল বিশ্লেষণ করতে নিচের প্রশ্নগুলো মাথায় রাখুন। এই প্রশ্নগুলো দিয়েই রিপোর্ট তৈরি করতে হবে।

 

ভাবনার খোরাক

১(ক). আপনি কি এসেম্বলি থেকে একটি দীর্ঘ কন্টিগ (contig) পেয়েছেন? যদি একটি কন্টিগ না পেয়ে থাকেন, তাহলে কি কি বিষয় দিয়ে তা ব্যাখ্যা করা যায়?

১(খ). এই কন্টিগগুলো জোড়া লাগানোর কোন উপায় রয়েছে? অথবা কোন কন্টিগের পরে কোন কন্টিগ বসবে তার অনুক্রম বের করার জন্য কোন পদ্ধতি কি খুঁজে পাচ্ছেন? (ইঙ্গিত: সিকোয়েন্সের F বা R থেকে কোন সূত্র পাওয়া যায়?)

১(গ). যখন সিকোয়েন্সের মাঝে  ’N’ (অসনাক্তকৃত বেস) আসে, বা একাধিক সিকোয়েন্সের মধ্যে যখন অমিল থাকে, তখন CAP প্রোগ্রামটি কি করে?

প্রশ্নগুলো নিয়ে ভাবুন, বারবার। খাতা-কলমের মাধ্যমে ভাবুন। ভাবনা লিখে রাখুন।



যদি মনে হয় অনেক কিছুই বুঝছি না, জানি না ইত্যাদি, তাহলে আপনাকে প্রথমেই যা করতে হবে তা হলো Google Search। এছাড়া Theory of partial ignorance প্রক্রিয়া অনুসরণ করতে বলবো। Theory of partial ignorance সম্পর্কে জানা যাবে এখানে: http://wp.me/p91Qzw-b

সমমনা কয়েকজন একসাথে গ্রুপে কাজ করা শেখার জন্য খুব সহায়ক হতে পারে। পাশাপাশি এ বিষয়ে কোন জিজ্ঞাসা থাকলে ফেসবুকে বায়ো-বায়ো-১ বায়োইনফরমেটিক্স ডিসকাশন ফোরামের সাহায্য নিতে পারেন: https://www.fb.com/groups/biobio1/

gene | Definition, Structure, Expression, & Facts | Britannica
জিনের বিভিন্ন অংশ
           এই লেখাটি কেবলমাত্র বিজ্ঞান ব্লগের নিয়মিত লেখক এবং ইনসাইডার সদস্যদের জন্য। অনুগ্রহ করে লগ ইন করুন।
           

ইনসাইডার হলো বিজ্ঞান ব্লগের একটি সদস্য প্রোগ্রাম। বিজ্ঞান ব্লগে প্রতি মাসে কিছু বিশেষ প্রবন্ধ প্রকাশিত হবে। এগুলো লিখছেন আরাফাত রহমান ও সুজয় কুমার দাশ। এই লেখাগুলো কেবল মাত্র লগইন করে পড়া যাবে। আপনি যদি বিজ্ঞান ব্লগের ইনসাইডার হতে চান, তাহলে এই পেজে গিয়ে আমাদের বার্তা দিন। বার্তা পাওয়ার পর আপনার সাথে ইমেইলে যোগাযোগ করা হবে।



এতদুর পড়ে ফেলার জন্য আপনাকে অভিনন্দন। আশা করছি, এই টিউটোরিয়াল শেষে আপনারা একটি ‘ম্যাপ’ বা মানচিত্র পাবেন, যার মাধ্যমে ধারণা পাওয়া যায় যে একটি বায়োইনফরমেটিক্স প্রজেক্টে কত রকমের ভিন্ন ভিন্ন বিশ্লেষণ প্রক্রিয়ার মাধ্যমে যেতে হয়। যে কোন প্রশ্নের জন্য নিচে মন্তব্য করুন! শুভেচ্ছা!

আমি কার্ল জিমারের গেম অব জিনোমস অনুবাদ করছি। বায়োইনফরমেটিক্সে আগ্রহী হয়ে থাকলে এটা পড়তে পারেন। এছাড়া UPL থেকে আমার বই ‘জেনেটিক্স – বংশগতিবিদ্যার সহজপাঠ’ বের হয়েছে, সেটা ছোট যারা জেনেটিক্স নিয়ে জানতে চায়, তাদেরকে উপহার দিতে পারেন!

লেখাটি 2,354-বার পড়া হয়েছে।


নিজের ওয়েবসাইট তৈরি করতে চান? হোস্টিং ও ডোমেইন কেনার জন্য Hostinger ব্যবহার করুন ৭৫% পর্যন্ত ছাড়ে।

আলোচনা

Responses

  1. This is a complete guide for all. Thank u Sir.

  2. প্রবন্ধটি দারুন লেগেছে। লেখককে এমন তথ্যবহুল লেখার জন্য ধন্যবাদ জানাই।

    1. আপনাকেও ধন্যবাদ 🙂

  3. মুন এহসান Avatar
    মুন এহসান

    অনেক উপকার হলো, ধন্যবাদ ভাইয়া

    1. জানানোর জন্য ধন্যবাদ!!

  4. Musfeka Ikfat Mitu Avatar
    Musfeka Ikfat Mitu

    Thanks Vai. I’m waiting for your ‘Genetics’ book.Has it been published?

    1. আরাফাত Avatar
      আরাফাত

      It’s not! Unfortunately, there was catastrophic COVID19 events in the publishers family. Now we have started working on that again. Thanks for your interest 🙂

  5. জুবায়ের বিন লিয়াকত Avatar
    জুবায়ের বিন লিয়াকত

    অসাধারণ তথ্যবহুল লেখার জন্য ধন্যবাদ জানাই।

  6. Maksudur Rahman Nayem Avatar
    Maksudur Rahman Nayem

    That was helpful. please write a book on bioinformatics in bangla sir.

    1. আরাফাত রহমান Avatar
      আরাফাত রহমান

      আমার ইচ্ছে আছে লেখার। ধন্যবাদ মন্তব্যের জন্য।

Leave a Reply

ই-মেইল নিউজলেটার

বিজ্ঞানের বিভিন্ন খবর সম্পর্কে আপডেট পেতে চান?

আমরা প্রতি মাসে ইমেইল নিউজলেটার পাঠাবো, মাসে একবার। নিউজলেটারে সাম্প্রতিক বিজ্ঞানের বিভিন্ন খবরাখবর নিয়ে বিশ্লেষণ থাকবে। এছাড়া বিজ্ঞান ব্লগে কি কি লেখা আসলো, কি কি কর্মযজ্ঞ চলছে, সেটার খবরও থাকবে।







Loading