top of page
Search

গ্রাফ থেকে ডেটা এক্সট্রাকশন বা ডেটা ডিজিটাইজেশন

  • Writer: প্রয়াস জামান
    প্রয়াস জামান
  • Sep 29, 2019
  • 2 min read

অনেক সময় এমন হতে পারে যে আপনি কোন এক্সপেরিমেন্টাল ডেটা কালেক্ট করেছেন কোন এক্সপেরিমেন্টাল সেট আপ থেকে বা থিওরেটিক্যালি কিছু ভ্যালু ক্যালকুলেট করেছেন তখন আপনার মতই কাজ করেছেন এমন একজনের সাথে আপনার পাওয়া ডেটার একটা তুলনামূলক পর্যালোচনা করার প্রয়োজন পড়তে পারে কিংবা আপনার লেখা ম্যানুস্ক্রিপ্টে অন্যদের ডাটার সাথে তুলনা করে আপনার একটা গ্রাফ আঁকতে পারেন যেটা দিয়ে বোঝা যাবে যে আপনার ডাটা অন্যদের থিওরেটিক্যালি/এক্সপেরিমেন্টালী বের করা ভ্যালুরকতটুকু অ্যাকুরেট বা কাছাকাছি। বিশেষত যারা এক্সপেরিমেন্টাল রিসার্চের সাথে জড়িত তাদেরই বেশি লাগে তবে থিওরেটিক্যালি কিংবা সিমুলেশন নিয়ে যারা কাজ করেন তাদেরও এই কাজটা করতে হয়। যেমন নিচের গ্রাফটা দেখুন, এখানে চারটা গ্রুপ একই এক্সপেরিমেন্টের কি রকম ভ্যালু পেয়েছে বা তাদের মানগুলো কিভাবে এক গ্রুপ থেকে কতটা ভিন্ন বা সামঞ্জস্যপূর্ণ একটা গ্রাফে দেখানো হয়েছে। এরকম অন্য ম্যানুস্ক্রিপ্ট বা রিসার্চ পেপার থেকে ডাটা নিয়ে আপনারও কম্পেয়ার করে একটা গ্রাফ দেখাতে হতে পারে।

Example of Data comparison

এখন কথা হলো আপনি আরেকজন গবেষকের ডেটা পাবেন কিভাবে। সবচেয়ে ভালো পদ্ধতি হলো আপনি ওই গবেষককে মেইল দিয়ে আপনার কাজকর্মের কথা জানিয়ে নির্দিষ্ট কারণ দেখিয়ে ডেটা চাইতে পারেন। এটা একটু কঠিন কারণ সবসময় জবাব না পাওয়ার সম্ভাবনা বেশি এবং গবেষকরা ডেটার মিসইউজের কথা ভেবে আপনাকে মানাও করে দিতে পারেন। আর এজন্যই আপনার কাছে সবচেয়ে সহজ অপশন হলো আপনার যে পেপার থেকে যে গ্রাফের ডেটা লাগবে সেই গ্রাফ বা ইমেজ(ছবি) থেকেই ডেটা পুন্রুদ্ধার করতে পারেন বা বের করতে পারেন। এই প্রক্রিয়ার নাম হলো ডেটা এক্সট্রাকশন (Data Extraction) বা ডেটা ডিজিটাইজেশন (Data Digitization)। ডাটা এক্সট্রাকশনের কথা আমি প্রথম জেনেছি আমার থিসিস সুপারভাইজার প্রফেসর ডক্টর মোহাম্মদ রফিকুল ইসলাম স্যার (অধ্যাপক, পদার্থবিদ্যা বিভাগ, চট্টগ্রাম বিশ্ববিদ্যালয়) থেকে। ডেটা এক্সট্রাকশন বা গ্রাফ থেকে ডেটা বের করা ম্যাটল্যাব বা অ্যাবাকাস নামের দুটো এডভান্স সফটওয়্যারের পাশাপাশি অরিজিন গেট-ডাটা অথবা গ্রাফ টু ডেটা নামের সহজ-ছোট সফটওয়্যার দিয়েও পারা যায়। তবে সবচেয়ে সহজভাবে অল্প সময়ে পারা যায় গেট-ডাটা গ্রাফ ডিজিটাইজার দিয়ে। খুবই হাল্কা এই সফটওয়্যারটি পাওয়া যাবে এখান থেকে।



সহজভাবে বললে প্রক্রিয়াটা এমন,১। গেট ডাটা ইন্সটল করে নিন। ২। আপনার যে পিডিএফ ফাইলটাতে গ্রাফটা আছে সেটা বের করে, গ্রাফটাকে পিএনজি বা জেপিইজি ফরম্যাটে সেইভ করুন। ছবি যদি সেইভ করা না যায় অর্থাৎ রেস্ট্রিকট্রেড পিডিএফ হলে স্ক্রীনশট নিয়ে মাইক্রোসফট ওয়ার্ডে পেস্ট করে ছবিটা সেভ করুন। প্রয়োজনে ক্রপ করে প্রয়োজনীয় অংশ রেখে ছবির বাকি অংশ ফেলে দিন। ৩। গেট ডাটা ওপেন করে কিছুক্ষণ আগে সেভ করা গ্রাফের ইমেজ ফাইলটা ওপেন করুন। ৪। এক্স এক্সিস, ওয়াই এক্সিসের মিনিমান ম্যাক্সিমাম ভ্যালুগুলো মাউস আর কার্সর দিয়ে সিলেক্টকরুন। ৪। গ্রাফের লাইনটায় বিভিন্ন পয়েন্টগুলোয় ক্লিক করে সিলেক্ট পয়েন্ট দিন। অথবা নিজেই র‍্যান্ডমলি বিভিন্ন পয়েন্টে ক্লিক করলেও হবে।

৫। সবকিছু ঠিকঠাক থাকলে পাশের একটা প্যানেলে ডাটা পয়েন্টের মানগুলো পেয়ে যাবেন। সেগুলো এক্সেল বা ম্যাটল্যাব যেখানে খুশি, কপি করে ইমপোর্ট করে নিন। এরপর আপনার প্রয়োজন মতো ব্যবহার করুন। অনলাইন পদ্ধতিও আছে। এবং এটায় অনেক বেশি সুবিধা এবং অপশনও আছে যেটা বায়োলজি বা জিওগ্রাফি নিয়ে কাজ করা গবেষকদেরও কাজ লাগে। এটার নাম WEBPLOT DIGITIZER. সফটওয়্যার ডাউনলোড করতে পারেন এখান থেকে


গুগল অথবা আপনার কম্পিউটারের ক্রোমের সাথে যুক্ত করে নিতে পারেন এইখান থেকে https://chrome.google.com/webstore/detail/webplotdigitizer/blomnnpciekdhecimpnjfcchdicopdii?hl=en

ওয়েবপ্লট ডিজিটাইজারের কার্যপ্রণালী গেট ডাটার মতোই। আমার দেয়া সাইটে গেলে ভিডিও টিউটোরিয়ালও পেয়ে যাবেন। বাংলায়ও ইউটিউবে আমার কাছে আলমগীর হোসেন ভাইয়ের করা ভিডিও টিউটোরিয়াল ভালো লেগেছে। লিংক




এতটুকুতেই শেষ করছি, আরো কিছু জানার থাকলে কমেণ্টবক্সে বলতে পারেন।

 
 
 

1 Comment


bottom of page