গ্রাফ থেকে ডেটা এক্সট্রাকশন বা ডেটা ডিজিটাইজেশন
- প্রয়াস জামান
- Sep 29, 2019
- 2 min read
অনেক সময় এমন হতে পারে যে আপনি কোন এক্সপেরিমেন্টাল ডেটা কালেক্ট করেছেন কোন এক্সপেরিমেন্টাল সেট আপ থেকে বা থিওরেটিক্যালি কিছু ভ্যালু ক্যালকুলেট করেছেন তখন আপনার মতই কাজ করেছেন এমন একজনের সাথে আপনার পাওয়া ডেটার একটা তুলনামূলক পর্যালোচনা করার প্রয়োজন পড়তে পারে কিংবা আপনার লেখা ম্যানুস্ক্রিপ্টে অন্যদের ডাটার সাথে তুলনা করে আপনার একটা গ্রাফ আঁকতে পারেন যেটা দিয়ে বোঝা যাবে যে আপনার ডাটা অন্যদের থিওরেটিক্যালি/এক্সপেরিমেন্টালী বের করা ভ্যালুরকতটুকু অ্যাকুরেট বা কাছাকাছি। বিশেষত যারা এক্সপেরিমেন্টাল রিসার্চের সাথে জড়িত তাদেরই বেশি লাগে তবে থিওরেটিক্যালি কিংবা সিমুলেশন নিয়ে যারা কাজ করেন তাদেরও এই কাজটা করতে হয়। যেমন নিচের গ্রাফটা দেখুন, এখানে চারটা গ্রুপ একই এক্সপেরিমেন্টের কি রকম ভ্যালু পেয়েছে বা তাদের মানগুলো কিভাবে এক গ্রুপ থেকে কতটা ভিন্ন বা সামঞ্জস্যপূর্ণ একটা গ্রাফে দেখানো হয়েছে। এরকম অন্য ম্যানুস্ক্রিপ্ট বা রিসার্চ পেপার থেকে ডাটা নিয়ে আপনারও কম্পেয়ার করে একটা গ্রাফ দেখাতে হতে পারে।
এখন কথা হলো আপনি আরেকজন গবেষকের ডেটা পাবেন কিভাবে। সবচেয়ে ভালো পদ্ধতি হলো আপনি ওই গবেষককে মেইল দিয়ে আপনার কাজকর্মের কথা জানিয়ে নির্দিষ্ট কারণ দেখিয়ে ডেটা চাইতে পারেন। এটা একটু কঠিন কারণ সবসময় জবাব না পাওয়ার সম্ভাবনা বেশি এবং গবেষকরা ডেটার মিসইউজের কথা ভেবে আপনাকে মানাও করে দিতে পারেন। আর এজন্যই আপনার কাছে সবচেয়ে সহজ অপশন হলো আপনার যে পেপার থেকে যে গ্রাফের ডেটা লাগবে সেই গ্রাফ বা ইমেজ(ছবি) থেকেই ডেটা পুন্রুদ্ধার করতে পারেন বা বের করতে পারেন। এই প্রক্রিয়ার নাম হলো ডেটা এক্সট্রাকশন (Data Extraction) বা ডেটা ডিজিটাইজেশন (Data Digitization)। ডাটা এক্সট্রাকশনের কথা আমি প্রথম জেনেছি আমার থিসিস সুপারভাইজার প্রফেসর ডক্টর মোহাম্মদ রফিকুল ইসলাম স্যার (অধ্যাপক, পদার্থবিদ্যা বিভাগ, চট্টগ্রাম বিশ্ববিদ্যালয়) থেকে। ডেটা এক্সট্রাকশন বা গ্রাফ থেকে ডেটা বের করা ম্যাটল্যাব বা অ্যাবাকাস নামের দুটো এডভান্স সফটওয়্যারের পাশাপাশি অরিজিন গেট-ডাটা অথবা গ্রাফ টু ডেটা নামের সহজ-ছোট সফটওয়্যার দিয়েও পারা যায়। তবে সবচেয়ে সহজভাবে অল্প সময়ে পারা যায় গেট-ডাটা গ্রাফ ডিজিটাইজার দিয়ে। খুবই হাল্কা এই সফটওয়্যারটি পাওয়া যাবে এখান থেকে।
সহজভাবে বললে প্রক্রিয়াটা এমন,১। গেট ডাটা ইন্সটল করে নিন। ২। আপনার যে পিডিএফ ফাইলটাতে গ্রাফটা আছে সেটা বের করে, গ্রাফটাকে পিএনজি বা জেপিইজি ফরম্যাটে সেইভ করুন। ছবি যদি সেইভ করা না যায় অর্থাৎ রেস্ট্রিকট্রেড পিডিএফ হলে স্ক্রীনশট নিয়ে মাইক্রোসফট ওয়ার্ডে পেস্ট করে ছবিটা সেভ করুন। প্রয়োজনে ক্রপ করে প্রয়োজনীয় অংশ রেখে ছবির বাকি অংশ ফেলে দিন। ৩। গেট ডাটা ওপেন করে কিছুক্ষণ আগে সেভ করা গ্রাফের ইমেজ ফাইলটা ওপেন করুন। ৪। এক্স এক্সিস, ওয়াই এক্সিসের মিনিমান ম্যাক্সিমাম ভ্যালুগুলো মাউস আর কার্সর দিয়ে সিলেক্টকরুন। ৪। গ্রাফের লাইনটায় বিভিন্ন পয়েন্টগুলোয় ক্লিক করে সিলেক্ট পয়েন্ট দিন। অথবা নিজেই র্যান্ডমলি বিভিন্ন পয়েন্টে ক্লিক করলেও হবে।
৫। সবকিছু ঠিকঠাক থাকলে পাশের একটা প্যানেলে ডাটা পয়েন্টের মানগুলো পেয়ে যাবেন। সেগুলো এক্সেল বা ম্যাটল্যাব যেখানে খুশি, কপি করে ইমপোর্ট করে নিন। এরপর আপনার প্রয়োজন মতো ব্যবহার করুন। অনলাইন পদ্ধতিও আছে। এবং এটায় অনেক বেশি সুবিধা এবং অপশনও আছে যেটা বায়োলজি বা জিওগ্রাফি নিয়ে কাজ করা গবেষকদেরও কাজ লাগে। এটার নাম WEBPLOT DIGITIZER. সফটওয়্যার ডাউনলোড করতে পারেন এখান থেকে
গুগল অথবা আপনার কম্পিউটারের ক্রোমের সাথে যুক্ত করে নিতে পারেন এইখান থেকে https://chrome.google.com/webstore/detail/webplotdigitizer/blomnnpciekdhecimpnjfcchdicopdii?hl=en
ওয়েবপ্লট ডিজিটাইজারের কার্যপ্রণালী গেট ডাটার মতোই। আমার দেয়া সাইটে গেলে ভিডিও টিউটোরিয়ালও পেয়ে যাবেন। বাংলায়ও ইউটিউবে আমার কাছে আলমগীর হোসেন ভাইয়ের করা ভিডিও টিউটোরিয়াল ভালো লেগেছে। লিংক
এতটুকুতেই শেষ করছি, আরো কিছু জানার থাকলে কমেণ্টবক্সে বলতে পারেন।
ইউটিউব (YT) থাম্বনেইল ডাউনলোড টুল - ইমেজ ডাউনলোডার