বিষয়বস্তু
একটি পিডিএফ ফাইলের স্প্রেডশীট থেকে মাইক্রোসফ্ট এক্সেল শীটে ডেটা স্থানান্তর করার কাজটি সর্বদা "মজাদার"। বিশেষ করে যদি আপনার কাছে ফাইনরিডার বা এরকম কিছুর মতো ব্যয়বহুল স্বীকৃতি সফ্টওয়্যার না থাকে। সরাসরি অনুলিপি সাধারণত ভাল কিছু বাড়ে না, কারণ. শীটে কপি করা ডেটা পেস্ট করার পরে, তারা সম্ভবত একটি কলামে "একসাথে লেগে থাকবে"। তাই তাদের তখন একটি টুল ব্যবহার করে কষ্ট করে আলাদা করতে হবে কলাম দ্বারা পাঠ্য ট্যাব থেকে উপাত্ত (ডেটা — টেক্সট টু কলাম).
এবং অবশ্যই, অনুলিপি করা কেবলমাত্র সেই পিডিএফ ফাইলগুলির জন্যই সম্ভব যেখানে একটি পাঠ্য স্তর রয়েছে, অর্থাত্ কাগজ থেকে পিডিএফে স্ক্যান করা একটি নথির সাথে, এটি নীতিগতভাবে কাজ করবে না।
কিন্তু এটা এত দুঃখের নয়, সত্যিই 🙂
আপনার যদি অফিস 2013 বা 2016 থাকে, তবে কয়েক মিনিটের মধ্যে, অতিরিক্ত প্রোগ্রাম ছাড়াই, পিডিএফ থেকে মাইক্রোসফ্ট এক্সেলে ডেটা স্থানান্তর করা বেশ সম্ভব। এবং Word এবং Power Query এতে আমাদের সাহায্য করবে।
উদাহরণস্বরূপ, ইউরোপের জন্য অর্থনৈতিক কমিশনের ওয়েবসাইট থেকে একগুচ্ছ পাঠ্য, সূত্র এবং টেবিলের সাথে এই পিডিএফ রিপোর্টটি নেওয়া যাক:
… এবং এক্সেলে এটি বের করার চেষ্টা করুন, প্রথম টেবিলটি বলুন:
চলো যাই!
ধাপ 1. Word এ PDF খুলুন
কিছু কারণে, খুব কম লোকই জানে, কিন্তু 2013 সাল থেকে মাইক্রোসফ্ট ওয়ার্ড পিডিএফ ফাইলগুলি খুলতে এবং চিনতে শিখেছে (এমনকি স্ক্যান করা, অর্থাৎ কোনও পাঠ্য স্তর ছাড়াই!) এটি একটি সম্পূর্ণ আদর্শ উপায়ে করা হয়: ওয়ার্ড খুলুন, ক্লিক করুন খোলা ফাইল (খোলা ফাইল) এবং উইন্ডোর নীচের ডানদিকে কোণায় ড্রপ-ডাউন তালিকায় পিডিএফ ফর্ম্যাটটি নির্দিষ্ট করুন।
তারপর আমাদের প্রয়োজনীয় পিডিএফ ফাইলটি নির্বাচন করুন এবং ক্লিক করুন খোলা (উন্মুক্ত). শব্দ আমাদের বলে যে এটি পাঠ্যের জন্য এই নথিতে OCR চালাতে চলেছে:
আমরা সম্মতি জানাই এবং কয়েক সেকেন্ডের মধ্যে আমরা ইতিমধ্যেই Word এ সম্পাদনা করার জন্য আমাদের PDF খোলা দেখতে পাব:
অবশ্যই, নকশা, শৈলী, ফন্ট, শিরোনাম এবং পাদচরণ ইত্যাদি আংশিকভাবে নথি থেকে উড়ে যাবে, তবে এটি আমাদের জন্য গুরুত্বপূর্ণ নয় - আমাদের কেবল টেবিল থেকে ডেটা দরকার। নীতিগতভাবে, এই পর্যায়ে, এটি ইতিমধ্যেই স্বীকৃত নথি থেকে ওয়ার্ডে টেবিলটি অনুলিপি করতে এবং কেবল এটিকে এক্সেলে পেস্ট করতে প্রলুব্ধ করে। কখনও কখনও এটি কাজ করে, তবে প্রায়শই এটি সমস্ত ধরণের ডেটা বিকৃতির দিকে নিয়ে যায় - উদাহরণস্বরূপ, সংখ্যাগুলি তারিখে পরিণত হতে পারে বা পাঠ্য থেকে যেতে পারে, যেমন আমাদের ক্ষেত্রে, কারণ। পিডিএফ অ-বিভাজক ব্যবহার করে:
সুতরাং আসুন কোণগুলি কাটা না, তবে সবকিছুকে একটু বেশি জটিল করে তুলুন, তবে ঠিক।
ধাপ 2: একটি ওয়েব পেজ হিসাবে নথি সংরক্ষণ করুন
তারপরে প্রাপ্ত ডেটা এক্সেলে (পাওয়ার কোয়েরির মাধ্যমে) লোড করার জন্য, Word-এ আমাদের নথিটিকে ওয়েব পৃষ্ঠা বিন্যাসে সংরক্ষণ করতে হবে – এই বিন্যাসটি এই ক্ষেত্রে, Word এবং Excel এর মধ্যে এক ধরনের সাধারণ হরক।
এটি করতে, মেনুতে যান ফাইল - হিসাবে সংরক্ষণ করুন (ফাইল — হিসাবে সংরক্ষণ করুন) বা কী টিপুন F12 কীবোর্ডে এবং যে উইন্ডোটি খোলে সেখানে ফাইলের ধরনটি নির্বাচন করুন একটি ফাইলে ওয়েব পেজ (ওয়েবপৃষ্ঠা - একক ফাইল):
সংরক্ষণ করার পরে, আপনার mhtml এক্সটেনশন সহ একটি ফাইল পাওয়া উচিত (যদি আপনি এক্সপ্লোরারে ফাইল এক্সটেনশনগুলি দেখতে পান)।
পর্যায় 3. পাওয়ার কোয়েরির মাধ্যমে এক্সেলে ফাইল আপলোড করা
আপনি সরাসরি এক্সেলে তৈরি এমএইচটিএমএল ফাইলটি খুলতে পারেন, তবে তারপরে আমরা প্রথমত, পিডিএফের সমস্ত বিষয়বস্তু একসাথে পাঠ্য এবং একগুচ্ছ অপ্রয়োজনীয় টেবিলের সাথে পাব এবং দ্বিতীয়ত, ভুলের কারণে আমরা আবার ডেটা হারাবো। বিভাজক তাই, আমরা পাওয়ার কোয়েরি অ্যাড-ইন-এর মাধ্যমে এক্সেলে আমদানি করব। এটি একটি সম্পূর্ণ বিনামূল্যের অ্যাড-অন যার সাহায্যে আপনি প্রায় যেকোনো উত্স (ফাইল, ফোল্ডার, ডাটাবেস, ইআরপি সিস্টেম) থেকে এক্সেলে ডেটা আপলোড করতে পারেন এবং তারপরে প্রাপ্ত ডেটাকে প্রতিটি সম্ভাব্য উপায়ে রূপান্তরিত করতে পারেন, এটি পছন্দসই আকার দেয়।
আপনার যদি এক্সেল 2010-2013 থাকে, তাহলে আপনি অফিসিয়াল মাইক্রোসফ্ট ওয়েবসাইট থেকে পাওয়ার কোয়েরি ডাউনলোড করতে পারেন - ইনস্টলেশনের পরে আপনি একটি ট্যাব দেখতে পাবেন পাওয়ার কোয়েরি. যদি আপনার কাছে এক্সেল 2016 বা নতুন থাকে, তাহলে আপনাকে কিছু ডাউনলোড করতে হবে না - সমস্ত কার্যকারিতা ইতিমধ্যেই ডিফল্টরূপে এক্সেলে তৈরি করা আছে এবং ট্যাবে অবস্থিত। উপাত্ত (তারিখ) গ্রুপের মধ্যে ডাউনলোড করুন এবং রূপান্তর করুন (পান এবং রূপান্তর).
তাই আমরা হয় ট্যাব যান উপাত্ত, অথবা ট্যাবে পাওয়ার কোয়েরি এবং একটি দল নির্বাচন করুন তথ্য পেতে or ক্যোয়ারী তৈরি করুন - ফাইল থেকে - XML থেকে. শুধুমাত্র XML ফাইলগুলিকে দৃশ্যমান করার জন্য, উইন্ডোর নীচের ডানদিকে কোণায় ড্রপ-ডাউন তালিকার ফিল্টারগুলি পরিবর্তন করুন সব নথিগুলো (সব নথিগুলো) এবং আমাদের MHTML ফাইল নির্দিষ্ট করুন:
দয়া করে মনে রাখবেন যে আমদানি সফলভাবে সম্পূর্ণ হবে না, কারণ. পাওয়ার কোয়েরি আমাদের কাছ থেকে এক্সএমএল আশা করে, কিন্তু আমাদের আসলে একটি এইচটিএমএল ফর্ম্যাট আছে। অতএব, পরবর্তী উইন্ডোতে যেটি প্রদর্শিত হবে, আপনাকে পাওয়ার কোয়েরির অবোধগম্য ফাইলটিতে ডান-ক্লিক করতে হবে এবং এর বিন্যাসটি নির্দিষ্ট করতে হবে:
এর পরে, ফাইলটি সঠিকভাবে স্বীকৃত হবে এবং আমরা এতে থাকা সমস্ত টেবিলের একটি তালিকা দেখতে পাব:
আপনি ডেটা কলামের ঘরের সাদা পটভূমিতে (টেবিল শব্দে নয়!) বাম মাউস বোতামে ক্লিক করে টেবিলের বিষয়বস্তু দেখতে পারেন।
পছন্দসই টেবিলটি সংজ্ঞায়িত হলে, সবুজ শব্দে ক্লিক করুন টেবিল - এবং আপনি এটির বিষয়বস্তুর মধ্যে "পড়বেন":
এটির বিষয়বস্তু "আঁচড়ান" করার জন্য কয়েকটি সহজ পদক্ষেপ করা বাকি আছে, যথা:
- অপ্রয়োজনীয় কলাম মুছুন (কলাম হেডারে ডান ক্লিক করুন - অপসারণ)
- কমা দিয়ে বিন্দু প্রতিস্থাপন করুন (কলাম নির্বাচন করুন, ডান-ক্লিক করুন - মান প্রতিস্থাপন)
- হেডারে সমান চিহ্নগুলি সরান (কলাম নির্বাচন করুন, ডান-ক্লিক করুন - মান প্রতিস্থাপন)
- উপরের লাইনটি সরান (হোম - লাইন মুছুন - শীর্ষ লাইন মুছুন)
- ফাঁকা লাইন সরান (হোম - লাইনগুলি মুছুন - খালি লাইনগুলি মুছুন)
- টেবিল হেডারে প্রথম সারি বাড়ান (হোম - শিরোনাম হিসাবে প্রথম লাইন ব্যবহার করুন)
- ফিল্টার ব্যবহার করে অপ্রয়োজনীয় ডেটা ফিল্টার করুন
যখন টেবিলটি তার স্বাভাবিক আকারে আনা হয়, তখন এটি কমান্ডের সাহায্যে শীটে আনলোড করা যেতে পারে বন্ধ করুন এবং ডাউনলোড করুন (বন্ধ এবং লোড) on প্রধান ট্যাব এবং আমরা এমন সৌন্দর্য পাব যার সাথে আমরা ইতিমধ্যে কাজ করতে পারি:
- পাওয়ার কোয়েরি দিয়ে একটি কলামকে টেবিলে রূপান্তর করা
- কলামে স্টিকি টেক্সট বিভক্ত করা