পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

একটি পিডিএফ ফাইলের স্প্রেডশীট থেকে মাইক্রোসফ্ট এক্সেল শীটে ডেটা স্থানান্তর করার কাজটি সর্বদা "মজাদার"। বিশেষ করে যদি আপনার কাছে ফাইনরিডার বা এরকম কিছুর মতো ব্যয়বহুল স্বীকৃতি সফ্টওয়্যার না থাকে। সরাসরি অনুলিপি সাধারণত ভাল কিছু বাড়ে না, কারণ. শীটে কপি করা ডেটা পেস্ট করার পরে, তারা সম্ভবত একটি কলামে "একসাথে লেগে থাকবে"। তাই তাদের তখন একটি টুল ব্যবহার করে কষ্ট করে আলাদা করতে হবে কলাম দ্বারা পাঠ্য ট্যাব থেকে উপাত্ত (ডেটা — টেক্সট টু কলাম).

এবং অবশ্যই, অনুলিপি করা কেবলমাত্র সেই পিডিএফ ফাইলগুলির জন্যই সম্ভব যেখানে একটি পাঠ্য স্তর রয়েছে, অর্থাত্ কাগজ থেকে পিডিএফে স্ক্যান করা একটি নথির সাথে, এটি নীতিগতভাবে কাজ করবে না।

কিন্তু এটা এত দুঃখের নয়, সত্যিই 🙂

আপনার যদি অফিস 2013 বা 2016 থাকে, তবে কয়েক মিনিটের মধ্যে, অতিরিক্ত প্রোগ্রাম ছাড়াই, পিডিএফ থেকে মাইক্রোসফ্ট এক্সেলে ডেটা স্থানান্তর করা বেশ সম্ভব। এবং Word এবং Power Query এতে আমাদের সাহায্য করবে।

উদাহরণস্বরূপ, ইউরোপের জন্য অর্থনৈতিক কমিশনের ওয়েবসাইট থেকে একগুচ্ছ পাঠ্য, সূত্র এবং টেবিলের সাথে এই পিডিএফ রিপোর্টটি নেওয়া যাক:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

… এবং এক্সেলে এটি বের করার চেষ্টা করুন, প্রথম টেবিলটি বলুন:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

চলো যাই!

ধাপ 1. Word এ PDF খুলুন

কিছু কারণে, খুব কম লোকই জানে, কিন্তু 2013 সাল থেকে মাইক্রোসফ্ট ওয়ার্ড পিডিএফ ফাইলগুলি খুলতে এবং চিনতে শিখেছে (এমনকি স্ক্যান করা, অর্থাৎ কোনও পাঠ্য স্তর ছাড়াই!) এটি একটি সম্পূর্ণ আদর্শ উপায়ে করা হয়: ওয়ার্ড খুলুন, ক্লিক করুন খোলা ফাইল (খোলা ফাইল) এবং উইন্ডোর নীচের ডানদিকে কোণায় ড্রপ-ডাউন তালিকায় পিডিএফ ফর্ম্যাটটি নির্দিষ্ট করুন।

তারপর আমাদের প্রয়োজনীয় পিডিএফ ফাইলটি নির্বাচন করুন এবং ক্লিক করুন খোলা (উন্মুক্ত). শব্দ আমাদের বলে যে এটি পাঠ্যের জন্য এই নথিতে OCR চালাতে চলেছে:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

আমরা সম্মতি জানাই এবং কয়েক সেকেন্ডের মধ্যে আমরা ইতিমধ্যেই Word এ সম্পাদনা করার জন্য আমাদের PDF খোলা দেখতে পাব:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

অবশ্যই, নকশা, শৈলী, ফন্ট, শিরোনাম এবং পাদচরণ ইত্যাদি আংশিকভাবে নথি থেকে উড়ে যাবে, তবে এটি আমাদের জন্য গুরুত্বপূর্ণ নয় - আমাদের কেবল টেবিল থেকে ডেটা দরকার। নীতিগতভাবে, এই পর্যায়ে, এটি ইতিমধ্যেই স্বীকৃত নথি থেকে ওয়ার্ডে টেবিলটি অনুলিপি করতে এবং কেবল এটিকে এক্সেলে পেস্ট করতে প্রলুব্ধ করে। কখনও কখনও এটি কাজ করে, তবে প্রায়শই এটি সমস্ত ধরণের ডেটা বিকৃতির দিকে নিয়ে যায় - উদাহরণস্বরূপ, সংখ্যাগুলি তারিখে পরিণত হতে পারে বা পাঠ্য থেকে যেতে পারে, যেমন আমাদের ক্ষেত্রে, কারণ। পিডিএফ অ-বিভাজক ব্যবহার করে:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

সুতরাং আসুন কোণগুলি কাটা না, তবে সবকিছুকে একটু বেশি জটিল করে তুলুন, তবে ঠিক।

ধাপ 2: একটি ওয়েব পেজ হিসাবে নথি সংরক্ষণ করুন

তারপরে প্রাপ্ত ডেটা এক্সেলে (পাওয়ার কোয়েরির মাধ্যমে) লোড করার জন্য, Word-এ আমাদের নথিটিকে ওয়েব পৃষ্ঠা বিন্যাসে সংরক্ষণ করতে হবে – এই বিন্যাসটি এই ক্ষেত্রে, Word এবং Excel এর মধ্যে এক ধরনের সাধারণ হরক।

এটি করতে, মেনুতে যান ফাইল - হিসাবে সংরক্ষণ করুন (ফাইল — হিসাবে সংরক্ষণ করুন) বা কী টিপুন F12 কীবোর্ডে এবং যে উইন্ডোটি খোলে সেখানে ফাইলের ধরনটি নির্বাচন করুন একটি ফাইলে ওয়েব পেজ (ওয়েবপৃষ্ঠা - একক ফাইল):

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

সংরক্ষণ করার পরে, আপনার mhtml এক্সটেনশন সহ একটি ফাইল পাওয়া উচিত (যদি আপনি এক্সপ্লোরারে ফাইল এক্সটেনশনগুলি দেখতে পান)।

পর্যায় 3. পাওয়ার কোয়েরির মাধ্যমে এক্সেলে ফাইল আপলোড করা

আপনি সরাসরি এক্সেলে তৈরি এমএইচটিএমএল ফাইলটি খুলতে পারেন, তবে তারপরে আমরা প্রথমত, পিডিএফের সমস্ত বিষয়বস্তু একসাথে পাঠ্য এবং একগুচ্ছ অপ্রয়োজনীয় টেবিলের সাথে পাব এবং দ্বিতীয়ত, ভুলের কারণে আমরা আবার ডেটা হারাবো। বিভাজক তাই, আমরা পাওয়ার কোয়েরি অ্যাড-ইন-এর মাধ্যমে এক্সেলে আমদানি করব। এটি একটি সম্পূর্ণ বিনামূল্যের অ্যাড-অন যার সাহায্যে আপনি প্রায় যেকোনো উত্স (ফাইল, ফোল্ডার, ডাটাবেস, ইআরপি সিস্টেম) থেকে এক্সেলে ডেটা আপলোড করতে পারেন এবং তারপরে প্রাপ্ত ডেটাকে প্রতিটি সম্ভাব্য উপায়ে রূপান্তরিত করতে পারেন, এটি পছন্দসই আকার দেয়।

আপনার যদি এক্সেল 2010-2013 থাকে, তাহলে আপনি অফিসিয়াল মাইক্রোসফ্ট ওয়েবসাইট থেকে পাওয়ার কোয়েরি ডাউনলোড করতে পারেন - ইনস্টলেশনের পরে আপনি একটি ট্যাব দেখতে পাবেন পাওয়ার কোয়েরি. যদি আপনার কাছে এক্সেল 2016 বা নতুন থাকে, তাহলে আপনাকে কিছু ডাউনলোড করতে হবে না - সমস্ত কার্যকারিতা ইতিমধ্যেই ডিফল্টরূপে এক্সেলে তৈরি করা আছে এবং ট্যাবে অবস্থিত। উপাত্ত (তারিখ) গ্রুপের মধ্যে ডাউনলোড করুন এবং রূপান্তর করুন (পান এবং রূপান্তর).

তাই আমরা হয় ট্যাব যান উপাত্ত, অথবা ট্যাবে পাওয়ার কোয়েরি এবং একটি দল নির্বাচন করুন তথ্য পেতে or ক্যোয়ারী তৈরি করুন - ফাইল থেকে - XML ​​থেকে. শুধুমাত্র XML ফাইলগুলিকে দৃশ্যমান করার জন্য, উইন্ডোর নীচের ডানদিকে কোণায় ড্রপ-ডাউন তালিকার ফিল্টারগুলি পরিবর্তন করুন সব নথিগুলো (সব নথিগুলো) এবং আমাদের MHTML ফাইল নির্দিষ্ট করুন:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

দয়া করে মনে রাখবেন যে আমদানি সফলভাবে সম্পূর্ণ হবে না, কারণ. পাওয়ার কোয়েরি আমাদের কাছ থেকে এক্সএমএল আশা করে, কিন্তু আমাদের আসলে একটি এইচটিএমএল ফর্ম্যাট আছে। অতএব, পরবর্তী উইন্ডোতে যেটি প্রদর্শিত হবে, আপনাকে পাওয়ার কোয়েরির অবোধগম্য ফাইলটিতে ডান-ক্লিক করতে হবে এবং এর বিন্যাসটি নির্দিষ্ট করতে হবে:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

এর পরে, ফাইলটি সঠিকভাবে স্বীকৃত হবে এবং আমরা এতে থাকা সমস্ত টেবিলের একটি তালিকা দেখতে পাব:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

আপনি ডেটা কলামের ঘরের সাদা পটভূমিতে (টেবিল শব্দে নয়!) বাম মাউস বোতামে ক্লিক করে টেবিলের বিষয়বস্তু দেখতে পারেন।

পছন্দসই টেবিলটি সংজ্ঞায়িত হলে, সবুজ শব্দে ক্লিক করুন টেবিল - এবং আপনি এটির বিষয়বস্তুর মধ্যে "পড়বেন":

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

এটির বিষয়বস্তু "আঁচড়ান" করার জন্য কয়েকটি সহজ পদক্ষেপ করা বাকি আছে, যথা:

  1. অপ্রয়োজনীয় কলাম মুছুন (কলাম হেডারে ডান ক্লিক করুন - অপসারণ)
  2. কমা দিয়ে বিন্দু প্রতিস্থাপন করুন (কলাম নির্বাচন করুন, ডান-ক্লিক করুন - মান প্রতিস্থাপন)
  3. হেডারে সমান চিহ্নগুলি সরান (কলাম নির্বাচন করুন, ডান-ক্লিক করুন - মান প্রতিস্থাপন)
  4. উপরের লাইনটি সরান (হোম - লাইন মুছুন - শীর্ষ লাইন মুছুন)
  5. ফাঁকা লাইন সরান (হোম - লাইনগুলি মুছুন - খালি লাইনগুলি মুছুন)
  6. টেবিল হেডারে প্রথম সারি বাড়ান (হোম - শিরোনাম হিসাবে প্রথম লাইন ব্যবহার করুন)
  7. ফিল্টার ব্যবহার করে অপ্রয়োজনীয় ডেটা ফিল্টার করুন

যখন টেবিলটি তার স্বাভাবিক আকারে আনা হয়, তখন এটি কমান্ডের সাহায্যে শীটে আনলোড করা যেতে পারে বন্ধ করুন এবং ডাউনলোড করুন (বন্ধ এবং লোড) on প্রধান ট্যাব এবং আমরা এমন সৌন্দর্য পাব যার সাথে আমরা ইতিমধ্যে কাজ করতে পারি:

পাওয়ার কোয়েরির মাধ্যমে PDF থেকে Excel এ ডেটা আমদানি করুন

  • পাওয়ার কোয়েরি দিয়ে একটি কলামকে টেবিলে রূপান্তর করা
  • কলামে স্টিকি টেক্সট বিভক্ত করা

নির্দেশিকা সমন্ধে মতামত দিন