Cách scan ảnh thành file PDF trên Drive

Một vài hướng dẫn cách scan tài liệu từ văn bản, ảnh thành file pdf cho vào máy tính cực kỳ đơn giản mà bạn đọc nên biết


Để biến những văn bản, tài liệu trên giấy thành những file lưu vào máy tính cho gọn và dễ tìm, người ta sẽ thực hiện như thế nào? Nhờ một phần mềm nhận dạng ký tự hay quét thành file ảnh? Thực ra, giải pháp khả thi cho công việc số hóa tài liệu này là quét thành những file pdf. Bài viết dưới đây sẽ hướng dẫn cách scan tài liệu sang pdf cho vào máy tính:

Nếu bạn đang lưu trữ khá nhiều tài liệu cũ ở dạng sách, báo, giấy tờ viết tay… và luôn thấp thỏm lo sợ chúng sẽ bị mục nát theo thời gian, cũng như mất nhiều thời gian kiểm tra và bảo quản chúng thì có một cách giúp bạn quẳng đi gánh nặng này với chi phí khoảng chừng 850.000 đồng. Đó là số hóa tất cả những gì có thể bằng một máy quét hình (scanner), hay còn gọi là máy scan, tất nhiên là bạn đã có máy tính.

Hiện nay trên thị trường chỉ có loại máy scan khổ A4 của các nhãn hiệu Genius, HP, Epson, plustek. Tuy nhiên, vì mục đích chính là dùng vào việc số hóa tài liệu nên bạn có thể không cần quan tâm đến nhãn hiệu hay độ phân giải tối đa của từng loại máy scan. Do vậy bạn có thể chọn loại máy scan có giá thấp nhất với độ phân giải 1200×2400 dpi, giá chừng 850.000 đồng. Không nên chọn loại máy có chức năng scan phim mà đắt tiền.

Cách scan ảnh thành file PDF trên Drive

Sau đó, kết nối với máy tính bằng cáp USB kèm theo máy rồi cài chính xác driver cho nó. Thông thường, trên các đĩa CD kèm theo máy sẽ có rất nhiều chương trình hỗ trợ scan của nhà sản xuất nhưng bạn chỉ cần cài driver và phần mềm hỗ trợ scan là đủ.

Để dễ quản lý và lưu trữ cài tài liệu, bạn nên lưu tài liệu scan được ở dạng file sách điện tử PDF thay vì file hình dạng JPG, mặc dù kích thước file JPG nhỏ hơn khoảng 10% so với file PDF. Nếu phần mềm hỗ trợ scan của nhà sản xuất có chức năng scan tạo file PDF thì bạn không cần phải cài thêm các phần mềm hỗ trợ scan khác.

Cách scan ảnh thành file PDF trên Drive

Còn nếu thấy phần mềm khó dùng và chức năng scan tạo PDF không tối ưu, hoặc không có chức năng scan tạo file PDF, bạn hãy cài thêm phần mềm Free Easy Scan to PDF để thực hiện nhanh việc scan tạo file PDF.

- Tạo file PDF: Bạn chạy phần mềm Softi Scan to PDF, bấm chọn chuẩn scan ở ô Select Scanner, chọn 200 ở ô DPI và chọn Color ngay sau ô DPI, đánh dấu chọn trước hàng chữ Show Scanner Dialog, bấm nút Scan, bấm nút Preview, quét chọn hoặc điều chỉnh vùng tài liệu scan, bấm nút Scan, bấm nút để xoay tài liệu về hướng thẳng đứng (đọc từ trên xuống), thực hiện scan trang tài liệu tiếp theo hoặc cùng chủ đề, hoặc bấm nút Save PDF để lưu file.

- Tạo file hình: Đối với tài liệu hình ảnh, bạn có thể scan tạo file hình bằng chương trình Photoshop, hoặc chia theo từng chủ đề rồi scan để lưu chúng trong một file PDF theo cách trên. Bạn chạy Photoshop, bấm menu File > Import > WIA…, chọn chế độ scan màu, giữ nguyên độ phân giải 200 hoặc tăng lên.

- Tạo file văn bản: Nếu là văn bản tiếng Anh, bạn cài và chạy phần mềm FreeOCR.net ; bấm nút Scan để scan tài liệu cần thực hiện hoặc bấm nút Open để mở file tài liệu đã scan và lưu ở dạng file hình, bấm nút OCR; nội dung văn bản của tài liệu sẽ hiện trong khung bên trái, bạn có thể lưu thành file text hoặc copy vào các chương trình khác. Xong, bấm nút Clear Text Windows xóa nội dung và bắt đầu cho tài liệu khác.

Nhờ dùng công nghệ mới và phần mềm hỗ trợ scan của nhà sản xuất, hiện nay đa số các máy scan đều có tính năng tự động nhận dạng vùng tài liệu cần scan trên trang giấy và bỏ đi những vùng trống xung quanh tài liệu, hoặc tự động nhận và bắt (chọn) tất cả các tài liệu đặt rời rạc trên mặt quét của máy scan rồi lần lượt quét các vùng chọn. Cách này sẽ giúp bạn đỡ nhọc công nhưng tài liệu thu được sẽ không rõ.

Tốt nhất, bạn hãy bấm nút Preview, quét chọn vùng scan rồi bấm nút Scan. Khi bấm nút Preview, đèn quét của máy sẽ đi qua tất cả các vùng mà tài liệu đang chiếm trên mặt quét, do vậy nếu đặt cùng lúc nhiều tài liệu trên mặt quét thì bạn sẽ mất nhiều thời gian chờ hơn so với việc đặt từng tài liệu vào mặt quét.

Khi thực hiện scan, dung lượng trống của phân vùng ổ đĩa C sẽ cạn dần nhưng phần dung lượng này sẽ được khôi phục khi bạn lưu file hay tắt các chương trình scan. Do vậy, bạn chừa hoặc dọn dẹp sao cho phân vùng ổ đĩa C còn trống ít nhất là 3 GB.

Mỗi thiết bị có chức năng quét hình vào máy tính (máy scan, camera, webcam…) thường có 2 chuẩn scan, được phân biệt bằng tiền tố TWAIN hoặc WIA trước tên thiết bị. Trong đó, chuẩn WIA thường dễ dùng hơn so với chuẩn TWAIN.

Khi scan, bạn chỉ cần để độ phân giải 200 dpi là vừa, không cần thiết lập cao hơn làm tăng kích thước file, và nên chọn chế độ scan màu (color) thay vì chế độ đơn sắc (Grayscale hoặc Black and White) để giữ nguyên hình ảnh thực của tài liệu. Tuy nhiên, đối với một số tài liệu bị ố vàng, bạn có thể chọn chế độ scan đơn sắc để thấy tài liệu mới hơn.

Bạn có thể khắc một con dấu làm tên tủ sách của mình và đóng lên bề mặt tài liệu trước khi scan để nhận dạng được tài liệu của mình khi thất thoát hoặc để người đọc biết đến công trình của bạn.

Một khi đã số hóa tài liệu, ngoài việc lưu trữ file tài liệu trên đĩa cứng, bạn có thể ghi chúng lên đĩa CD/DVD để tạo thêm bản dự phòng.

Các Scan nhiều trang thành 1 file PDF

Việc scan nhiều trang thành 1 file PDF tưởng chừng rất khó nhưng sẽ thật dễ dàng nếu bạn áp dụng đúng theo những bước dưới đây: 

Bước 1: Đầu tiên, tiến hành kết nối máy scan với máy tính: Tùy thuộc vào loại máy scan mà bạn lựa chọn để kết nối bằng thiết bị khác nhau: USB, hoặc mạng

Bước 2: Đưa tài liệu muốn scan chuyển thành tập tin PDF vào máy 

Bước 3: Click chuột vào trình duyệt Start (Bắt đầu) - Biểu tượng ô vuông ở góc bên trái phía cuối màn hình máy tính

Bước 4: Soạn dòng chữ Fax and Scan (Fax và Scan) trong khu Start. Lúc này máy tính sẽ mở ra chương trình scan cho bạn 

Bước 5: Đưa chuột vào nút Fax and Scan - biểu tượng máy nằm phía cửa sổ Start. 

Bước 6: Nhấn chuột vào nút New Scan (Scan mới) ở góc bên dưới cửa sổ. Ấn chuột vào đây bạn sẽ được mở ra một cửa sổ mới. 

Bước 7: Chắc chắn rằng máy scan của bạn đã được chọn. Tiến hành kiểm tra nếu trong mạng có nhiều máy scan ở phần Scanner (máy scan) ở phía cửa sổ để chắc chắn đúng chiếc máy scan bạn mong muốn. 
Ngược lại, nếu không phải máy như mong muốn hãy nhấp chuột vào Change (thay đổi)...để đưa ra sự thay đổi khác. 

Bước 8: Chọn loại tài liệu: Đưa chuột vào profile (cá nhân) rồi tùy chọn theo ý muốn: 

  • Photo (hình ảnh) 
  • Documents (tài liệu) 

Bước 9: Muốn chọn kiểu máy bạn đưa chuột vào phần “Source” (Nguồn) để có lựa chọn:

  • Chọn Feeder (khay nạp): nếu muốn tài liệu đưa vào máy như máy trượt. Thông thường cách này được dùng nhiều nếu muốn tạo thành file PDF
  • Chọn Flatbed (Hình phẳng): Chọn chương trình này nếu máy scan của bạn có nắp, bạn cần lật nắp để đặt tài liệu. 

Bước 10: Nhấn chuột tìm đến nút scan ở phía cuối cửa sổ để bắt đầu đưa tài liệu vào máy tính. Đồng thời, bạn cũng có thể thay đổi màu sắc ở bước này. 

Bước 11: Click chuột vào thẻ (tập tin): Khi tiến hành scan xong hãy đưa chuột vào thẻ ở góc bên trái cửa sổ. 

Bước 12: Nhấn chuột vào Print (In): Tùy chọn mục đã được thả xuống theo ý muốn

Bước 13: Nhấn chuột vào Printer (máy in), bạn tìm đến hộp ở góc trái cửa sổ. 

Bước 14: Chọn Microsoft Print to PDF ( In thành file PDF) trong menu Printer đã thả xuống

Bước 15: Chọn Print 

Bước 16: Chọn nơi lưu tài liệu mong muốn

Bước 17: Nhập tên tài liệu PDF đã scan theo ý 

Bước 18: Nhấn nút chuột SAVE 


Công ty CP Đầu tư thương mại và Phát triển công nghệ FSI
Hotline: 0904 805 255
Email:
Website: www.sohoatailieu.com – www.fsivietnam.com.vn
Facebook: https://www.facebook.com/fsivietnam.com.vn/

Nhu cầu chuyển đổi hình ảnh sang các định dạng tài liệu khác như PDF, Word, Excel hiện nay khá phổ biến. Chính vì thế có nhiều phần mềm, dịch vụ trực tuyến hỗ trợ bạn xử lý với file hình ảnh, chuyển hình ảnh sang nhiều kiểu tài liệu. Nếu như bạn có nhu cầu thường xuyên trích xuất nội dung có trong hình ảnh thành tài liệu, thì có thể sử dụng ngay công cụ Google Drive hoặc OneNote.

Hai công cụ này có sẵn tính năng chuyển nội dung có trong hình ảnh, sang văn bản. Từ đó bạn có thể lưu, chỉnh sửa, hoặc chia sẻ nội dung này tùy thích.

1. Trích xuất văn bản trên ảnh bằng Google Drive

Google Drive là dịch vụ lưu trữ đám mây phổ biến hiện nay. Và ngoài tính năng lưu trữ cơ bản đó, dịch vụ còn có thể trích xuất văn bản trên ảnh rất nhanh, hỗ trợ nhiều ngôn ngữ bao gồm cả Tiếng Việt.

Bước 1:

Trước hết người dùng đăng nhập tài khoản Google Drive cá nhân. Tại giao diện này, bạn nhấn chọn vào My Drive (Drive của tôi) rồi chọn tiếp Upload files (Tải tệp lên).

Cách scan ảnh thành file PDF trên Drive

Bước 2:

Sau đó bạn tiến hành tải hình ảnh mà bạn muốn trích xuất dữ liệu lên Google Drive. Tại hình ảnh được tải lên trên Google Drive, click chuột phải và chọn Open with (Mở bằng) rồi chọn Google Docs (Google Tài liệu).

Cách scan ảnh thành file PDF trên Drive

Bước 3:

Ngay sau đó hình ảnh sẽ được mở trên Google Docs, với bên trên là hình ảnh gốc chứa nội dung văn bản và bên dưới là nội dung đã được trích từ hình ảnh.

Cách scan ảnh thành file PDF trên Drive

Tại đây người dùng có thể tiến hành chỉnh sửa nội dung tùy ý theo nhu cầu của công việc.

Cách scan ảnh thành file PDF trên Drive

2. OneNote trích xuất nội dung trong hình ảnh

OneNote là công cụ ghi chú quen thuộc trong bộ Office của Microsoft. Bên cạnh việc sử dụng ghi chú nội dung, chúng ta có thể sử dụng OneNote để trính xuất văn bản trên hình ảnh.

Bước 1:

Tại giao diện trên OneNote, bạn nhấp vào mục Chèn (Insert) chọn tiếp mục Hình ảnh (Picture), rồi lựa chọn tải hình ảnh có sẵn trên máy tính Pictures, hay dùng Ảnh trực tuyến (Online Pictures).

Cách scan ảnh thành file PDF trên Drive

Bước 2:

Tại giao diện hình ảnh chứa nội dung muốn trích xuất thành văn bản, nhấn chuột phải vào hình ảnh và chọn Sao văn bản từ hình ảnh (Copy Text from Picture).

Cách scan ảnh thành file PDF trên Drive

Bước 3:

Ngay sau đó việc trích xuất sẽ tiến hành nhanh chóng. Chúng ta sẽ bấm tổ hợp phím Ctrl + V để dán nội dung cần trích xuất, hoặc lưu lại. Tuy nhiên, OneNote chỉ có thể trích xuất văn bản không dấu.

Cách scan ảnh thành file PDF trên Drive

3. Sao chép văn bản từ bản in file trong OneNote

Có thể chèn nội dung của các file khác, như file PDF, vào notebook OneNote dưới dạng bản in file. Các trang từ những file được chèn này xuất hiện dưới dạng hình ảnh không thể chỉnh sửa trực tiếp.

Một cách để khắc phục vấn đề này là chèn bản in file, sau đó chuyển đổi hình ảnh được chèn thành văn bản. Điều này giả định rằng bản in file của bạn chứa văn bản dễ đọc, có thể được chuyển đổi bằng OCR.

Trước tiên, bạn sẽ cần mở tài liệu OneNote của mình và chèn bản in file. Mở OneNote và, trong thanh ribbon, bấm Insert > File Printout.

Chọn file cần chèn, chẳng hạn như file PDF, sau đó nhấn Insert để chèn các trang của file dưới dạng hình ảnh trong notebook OneNote.

Sau một lát, OneNote sẽ chèn các trang vào tài liệu. Khi các trang được chèn, bạn có thể chọn sao chép văn bản từ một trang hoặc từ tất cả các trang cùng một lúc.

Để thực hiện việc này, nhấp chuột phải vào hình ảnh bạn đã chọn và nhấn vào tùy chọn Copy text from this page of the printout. Nếu bạn muốn sao chép văn bản từ tất cả các hình ảnh, hãy bấm chuột phải vào bất kỳ hình ảnh nào, sau đó chọn Copy text from all the pages of the printout thay thế.

Cách scan ảnh thành file PDF trên Drive
Sao chép văn bản từ bản in file trong OneNote

Văn bản từ hình ảnh sẽ được lưu vào clipboard. Bạn có thể dán trực tiếp vào OneNote bằng cách nhấp chuột phải vào notebook và nhấp vào tùy chọn dán. Bạn cũng có thể dán bằng cách nhấn Ctrl+V trên bàn phím.

OneNote là một công cụ tuyệt vời để chuyển đổi hình ảnh thành văn bản, nhưng có những lựa chọn thay thế. Bạn có thể sử dụng ứng dụng Microsoft Office Lens Mobile Scanner để chuyển đổi hình ảnh.

Trên đây là cách trích xuất nội dung trong hình ảnh thành văn bản, bằng 2 công cụ là Google Drive dịch vụ lưu trữ trực tuyến và công cụ ghi chú OneNote. Khả năng trích xuất và xử lý nội dung của Google Drive có vẻ tốt hơn so với OneNote khi hỗ trợ Tiếng Việt. Với trường hợp văn bản Tiếng Anh, bạn có thể sử dụng OneNote để chuyển nội dung trong hình ảnh thành tài liệu.

Chúc các bạn thực hiện thành công!