Có bao giờ bạn tự hỏi làm thế nào những dịch vụ web tìm kiếm như Google, MSN, Yahoo... có thể tìm ra các trang web ứng với từ khóa mà bạn chọn trong vô vàn trang web trên Internet chỉ trong tíc tắc không? Thực tế, việc tìm kiếm diễn ra nhanh là vì sử dụng cơ sở dữ liệu chỉ mục (index) có sẵn trong máy chủ dịch vụ. Áp dụng nguyên lý này, những công ty trên liên tiếp đưa ra các công cụ tìm kiếm cực mạnh trên máy tính, bỏ xa tính năng Search chậm chạp của Windows, biến quá trình tìm kiếm trở nên siêu tốc như trên mạng vậy. Tuy nhiên những công cụ tuyệt vời này không phải chỉ mang đến toàn điều tốt.Nguồn: Istockphoto
Sau khi cài đặt, bạn sẽ thấy phần mềm chỉ chiếm khoảng vài MB của ổ đĩa cứng. Nhưng trong quá trình xây dựng cơ sở dữ liệu (CSDL), mỗi file được lập chỉ mục (index) đều có ít nhất một hoặc nhiều bản dự trữ khác nhau, vì vậy CSDL ngày càng lớn, có thể lên đến hàng GB. Để che dấu điều này, CSDL thường được đưa vào thư mục ẩn của hệ thống. Ví dụ với Google Desktop Search, file cài đặt chỉ chiếm vài MB "khoe" ra trước mắt người dùng tại X:\Program Files\Google\Google Desktop Search\, còn file dữ liệu thật sự nằm trong X:\Documents and Settings\tên đăng nhập\Local Settings\Application Data\Google\Google Desktop Search\ (với X là ổ đĩa cài hệ điều hành). Chưa kể phần mềm luôn được khởi chạy cùng Windows nên sẽ chiếm dụng một phần tài nguyên hệ thống nhất định và làm tăng thời gian khởi động máy.
Có thể bạn nghĩ: "Tốn vài GB cũng đâu có sao, miễn là thấy thoải mái, không phải sốt ruột chờ đợi mỗi khi tìm kiếm thì cũng đáng". Nhưng bạn hãy nghĩ thêm về vấn đề bảo mật. Giả sử bạn có một tài liệu hết sức riêng tư và quan trọng trên máy tính và không muốn nó rơi vào tay bất kỳ ai. Khi không còn cần dùng tài liệu này nữa hay sau khi đã copy sang một thiết bị lưu trữ khác nhỏ gọn hơn để tiện cho việc cất vào két sắt chẳng hạn, bạn quyết định dùng một phần mềm tiêu hủy dữ liệu chuyên nghiệp như WhiteCanyon SecureClean, Ontrack DataEraser hoặc Symantec Wipe Info... để xóa nó hoàn toàn. Nhưng có một vấn đề mới phát sinh: chỉ có file gốc bị xóa hoàn toàn, còn rất nhiều bản dự trữ (cached) của nó do quá trình index tạo ra vẫn còn nguyên trong CSDL của công cụ tìm kiếm. Không cần bỏ công tìm, có khi chỉ là vô tình thôi những người khác cũng dễ dàng biết được đầy đủ nội dung của tài liệu mà bạn dày công che giấu nhờ những bản dự trữ.
Không thể phủ định khả năng tìm kiếm tuyệt vời mà các công cụ tìm kiếm đem lại. Ngay cả khuyết điểm về bảo mật đôi lúc cũng có cái lợi riêng. Xin dẫn một trường hợp mà chính tác giả đã từng trải qua và cũng từ đó nảy ra ý định viết bài này: Vào một ngày rảnh rỗi, khi ngồi dọn dẹp ổ đĩa tôi đã nhỡ tay xóa mất một tài liệu khá quan trọng bằng tổ hợp phím Shift+Delete (không lưu vào Recycle). Khi kịp nhận ra sai lầm thì mọi thứ đã quá muộn, ngay cả một phần mềm khôi phục file chuyên nghiệp như EasyRecovery Pro cũng không đem lại kết quả vì trớ trêu thay trong quá trình copy, dồn đĩa, dữ liệu đã bị xóa sạch. Phải làm sao đây? Chịu bó tay ư? Tất nhiên là không. Google Desktop Search đã giúp tôi việc này. Chỉ bằng tổ hợp phím tắt Windows+G và nhập thêm một từ khóa, sau 0,4 giây tài liệu bị mất đã hiện lên, mặc dầu "File Not Found" nhưng với hàng chục bản dự trữ tôi dễ dàng tìm thấy bản "cached" mới nhất với nội dung y hệt file gốc, không những vậy tôi còn biết thêm tường tận quá trình thay đổi tài liệu của mình.
Tóm lại, nếu không mấy quan tâm đến dung lượng và tính bảo mật thì những công cụ tìm kiếm siêu tốc trên máy tính vẫn là một ứng dụng tuyệt vời, nó sẽ giúp bạn khám phá mọi tài liệu trên máy vi tính với thời gian nhanh nhất. Và xin thưa với các bạn cho đến lúc này file .doc chứa bài viết của tôi đã có đến "43 cached"!
Nguyễn Tiến Dũng
Email: dung.87@gmail.com