“Cha đẻ” Wikipedia Jimmy Wales cuối tuần qua cho biết ông đang tiến hành đặt nền móng cho sự phát triển của một dịch vụ tìm kiếm nguồn mở cạnh tranh trực tiếp với các dịch vụ khác như Google hay Yahoo.
Phát biểu trước các nhà phát triển phần mềm tham gia một hội thảo được tổ chức tại Portland, Oregon, ông Wales cho biết Wikia – một công ty thương mại mới được Wales thành lập – đã hoàn tất thủ tục mua lại Grub - hãng phát triển công nghệ tìm kiếm thông tin trên web (web crawler). Ứng dụng công nghệ này sẽ cho phép dịch vụ sắp ra mắt của Wikia có thể lùng sục tìm kiếm thông tin trên khắp Internet.
“Sẽ có một sự thay đổi rất đáng kể nếu như công cụ tìm kiếm cho ra kết quả chính xác. Lúc đó vai trò sẽ thuộc về nhà cung cấp nội dung chứ không còn phụ thuộc vào hãng cung cấp dịch vụ tìm kiếm,” ông Wales phát biểu.
Tương tự Wikipedia, Wikia sẽ xây dựng dịch vụ tìm kiếm “nguồn mở” dưới sự giúp đỡ của hàng nghìn tình nguyện viên.
Công nghệ tìm kiếm bằng con người
Dự kiến phiên bản thử nghiệm đầu tiên trang web tìm kiếm Wikia sẽ chính thức ra mắt trong khoảng cuối năm nay.
Dịch vụ tìm kiếm mới sẽ kết hợp thuật toán máy tính với sự trợ giúp của con người. Ở đây con người sẽ đóng vai trò chính sửa các thuật ngữ tìm kiếm có nghĩa không rõ ràng hoặc đa nghĩa. Ví dụ, “palm” không chỉ trở tới địa điểm Palm Beach mà còn có nghĩa là “cây cọ” và thiết bị PDA. Kết quả tìm kiếm sẽ được triết xuất thông qua một phần mềm mã nguồn mở có tên là Lucerne.
Grub vốn là một dự án mã nguồn mở miễn phí hoàn toàn. Wikia mua lại Grub từ tay LookSmart Ltd. sau khi hãng này ra quyết định ngừng duy trì phát triển nó. Wikia đã lên kế hoạch tiếp tục mở cửa Grub để kêu gọi sự hỗ trợ từ các nhà phát triển nhằm phát triển và hoàn thiện công nghệ.
Grub được phát triển trên nền tảng công nghệ điện toán phân tán (distributed computing technology). Mỗi người dùng phần mềm Grub tải về từ website http://www.grub.org/ có thể đóng góp sức mạnh xử lý PC của họ trong thời gian rỗi phục vụ cho công việc tìm kiếm thông tin. Giải pháp này sẽ giúp Wikia tiết kiệm được rất nhiều chi phí trong việc phát triển hệ thống mạng máy tính cần thiết cho công việc lùng sục thông tin trên web.
Hoàng Dũng