Hiện có rất nhiều các chuyên gia nghiên cứu và các nhà khoa học máy tính đang họp tại thành phố Edinburgh (Scotland) để thảo luận về ý tưởng tổ chức một nguồn thông tin dữ liệu khổng lồ trên Web hiện nay.
Hầu hết các cuộc thảo luận đều tập trung vào vấn đề “semantic Web”. Một thuật ngữ mà các chuyên gia cho rằng các thông tin trên web sẽ có thể được dán nhãn đặt tên, dịch và liên kết một cách thông minh thông qua các ứng dụng. Các ứng dụng này có chức năng chủ yếu giúp thiết lập các liên kết và tìm kiếm các thông tin.
Trong khi đó các nhà khoa học máy tính lại cho rằng “semantic Web” sẽ giúp cho người sử dụng tìm chính xác được các thông tin mà họ đang cần. Trong một vài năm trở lại đây, việc tích hợp các từ khoá vào trong một trang web được xem như là một cách để giúp người dùng tìm kiếm dữ liệu nhưng phương thức này nhanh chóng trở thành một giải pháp lỗi thời không hiệu quả.
Tuy nhiên, vẫn còn có rất nhiều những sự băn khoăn về phương thức phát triển phiên bản Internet kế tiếp và nếu như những ý tưởng mới được hiện thực hoá thành các ứng dụng thì liệu giao diện có dễ sử dụng với người dùng hay không.
Tim Berners-Lee – cha đẻ của World Wide Web – cho rằng hiện vẫn còn có cơ hội để phát triển web trở nên tốt hơn.
Thiết kế lại web
Google PageRank được xem là một bước nhảy mới trong công nghệ tìm kiếm. Tuy nhiên, các nhà khoa học máy tính cho rằng chúng ta cần phải nỗi lực rất nhiều và tốn nhiều thời gian nữa để phát triển các công cụ tiên tiến. Một khi mà “semantic Web” ra mắt thì nó cũng chưa thể có khả năng thay thế cho các động cơ tìm kiếm. Công nghệ web mới có thể sẽ chỉ là công nghệ bổ sung thêm cho các ứng dụng giúp tìm kiếm khai thác các thông tin trên Web.
Trong khi đó, các động cơ tìm kiếm trên Internet sẽ có thể sử dụng các tragn web đã được tối ưu hoá theo nội dụng “semantic Web”. Còn cha để của World Wide Web Berners-Lee lại dự đoán rằng các công ty cung cấp dịch vụ tìm kiếm sẽ không mấy mặn mà lắm với khái niệm công nghệ web thế hệ kế tiếp.
“Các động cơ tìm kiếm thu được lợi nhuận từ những đơn đặt hàng tìm kiếm trong một sự hỗn trợ,” Berners-Lee nói. “Nếu bạn không đưa yêu cầu hay đặt hàng với họ thì họ sẽ không thu được lợi nhuận. Vì thế mà họ sẽ không mặn mà lắm với semantic Web.”
Dán dãn thông tin trên Internet liên quan đến vấn đề tách nhỏ chúng bằng các đoạn mã và phân loại theo những nguyên tắc nhất định. Các mô hình dữ liệu sẽ có thể được tạo ra tuỳ thuộc và từ chủ đề dữ liệu khác nhau để liên kết các thông tin phân mảnh trên rất nhiều máy chủ Internet.
Đây là một xu hướng khác xa công nghệ tìm kiếm hiện tại – công nghệ cho phép tìm kiếm moi từ khoá và sắp xếp mức độ phổ biến của thông tin nhưng lại không có khả năng biên tập thông tin cho phù hợp với bối cảnh tìm kiềm.
“Google là rất tuyệt, nhưng tôi không muốn chỉ tìm kiếm từ khoá Exxon Mobile ở đây rồi nhận lại hơn 6 triệu kết quả khác nhau,” Clare Hart, chủ tịch điều hành của Dow Jones, nói. "Google không thể giúp tôi tìm được khoảng 20 liên kết có ích và có ý nghĩa nhất."
Thách thức
Semantic Web cũng có thể được ứng dụng cho các dữ liệu trong doanh nghiệp. Nhưng các doanh nghiệp lại rất băn khoăn về phương thức dãn nhãn dữ lieuẹ của họ cũng như những gì mà họ có thể thu lại được khi đầu tư và công nghệ “semantic Web”.
Nhưng về lâu về dài, các doanh nghiệp cũng cần phải nhận ra một điều là dữ liệu cũng là một loại tài sản, Richard Benjamins, giám đốc phụ trách nghiên cứu, phát kiến và phát triển của Intelligent Software Components, khẳng định.
Trước khi công nghệ “semantic web” được đưa vào ứng dụng, chúng ta cần phải thuyết phục được các doanh nghiệp là dữ liệu của họ hoàn toàn có thể được quản lý và kinh doanh. Nhưng chi phí bỏ ra để tìm kiếm dữ liệu thì lại rất cao vì chúng ta vẫn chưa sử dụng một cách có hiệu quả chúng.
Đáng buồn là chúng ta vẫn còn phải dành rất nhiều thời gian để tìm kiếm các loại dữ liệu và thông tin. Không những thế khoảng thời gian này vẫn không hề giảm đi mà lại đang tăng lên. Semantic Web có khả năng giảm đi khoảng thời gian đó và sẽ có thể trả lại cho các doanh nghiệp những gì mà họ đã bỏ ra đầu tư cho nó.
Hoàng Dũng