Blinkx và EveryZing sử dụng công nghệ chuyển thể lời nói trong clip sang dạng văn bản (speech-to-text) để phân loại, Truveo khai thác "điện toán xã hội" còn Mefeedia xây dựng sẵn các kênh theo chủ đề.
Hiện nay, video nhạc, chương trình TV hay clip "cây nhà lá vườn" tràn ngập trên Internet khiến việc tìm và chọn lọc đúng nội dung trở thành một trong những thách thức lớn nhất của người sử dụng web. Công cụ tra cứu thông thường chỉ có thể đọc và phân tích văn bản, còn việc đoán nội dung clip sẽ chủ yếu dựa trên các "tag" (thẻ đánh dấu) hoặc qua từ ngữ mô tả trên trang chứa video đó.
Google đang thử nghiệm chương trình nhận dạng video liên quan đến chính trị trên YouTube. Ngoài ra, những dịch vụ tìm kiếm clip đang được đánh giá cao còn có:
Truveo.com "săn lùng" video trên hàng triệu website, kể cả những trang sử dụng công nghệ web mới như JavaScript và Flash. Dịch vụ của AOL còn nhờ đến thủ thuật "điện toán xã hội", chẳng hạn như danh sách clip được yêu thích do người sử dụng lập ra, để đưa vào kết quả.
Mefeedia.com lại tạo ra các kênh (channel) và danh mục (playlist) để mọi người xem, đóng góp và chia sẻ nội dung.
Tương tự Blinkx, EveryZing.com phân tích âm thanh trong clip và chuyển sang dạng text để phân loại với độ chính xác lên đến 90%.