Powerset tích hợp với Live Search

Có vẻ như mọi người đều quen với ý nghĩ rằng thị trường tìm kiếm đang bị thống trị hoàn toàn bởi Google và Microsoft hoàn toàn lép vế. Tuy nhiên gã khổng lồ Microsoft cũng đã từng “đè bẹp” rất nhiều đối thủ “khó ưa”, liệu lần này họ có lật đổ được Google? Thất bại từ thương vụ với Yahoo không thể dập tắt được những tham vọng của họ.  Tại hội nghị và triển lãm Search Engines Strategies, phó chủ tịch cấp cao bộ phận Microsoft Search Portal and Advertising Platform Group đã phát biểu rằng ít nhất thì Microsoft cũng đã nhìn thấy được khả năng để thay đổi tình thế hiện nay.

Microsoft vừa chính thức hoàn thành thương vụ thâu tóm Powerset với trị giá 100 triệu đô la kéo dài từ tháng 1 đến tận tháng 7 năm nay. Những ứng dụng của Powerset cũng đang dần mang lại những thay đổi cho Live searh. Nhiều chủ đề sẽ được trả lại câu trả lời hoặc biểu đồ xRank, link, và thông tin lấy từ kho dữ liệu của Freebase, tạo nên những thay đổi đặc biệt trong khả năng tìm kiếm ảnh, thông tin y tế, những thông tin về đời tư của những nhân vật nổi tiếng.

Powerset được thành lập vào năm 2005. Tháng 10 năm 2006, Powerset đã có được 12,5 triệu USD đầu tư từ các quỹ như Foundation Capital, Founders Fund, and Angel investors. Từ tháng 2 năm 2007, Powerset mua được bản quyền sử dụng công nghệ xử lý ngôn ngữ tự nhiên từ trung tâm nghiên cứu Xerox’s Palo Alto. Sản phẩm đầu tiên của Powerset là một search engine tìm kiếm trên kho dữ liệu của Wikipedia được ra mắt vào tháng 5 năm 2008. Điểm nổi bật của nó là thay đổi cách con người ảnh hưởng bởi công nghệ bằng cách tạo ra những máy tính có thể hiểu được ngôn ngữ của con người. Trong khi đó là cuộc chơi thực sự khó khăn, họ tin rằng đây chính là thời điểm để bắt đầu. Powerset đưa quá trình xử lý ngôn ngữ tự nhiên vào search, cải thiện cách mà chúng ta tìm kiếm thông tin bằng cách giải mã những ý nghĩa được mã hóa trong ngôn ngữ tự nhiên của con người. Powerset đã phát triển công nghệ cho phép người sử dụng thoát khỏi việc phải sử dụng những từ chính xác để tìm kiếm, thay vào đó họ có thể sử dụng những truy vấn như lời nói hàng ngày và phần lớn thông tin sẽ hiển thị dựa trên việc phần mềm của Powerset sẽ hiểu ý nghĩa của các trang web. Trong ô search box bạn có thể gõ query là từ, cụm từ hoặc câu. Trong trang kết quả Powerset đưa ra nhiều kết quả chính xác hơn, thường cho câu trả lời trực tiếp cho câu hỏi truy vấn, tổng hợp thông tin qua nhiều article phức tạp.

Tuy nhiên, phiên bản beta của Powerset trong khi cho ra những kết quả ấn tượng thì phạm vi và số lượng chỉ mục liệt kê vẫn còn hạn chế, để lại những câu hỏi chưa có lời đáp về khả năng kì diệu của nó, liệu có thể đạt tới một mức độ phong phú như bộ máy tìm kiếm dựa trên từ khoá của Google hay không ?

Mark Johnson cho biết “Tại Powerset chúng tôi đã truyền tải ý tưởng của mình vào một nền tảng search ngữ nghĩa – công nghệ search của tương lai và đã thử nghiệm cho việc xây dựng một search trong kho dữ liệu của wikipedia. Tuy nhiên để xây dựng một search ngữ nghĩa với quy mô lớn thì cần đòi hỏi vốn đầu tư lớn, nguồn lực kỹ thuật và máy tính khổng lồ. chúng tôi tin rằng cách nhanh nhất để đưa công nghệ của chúng tôi đến với thị trường là thông qua một hãng lớn.”

Microsoft hi vọng sẽ tích hợp một số tính năng của công nghệ search ngữ nghĩa của Powerset vào cuối năm 2008. Ý tưởng của Microsoft dựa vào thực tế rằng một cơ cấu tìm kiếm nếu muốn thực sự hữu ích đối với người dùng thì nó phải hiểu đúng những gì mà mỗi người dùng khác nhau muốn tìm (chứ không chỉ là những trang kết quả được cho là thỏa đáng với đại đa số người dùng). Và để hiểu được nhu cầu của người dùng thì cơ cấu tìm kiếm phải biết nhiều hơn về người dùng bằng cách nhớ và phân tích những gì mà mỗi người dùng tìm kiếm trong các truy vấn khác nhau. Hiện tại, Microsoft chỉ lưu giữ thông tin của một lần tìm kiếm trước đó do người dùng thực hiện, nhưng theo kế hoạch thì sẽ lưu thông tin của nhiều lần tìm kiếm hơn và nhờ đó hi vọng sẽ hiểu được người dùng thực sự muốn tìm cái gì. Theo thống kê của Microsoft, hiện nay một nửa các truy vấn tìm kiếm do các cơ cấu tìm kiếm xử lí thường kéo dài 30 phút mỗi khi người dùng “lục lọi” thông tin về một đề tài đặc biệt nào đó, vì lúc đó người dùng sẽ mất thời gian để kiểm tra các website khác nhau từ các kết quả tìm kiếm, sau đó mới lọc theo các truy vấn để có kết quả tốt hơn. Nếu một nửa “cư dân” web tốn nhiều thời gian để tìm kiếm như vậy thì nhất định công nghệ tìm kiếm theo ngữ nghĩa sẽ là một thị trường đầy hứa hẹn. Vì vậy đây là lĩnh vực mà Microsoft nhìn thấy tiềm năng thực sự: Khi người dùng thực hiện một tìm kiếm có chiều sâu như vậy thì các truy vấn tìm kiếm khác nhau mà người dùng thử để tìm ra kết quả mong muốn sẽ được hỗ trợ để hiểu người dùng thực sự muốn gì và cung cấp kết quả mà họ mong muốn tốt hơn. Cùng với việc hiểu các truy vấn tìm kiếm tốt hơn, Microsoft cũng dự định sẽ sử dụng công nghệ xử lí ngôn ngữ tự nhiên (hiện đang được Powerset áp dụng để tìm kiếm nội dung trên Wikipedia) để có thể hiểu được nội dung các trang web tốt hơn. Và ở một mức độ nào đó, cơ cấu tìm kiếm sẽ không chỉ hiểu được người dùng muốn tìm gì mà còn biết được đâu là nội dung thỏa mãn yêu cầu của người dùng tốt nhất. Trong một cuộc phỏng vấn Ramez Nammc của microsoft cho biết công nghệ của Powerset sẽ giúp Microsoft trong kế hoạch dài hơi của họ để xây dựng công cụ search. Ông cũng cho biết thêm rằng có một số điều có thể áp dụng ngay mặc dù chưa mang lại điều gì đặc biệt lắm.

Nguồn nhân lực của Powerset gồm hơn 60 người tiếp tục làm việc tại văn phòng ở san Franciso với tư cách như một nhóm thuộc đội làm search của Microsoft. Theo Satya Nadella người quản lý bộ phận search của Microsoft. họ sẽ tiếp tục tuyển dụng và phát triển bộ phận search ở san Fraciso vào tháng tới.

Nhóm nghiên cứu thị trường xalo.vn