24h購物| | PChome| 登入
2005-08-20 23:05:51| 人氣112| 回應0 | 上一篇 | 下一篇

網際網路有多大?Yahoo、Google吵不休

推薦 0 收藏 0 轉貼0 訂閱站台


World Wide Web有多大?許多網際網路工程師認為這個問題,就像「一根針尖上有多少天使飛舞」這種哲學問題一樣難以想像。

但在上週入口網站巨人雅虎(Yahoo)於一個網路搜尋引擎會議宣佈該公司的搜尋引擎的索引(index)──其資料庫可以找到的文件數量之計算數值──達到192億個之後,網際網路有多大這個問題引起廣泛討論。

因為這個數字是雅虎的死對頭及矽谷的鄰居──Google──提報的文件數量的兩倍有餘,進而引發一場激烈爭辯。Google相當懷疑對手是怎麼算的。

Google共同創辦人Sergey Brin認為雅虎的數字是重覆計算的膨脹結果,因此雖然很大卻也削減了數字的有效性。

「搜尋引擎的完整性應該以可回應真正搜尋查詢、並且被證實是獨一無二的真正網頁為基礎。」他在上週五說。「我們索引總量的報告就是用這種方法做出來的。」

但雅虎高層則力保他們之前的宣佈。「我們索引中文件數量是正確的,」雅虎搜尋與市場部份資深副總裁Jeff Weiner周六指出。「我們對我們搜尋工程師與科學家的成就感到十分驕傲,而且我們也將持續提供全球最優質的搜尋經驗以滿足使用者的需求。」

網路搜尋引擎的規模,以及網際網路的規模,長久以來一直是資訊科學研究與爭論的焦點。

商業搜尋引擎是使用一種稱為Web crawler的軟體程式有系統遍尋網際網路上的文件,並加上索引。索引則是電腦科學裏一種晦澀難懂的結構,可讓搜尋引擎在短短幾百分之一秒內找到數百筆像是「布蘭妮」或「伊拉克與大規模毀滅武器」等關鍵字查詢的結果。

星期天美國全國超級電腦應用中心的研究人員就利用Yahoo和Google的索引方法執行大規模隨機搜尋,希望找出爭辯的起因。他們對10,012項查詢中做了個隨機抽樣,發現Google的搜尋結果平均為雅虎的166.9%。雅虎的搜尋結果比Google多的只有3%的比例。該小組表示雅虎對索引的說法很可疑。

雅虎和Google都不願公開他們搜尋的軟體演算法。事實上,這可是Google、雅虎與微軟三巨頭激烈生存戰中賴以致勝的最高機密。

在史丹佛大學教授資訊取得的Christopher Manning指出,要回答網際網路索引有多少很難、也有點好笑,因此這問題實在充滿了政治與商業意味。

雖然搜尋方法不得而知,不過對於紛歧的數字代表什麼意義,其他人則有眾多揣測。

法國語言學家與社會科學暨文字資訊中心主任Jean Veronis在一個部落格網站中表示,雅虎的法文網頁似乎和雅虎報告的整體網頁數量一致。

不過他也警告,「我不想把話說太滿。目前我並沒有看到雅虎在數字裏有做什麼手腳,但這可能只是因為他們操弄數字的手法比競爭者更高明 ;-)。」

部落格中另一位人士Akash Jain則表示,他自己做過隨機查詢,覺得Google的索引似乎比雅虎多了50%。

其他搜尋引擎專家則認為,只要搜尋引擎的方法不公開,就不太可能對網際網路或索引做出正確估計。Clusty搜尋引擎供應商Vivisimo執行長,同時也是電腦科學家的Raul Valdes-Petez就直言,「我沒有可以檢查的好辦法。」他說,「這個問題好比哈佛和耶魯大學爭辯誰的圖書館藏比較大一樣。」

台長: 〥芹蟹麵〥
人氣(112) | 回應(0)| 推薦 (0)| 收藏 (0)| 轉寄
全站分類: 數位資訊(科技、網路、通訊、家電)

是 (若未登入"個人新聞台帳號"則看不到回覆唷!)
* 請輸入識別碼:
請輸入圖片中算式的結果(可能為0) 
(有*為必填)
TOP
詳全文