24h購物| | PChome| 登入
2019-10-27 21:10:41| 人氣887| 回應0 | 下一篇
推薦 0 收藏 1 轉貼0 訂閱站台

搜尋引擎過去歷史與未來發展

因應網際網路資訊的快速發展,網絡用戶要找的資料有如大海撈針,為了滿足大眾對於資訊檢索的需求,於是搜尋引擎的服務便蘊育而生,搜尋引擎的發展已經與現代生活密不可分,搜尋引擎幾乎無所不搜無所不怪,人們習慣突然想到什麼,便直接打開搜尋引擎尋求答案,它對現今人類的影響力有目共睹,在此也篤定預測它對我們的影響將不僅僅是生活服務、廣告與客戶業務,甚至將會改變世界的樣貌,或許我們很難想像這是甚麼情況, 如同90年代搜尋引擎問世,同時Web的發展才剛起步,當下面對寥寥可數的網站,有誰會相信所有的資訊都可上網查詢? 然而今日將步入所謂「物聯網」時代,未來利用搜尋引擎達成「萬物聯網,搜尋萬物」的願景,將重新改變對搜尋引擎服務功能的認知,這是一個時代的機遇,且看過去搜尋引擎的發展歷史,讓我們推敲物聯網搜尋入口尚未成形的癥結,以及未來巨大市場潛力的真正原因。

全球第一個瀏覽器-WorldWideWeb

網際網路在人類史上是一件不折不扣的大事,有了網際網路的全球化普及的硬體鋪陳,全球的網際網路才能連接在一起,因此思科無疑為網際網路發展奠定了根基。網際網路發展的另一建樹則是瀏覽器,英國科學家Timothy John Berners-Lee,他是全球資訊網的發明者,1990年開發全球第一個瀏覽器 -WorldWideWeb,儘管與現今使用的瀏覽器大不相同,但它還是引導了瀏覽器發展的核心思想,隨後Mosaic與Netscape進一步推動了瀏覽器的創新,使其具有更為直觀的介面,因此在當時大受歡迎,1994年Netscape 推出第一款全球資訊網瀏覽器,不僅佔據瀏覽器市場主導地位,同時開啟了全球資訊網上網熱潮,且於1995年將Infoseek預設為瀏覽器搜尋引擎。瀏覽器的發明帶領用戶使用網際網路可以更為簡單便利,以前訪問網際網路是極其複雜的,只有電腦專業人士才能上網,瀏覽器開啟了只要會用滑鼠和鍵盤就會上網的可能,毫無疑問,瀏覽器拉近了人類與網際網路資訊之間的距離,大大減少了人們搜尋資訊的時間成本,Netscape瀏覽器也成為了日後瀏覽器的發展原型。

搜尋引擎的起始發展

對於網路搜尋的發展概念,則可追溯1990年,蒙特婁大學三位學生Alan Emtage、Peter Deutsch、Bill Wheelan發明了Archie,當時全球資訊網還沒有出現,由於大量的檔案散佈在各個FTP主機中查詢不便,而Archie恰恰可以自動索引Internet的免費FTP檔案資訊,並提供一種根據檔案名稱查詢所在FTP地址的方法,因此Archie被稱為搜尋引擎的始祖。1993年Matthew Gray開發了Wandex,Wandex的技術是第一個對Web索引進行爬網,並在Web上搜索索引頁面目錄的技術,接著搜索引擎的另一個重大發展為WebCrawler,1994年搜索引擎開始導入網站全文索引概念,而不是僅對網頁標題進行索引。此外,1993年斯坦福大學一個名為Architext的大學項目,六名大學生利用單詞的統計分析提高搜索的關聯性,這個項目於1995年底創立Excite,首次以爬網的搜索引擎商業方式發布。另外,1994年卡內基梅隆大學Michael Mauldin博士成立Lycos,開發以頁面網址追踪的爬網技術,而且荷蘭軟體工程師 Martijin Koster 提出了 REP (Robots Exclusion Protocol,爬蟲協議)的概念,通過 robots.txt 抓取應該被抓取的頁面等,網路資訊自動化搜索自此得到完整的發展架構。

搜尋引擎的突圍者-Yahoo

1994年引發著楊致遠 (Jerry Yang) 和David Filo對網站的探尋,兩個年輕人創建了一個分類查詢目錄,存放著兩人找到的網頁並發布到網絡上,他們將它命名成 "Jerry and David's Guide to the World Wide Web”,其核心就是按照字母順序將站點分類,Yahoo的雛形因此誕生,它制訂了網際網路這個行業的遊戲規則—開放、免費和營利的新型商業模式,直到2001年,Yahoo開始收取列入其目錄清單的費用。1996年Yahoo成立僅一年,便創下了上市時間最短的奇蹟,1998年Yahoo成為世界最大的網際網路公司,當此巔峰際遇卻發生了轉折,搜索業務一直依靠人工進行,未能以HTML的Tags參數導向自動化搜索技術,此外,1999年拒絕主動上門以100萬美元收購的Google,因為Yahoo一度認為用戶上網動機,在於瀏覽資訊,不存在目的性搜索。2000年Yahoo開始使用人工與網絡搜索的組合支持其目錄技術合作者包括與Inktomi和Google,直到2002年10月開始收購Overture (AltaVista),Yahoo才將搜索結果完全轉移到基於爬蟲的技術。

搜尋排序的創建者 - Google

Google搜尋引擎的發展,始於1996年1月Larry Page和Sergey Brin,在史丹佛大學研究關於搜尋的專案,1994年W3C (World Wide Web Consortium) 定義HTML的Meta參數,創建了搜尋引擎自動化搜索的環境,鑒於網頁上只有向外的連結網址,但無法看到指向這個網頁的連結的數量,為了實踐網站連結數量決定排名的「Page Rank」機制,於是他們開始嘗試建立一個大量連結的資料庫,藉以找出每個網頁的連結會通向什麼網站,因此搜尋引擎架構—爬取 (Crawling) 、索引 (Indexing) ,也進而創建出排序 (Ranking)的機制,Page和Brin將這個搜尋引擎命名為「BackRub」,他們的構想在1998年8月獲得Sun Microsystems十萬美元的投資,繼而1998年9月他們在車庫建立了公司,搜尋引擎更改為「Google」名稱。Google的搜尋引擎架構收集全球資訊網快速成長,根據GoogleBlog公布索引資訊數量,1998年僅為25萬筆,2000年便成長到10億6千萬筆。

搜尋引擎下一波機會在哪裡?

機會其實就在人人耳熟能詳的「物聯網」,物聯網最終以「萬物聯網,搜尋萬物」願景為目標,潛藏的市場指向線下的大數據藍海商機,然而提供線下搜尋與大數據服務的關鍵樞紐,實質的運作機制便是線下搜尋引擎,它可以接管用戶未來的生活服務,也接管未來實體世界的廣告與客戶業務,所以未來商店將不再需要招牌廣告,街頭的樣貌與生活方式因之改變,社會中的各層面資訊效能也因之提升,進而達到「人盡其用,貨暢其流」目標。對於現有的市場規模估算,根據易觀智庫2019年中國線下市場數據顯示,佔據社會消費零售總額80%市場,是線上消費零售總額的四倍,規模達到大約30兆元人民幣,此將是中國線下導入線上發展的潛在商機,而全球線下市場的潛在商機可達16兆美元,所以物聯網商機可謂十分鉅大,雖然潛在商機並不等於物聯網平台的交易產值,但指標意義在於等同的市場覆蓋範圍,這也是線下搜尋引擎可以拓展市場的最大範圍。

線下搜尋入口的發展現況

當今網際網路進入行動服務時代,服務型態著重於用戶與實體資訊的連結關係,開始導向以人的位置為中心的服務價值,因此線下服務搜尋的需求與日俱增,然而搜尋引擎技術歷經90年代飛躍進展,轉眼已超過二十年光景,時至今日仍難以得見線下搜尋引擎身影,綜觀現有線下搜尋應用形式,最大的改變就是普遍以App做為線下搜尋服務應用 (應用例如,Uber、Foodpanda、Mobike等) ,但主流App採用資料串接架構,實際上是一種封閉系統,難以如同開放性的Web系統,去發展跨應用跨服務的整合入口,加上用戶安裝App數量十分有限,致使大部分App在用戶端沒有市場,根據統計排名前十的App囊括85%以上流量,而且高達90%以上的殭屍App,形成嚴重的軟體資源浪費問題。雖然市面上已發展跨應用整合的線下搜尋入口,例如微信小程序、Amazon智能語音服務,Google地圖等系統,但這些方案整合線下移動服務的方法,幾乎著眼於串接App應用,對照搜尋引擎技術的發展佈局,似乎仍然欠缺完善架構與發展機制,因為服務源頭並非來自開放的Web資訊,而是意圖將主流的App應用導入自家的系統,在山頭林立且互搶資源的情況下,未來能成為線下搜尋入口的機會其實不易達成。

線下搜尋引擎發展的癥結

若把網站比喻成一項商品,商品的自由流通將保證市場最大繁榮,網際網路上的各個網站可以從搜尋引擎分享資訊並帶來流量,搜尋引擎如同組織一個雲端世界,將所有的雲端的服務與資訊連結起來;利用關鍵字搜尋Web內容,水平整合不同應用領域,達成跨領域、跨服務的資訊流通機制,所以若要突破App資訊流通的瓶頸,達到開放共享的最大服務價值,最終需要倚重一個線下搜尋引擎做為推手。 然而線下搜尋引擎市場尚未成形是甚麼原因? 為了推演這樣的因果,我們先假設當前只有瀏覽器沒有搜尋引擎,看看應用情況將會變得如何? 我們可以想像查詢得到的網址需要存放,將是加到書籤或者是置放PC/手機桌面,這樣的應用方式,與App 目前使用情況極其類似,也進而觀察發現,PC的應用軟體的發展歷程,也是由封閉式App應用,歷經硬體效能提升與瀏覽環境改善,慢慢轉向開放性的Web應用,因而形成了搜尋引擎發展環境,現階段智慧手機也不難推測將因循PC發展腳步,終歸由App應用逐漸轉向Web應用,然而Web線下應用未能發展的主因在於,全球資訊網W3C尚未制定HTML線下應用規範,故全球開發者無法著力在Web線下應用開發,導致線下搜尋引擎尚無法實現自動化資訊匯集機制

線下搜尋引擎拓荒者-大千搜尋

線下搜尋引擎架構如何著手,業界仍然處於探索方法以及持續調整的階段,於此之際終於出現一個先行者,台灣的新創團隊「大千搜尋」,延伸雲端搜尋引擎的理念,業已打造出全球第一個線下搜尋引擎,大千搜尋引擎的運作原理,將雲端Web轉為Location Web,達成線上線下虛實融合 (OMO, Online-Merge-Offline)效益,以關鍵字搜尋雲端服務內容,即能對應服務內容與實際方位,得到線下服務的搜尋結果。其發展理念完全符合搜尋引擎原有資訊共享機制,利用Web開放資訊與關鍵字搜尋方式,提供用戶搜尋周遭各種服務的便利入口,解決了跨應用跨服務搜尋問題,並且同於雲端搜尋引擎的服務機制,不僅提升第三方應用服務能見度,而且與各服務業者皆可達成合作互利關係。

大千搜尋實現的線下搜尋引擎,主要應用以下的幾種技術實現,首先改變IP對應聯網裝置的概念,改為URL對應實體萬物,以擴大物聯網的服務範疇,然後應用「Location Web」運算機制,將沒有方位資訊的雲端Web,以O2P (Online to Place)模式實現Web實體化,再輔以「物件虛擬聯網」的方法,達成「萬物聯網」機制,讓草木瓦石可以無需連網裝置與QR 碼,也能具有連網效果,此外,線下資訊包含定點與移動服務,因移動服務無法預排搜尋結果,關鍵字搜尋必需real-time處理,為解決服務資料遞增,導致搜尋時間遞增的問題,故提出「移動矩陣演算法」技術,以節省搜尋時間與伺服器處理成本。對於實現線下搜尋引擎自動化資訊匯集機制大千搜尋依循多年的系統應用經驗已研究並制定完成 線下應用服務規範,因線下搜尋引擎尚未俱足資料處理資源與設備只能暫緩W3C Conference提案計畫對於缺乏發展資源的新創而言,未來是否可以等到異軍突起的機會仍待觀察。

結論

儘管網際網路的創新多如繁星,搜尋引擎始終是那顆最耀眼的明星,因為網際網路前進的腳步,需要搜尋引擎巨輪帶領,所以幾乎沒有其他平台可以超越其價值,因而Yahoo曾經造就最大的網際網路公司, Google得以締造全球市值第二的紀錄,也從過去的發展歷程得知,成就偉大的公司的關鍵在於適時創新,但創新並非需要創造十分艱難的技術,比如Yahoo創建的分類查詢機制,則是以普通分類概念達成創新應用,而Google搜尋引擎的爬取與索引方法,則源自Wandex與WebCrawler的第三方創意,而網站以被連結數量決定排名的「Page Rank」機制,則延伸自百度創辦人李彥宏的專利,事實上這些技術在一般軟體工程師眼中,並非具備甚高的發展門檻,而真正獲取成功的核心關鍵,則在於掌握最佳時機,提出具有創新應用想法與發展架構。

最後聚焦於萬物聯網願景的「物聯網」做結論,物聯網的商機被認為如此巨大,但打著物聯網口號做佈局的業者,卻很少有賺到錢的,似乎突破物聯網發展的最後一哩路,還沒被主流的業者發掘,審視業界對物聯網發展瓶頸的評論,歸納最大的發展問題就是「物不互聯」,因此推出的方案往往形成新的資料孤島,分析突破此問題的解決方法,並非發展更多的物聯網裝置,或是制定更細分的通訊協定,因為用戶還是無法找到那些服務在哪裡,其實真正能突破最後一哩路的發展,在於需求一個可以跨應用跨服務線下搜尋入口,也就是「搜尋萬物」的線下搜尋引擎,如此才能適時適地適人傳遞服務給任何需要服務的人,進而創建完整價值的資訊流、服務流以及大數據服務。事實上,物聯網的正確理解觀點為聯網的「線下服務」,如果將之誤認為是聯網的「硬體服務」,不僅無法區分「物聯網」與「互聯網」的差異,也無法找到物聯網真正的核心商機,近年華人組織對於物聯網發展佈局尤為熱衷,如果在這波物聯網發展趨勢中迷航,契機過去就不會再重來,希望藉由本文對搜尋引擎的發展分析,讓想要抓住物聯網潛在商機的業者,能夠掌握時代的機遇,引導發展與投資到正確的方向,創造未來的巨大發展機會。

台長: 黃柏堯 Hal Huang
人氣(887) | 回應(0)| 推薦 (0)| 收藏 (1)| 轉寄
全站分類: 數位資訊(科技、網路、通訊、家電)

是 (若未登入"個人新聞台帳號"則看不到回覆唷!)
* 請輸入識別碼:
請輸入圖片中算式的結果(可能為0) 
(有*為必填)
TOP
詳全文