新聞| | PChome| 登入
2008-05-11 20:22:34| 人氣74| 回應0 | 上一篇 | 下一篇

微軟亞洲研究院在忙什麼? 搜尋、多媒體

推薦 0 收藏 0 轉貼0 訂閱站台

微軟亞洲研究院剛歡慶成立十週年,但究竟做了哪些研究知道的人卻不多,此刻正在台灣訪問的院長洪小文透露了部份研究成果:搜尋與多媒體技術。

本週返台並為微軟新產品上市站台的微軟亞洲研究院院長洪小文,在與媒體見面的場合並未提及太多亞洲研究院的研究內容。不過,他倒是在台大、清華與交大的三場演講中,展示了多項正在進行,或已經開發完畢的技術:從自動化圖片編輯、與行動定位系統搭配的圖片搜尋、以搜尋為基礎的翻譯技術、哼唱搜尋,以及自動語音合成技術等,全都與多媒體或搜尋技術相關,反映出微軟在技術面打算與Google匹敵的企圖。

以搜尋技術來說,洪小文便展示了一款打算與Google Earth與街景服務競爭的圖片搜尋技術。這項被稱為Photo2Search的技術,是以微軟推動、類似Google Earth的Virtual Earth中的街景圖片為基礎,使用者可用手機將街道上的建築物拍攝並上傳至系統後,系統便會先取得基地台的位址資料,再將附近街道圖片與使用者上傳之圖片進行比對,比對完成後,再將使用者所需的資訊,如附近地圖、觀光點、建物資訊等訊息回傳給使用者,「在手機上輸入地址等資訊太麻煩,但透過建築物照片反向搜查使用者位址,會更有效率,」洪小文說。

傳統的圖片搜尋多半是透多對圖片內容建制文字化的後設資料(metadata)後,才能進行搜尋,但洪小文表示,Photo2Search是透過基地台的位置比對,將搜尋目標範圍縮小後,再針對圖片內容進行畫素分析,「是真正的圖片搜尋,」他說。

其他關於搜尋的技術研發,還有翻譯搜尋Lingo。洪小文表示,傳統的字典已無法應付快速增加的字辭彙,但透過比對網路上現成的多語言資料,可以更精確找出特定語詞的譯法。他以成語「聲東擊西」為例解釋道,一般漢英辭典未必會有收錄,但透過該技術,則可找出曾真正被使用過的譯法,還可透過排序了解哪種譯法最常被使用。

至於已被商品化的搜尋技術,則是哼唱搜尋(Query by Humming),藉由哼唱一段歌曲,再透過語音辨識技術來找出資料庫中吻合的曲目,洪小文表示,該技術目前已輸出給部分手機彩鈴(ringtone)業者,並已有商業化服務。

微軟加碼搜尋相關技術,以搜尋起家的Google一方面深耕搜尋,另一方面則致力於往其他技術領域發展。Google過去幾年來除了從單純的網頁搜尋一路加碼至圖片、新聞、專利乃至圖書搜尋,在應用軟體,如文書處理、試算表與簡報等辦公室軟體上,亦多有發展。去(2007)年甚至還推出了行動電話軟體平台 Android、競標無線電頻譜等,觸角也早由搜尋向外延伸。

周杰倫唱歌給你聽

而引起在場學生最大共鳴的,則是歌唱語音合成技術(Singing Voice Synthesis)。該技術結合了人聲自動合成與電腦音樂MIDI,可在有歌詞與MIDI檔案的情況下,讓電腦自動唱歌。

值得注意的是,該語音合成的發聲特徵來自建模(modeling)技術,「任何人只要先花二十分鐘說話,讓系統學習,然後就能用他的聲音唱任何歌曲、說任何話,」洪小文說。

「這樣一來,你可以讓你喜歡的對象、明星,對你說任何你想聽的話,」他說。

洪小文表示,微軟亞洲研究院自兩年前已開放技術輸出,一般企業若對其研究內容感興趣,也能夠採用並與自家技術整合成新產品。

台長: 〥芹蟹麵〥
人氣(74) | 回應(0)| 推薦 (0)| 收藏 (0)| 轉寄
全站分類: 數位資訊(科技、網路、通訊、家電)

是 (若未登入"個人新聞台帳號"則看不到回覆唷!)
* 請輸入識別碼:
請輸入圖片中算式的結果(可能為0) 
(有*為必填)
TOP
詳全文