新聞| | PChome| 登入
2007-05-25 23:21:21| 人氣133| 回應0 | 上一篇 | 下一篇

新工具自動過濾垃圾郵件、編輯數位書

推薦 0 收藏 0 轉貼0 訂閱站台

卡內基美隆大學的程式設計師推出新服務,稱為「ReCaptcha」,可協助減少垃圾郵件的量,同時讓使用者把圖書數位化。

這項計畫根據一種使用普遍的「Captcha」技術,用來濾除垃圾電子郵件、或在部落格回應中亂貼垃圾訊息等電腦濫發資訊。使用Captchas必須通過一些小測驗,例如判讀刻意扭曲或不清楚的文字。

ReCaptcha把這類瑣事轉化成有生產力的任務,方法是讓使用者把文字掃成數位化影像,這些影像電腦無法判讀。

這項計畫的架構長兼卡內基美隆大學部學生Ben Maurer周三在他的部落格撰文說:「這不但能解決你的垃圾郵件問題,也有助於把人類過往的書寫史在數位時代保存下來。」

卡內基美隆助理教授兼ReCaptcha「執行製作人」Luis von Ahn說,自從這項計畫22日上路以來,已有150個網站開始採用。他指出,單是24日白天,該計畫就已數位化八千個字。

這又是網際網路利用集體智慧結晶的一個例子。其他實例包括Digg和Slashdot等新聞網站,可凸顯使用者評價高的內容ighly;iStockphoto則在測試一個Image Fight網站,可評比照片的畫質。

ReCaptcha有潛力把巨量的文字數位化。Von Ahn估計,使用者每天執行大約6,000萬次的 Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart)測驗。

新服務給使用者兩組字,一組是傳統的Captcha測驗,另一組則是未知的字(unknown word),是用電腦化光學字元辨識器所無法判讀的。如果使用者正確辨識已知的字,他照理來說就應該能解碼另一個未知的字。von Ahn說,目前,ReCaptcha需要三個不同的人把文字以同樣的方式數位化,才能斷定那個字是正確的。

Von Ahn是卡內基美隆研究團隊的成員,先前應雅虎(Yahoo)之邀而開發Captcha技術,以反制不肖人士用電腦程式註冊電子郵件帳號。他是麥克阿瑟基金會(MacArthur Foundation)「資賦優異」(genius)獎學金得主,該基金會出資贊助一些ReCaptcha研究工作。

數位圖書館

ReCaptcha計畫將逐步數位化Internet Archive計畫涵蓋的書籍。Internet Archive是一項把文化資料收入數位圖書館的計畫,也是歷史網址照片網站Wayback Machine的管理者。

von Ahn說,在第一批數位化圖書當中,有一本是哲學家杜威(John Dewey)著的《Psychology》。未來也考慮把其他圖書資料庫納入這項計畫。

即日起,ReCaptcha服務透過應用程式設計介面(API),讓使用者整合到自己的網站。搭配這個API使用的開源碼外掛程式可上Google Code網站取得。

ReCaptcha也可用來避免電子郵件地址遭到電腦搜刮、並納入垃圾郵件清單。

Von Ahn的專長是「真人電算」(human computation),也就是他所謂「使用人類運算能力(或稱「cycles」)的新奇技巧」。

Microsoft Research也有自己的公益性Captcha技術:Asirra。這項技術顯示貓狗的圖片,而不是文字。電腦區別動物的能力很差,但人瞄一眼便知。微軟的這項技術利用不斷更新的寵物照片,擷取自PetFinder網站的「領養我」連結。

von Ahn說,卡內基美隆正用英特爾捐贈、價值3萬美元的伺服器上架設ReCaptcha服務。其他贊助者包括:提供Suse Linux Enterprise Server支援的Novell公司,以及卡內基美隆大學。

台長: 〥芹蟹麵〥
人氣(133) | 回應(0)| 推薦 (0)| 收藏 (0)| 轉寄
全站分類: 數位資訊(科技、網路、通訊、家電) | 個人分類: New Trend |
此分類下一篇:記憶卡配Wi-Fi功能 拍照後可立即上傳
此分類上一篇:MySpace進軍中國

是 (若未登入"個人新聞台帳號"則看不到回覆唷!)
* 請輸入識別碼:
請輸入圖片中算式的結果(可能為0) 
(有*為必填)
TOP
詳全文