新聞| | PChome| 登入
與好友分享這篇文章

AI 代理真正要考的是它能否完成一件現實中的事

AI 評估這件事過去一直有一個很深的慣性。大家習慣先問模型跑分高不高或能否在某些題庫中取得更漂亮的成績。這套方法在純模型時代有其作用,因為那時候我們主要想知道一個模型本身夠不夠強,是否有足夠的語言理解、知識調用和推理能力。但到 AI 代理時代,這種評估框架開始失效。原因很簡單:代...

新聞台: 日常與非常 | 台長:Tony_CHAN
收件者E-mail:

請以分號區隔每個E-mail
例如:john@pchome.com.tw;mary@pchome.com.tw
信件標題:
與你分享這篇文章
訊息內容:
很精采的好文章!
如果你也喜歡,請轉寄給好友幫忙增加人氣吧!
您的名字:
Tony_CHAN
TOP