每種具體的人工智能系統(tǒng)往往只具備一個或若干上述提到的功能。例如IBM的深藍(lán)強(qiáng)于計(jì)算能力,在國際象棋方面可以與人類對手一決高下;沃森系統(tǒng)擁有龐大知識庫系統(tǒng),因此可以在常識問答比賽中擊敗人類選手。因?yàn)闆]有統(tǒng)一的模型可以涵蓋這些人工智能系統(tǒng),就無法形成統(tǒng)一的測試方法進(jìn)行測試和比較。如圖1.2所示,人工智能系統(tǒng)A 在計(jì)算能力上得分為100,人工智能系統(tǒng)B 在計(jì)算機(jī)視覺識別上得分為80,人工智能系統(tǒng)C在機(jī)器翻譯測試得分為90分,我們?nèi)匀粺o法得出結(jié)論A的智力能力高于C,C的智力能力高于B的結(jié)論。
?。?)第二個困難是沒有統(tǒng)一的模型和測試方法,能夠同時對人工智能系統(tǒng)和人類進(jìn)行測試,這也是當(dāng)前人工智能威脅論產(chǎn)生最重要的原因之一。因?yàn)闆]有人工智能系統(tǒng)和人類智能水平統(tǒng)一的測量方法,人工智能威脅論宣揚(yáng)者往往將計(jì)算機(jī)或軟件系統(tǒng)表現(xiàn)強(qiáng)大的領(lǐng)域作為標(biāo)準(zhǔn),例如計(jì)算能力,歷史,地理等常識的掌握能力等,而忽略諸如圖像識別能力,創(chuàng)新創(chuàng)造的能力,發(fā)現(xiàn)規(guī)律的能力等,對于這個原因產(chǎn)生的問題,人工智能威脅論反駁者往往無法拿出定量的數(shù)字結(jié)果進(jìn)行反駁。
目前雖然針對人類智力能力的評測方法已經(jīng)非常成熟,但過去100多年的發(fā)展和改進(jìn)過程中,這些方法并沒有考慮到人工智能系統(tǒng)的特點(diǎn)和發(fā)展水平,因此很難將人類的智商測試方法拿來測試人工智能系統(tǒng)。例如目前絕大多數(shù)人工智能系統(tǒng)就無法完成圖1.3所示題目,因?yàn)闇y試者需要首先識別圖像中的問題,并與圖中的各個圖形特征關(guān)聯(lián)起來。做不到這一點(diǎn),回答問題就無法進(jìn)行下去。
圖1.4所示的人類智商測試的題目需要測試者運(yùn)用鉛筆,鋼筆等工具繪制圖形。用手操作物體完成任務(wù),解決問題是人類普通的能力,但對大多數(shù)人工智能系統(tǒng)因?yàn)闆]有相應(yīng)輸出系統(tǒng)或操控設(shè)備,于是無法完成圖1.4所示的測試。
2025-04-24 13:29
2025-04-21 08:38
2025-04-20 07:42
2025-04-19 09:16
2025-04-18 09:06
2025-04-18 09:06
2025-04-16 13:34
2025-04-16 11:09
2025-04-16 09:03
2025-04-15 09:28