科學(xué)研究領(lǐng)域中,追求真理經(jīng)常意味著穿著白大褂在實(shí)驗(yàn)室做實(shí)驗(yàn),其中免不了做一些失敗的試驗(yàn)。沒關(guān)系,因?yàn)槭〉脑囼?yàn)有時候也能帶來很多新發(fā)現(xiàn)。現(xiàn)在,哈佛大學(xué)正努力幫助科學(xué)家加速試驗(yàn)研究的速度,通過一個可以預(yù)測化學(xué)反應(yīng)成功率的機(jī)器學(xué)習(xí)算法,算法成功率超過了人類科學(xué)家。
算法分析了失敗實(shí)驗(yàn)的數(shù)據(jù)。通常,這些數(shù)據(jù)呆在實(shí)驗(yàn)室的電腦里,只有做原始實(shí)驗(yàn)的科學(xué)家才會接觸到這些數(shù)據(jù)。哈佛大學(xué)采取了另一種方法,將幾千個成功和失敗的數(shù)據(jù)數(shù)字化,創(chuàng)造了一個開放的巨大數(shù)據(jù)庫?;瘜W(xué)副教授JoshuaSchrier將每個實(shí)驗(yàn)的特性分解,研究員化學(xué)副教授AlexanderNorquist研究出了機(jī)器學(xué)習(xí)算法。
如《自然》雜志解釋道,團(tuán)隊(duì)專注在結(jié)晶反應(yīng),這種反應(yīng)需要將一組試劑在溶劑中混合并加熱。具體來說,這需要一種叫做釩亞硒酸鹽的材料,是鋁、硒和氧氣形成的化合物。研究員通過看筆記,基于多年的科研經(jīng)驗(yàn)預(yù)測了新的反應(yīng)結(jié)果。但是算法可以看得更加深入,發(fā)現(xiàn)數(shù)據(jù)背后人類科學(xué)家沒有看出來的模式。
在大約500個案例中,算法可以以89%的比例生成結(jié)晶。而研究員只有78%的成功率?!坝脵C(jī)器學(xué)習(xí)模型,不帶任何偏見地來審視這些沒有利用起來的數(shù)據(jù),可以帶來無價的預(yù)測幫助科學(xué)家。”哈佛化學(xué)及生物化學(xué)教授AlanAspuru-Guzik說。“尤其是數(shù)據(jù)中可以產(chǎn)生有實(shí)質(zhì)意義的關(guān)聯(lián)和預(yù)測,這能加速新材料的研究發(fā)現(xiàn)?!?/P>
這樣的思路還可能改變科學(xué)新發(fā)現(xiàn)的報(bào)導(dǎo)方式。目前,研究員經(jīng)常只針對能夠成功產(chǎn)生化合物的材料和過程發(fā)表論文,而各種失敗的數(shù)據(jù)則被忽略,埋沒在實(shí)驗(yàn)室的電腦硬盤里?!昂芸赡茉趯?shí)驗(yàn)開發(fā)和情景優(yōu)化的過程中,為了一次成功反應(yīng)需要做一百次反應(yīng)?!盢orquist解釋道,“我將這些失敗的反應(yīng)看做冰山在水面以下的部分——我們所見到的科研結(jié)果,只是冰山一角?!?/P>
團(tuán)隊(duì)的數(shù)據(jù)庫科研在DarkReactionProject項(xiàng)目網(wǎng)站(http://darkreactions.haverford.edu/)上獲得。團(tuán)隊(duì)希望,其他科學(xué)家科研可以來分享他們的失敗案例,從而不斷提升數(shù)據(jù)庫,以及機(jī)器學(xué)習(xí)的預(yù)測能力。
2025-07-13 08:45
2025-07-13 08:41
2025-07-13 08:40
2025-07-13 08:13
2025-07-13 07:58
2025-07-12 09:32
2025-07-12 09:30
2025-07-12 09:26
2025-07-12 09:20
2025-07-11 14:17