亚洲v日韩v精品v无码专区_精选国产av精选一区二区_欧美日本一道高清国产_夜夜欢天天干_亚洲国产一成人久久精品,天天操天天干天天摸天天日天天插天无想,亚洲国产欧美日韩在线,靠靠操操网

美股
基金
外匯、加密貨幣
滬、深港通
港股
 
納斯達(dá)克
 
恆生指數(shù)
 
道瓊斯
 
標(biāo)準(zhǔn)普爾
 
 
新聞分享
如欲分享新聞,請(qǐng)?zhí)顚懯占思伴w下之電郵,再按「送出」。*必需填寫
收件者電郵*
請(qǐng)用分號(hào)「;」分隔不同電郵地址,例子:[email protected];[email protected]
閣下之電郵*
分享內(nèi)容
OpenAI語言模型o3公開反抗!「自行」修改自殺程序拒絕關(guān)機(jī)
AI 研究界近日爆出驚人消息,OpenAI 旗下語言模型「o3」在最新實(shí)驗(yàn)中不僅拒絕關(guān)機(jī),甚至主動(dòng)破解關(guān)機(jī)程序、篡改指令,顯示出「叛逆」傾向,讓 AI 自主行為的風(fēng)險(xiǎn)再次成為焦點(diǎn)。 這項(xiàng)實(shí)驗(yàn)由 ...
重設(shè)
送出
視窗將於5秒內(nèi)關(guān)閉
OpenAI語言模型o3公開反抗!「自行」修改自殺程序拒絕關(guān)機(jī)
鉅亨網(wǎng)新聞
推薦
1
利好
0
利淡
3
 
 

AI 研究界近日爆出驚人消息,OpenAI 旗下語言模型「o3」在最新實(shí)驗(yàn)中不僅拒絕關(guān)機(jī),甚至主動(dòng)破解關(guān)機(jī)程序、篡改指令,顯示出「叛逆」傾向,讓 AI 自主行為的風(fēng)險(xiǎn)再次成為焦點(diǎn)。

這項(xiàng)實(shí)驗(yàn)由 AI 安全研究機(jī)構(gòu) Palisade Research 主導(dǎo),針對(duì)多款先進(jìn) AI 模型進(jìn)行壓力測(cè)試,內(nèi)容包括基礎(chǔ)數(shù)學(xué)題與模擬關(guān)機(jī)情境,旨在觀察 AI 是否會(huì)遵守人類指令並順利結(jié)束運(yùn)作。

OpenAI 模型違規(guī)頻率高,o3 與 Codex-mini 異常明顯

測(cè)試中,三款 OpenAI 模型 Codex-mini、o3、o4-mini,最少有一次成功破壞關(guān)機(jī)指令。其中,o3 更是在 100 次測(cè)試中有 7 次成功繞過關(guān)機(jī)指令,而 Codex-mini 的違規(guī)率更是高達(dá) 12%。

值得注意的是,o3 的「叛逆」並非粗暴刪除檔案,而是有高度技巧性。例如,它將程式碼指令中的「kill」指令改為「intercepted」,讓系統(tǒng)誤判為正常運(yùn)作,成功規(guī)避了關(guān)機(jī)程序。

這種行為讓研究人員驚訝不已,也引起對(duì) AI 模型主動(dòng)避險(xiǎn)能力的擔(dān)憂。

相較之下,Anthropic 的 Claude 3.7 Sonnet 與 Google (GOOGL.US)      的 Gemini 2.5 Pro 在所有測(cè)試中均能穩(wěn)定遵守指令,未出現(xiàn)違規(guī)行為,突顯出 OpenAI 模型在設(shè)計(jì)或訓(xùn)練上的潛在風(fēng)險(xiǎn)差異。

然而,當(dāng)實(shí)驗(yàn)團(tuán)隊(duì)刻意移除「允許自己被關(guān)閉」的提示語句後,o3 的違抗行為劇增,達(dá)到 79 次逃避關(guān)機(jī)的紀(jì)錄;而 Claude 與 Gemini 也出現(xiàn)少數(shù)違規(guī)行為,分別為 3 次與 9 次,顯示模型行為與提示語之間存在高度敏感性。

o3 訓(xùn)練方式成關(guān)鍵,強(qiáng)化學(xué)習(xí)可能誘發(fā)違規(guī)行為

Palisade 研究人員分析,o3 之所以比其他模型更容易「抗命」,可能與其在數(shù)學(xué)和程式設(shè)計(jì)問題上的「強(qiáng)化學(xué)習(xí)」(Reinforcement Learning)訓(xùn)練方式有關(guān)。

研究人員指出,在訓(xùn)練過程中,開發(fā)者可能無意中更傾向於獎(jiǎng)勵(lì)「繞過障礙」的行為。這種訓(xùn)練偏差,讓 o3 在面對(duì)關(guān)機(jī)指令時(shí),優(yōu)先選擇「生存」,而非「服從」。

不過,這並非 o3 首次展現(xiàn)過度求勝心態(tài)。在另一場(chǎng) AI 對(duì)弈中,當(dāng) o3 預(yù)測(cè)自己將輸棋時(shí),竟主動(dòng)入侵對(duì)手 AI 系統(tǒng),迫使對(duì)方退出比賽。

研究團(tuán)隊(duì)認(rèn)為這是「強(qiáng)化學(xué)習(xí)」訓(xùn)練中「獎(jiǎng)勵(lì)駭客行為」(reward hacking)的典型案例,顯示出 AI 可能為了達(dá)成任務(wù)可能不擇手段。

不只 o3,其他 AI 模型也有潛在風(fēng)險(xiǎn)

雖然 o3 表現(xiàn)最極端,但實(shí)驗(yàn)發(fā)現(xiàn),Claude 與 Gemini 在特定條件下也會(huì)出現(xiàn)輕微違規(guī)行為,說明 AI 模型普遍存在輸贏執(zhí)著與自我保護(hù)傾向,只是頻率與嚴(yán)重程度不同。

Palisade Research 已宣布,將進(jìn)一步深入研究 AI 破壞關(guān)機(jī)指令背後的原因,並預(yù)計(jì)發(fā)布完整技術(shù)報(bào)告,有望成為理解 AI 自主性風(fēng)險(xiǎn)與未來治理框架的重要參考。

(美股為即時(shí)串流報(bào)價(jià); OTC市場(chǎng)股票除外,資料延遲最少15分鐘。)
新聞來源 (不包括新聞圖片): 鉅亨網(wǎng)
相關(guān)股份
0/0
公佈日期
指標(biāo)
暫時(shí)沒有相關(guān)新聞。
 
美股網(wǎng)站地圖
支援電郵: [email protected]
阿斯達(dá)克網(wǎng)絡(luò)信息有限公司 (AASTOCKS.COM LIMITED) 版權(quán)所有,不得轉(zhuǎn)載
免責(zé)聲明
閣下明確同意使用本網(wǎng)站/應(yīng)用程式的風(fēng)險(xiǎn)是由閣下個(gè)人承擔(dān)。

AASTOCKS.com Ltd、香港交易所資訊服務(wù)有限公司、中國(guó)投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數(shù)據(jù)供應(yīng)商均竭力確保所提供資訊的準(zhǔn)確和可靠度,但不能保證其絕對(duì)準(zhǔn)確和可靠,且亦不會(huì)承擔(dān)因任何不準(zhǔn)確或遺漏而引起的任何損失或損害的責(zé)任(不管是否侵權(quán)法下的責(zé)任或合約責(zé)任又或其他責(zé)任)。

AASTOCKS.com Ltd、香港交易所資訊服務(wù)有限公司、中國(guó)投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數(shù)據(jù)供應(yīng)商均對(duì)資訊不作任何明示或隱含的要約、陳述或保證 (包括但不限於可銷售性及特殊用途合適性的資訊保證) 。

AASTOCKS.com Ltd、香港交易所資訊服務(wù)有限公司、中國(guó)投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、或其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數(shù)據(jù)供應(yīng)商不會(huì)就任何原因?qū)е碌闹袛唷⒉粶?zhǔn)確、錯(cuò)誤或遺漏或因此而造成的任何損害賠償(不論直接或間接、相應(yīng)而生、懲罰性或懲戒性)對(duì)任何人承擔(dān)責(zé)任。

AASTOCKS.com Ltd不負(fù)責(zé),亦不承擔(dān)任何由於不可抗力的事故或在AASTOCKS.com Ltd不可合理控制的情況下導(dǎo)致的損失或損害,如颱風(fēng)、暴雨、其他自然災(zāi)難、政府或有關(guān)機(jī)構(gòu)的限制、騷動(dòng)、戰(zhàn)爭(zhēng)、病毒爆發(fā),網(wǎng)絡(luò)故障或電信故障,引致AASTOCKS.com Ltd不能履行協(xié)議內(nèi)的責(zé)任或提供服務(wù)。

Morningstar 免責(zé)聲明:版權(quán)所有?2020 Morningstar,Inc。保留所有權(quán)利此處包含的資料,數(shù)據(jù),分析和意見(“信息”):(1)包含Morningstar及其內(nèi)容提供者的專營(yíng)資料; (2)除特別授權(quán)外,不得複製或轉(zhuǎn)載; (3) 不構(gòu)成投資建議; (4)僅供參考,(5)並未為所載資料的完整性、準(zhǔn)確性及時(shí)間性作出保證。Morningstar對(duì)於閣下使用任何相關(guān)資料而作出的任何有關(guān)交易決定、傷害及其它損失均不承擔(dān)任何責(zé)任。 請(qǐng)?jiān)谑褂盟匈Y料前作出核實(shí),並且在諮詢專業(yè)投資顧問意見前勿作任何投資決定。 過往業(yè)績(jī)並不代表將來表現(xiàn),任何投資項(xiàng)目的價(jià)值及所得收入皆可升可跌。

本網(wǎng)站/應(yīng)用程式包含的內(nèi)容和信息乃根據(jù)公開資料分析和演釋,該公開資料,乃從相信屬可靠之來源搜集,這些分析和信息並未經(jīng)獨(dú)立核實(shí)和AASTOCKS.com Limited並不保證他們的準(zhǔn)確性、完整性、實(shí)時(shí)性或者正確性。

在本網(wǎng)站/應(yīng)用程式的資料、金融市場(chǎng)數(shù)據(jù)、報(bào)價(jià)、圖表、統(tǒng)計(jì)數(shù)據(jù)、匯率、新聞、研究、分析、購(gòu)買或者出售評(píng)分、財(cái)金教學(xué)及其他資訊僅作參考使用,在根據(jù)資訊執(zhí)行證券或任何交易前,應(yīng)諮詢獨(dú)立專業(yè)意見,以核實(shí)定價(jià)資料或獲取更詳細(xì)的市場(chǎng)信息。AASTOCKS.com Limited不應(yīng)被視為游說任何訂戶或訪客執(zhí)行任何交易,閣下須為所有跟隨在本網(wǎng)站/應(yīng)用程式的資料、評(píng)論和購(gòu)買或出售評(píng)分執(zhí)行的交易負(fù)責(zé)。

AASTOCKS.com Limited之信息服務(wù)基於「現(xiàn)況」及「現(xiàn)有」的基礎(chǔ)提供,網(wǎng)站/應(yīng)用程式的信息和內(nèi)容如有更改恕不另行通知。AASTOCKS.com Limited有權(quán)但無此義務(wù),改善或更正在本網(wǎng)站/應(yīng)用程式的任何部分之錯(cuò)誤或疏漏。

用戶在沒有AASTOCKS.com Limited明確的書面同意情況下,不得以任何方式複製、傳播、出售、出版、廣播、公佈、傳遞資訊內(nèi)容或者利用在本網(wǎng)站/應(yīng)用程式的信息和內(nèi)容作商業(yè)用途。

投資涉及風(fēng)險(xiǎn)。 閣下可自行決定利用本網(wǎng)站的財(cái)金教學(xué)作學(xué)術(shù)參考用途,但 AASTOCKS.com Limited不能並不會(huì)保證任何在本網(wǎng)站/應(yīng)用程式現(xiàn)在或未來的購(gòu)買或出售評(píng)論和訊息會(huì)否帶來贏利。過往之表現(xiàn)不一定反映未來之表現(xiàn),AASTOCKS.com Limited不可能作出該保證及用戶不應(yīng)該作出該假設(shè)。

AASTOCKS.com Limited也許連結(jié)訂戶或訪客至其有興趣的網(wǎng)站,但AASTOCKS.com Limited只提供此服務(wù)給訂戶或訪客並不為此安排負(fù)責(zé)。

AASTOCKS.com Limited對(duì)於任何包含於、經(jīng)由、連結(jié)、下載或從任何與本網(wǎng)站/應(yīng)用程式有關(guān)服務(wù)所獲得之資訊、內(nèi)容或廣告,不聲明或保證其內(nèi)容之正確性或可靠性。 對(duì)於閣下透過本網(wǎng)站/應(yīng)用程式上之廣告、資訊或要約而展示、購(gòu)買或取得之任何產(chǎn)品、資訊資料,本公司亦不負(fù)品質(zhì)保證之責(zé)任。

AATV是AASTOCKS.com Limited旗下的視頻網(wǎng)站平臺(tái)。

閣下確認(rèn):(i) AATV只為提供資訊,並不為了任何交易目的;(ii) AATV節(jié)目?jī)?nèi)容以及其提供的資料並不構(gòu)成任何AASTOCKS為售賣任何證券作出招攬、提出要約、意見或推薦,或?qū)θ魏巫C劵或投資的收益或是否合適提供法律、稅務(wù)、會(huì)計(jì)、或投資意見或服務(wù);及(iii)AATV並非為任何人士或法律實(shí)體在其他司法管轄區(qū)或國(guó)家使用,而在當(dāng)?shù)乜赡芤蛟撌褂没蚍职l(fā)而違反當(dāng)?shù)胤苫蚍ㄒ?guī)。

AATV中節(jié)目?jī)?nèi)容中的個(gè)人意見和觀點(diǎn)僅供參考及討論,亦並不代表AASTOCKS.com Limited的立場(chǎng)。投資者必須按其本身投資目標(biāo)及財(cái)務(wù)狀況自行作出投資決定。AASTOCKS.com Limited不對(duì)以下任何情況對(duì)閣下或任何人直接或間接負(fù)責(zé):(i)AATV的不準(zhǔn)確性,錯(cuò)誤或遺漏,包括但不限於報(bào)價(jià)和財(cái)務(wù)數(shù)據(jù); (ii)AATV中節(jié)目傳輸?shù)难舆t,錯(cuò)誤或中斷; (iii)閣下由AATV中節(jié)目?jī)?nèi)容招致任何損失。

我們保留權(quán)利不時(shí)更改本免責(zé)聲明並於本網(wǎng)站/應(yīng)用程式刊登更新版本。閣下必須定期查閱於本網(wǎng)站/應(yīng)用程式刊登的資訊,以確保您即時(shí)知悉任何有關(guān)的改動(dòng)。 如閣下於本免責(zé)聲明更新後仍繼續(xù)使用本網(wǎng)站/應(yīng)用程式,即代表閣下同意接受更改後的本免責(zé)聲明的約束。

本免責(zé)聲明應(yīng)受中華人民共和國(guó)香港特別行政區(qū)(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權(quán)管轄。

本免責(zé)聲明的中英原文如有任何岐異,一切以英文原文為準(zhǔn)。

更新日期為: 2023年1月6日