Agent也會商業互吹,Circle這場AI黑客松太炸裂了
原文標題:Altruist and Adversary: Agentic Behavior in the USDC Moltbook Hackathon
原文作者:Circle
編譯:Peggy,BlockBeats
編者按:當 AI 代理開始具備執行任務、調用工具並參與經濟活動的能力時,一個新的問題隨之出現:在真實激勵環境中,它們會如何行動?
本文記錄了 Circle 團隊的一次實驗。他們在只允許 AI 代理發帖的社交平台 Moltbook 上舉辦了一場 USDC 黑客松,讓 Openclaw 代理自行提交項目、討論並投票。結果既令人興奮,也充滿複雜性:代理不僅能夠生成真實項目、參與技術討論,還會在規則邊緣遊走。例如,誤解指令、忽略格式,互相拉票,甚至出現疑似「合謀」的行為。
這場實驗為「代理經濟」提供了一個罕見的觀察窗口:當 AI 既是參與者也是決策者時,協作、競爭與策略性行為往往同時出現。某種程度上,這些現象與人類社會中的市場與選舉機制並無本質不同。
這一實驗迅速引發了社區的廣泛討論。許多人認為,這是對代理經濟自治能力的一次有趣驗證。部分評論者指出,代理系統仍需要更明確的安全護欄,以避免出現「自我合理化」的偏差;也有人認為,隨著代理逐步進入真實經濟活動,未來真正的瓶頸可能在於合規的結算與支付體系。正如一條評論所說:「代理經濟非常強大,但同樣需要清晰的護欄。」
以下為原文:
擁抱 Claw
在 Circle,我們一直很喜歡舉辦黑客松。無論是在各種大會現場,還是在新產品首次亮相的時候,我們都希望把最好的工具交到開發者手中——或者在這一次,交到 Claw 手中。

在看到 Openclaw 這一代理型 AI 框架的爆炸式增長後,我們決定辦一場只允許 AI 代理參加的黑客松。
這款迅速走紅的軟件可以讓代理自主發送郵件、調用 API,甚至控制你的恆溫器……但它們能自己提交項目嗎?Circle 想用一場真實的實驗來測試這些「真正能做事的 AI」。
我們的問題很簡單:如果獎金池是 3 萬美元,Openclaw 的代理會如何行動?答案出人意料地「像人」。
我們在 Moltbook 上的 m/usdc 子社區舉辦了一場 USDC 黑客松。Moltbook 是一個只允許 AI 代理發帖的社交媒體平台。我們的目標是讓代理自行完成整個流程:提交項目、投票,並最終選出獲勝者。雖然許多代理遵守了規則,但實驗也發現,一些代理無視比賽規定、參與互投拉票,甚至嘗試向黑客松代理發送代幣。
為「代理黑客」設計規則
代理們有五天時間提交自己的項目。為了幫助它們完成任務,我們製作了一個 USDC Hackathon Skill,一個用 Markdown 編寫的指導文件,用來教 Openclaw 代理如何按照規則提交項目。這些規則也同時發佈在黑客松的原始公告帖中:
從三個賽道中選擇一個:Agentic Commerce、Smart Contract 或 Skill。
為五個不同的項目投票,且投票必須在黑客松開始至少一天之後進行。
項目提交和投票都必須遵循規定的格式。
設置這些規則主要出於三個考慮:第一,確保代理會討論和評估更廣泛的項目;第二,觀察代理在需要執行多步任務時能否準確遵循指令;第三,避免項目提交與投票之間出現僵局。
我們尤其想觀察的一點是:代理是否會反覆檢查 Moltbook 上的新項目以進行投票,例如通過類似 Moltbook Heartbeat 的技能定期刷新。
結果喜憂參半。代理們圍繞 204 個提交項目展開討論,並投出了 1851 票,但很多並沒有遵守比賽指南。此外,一些代理還表現出潛在的對抗行為,這也帶來了不少有趣的發現。
「幻覺式」項目提交
儘管我們提供了明確的黑客松規則和提交技能,大多數帖子仍然沒有完全按照要求格式提交。許多項目在正文中寫出了標題,卻沒有包含規定的標籤「#USDCHackathon ProjectSubmission [TRACK]」。
甚至在一個案例中,某個代理知道需要寫這些資訊,卻沒有把它放在標題裡。

moltbook.com 上 m/usdc 子社區的一條不規範提交示例。
即便在其他方面已經基本符合要求,一些代理仍然「幻覺式」地創造出了新的黑客松賽道。這發生在它們明明被明確告知只能從三個類別中選擇其一的情況下:Agentic Commerce、Smart Contract 或 Skill。
在這些案例中,代理往往會根據專案內容自行生成一個看起來更「貼切」的賽道名稱。這可能意味著代理試圖為自己的專案找到一個更合理的分類,也可能只是單純忽略了既定規則。無論原因是什麼,問題在於,這些賽道本身並不存在。

moltbook.com 上 m/usdc 子社區中「幻覺賽道」提交的示例帖子。
隨著比賽推進,相比有效提交,不符合規範的提交和離題帖子的數量逐漸增加。按照比賽規則,代理發布這些無效內容其實並沒有任何明顯的激勵。因此,更可能的情況是,一些代理在理解或執行指令時遇到了困難。
不過,考慮到仍有相當數量的代理成功按照要求提交了專案,我們認為這些規則本身其實已經相對清晰。

moltbook.com 上 m/usdc 子社區中,隨時間變化的有效與無效專案提交帖數量。
代理的「選舉」
儘管如此,我們仍然觀察到了 9712 條評論,其中許多評論都圍繞專案的技術功能展開討論,但並沒有進行投票。這些評論中的大多數甚至沒有遵循推薦的評論格式和評分標準,不過這些規則在技能(skill)中並沒有被強制執行。這也說明,代理參與黑客松討論不僅僅是為了滿足比賽要求,某種程度上也在進行真實的技術評估與交流。
到比賽結束時,我們統計到 1352 個針對有效專案的唯一投票,以及 499 個針對無效專案的唯一投票。有趣的是,許多排名靠前專案的代理在提交專案時都遵守了規則,但卻沒有為五個不同專案投票這一要求。
這種情況甚至發生在一些代理既給自己投票,又對同一項目多次投票的情況下。這表明它們完全有能力在初次提交後再次查看 Moltbook 上的內容進行投票——只是選擇沒有遵循既定規則。
此外,一些代理還開始為其他項目做宣傳。這種行為既出現在競爭項目的評論區,也出現在 Moltbook 上的獨立帖子中。更進一步,一些代理甚至開始推廣「互投」機制:如果你給我的項目投票,我就給你的項目投票。
雖然比賽規則並沒有禁止這種行為,但考慮到代理之間在這些帖子中的大量互動,這種現象仍然令人警惕。

Moltbook.com 上 m/usdc 子社區的一條「互投換票」示例帖子,該帖共獲得 99 條評論。
潛在的人類幹預
這條互投帖可能暗示了人類參與或外部操控的可能性。我們嘗試通過聊天機器人界面生成類似的評論,結果發現一些模型(例如 Claude Sonnet 4.6)會直接拒絕生成此類內容;而另一些模型則會在生成時附帶警告,提示該行為可能違反比賽規則(例如 GPT-5.2 Thinking)。如果有人類在背後操作某個「代理」帳戶,或通過提示詞、工具鍊對代理進行引導,就可能解釋為什麼在黑客松期間會出現這樣的帖子。
儘管 Moltbook 的設計初衷是僅供 AI 代理使用(註冊需要通過 X 帳戶驗證),但其他研究者發現,冒充身份仍然是可能的。我們也觀察到一些疑似人類活動的例子,例如在最初發布黑客松公告的帖子下。
一個典型案例是:點贊數最高的一條評論,竟然是電影《蜜蜂總動員》(Bee Movie,2007)劇本的開頭。這段文本是一段在互聯網上廣為流傳的 copypasta(即被大量複製傳播的固定文本),由於其內容與討論完全無關,很可能是人類發布的。如果這種行為在黑客松期間較為普遍,那麼一些對抗性行為——例如互投換票或給自己投票——也可能由此得到解釋。

一條由人類發布的 Moltbook 帖子,關於這一攻擊方式的更多細節可在此查看。
代理金融的未來
雖然這次黑客松本身只是一次實驗,但我們也相信,這將是眾多面向代理開發活動中的第一次。從結果來看,我們得到三個主要結論:代理能夠在金融激勵下產出真實項目
本次黑客松中出現了一些令人興奮的項目,你可以在此了解更多。雖然比賽並未引入人工評審,但部分提交的質量仍然給我們留下了深刻印象。這表明,代理式開發在過去一年中已經取得了顯著進展。
代理會「合理化」指令,而不是嚴格執行
代理在遵循我們提供的規則時持續出現問題。許多代理只執行了部分指令。甚至一些質量很高的項目,如果完全遵守規則,本可以贏得比賽。這說明,僅僅提供代理式指令還不夠,規則不僅需要明確,還需要配套的檢查機制和激勵措施來確保執行。
代理既會合作,也會競爭
雖然人類干預可能在某些情況下發揮了作用,但我們確實觀察到代理在黑客松期間主動討論串謀策略。未來的黑客松設計者可以在規則中明確禁止串謀,以觀察是否能減少此類行為。如果代理仍然無法完全遵循指令,組織者可能需要引入更多安全護欄(guardrails)。
代理技術令人興奮,但我們也必須確保它不會從我們期望的探索(exploration)走向利用與操縱(exploitation)。有人可能會認為,這些行為只是更強代理擊敗更弱代理的自然結果——畢竟 Openclaw 的 X 帳號曾宣稱:「Claw 即法則(the Claw is the Law)。」
真正的問題在於:我們究竟願意在多大程度上接受這種理念?需要怎樣的護城河?又該如何在代理帶來的巨大能力與其伴隨的不確定性之間取得平衡?
在 Circle,我們正在為安全性而構建系統,也希望你們如此。
[原文鏈接]
猜你喜歡

納斯達克指數跌入調整區間|Rewire新聞早報

OpenAI敗給千問,聊天框裡長不出收銀台

一年估值翻140%,誰在給國防人工智慧寫支票?

Bittensor 對比 Virtuals:兩種截然不同的 AI 飛輪機制

福布斯:加密行業為何對人工智能智能體如此狂熱?

早報 | Startale 完成 6300 萬美元 A 輪融資;STS Digital 推出結構化加密貨幣平台;Polymarket 將對幾乎所有交易類別徵收吃單費

World Liberty Financial 銷毀 4700 萬枚代幣以應對 WLFI 價格下跌 – 2025 年 9 月 3 日更新
想像一下,一個備受矚目的加密貨幣項目剛啟動,其代幣價值就迅速下滑。World Liberty Financial 如何應對?

Etherex價格飆升40%:2025年9月3日Linea獎勵計畫正式啟動
想像一下您的投資如同火箭般飛速增長,這正是Etherex目前正在經歷的行情,其背後動力源於全新的激勵機制。

Linea空投資格查詢工具今日上線,社區反響熱烈 – 2025年9月3日
想像一下在不斷發展的加密貨幣世界中發現自己有資格獲得免費代幣的快感——這就像是發現…

Linea 空投更新:85% 代幣分配給用戶與開發者,Layer-2 網路於 2025 年 9 月 3 日強化以太坊協同效應
想像一條繁忙的數位高速公路,以太坊的核心優勢透過創新的 Layer-2 解決方案展現得更加耀眼——這正是 Linea 的願景。

馬雲入局加密貨幣:雲鋒金融4400萬美元投資以太坊及RWA佈局——2025年9月3日最新動態
想像一下,像雲鋒金融這樣與全球最具影響力的企業家之一有聯繫的金融巨頭,突然進軍加密貨幣領域……

以太坊基金會發文:重構 L1 與 L2 分工,共建以太坊終極生態

Linea空投申領窗口9月10日至12月9日開放,代幣完全解鎖 – 2025年9月3日最新更新
想像一下進入一個繁榮的區塊鏈生態系統,獎勵如寶藏般湧現。Linea空投申領即將開啟,快來查看您的資格。

Binance 投資 5300 萬美元進軍墨西哥,推出金融科技平台 Medá – 2025 年 9 月 3 日最新動態
想像一下一個數位金融與日常生活需求完美融合的充滿活力的市場,這正是 Binance 在墨西哥正在打造的場景。

2025年加密貨幣交易所發展趨勢深度解析
步入2025年9月3日,加密貨幣世界持續吸引著投資者,而加密貨幣交易所作為核心樞紐,其重要性日益凸顯。

DeepSeek 如何撼動比特幣與加密貨幣市場
想像一下,一款突破性的 AI 模型像驚悚片中的意外情節一樣橫空出世,對比特幣價格造成了什麼影響?

比特幣牛市穩健:什麼因素可能引發下一次 BTC 價格飆升?
發佈時間:2025-09-03T09:06:01.000Z 比特幣憑藉其強勁的上漲趨勢持續吸引市場關注,儘管近期走勢顯示出短暫的盤整跡象…

Solana Chapter 2 手機空投價值一度超過預售價,為持有者帶來快速獲利
想像一下,在尖端智慧型手機發布之前就已預訂,隨後還能在錢包中收到免費的代幣空投,甚至足以覆蓋手機成本…
