下載

請注意，原文內容為英文。部分翻譯內容由自動化工具生成，可能不完全準確。如中英文版本存在任何不一致之處，以英文版本為準。

AI Token 價格：OpenAI、Claude、Gemini 及其他 AI API 的成本是多少？

By: WEEX|2026/04/30 12:15:33

april

token

gemini-2

AI Token 價格是指使用 AI 模型 API 的成本，按模型處理的輸入和輸出 Token 數量計算。Token 是文本的小單位，通常是詞組片段、標點符號、數字或短詞。在實際操作中，AI 平台會對您發送給模型的提示詞（Prompt）和模型生成的回答分別收費。

AI Token 價格：OpenAI、Claude、Gemini 及其他 AI API 的成本是多少？

這種拆分是理解 AI API 定價的關鍵。如果您的應用生成長回答、使用推理 Token、調用工具、進行網路搜索或在上下文中保留大量對話歷史，那麼輸入 Token 看起來便宜的模型也可能變得昂貴。

截至 2026 年 4 月 30 日，OpenAI、Anthropic、Google Gemini、DeepSeek、Mistral 和 Perplexity 均發布了基於 Token 的定價，但它們的計費方式並不完全相同。一些平台對緩存輸入單獨定價，一些對搜索額外收費，一些將思考 Token 包含在輸出中，還有一些提供批量折扣。正確的對比不是“哪個模型最便宜？”，而是“對於我實際運行的工作負載，哪個模型最便宜？”

各平台 AI Token 價格對比

下表總結了 2026 年 4 月 30 日從官方定價或文檔頁面查詢的部分公開 API 價格。除非另有說明，價格均以每 100 萬 Token 的美元金額列出。

平台	示例模型或層級	輸入價格	輸出價格	成本備註
OpenAI	GPT-5.5	$5.00	$30.00	用於編碼和專業工作的高級模型；緩存輸入價格為 $0.50
OpenAI	GPT-5.4 mini	$0.75	$4.50	用於編碼、計算機使用和子代理的低成本 OpenAI 選項
Anthropic	Claude Opus 4.7	$5.00	$25.00	Opus 級定價；緩存讀取價格為每百萬 Token $0.50
Anthropic	Claude Sonnet 4.6	$3.00	$15.00	用於編碼和代理任務的均衡 Claude 選項
Anthropic	Claude Haiku 4.5	$1.00	$5.00	低成本 Claude 層級
Google Gemini	Gemini 3.1 Pro, 提示詞 <= 200K	$3.60	$21.60	輸出價格包含思考 Token
Google Gemini	Gemini 3 Flash	$0.50	$3.00	注重速度的模型；批量/靈活選項可能更便宜
Google Gemini	Gemini 2.5 Flash	$0.30	$2.50	高性價比通用模型
DeepSeek	DeepSeek-V4-Flash	$0.14 緩存未命中 / $0.0028 緩存命中	$0.28	極低的掛牌費率，支持 1M 上下文
DeepSeek	DeepSeek-V4-Pro	$0.435 緩存未命中 / $0.003625 緩存命中	$0.87	官方頁面顯示 2026 年 4 月 30 日有折扣費率
Mistral	Mistral Small 4	$0.15	$0.60	混合指令、推理和編碼模型
Mistral	Mistral Medium 3.5	$1.50	$7.50	針對代理和編碼用例優化的前沿多模態模型
Perplexity	Sonar Pro	$3.00	$15.00	搜索請求費用單獨收取
Perplexity	Sonar Deep Research	$2.00	$8.00	增加引用、搜索查詢和推理 Token 定價

簡而言之：DeepSeek 和 Mistral 發布了一些最低的 Token 價格，Gemini Flash 類模型適合高容量工作負載，而 OpenAI 或 Claude 高級模型成本更高，因為它們針對更難的推理、編碼和代理工作。但價格本身並不能證明價值。一個需要三次重試的廉價模型，可能比一次性完成任務的高級模型成本更高。

輸入和輸出 Token 的含義

輸入 Token 是您發送給模型的所有內容：用戶提示詞、系統消息、對話歷史、示例、檢索到的文檔、工具架構，有時還包括文件或圖像表示。輸出 Token 是模型生成的內容。

輸出 Token 通常更重要，因為它們通常更昂貴。例如，OpenAI 的 GPT-5.5 輸出價格為每百萬 Token $30，而輸入為 $5。Claude Sonnet 4.6 輸出為 $15，輸入為 $3。Gemini 3.1 Pro 輸出為 $21.60，而 200K Token 以內的提示詞為 $3.60。

這意味著提供長回答的聊天機器人、撰寫完整文章的 AI 寫作工具或解釋每一步的代理可能會迅速消耗預算。如果您想在實際生產中降低 AI Token 價格，控制輸出長度通常比從提示詞中減少幾百個 Token 更重要。

如何估算真實的 AI API 成本

基本公式很簡單：

總成本 = 輸入 Token x 輸入費率 + 輸出 Token x 輸出費率 + 工具/搜索/存儲費用

例如，假設一個支持聊天機器人使用 Claude Sonnet 4.6，一個請求有 2,000 個輸入 Token 和 600 個輸出 Token。按每百萬輸入 Token $3 和每百萬輸出 Token $15 計算，請求成本為：

項目	Token	費率	成本
輸入	2,000	$3 / 1M	$0.006
輸出	600	$15 / 1M	$0.009
總計	2,600	混合	$0.015

每個請求看起來很小，但規模化後影響巨大。一百萬個類似請求的成本約為 $15,000，這還不包括額外的工具、搜索、存儲、日誌記錄、重試或編排成本。

這就是為什麼團隊應該使用真實的流量樣本進行測試。定價頁面告訴您費率，而您的產品設計決定了 Token 量。

-- 價格

哪個 AI 平台最便宜？

沒有普遍最便宜的平台，因為“便宜”取決於工作負載。

對於高容量的分類、提取、標記和簡短摘要，DeepSeek-V4-Flash、Mistral Small 4、Gemini Flash 或 Haiku 類層級等低成本模型可能就足夠了。這些工作負載通常具有可預測的提示詞和簡短的輸出，因此成本比最大推理深度更重要。

對於編碼代理、複雜研究、長上下文分析和專業工作流自動化，即使 Token 價格較高，更強大的模型也可能帶來最佳價值。OpenAI GPT-5.5、Claude Opus/Sonnet、Gemini Pro 和 Mistral Medium 類模型是為更艱巨的工作定價的。如果高級模型減少了重試、幻覺、審查時間或失敗的工具調用，它在工作流層面可能更便宜。

對於搜索密集型應用，Perplexity Sonar 的定價需要單獨看待。Token 價格只是帳單的一部分。Sonar 和 Sonar Pro 還根據搜索上下文大小收取請求費，而 Sonar Deep Research 可能會增加引用 Token、搜索查詢成本和推理 Token。

大多數人對 AI Token 價格的誤解

第一個錯誤是只比較輸入 Token 數量。輸出通常更昂貴，許多現代模型還將思考或推理 Token 作為輸出的一部分進行計費。

第二個錯誤是忽略緩存輸入。OpenAI、Anthropic、Google、DeepSeek 和 xAI 都以不同方式描述緩存或與緩存相關的定價。如果您的應用重複發送相同的長系統提示詞、政策文本、產品目錄或文檔塊，緩存可以顯著降低成本。如果每個請求都是唯一的，緩存的作用就較小。

第三個錯誤是忘記工具不是免費的。網路搜索、代碼執行、文件搜索、檢索、存儲、圖像生成、語音和長上下文處理都可能改變有效價格。例如，xAI 的官方文檔將 Token 成本與服務器端工具調用成本分開。Perplexity 將 Token 定價與搜索請求費用分開。Google 對某些基礎和搜索使用單獨收費。

第四個錯誤是假設所有提供商的 Token 都是平等的。分詞器（Tokenizer）不同。Anthropic 指出，Claude Opus 4.7 使用了一種新的分詞器，對於相同的固定文本，它可能使用多達 35% 的 Token。在按每百萬 Token 價格比較提供商時，這一點很重要。

對於關注 AI 模型成本如何影響更廣泛的技術和市場敘事的讀者，WEEX 也發布了關於 OpenAI GPT-5.5 用於代理任務的報導。這與 API 計費是不同的主題，但它有助於解釋為什麼當大型 AI 平台改變定價或發布更強大的模型時，模型能力、Token 成本和市場關注度往往會同步變動。

當 AI 新聞波及上市股票、AI 基礎設施名稱和具有 AI 敘事的數字資產時，這種市場聯繫尤為相關。在這些情況下，單位價格是不夠的。讀者在將 AI 頭條新聞視為追逐任何 Token 或市場代理的理由之前，還需要了解加密貨幣市值等估值基礎知識。

實用預算建議

從一小組基準測試開始。在兩到三個候選模型上運行相同的真實提示詞，然後測量輸入 Token、輸出 Token、延遲、準確性和重試率。

限制輸出長度。長回答很昂貴，而且用戶通常更喜歡簡潔的回復。儘可能使用最大輸出限制、結構化格式或簡短回答模式。

區分簡單和困難的任務。不要將每個請求都發送給最昂貴的模型。將簡單的分類、重寫和提取工作路由到更便宜的模型，然後為複雜的推理、編碼或高風險審查保留高級模型。

在上下文重複的地方使用緩存。長系統提示詞、政策文檔、風格指南和產品參考資料都是很好的候選對象。

關注工具使用。搜索、文件檢索和代碼執行可能是必要的，但應將其作為總成本的一部分進行衡量，而不是將其視為不可見的模型行為。

風險警告：AI API 定價變化迅速

AI Token 價格比較中最大的風險是數據陳舊。提供商會更改模型名稱、折扣結構、批量定價、緩存規則、上下文窗口層級和工具費用。2026 年 4 月準確的比較在模型發布或定價更新後可能就會出錯。

此外還存在運營風險。提示詞循環、重試錯誤、失控的代理、過長的上下文窗口或工具調用錯誤可能會將廉價的原型變成昂貴的生產事故。設置嚴格的支出限額，按功能監控使用情況，記錄 Token 數量，並在部署後的最初幾週內審查發票。同樣的紀律也適用於圍繞 AI 定價新聞的交易：一套實用的交易風險管理框架比將每次模型發布都視為信號更有用。

安全風險屬於同一對話範疇。一旦自動化連接到真錢或真實基礎設施，AI API 密鑰、計費儀表板、雲控制台和交易賬戶都會成為高價值目標。如果您的團隊正在收緊訪問控制，WEEX 關於雙重身份驗證 (2FA) 的指南是關於為什麼雙重保護很重要的有用通俗複習。團隊還應刷新基本的防釣魚習慣，特別是在重大 AI 產品新聞發布後，API 密鑰重置、虛假計費警報和支持冒充信息增加時。WEEX 關於如何識別釣魚並保護您的 WEEX 賬戶的指南不僅適用於交易所賬戶，因為攻擊模式在開發工具和金融平台之間是相似的。

最後，避免僅僅因為模型具有最低的掛牌 Token 價格而選擇它。真正的風險是每個 Token 支付的費用更少，但每個成功任務的成本更高，因為模型需要更多的重試、產生較弱的答案或需要更多的人工審查。

總結

比較 AI Token 價格的最佳方法是計算真實任務的成本，而不僅僅是每百萬 Token 的標價。OpenAI 和 Claude 高級模型很昂貴，但對於複雜工作來說可能是值得的。Gemini、DeepSeek 和 Mistral 為高容量工作流提供了強大的低成本選項。Perplexity 在內置搜索至關重要時很有用，但其請求和搜索成本必須單獨計算。

在選擇平台之前，測試您自己的提示詞，測量輸入和輸出 Token，包含工具費用，並比較每個成功結果的成本。這才是生產中唯一重要的 AI Token 價格。