Giới hạn 3 lời chào, giới hạn mã Claude của bạn đâu rồi? Lỗi bộ nhớ đệm 28 ngày, và phản hồi chính thức khuyến khích bạn "sử dụng nó một cách tiết kiệm".

By: blockbeats|2026/04/03 13:18:46

Chia sẻ

4-17%. Đây là tỷ lệ truy cập bộ nhớ cache nhanh cho Claude Code trong tháng vừa qua. Mức bình thường là 97-99%.

Điều này có nghĩa là khi bạn tiếp tục một phiên làm việc trước đó, Claude Code không sử dụng lại ngữ cảnh đã được xử lý trước đó, mà thay vào đó sẽ xử lý mọi thứ từ đầu mỗi lần, tiêu tốn tín dụng với tốc độ cao hơn từ 10 đến 20 lần so với bình thường. Bạn có thể nghĩ rằng mình đang tiếp tục một cuộc trò chuyện, nhưng trên thực tế, mỗi lần như vậy bạn lại bắt đầu một cuộc trò chuyện hoàn toàn mới, với chi phí không giới hạn.

Giới hạn 3 lời chào, giới hạn mã Claude của bạn đâu rồi? Lỗi bộ nhớ đệm 28 ngày, và phản hồi chính thức khuyến khích bạn

Dữ liệu này đến từ hệ thống giám sát proxy của nhà phát triển độc lập ArkNill. Bằng cách thiết lập một máy chủ proxy trong suốt, anh ấy đã ghi lại mọi yêu cầu giữa Claude Code và API Anthropic, phát hiện ra ít nhất hai lỗi bộ nhớ đệm phía máy khách khiến máy chủ API không thể khớp các tiền tố hội thoại được lưu trong bộ nhớ đệm, buộc phải xây dựng lại toàn bộ mã thông báo mỗi vòng.

Biểu đồ trên cho thấy sự so sánh tỷ lệ truy cập bộ nhớ cache thành công qua ba giai đoạn. Trong các phiên bản từ v2.1.69 đến v2.1.89 (thời điểm xảy ra lỗi), tỷ lệ truy cập bộ nhớ cache của phiên bản độc lập chỉ đạt 4-17%. Sau khi khắc phục một lỗi nghiêm trọng trong phiên bản v2.1.90, tỷ lệ truy cập bộ nhớ cache khi khởi động nguội đã trở lại mức 47-99,7%. Đến phiên bản v2.1.91, tỷ lệ truy cập bộ nhớ cache ổn định đã phục hồi lên mức 97-99%.

Một chi tiết đáng chú ý từ biểu đồ: phạm vi trong phiên bản v2.1.90 khá rộng (từ 47% đến 99,7%) vì bộ nhớ đệm vẫn cần "khởi động" khi phiên làm việc được tiếp tục, dẫn đến tỷ lệ truy cập thấp trong vài vòng đầu tiên, nhưng nhanh chóng trở lại bình thường. Trong phiên bản bị lỗi, quá trình khởi động này không bao giờ diễn ra — tỷ lệ truy cập bộ nhớ cache luôn duy trì ở mức 14.500 token nhắc nhở hệ thống, và toàn bộ lịch sử hội thoại đều bị tính phí đầy đủ mỗi lần.

28 ngày, 20 phiên bản

Lỗi này không phải là loại lỗi được đưa vào trong một bản cập nhật và được sửa trong bản cập nhật tiếp theo. Theo hồ sơ phát hành trên npm registry, phiên bản v2.1.69 gây ra lỗi được phát hành vào ngày 4 tháng 3, và phiên bản v2.1.90 đã sửa lỗi được phát hành vào ngày 1 tháng 4. Khoảng thời gian giữa hai lần phát hành là 28 ngày, trải dài qua 20 phiên bản.

Dòng thời gian đã hé lộ một chi tiết hấp dẫn. Sau khi lỗi này xuất hiện vào ngày 4 tháng 3, người dùng không ngay lập tức phản ánh rộng rãi về vấn đề này. Mãi đến ngày 23 tháng 3, các khiếu nại mới bùng phát hàng loạt, gần ba tuần sau đó. Lý do là, theo phân tích sự cố #41930 trên GitHub, từ ngày 13 đến 28 tháng 3, Anthropic đã triển khai chương trình khuyến mãi gấp đôi hạn mức (gấp đôi trong giờ thấp điểm), điều này đã che giấu một cách khách quan tác động của lỗi. Sau khi chương trình khuyến mãi kết thúc, mức tiêu thụ bộ nhớ cache trở lại mức tính phí thông thường và hạn mức sử dụng của người dùng ngay lập tức "biến mất".

Phản hồi của Anthropic không nhanh chóng. Vào ngày 26 tháng 3, ba ngày sau khi người dùng bắt đầu phàn nàn, kỹ sư Thariq Shihipar đã thông báo trên tài khoản X cá nhân của mình rằng giới hạn giờ cao điểm (các ngày trong tuần từ 5 giờ sáng đến 11 giờ sáng theo giờ Thái Bình Dương) đã được thắt chặt. Vào ngày 30 tháng 3, Anthropic thừa nhận trên Reddit rằng "tỷ lệ người dùng đạt chỉ tiêu vượt xa mong đợi", đồng thời coi đây là ưu tiên hàng đầu của nhóm. Mãi đến ngày 1 tháng 4, thành viên nhóm Lydia Hallie mới công bố kết quả điều tra chính thức.

Trong suốt quá trình này, Anthropic không đăng bất kỳ bài viết nào trên blog, không gửi thông báo qua email, cũng không cập nhật trang trạng thái. Mọi thông tin chính thức đều được truyền đạt hoàn toàn thông qua các bài đăng trên mạng xã hội cá nhân của các kỹ sư và một vài bình luận trên Reddit.

Bạn đã trả bao nhiêu tiền và bạn có thể sử dụng nó trong bao lâu?

Vấn đề số #41930 trên GitHub đã thu thập hàng trăm báo cáo từ người dùng. Trường hợp cực đoan nhất là người dùng gói Max 20x (200 đô la/tháng), toàn bộ thời gian sử dụng 5 giờ của họ đã bị tiêu thụ hết chỉ trong 19 phút. Người dùng Max 5x (100 đô la/tháng) cho biết thời gian sử dụng 5 tiếng của họ đã hết chỉ trong 90 phút. Theo The Letter Two, một số người dùng cho rằng một lời chào đơn giản như "hello" đã tiêu tốn 13% dung lượng phiên của họ. Một người dùng Pro (20 đô la/tháng) trên Discord cho biết dung lượng sử dụng của anh ấy "hết vào mỗi thứ Hai và chỉ được thiết lập lại vào thứ Bảy", trong khi chỉ sử dụng bình thường được 12 ngày trong 30 ngày.

Dựa trên kết quả kiểm tra hiệu năng của ArkNill, ở phiên bản lỗi v2.1.89, dung lượng 100% của gói Max 20x sẽ bị cạn kiệt trong khoảng 70 phút. Ông cũng tính toán chi phí cho một thao tác --resume duy nhất đối với phiên ngữ cảnh 500K token, ước tính khoảng 0,15 đô la, vì hệ thống phát lại toàn bộ ngữ cảnh.

"Bạn đang cầm sai cách rồi"

Cuộc điều tra của Lydia Hallie đã xác nhận hai điểm: thứ nhất, quả thực đã có sự thắt chặt các giới hạn giờ cao điểm, và thứ hai, đã có sự gia tăng lượng tiêu thụ token trong bối cảnh 1 triệu token. Cô ấy đề cập rằng nhóm đã sửa một số lỗi nhưng nhấn mạnh rằng "không có lỗi nào dẫn đến việc tính phí quá cao."

Sau đó, bà đưa ra bốn lời khuyên về tiết kiệm:
1. Hãy sử dụng Sonnet 4.6 thay vì Opus (Opus tiêu tốn tài nguyên với tốc độ gấp đôi);

2. Giảm độ sâu của lập luận hoặc tắt chế độ suy luận mở rộng khi không cần thiết;

3. Không nên tiếp tục các phiên làm việc không hoạt động quá một giờ; thay vào đó hãy bắt đầu một phiên mới;

4. Đặt biến môi trường CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 để giới hạn kích thước cửa sổ ngữ cảnh.

Không hề đề cập đến bất kỳ hình thức thiết lập lại hạn ngạch hoặc bồi thường nào.

Người dẫn chương trình podcast về AI, Alex Volkov, đã tóm tắt phản hồi này là "Bạn đang hiểu sai vấn đề", chỉ ra rằng chính Anthropic đã đặt bối cảnh 1 triệu token làm mặc định, quảng bá Opus là mô hình chủ lực và nhấn mạnh khả năng tư duy mở rộng như một điểm bán hàng, nhưng hiện đang khuyên người dùng trả phí không nên sử dụng các tính năng này.

Việc khẳng định "không tính phí quá cao" cũng tạo ra mâu thuẫn với chính lịch sử cập nhật của Claude Code. Chỉ một ngày trước khi Lydia trả lời, phiên bản v2.1.90 đã sửa một lỗi hồi quy bộ nhớ cache tồn tại từ phiên bản v2.1.69: khi sử dụng --resume để tiếp tục phiên làm việc, các yêu cầu đáng lẽ phải được lưu vào bộ nhớ cache lại gây ra lỗi truy cập bộ nhớ cache hoàn toàn, dẫn đến việc tính phí đầy đủ. Phản hồi của Lydia không đề cập đến sự bất thường trong việc lập hóa đơn đã được xác nhận này.

Để so sánh, Codex của OpenAI trước đây cũng đã gặp phải các vấn đề tương tự về tiêu thụ hạn mức bất thường. Cách tiếp cận của OpenAI là đặt lại hạn mức người dùng, hoàn tiền tín dụng và thông báo về việc loại bỏ giới hạn sử dụng trên Codex vào tháng 3. Cách tiếp cận của Anthropic là khuyên người dùng hạ cấp mô hình, vô hiệu hóa các tính năng, hạn chế ngữ cảnh và quy trách nhiệm cho việc sử dụng của người dùng.

Anthropic bán gói đăng ký "mô hình mạnh nhất + ngữ cảnh tối đa + khả năng suy luận cao nhất", với mức phí từ 20 đến 200 đô la mỗi tháng. Lỗi bộ nhớ đệm 28 ngày đã khiến dung lượng sử dụng của người dùng trả phí bị hao hụt nhanh hơn từ 10 đến 20 lần, và phản hồi chính thức là nên sử dụng tiết kiệm.

Giá --

Bạn cũng có thể thích

Báo cáo sáng | Coinbase Ventures thực hiện khoản đầu tư đầu tiên vào ENA; SpaceX dự kiến đặt giá IPO ở mức 135 USD/cổ phiếu

Tổng quan các sự kiện thị trường quan trọng ngày 3 tháng 6

Toàn văn và phân tích bài phát biểu của CEO SanDisk tại Hội nghị Quyết định Chiến lược Thường niên lần thứ 42 của Bernstein

Giá trị cốt lõi trong bài phát biểu của Goeckeler nằm ở việc ông cung cấp một khung tường thuật minh bạch và logic cho quá trình chuyển đổi doanh nghiệp.

Cổ phiếu Mỹ được token hóa không phải là "kẻ hút cạn thanh khoản" của thị trường tiền mã hóa

"Khi các đồng tiền rác dần bị loại bỏ, các giao thức, cơ sở hạ tầng và sản phẩm tài chính thực sự tạo ra giá trị sẽ có cơ hội đạt được mức định giá hợp lý hơn."

TradFi là gì và tại sao mọi người lại bàn tán về nó trong năm 2026?

Vàng đang tăng giá, SpaceX chuẩn bị cho đợt IPO lịch sử và dầu mỏ vẫn biến động mạnh. Hãy khám phá lý do tại sao TradFi trở lại tâm điểm và cách các nhà giao dịch tiền điện tử có thể tiếp cận những cơ hội này bằng USDT. Nói cách khác, TradFi đang có thời điểm bùng nổ nhất từ trước đến nay, và các nhà giao dịch tiền điện tử đang ở vị thế hoàn hảo để nắm bắt.

Báo cáo buổi sáng | Strategy đã bán 32 BTC và hơn 800.000 cổ phiếu MSTR vào tuần trước; Binance chính thức công bố cổng giao dịch chứng khoán Mỹ; Polymarket đạt thỏa thuận hợp tác độc quyền với OneFootball

Tổng quan các sự kiện thị trường quan trọng ngày 1 tháng 6

Zhou Hang: SpaceX thực sự đáng giá bao nhiêu?

Công ty vĩ đại không đồng nghĩa với cổ phiếu tốt: Phân tích sâu sắc lý do tại sao định giá IPO 1,75 nghìn tỷ USD của SpaceX có thể chứa đựng bong bóng 1,25 nghìn tỷ USD, và các nhà đầu tư cá nhân nên tránh mù quáng theo đuổi "phí bảo hiểm câu chuyện".

Trại huấn luyện giao dịch WEEXPERIENCE tại Ba Lan: Cách WEEX & FireCrew giúp mọi người tiếp cận giao dịch tiền mã hóa dễ dàng hơn

WEEX đã hợp tác với Firecrew tại Ba Lan vào ngày 29 tháng 5 để tổ chức trại huấn luyện giao dịch WEEXPERIENCE. Hãy cùng điểm lại các phiên thảo luận chuyên sâu về phân tích kỹ thuật, tâm lý giao dịch và các công cụ AI, minh chứng cho sứ mệnh của WEEX trong việc giúp mọi người tiếp cận giao dịch tiền mã hóa dễ dàng hơn.

Paris lên ngôi vương: Cách PSG đập tan giấc mơ của Arsenal trong trận chung kết UCL lịch sử

PSG đối đầu Arsenal, kịch tính, định mệnh và lời nguyền 20 năm bị phá vỡ. Hãy cùng nhìn lại trận chung kết UCL 2026, nơi PSG bảo vệ thành công ngôi vương trong loạt sút luân lưu căng thẳng, khi khoảnh khắc vàng của Ousmane Dembélé và một pha bỏ lỡ đầy đau đớn đã viết nên lịch sử tại Budapest.

TaiJi hoàn tất vòng gọi vốn chiến lược 3,5 triệu USD, với sự tham gia của Castrum Capital, Becker Ventures và Coinvestor Ventures

Nền tảng thông tin thị trường on-chain Web3 dựa trên AI TaiJi đã công bố hoàn tất vòng gọi vốn chiến lược trị giá 3,5 triệu USD, nhằm đẩy nhanh quá trình xây dựng công cụ mô phỏng thị trường AI mới.

Bitcoin chững lại quanh mốc 73.000 USD? Cách các nhà giao dịch tìm kiếm lợi nhuận trong thị trường đi ngang tháng 6

Bitcoin đang chững lại quanh mốc 73.000 USD khi dòng vốn ETF hạ nhiệt và sự bất ổn vĩ mô khiến các nhà giao dịch trở nên thận trọng. Dưới đây là cách các chiến dịch phần thưởng như WEEX Joker Party giúp nhà giao dịch duy trì hoạt động trong thị trường đi ngang tháng 6.

Bitcoin ETF là gì? Hướng dẫn đơn giản cho năm 2026

Tìm hiểu Bitcoin ETF là gì, cách thức hoạt động của ETF giao ngay (spot) và ETF hợp đồng tương lai (futures), cùng những ưu và nhược điểm chính dành cho nhà giao dịch. Đọc hướng dẫn đầy đủ trên WEEX.

Cách Stake Solana: Hướng dẫn từng bước cho năm 2026

Tìm các đồng tiền mã hóa AI tốt nhất năm 2026 với các lựa chọn dựa trên dữ liệu: Bittensor, Render và các dự án mới nổi. Bao gồm các chỉ số on-chain, rủi ro và hướng dẫn giao dịch trên WEEX.

Tính năng Giá đảm bảo đã có mặt trên WEEX: Giao dịch với độ chính xác cao hơn

Để mang lại trải nghiệm giao dịch hợp đồng tương lai mượt mà hơn, WEEX futures đã ra mắt tính năng "Giá đảm bảo".

Báo cáo sáng | Coinbase Ventures thực hiện khoản đầu tư đầu tiên vào ENA; SpaceX dự kiến đặt giá IPO ở mức 135 USD/cổ phiếu

Tổng quan các sự kiện thị trường quan trọng ngày 3 tháng 6

Toàn văn và phân tích bài phát biểu của CEO SanDisk tại Hội nghị Quyết định Chiến lược Thường niên lần thứ 42 của Bernstein

Giá trị cốt lõi trong bài phát biểu của Goeckeler nằm ở việc ông cung cấp một khung tường thuật minh bạch và logic cho quá trình chuyển đổi doanh nghiệp.

Nội dung

Coin thịnh hành

Tin tức crypto mới nhất

04:45

Xác suất Cục Dự trữ Liên bang giữ nguyên lãi suất trong tháng 6 là 98,4% và xác suất tăng lãi suất trong tháng 7 là 8,4%

Theo báo cáo từ Jinshi, công cụ "Fed Watch" của CME cho thấy xác suất Cục Dự trữ Liên bang giữ nguyên lãi suất đến tháng 6 là 98,4% và xác suất cắt giảm lãi suất lũy kế 25 điểm cơ bản là 1,6%. Đến tháng 7, xác suất giữ nguyên lãi suất là 90,2%, xác suất...

04:45

Chỉ số đồng đô la Mỹ tăng 0,31%, đóng cửa ở mức 99,529

Theo báo cáo từ Jinshi, chỉ số đồng đô la, thước đo giá trị đồng đô la so với sáu loại tiền tệ chính, đã tăng 0,31% vào ngày 4 tháng 6, đóng cửa ở mức 99,529 trên thị trường ngoại hối. 1 euro đổi được 1,1598 đô la, giảm so với mức 1,1628 đô la của ngày giao dịch trước đó; 1 bảng Anh đổi được 1,3416 đô la...

04:45

Giới hạn 3 lời chào, giới hạn mã Claude của bạn đâu rồi? Lỗi bộ nhớ đệm 28 ngày, và phản hồi chính thức khuyến khích bạn "sử dụng nó một cách tiết kiệm".

28 ngày, 20 phiên bản

Bạn đã trả bao nhiêu tiền và bạn có thể sử dụng nó trong bao lâu?

"Bạn đang cầm sai cách rồi"

Giá --

Bạn cũng có thể thích

Báo cáo sáng | Coinbase Ventures thực hiện khoản đầu tư đầu tiên vào ENA; SpaceX dự kiến đặt giá IPO ở mức 135 USD/cổ phiếu

Toàn văn và phân tích bài phát biểu của CEO SanDisk tại Hội nghị Quyết định Chiến lược Thường niên lần thứ 42 của Bernstein

Dự báo giá Bitcoin năm 2030: Ark Invest dự đoán đạt 710.000 USD

Giá SOL hôm nay: Giá Solana trực tiếp, biểu đồ & dữ liệu thị trường

Bitcoin ETF là gì: Giải thích về Spot và Futures

Tại sao Bitcoin giảm 15% trong khi Nasdaq đạt mức cao kỷ lục?

WSJ: Hyperliquid đang trở thành "cửa hàng tiện lợi" tiền mã hóa của Phố Wall

Cổ phiếu Mỹ được token hóa không phải là "kẻ hút cạn thanh khoản" của thị trường tiền mã hóa

TradFi là gì và tại sao mọi người lại bàn tán về nó trong năm 2026?

Báo cáo buổi sáng | Strategy đã bán 32 BTC và hơn 800.000 cổ phiếu MSTR vào tuần trước; Binance chính thức công bố cổng giao dịch chứng khoán Mỹ; Polymarket đạt thỏa thuận hợp tác độc quyền với OneFootball

Zhou Hang: SpaceX thực sự đáng giá bao nhiêu?

Trại huấn luyện giao dịch WEEXPERIENCE tại Ba Lan: Cách WEEX & FireCrew giúp mọi người tiếp cận giao dịch tiền mã hóa dễ dàng hơn

Paris lên ngôi vương: Cách PSG đập tan giấc mơ của Arsenal trong trận chung kết UCL lịch sử

TaiJi hoàn tất vòng gọi vốn chiến lược 3,5 triệu USD, với sự tham gia của Castrum Capital, Becker Ventures và Coinvestor Ventures

Bitcoin chững lại quanh mốc 73.000 USD? Cách các nhà giao dịch tìm kiếm lợi nhuận trong thị trường đi ngang tháng 6

Bitcoin ETF là gì? Hướng dẫn đơn giản cho năm 2026

Cách Stake Solana: Hướng dẫn từng bước cho năm 2026

Tính năng Giá đảm bảo đã có mặt trên WEEX: Giao dịch với độ chính xác cao hơn

Báo cáo sáng | Coinbase Ventures thực hiện khoản đầu tư đầu tiên vào ENA; SpaceX dự kiến đặt giá IPO ở mức 135 USD/cổ phiếu

Toàn văn và phân tích bài phát biểu của CEO SanDisk tại Hội nghị Quyết định Chiến lược Thường niên lần thứ 42 của Bernstein

Dự báo giá Bitcoin năm 2030: Ark Invest dự đoán đạt 710.000 USD

Giá SOL hôm nay: Giá Solana trực tiếp, biểu đồ & dữ liệu thị trường

Bitcoin ETF là gì: Giải thích về Spot và Futures

Tại sao Bitcoin giảm 15% trong khi Nasdaq đạt mức cao kỷ lục?

Nội dung

Coin thịnh hành

Tin tức crypto mới nhất

Xác suất Cục Dự trữ Liên bang giữ nguyên lãi suất trong tháng 6 là 98,4% và xác suất tăng lãi suất trong tháng 7 là 8,4%

Chỉ số đồng đô la Mỹ tăng 0,31%, đóng cửa ở mức 99,529

Logan của Cục Dự trữ Liên bang: Lạm phát có rủi ro tăng, tăng trưởng kinh tế mạnh mẽ

Logan: Chính sách tiền tệ hiện tại tương đối nới lỏng và cần duy trì thắt chặt nhẹ

Dữ liệu: BTC giảm xuống dưới 65.000 USD