— Chuyên mục

Công nghệ

Code, kiến trúc, AI, và những thứ giữa các tầng abstraction.

1 bài viết

Prompt caching: kiến trúc 4 tầng cho ứng dụng AI

Tiết kiệm 93% token không phải bằng cách viết ít, mà bằng cách viết đúng tầng. Phân tích cách tổ chức prompt cho hệ thống multi-tenant.