RAG (Tạo tăng cường truy xuất)
Khái niệm về RAG
Kiến trúc RAG (Retreival-Augmented Generation), với cốt lõi là tìm kiếm vector, đã trở thành khung công nghệ hàng đầu để giải quyết hai thách thức lớn của các mô hình lớn: thu thập kiến thức bên ngoài mới nhất và giảm thiểu các vấn đề liên quan đến việc tạo ra thông tin không chính xác. Kiến trúc này đã được triển khai rộng rãi trong nhiều tình huống ứng dụng thực tế.
Các nhà phát triển có thể sử dụng công nghệ này để xây dựng các bot dịch vụ khách hàng được hỗ trợ bởi AI, các cơ sở tri thức doanh nghiệp, công cụ tìm kiếm AI, v.v. Những hệ thống này tương tác với các hình thức kiến thức được tổ chức thông qua đầu vào ngôn ngữ tự nhiên. Một ví dụ tiêu biểu về ứng dụng RAG là như sau:
Trong sơ đồ dưới đây, khi người dùng hỏi, "Ai là Tổng thống của Hoa Kỳ?", hệ thống không trực tiếp chuyển câu hỏi này đến mô hình lớn để lấy câu trả lời. Thay vào đó, nó trước tiên tiến hành tìm kiếm vector trong cơ sở tri thức (như Wikipedia, được thể hiện trong sơ đồ) cho câu hỏi của người dùng. Nó tìm thấy nội dung liên quan thông qua việc đối sánh ngữ nghĩa (ví dụ: "Biden là Tổng thống thứ 46 hiện tại của Hoa Kỳ…"), sau đó cung cấp câu hỏi của người dùng cùng với kiến thức tìm được cho mô hình lớn. Điều này cho phép mô hình có đủ và hoàn thiện kiến thức để trả lời câu hỏi, từ đó đưa ra câu trả lời đáng tin cậy hơn.

Tại sao điều này là cần thiết?
Chúng ta có thể ví một mô hình lớn như một chuyên gia siêu đẳng, hiểu biết về nhiều lĩnh vực của con người. Tuy nhiên, chuyên gia này cũng có những giới hạn; ví dụ, họ không biết tình huống cá nhân của bạn, vì những thông tin đó là riêng tư và không có sẵn công khai trên internet, do đó họ không có cơ hội học nó từ trước.
Khi bạn muốn thuê chuyên gia siêu đẳng này làm cố vấn tài chính gia đình của mình, bạn cần cho phép họ xem xét các hồ sơ đầu tư, chi tiêu gia đình, và các dữ liệu liên quan khác trước khi họ có thể trả lời các câu hỏi của bạn. Điều này cho phép họ cung cấp lời khuyên chuyên nghiệp phù hợp với hoàn cảnh cá nhân của bạn.
Đây là điều mà hệ thống RAG làm: nó giúp mô hình lớn tạm thời tiếp cận kiến thức bên ngoài mà nó không sở hữu, cho phép nó tìm kiếm câu trả lời trước khi phản hồi câu hỏi.
Dựa trên ví dụ này, rõ ràng rằng yếu tố quan trọng nhất của hệ thống RAG là việc truy xuất kiến thức bên ngoài. Khả năng của chuyên gia cung cấp lời khuyên tài chính chuyên nghiệp phụ thuộc vào việc tìm kiếm chính xác thông tin cần thiết. Nếu chuyên gia truy xuất thông tin không liên quan đến đầu tư tài chính, như kế hoạch giảm cân của gia đình, ngay cả chuyên gia tài giỏi nhất cũng sẽ trở nên không hiệu quả.