Tôi đã xây dựng một AI analyst cho quỹ của mình như thế nào, không cần kỹ sư

This article was originally published in English by Tech in Asia.

‍

Gần đây, một partner của tôi đặt một câu hỏi trên Slack - kiểu câu hỏi bình thường có thể khiến ai đó mất cả buổi chiều. Anh ấy muốn biết liệu chúng tôi có quyền pro rata, tức quyền cho phép nhà đầu tư hiện hữu tham giacác vòng gọi vốn tiếp theo, tại một công ty trong danh mục đầu tư hay không.

‍

Câu trả lời không nằm trong phần mềm quản lý quan hệ khách hàng (CRM) hay dashboard quản lý danh mục, mà nằm đâu đó trong một chồng filePDF trong thư mục Google Drive. Nếu con người phải tự tìm, họ sẽ phải mở từngtài liệu, đọc các điều khoản pháp lý dày đặc, rồi hy vọng rằng không có nội dung nào đã bị thay thế ở vòng gọi vốn gần nhất.

‍

Thay vào đó, một bot tên Ava xử lý truy vấn này bằng cách lấy thư mục Google Drive của công ty trong danh mục từ CRM của chúng tôi. Ava sau đó kiểm tra pháp nhân đăng ký của công ty để xác định tài liệu nào điều chỉnhquyền đó, đọc các tài liệu tài trợ vốn và điều lệ hiện hành, rồi trả lời kèm trích dẫn và liên kết đến tài liệu có liên quan.

‍

Không ai trong đội ngũ của tôi phải mở hay tìm kiếm một filePDF nào, và chúng tôi tiết kiệm được vài giờ làm việc.

‍

Tôi điều hành một quỹ VC - tôi không phải kỹ sư phần mềm.Nhưng tôi đã có thể xây dựng Ava trong một cuối tuần bằng cách mô tả điều mình muốn cho Claude Code và kiên trì đến cùng với từng chi tiết. Những quyết địnhkhó nhất không nằm ở code, mà ở niềm tin: bot được phép chạm vào những gì, hệt hống nào sẽ thắng khi có mâu thuẫn, và nhìn tổng thể thì thế nào được xem là Ava hoạt động thành công.

‍

Nhiều đội ngũ làm việc dựa trên tri thức cũng đang mắc kẹt trong cùng một mớ cơ sở dữ liệu rời rạc. Vì vậy, hãy xem đây vừa là một màn trình diễn, vừa là một lời thách thức.

‍

Thuế tab trình duyệt

‍

Tech stack của chúng tôi gồm bốn hệ thống: CRM Attio, nền tảng quản lý equity Carta, phần mềm intelligence cho danh mục Vestberry, và GoogleDrive. Stack của bạn có thể không giống hệt, nhưng nhiều khả năng cũng phân mảnhtương tự.

‍

Để trả lời bất kỳ câu hỏi nghiêm túc nào, bạn thường phải đi qua hầu hết, nếu không muốn nói là toàn bộ, các nền tảng này. Chúng tôi gọi đó là “thuế tab trình duyệt”: trước mỗi cuộc họp, mỗi partner phải trả một khoản phí 25 phút cho việc nhấp chuột, tìm kiếm và đọc lại.

‍

Một cách tiếp cận vấn đề này là xây dựng chatbot để tìm kiếm tài liệu. Nhưng điều chúng tôi muốn là một analyst cấp junior có thể đọc cả tài liệu lẫn dữ liệu, rồi chỉ cho chúng tôi biết câu trả lời đến từ đâu.

‍

Ava ra đời như vậy, được xây dựng trên Claude Agent SDK của Anthropic. Kiến trúc của Ava dễ hiểu nhất nếu xem nó như một sơ đồ tổ chức thu nhỏ, thay vì một pipeline. Ava làm việc với sự hỗ trợ của các AI agent mà chúng ta có thể gọi là các chuyên viên, mỗi chuyên viên có một chức năng riêng.

A table showing the agentic specialists.

Orchestrator là phần duy nhất của hệ thống được quyền ra quyết định, với logic điều phối được viết bằng tiếng Anh chứ không phải Python. Một prompt dài khoảng 600 dòng cho orchestrator biết câu hỏi nào nên tự trả lời, câu hỏi nào cần chuyển cho chuyên viên nào, và những hành động nào tuyệt đối không được thực hiện.

‍

Trong khi đó, năm chuyên viên còn lại tồn tại để mỗi nhiệm vụ đều có một điểm khởi đầu sạch, tránh để nhiễu từ nhiệm vụ này lan sang nhiệm vụ khác.

‍

Một bản briefing có thể cần đọc hàng nghìn dòng lịch sử CRM và cập nhật từ founder. Nếu orchestrator tự làm việc đó, nó sẽ bị phân tán bởi hàng nghìn dòng thông tin thô và trở nên kém đáng tin cậy hơn. Thay vào đó, mỗi chuyên viên có một bộ nhớ làm việc mới, kiểm tra tài liệu nguồn, và chỉ trả lại bản tổng hợp đã được chắt lọc.

‍

Mỗi chuyên viên cũng được cấp một bộ công cụ cố ý thu hẹp để tạo guardrail. Ví dụ, fund analyst chỉ nhìn thấy Carta và không gì khác, còn rights surveyor có thể đọc tài liệu nhưng không thể chạm vào các hệ thống tài chính.

‍

Đừng trao chìa khóa tổng cho analyst

‍

Ba nguyên tắc giúp Ava đủ đáng tin cậy để dùng trong công việc thực tế.

‍

1. Giữ chế độ read-only ở mọi nơi. Ava không thể ghi vào CRM, tạo ghi chú, hay gửi email. Mọi công cụ có khả năng ghi trên tất cả các tích hợp đều nằm trong blocklist, nghĩa là bot không thể chỉnh sửa fund books.

‍

2. Giới hạn những gì Ava có thể truy cập. Ban đầu, Ava có quyền dùng công cụ tìm kiếm email, nhưng một tập kết quả quá lớn đã làm sập toàn bộ agent runtime giữa chừng khi đang trả lời. Thay vì sửa công cụ đó, chúng tôi gỡ nó ra và tiếp tục loại bớt các quyền truy cập. Ava nhờ vậy trở nên ổn định hơn.

‍

3. Đừng bắt model tự biên đạo khi một hàm đơn giản là đủ. Một số tác vụ đòi hỏi chuỗi bàn giao phức tạp giữa các hệ thống, điều mà AI model rất dễ làm sai. Để tránh việc đó, chúng tôi viết các hàm đơn giản mà AI agent nhận diện như “một công cụ duy nhất”. Điều cốt lõi là biết tác vụ thuộc về đâu:chúng tôi để AI ra quyết định, nhưng để phần mềm xử lý các quy trình lặp lại.

‍

Vì sao “nhầm tài liệu” lại là câu trả lời tốt nhất

‍

Chồng tài liệu lộn xộn tôi mô tả ở trên là ví dụ rõ nhất cho thấy “AI cho VC” không thể chỉ dừng ở truy xuất thông tin. Quyền của cổ đông nằm rải rác trong nhiều file và phụ thuộc vào cả loại giao dịch lẫn quốc gia nơi công ty trong danh mục đặt pháp nhân.

‍

Thay vì chỉ tìm kiếm, rights surveyor của Ava tra cứu domicile của công ty từ CRM, lấy bộ tài liệu tài trợ vốn và điều lệ hiện hành, đi theo thứ tự ưu tiên tài liệu theo từng quốc gia, rồi trích dẫn tài liệu có hiệu lực điều chỉnh cho từng quyền.

‍

Đây là phần tôi thích nhất: Ava sẽ bỏ qua cách đặt vấn đề nếu bạn hỏi một câu sai, chẳng hạn: “SAFE nói gì về quyền pro rata?” Dù bạn đã nêu tên một tài liệu cụ thể và chủ đề là một quyền, quyền pro rata có thể hoàn toàn không nằm trong SAFE.

‍

Bot của chúng tôi phản hồi đúng bằng cách từ chối trả lời câu hỏi theo khung sai đó. Ngược lại, một chatbot có thể bịa ra điều gì đó để làm hài lòng người dùng.

‍

Hoài nghi như một tính năng sản phẩm

‍

Câu trả lời của Ava được dùng để hỗ trợ quyết định đầu tư và trao đổi với limited partners. Nguyên tắc của chúng tôi khi xây dựng bot là: tối ưu thêm 1% chất lượng thì không đáng kể, nhưng cải thiện 10% thì đáng trả gấp đôi chi phí. Trong khi đó, một con số bị hallucinate có giá trị âm.

‍

Vì vậy, việc quy nguồn cho câu trả lời là bắt buộc, các mâu thuẫn phải được nêu rõ, và “tôi không biết” là một tính năng. Chúng tôi liên tục kiểm tra xem Ava có đưa ra cùng một quyết định sau các thay đổi hoặc sau khi nâng cấp model hay không.

‍

Điểm cuối cùng là quan trọng nhất. Trước khi triển khai bất kỳ thay đổi nào, chúng tôi chạy 14 bài kiểm thử live để xác nhận rằng các câu hỏiphù hợp đang được gửi đến đúng chuyên viên. Phương pháp này đã phát hiện mọi lầnnâng cấp model làm thay đổi hành vi của Ava.

‍

Chi phí

‍

Vậy “tuyển” Ava đã tiêu tốn của chúng tôi bao nhiêu?

‍

Hạ tầng rất đơn giản: một process Python chạy trên Railway,Slack, và SQLite để ghi log. Bot đọc trực tiếp từ các hệ thống nguồn khi có câu hỏi, nghĩa là không có job đồng bộ, không có dữ liệu lỗi thời, và không có bản sao dữ liệu nhạy cảm.

‍

Ava chạy trên Claude Opus, và gần đây dùng thêm Fable cho một số truy vấn (trước lệnh cấm). Sau đó, “bộ não” của Ava - với khoảng 167,000 token ngữ cảnh - được cache bằng prompt caching của Anthropic.

‍

Câu hỏi đầu tiên là câu đắt nhất vì Ava phải tải toàn bộ hướng dẫn của nó. Chi phí khoảng 0.73 USD.

‍

Các câu hỏi tiếp theo có thể tái sử dụng phần thiết lập đó trong một khoảng thời gian, kéo chi phí xuống chỉ còn vài cent. Trên thực tế, sau câu hỏi đầu tiên với bot, hầu hết các câu hỏi tiếp nối cùng chủ đề gần như miễn phí.

‍

Các giới hạn, và những gì tôi sẽ làm khác đi

‍

Khi thiết lập cảnh báo lỗi, chúng tôi phát hiện không có công ty nào trong danh mục lưu annual recurring revenue như một metric có cấu trúc - một thất bại về vệ sinh dữ liệu. Phần lớn công việc thực sự khi triển khai một agent nằm ở việc tìm và làm sạch dữ liệu.

‍

Nhìn lại, tôi sẽ audit vệ sinh dữ liệu trước khi viết một dòng prompt nào, chứ không phải sau đó.

‍

Có hai điều khác tôi sẽ thay đổi: theo dõi chi phí của từng câu hỏi ngay từ ngày đầu, và bắt đầu với ít công cụ hơn.

‍

Cách tiếp cận này cũng có trần giới hạn. Ava đọc nhưng không ra quyết định, và nó chỉ chính xác đến mức các hệ thống phía sau nó chính xác.Đó là lý do chúng tôi luôn giữ con người trong vòng kiểm soát.

‍

Nếu bạn cũng muốn có một bot như vậy

‍

Đây là lúc tôi thuyết phục bạn tự xây bot của riêng mình.

‍

Chúng tôi chỉ cần vài ngày và không tuyển thêm kỹ sư nào để xây dựng bot, còn phần khó nhất là biên tập và thiết kế phạm vi, không phải kỹ thuật.

‍

Bot được truy cập những gì, bạn muốn phơi bày dữ liệu nào, hệt hống nào thắng khi có mâu thuẫn, và thế nào được xem là “xong” - đó đều là những quyết định bạn có thể tự đưa ra.

‍

Với chúng tôi, các bước sau đã hiệu quả:

‍

· Bắt đầu với Claude Agent SDK và Slack.

· Kết nối read-only với các hệ thống thực của bạn.

· Viết logic routing bằng văn xuôi. Dùng một orchestrator, cộng thêm vài chuyên viên với bộ công cụ hẹp.

· Chuyển sự hoài nghi của bạn thành cơ chế kiểm chứng, thay vì trì hoãn.

· Luôn giữ con người trong vòng kiểm soát.

‍

Thuế tab trình duyệt giờ đây là tùy chọn - chúng tôi đã ngừng trả khoản thuế đó từ tháng 5.

‍

Binh Tran là đồng sáng lập của quỹ đầu tư mạo hiểm giai đoạn sớm AVV.

Also on Substack →