Google Gemini
Phiên bản
Người dùng có thể chọn một trong 2 phiên bản v1 và v1beta để có thể sử dụng node
API Key
Để sử dụng node này, điền API key vào trường tương ứng.
Model
Chọn model để thực hiện yêu cầu. Có thể thêm model mới nếu hỗ trợ qua API.
Gemini 1.0 Pro
- Đây là một trong những model nền tảng đầu tiên của dòng Gemini do Google phát triển.
- Được thiết kế để cân bằng giữa hiệu năng và chi phí, phù hợp cho nhiều tác vụ xử lý ngôn ngữ tự nhiên như tạo văn bản, dịch thuật, tóm tắt, trả lời câu hỏi và lập trình.
- Nó có khả năng hiểu và tạo ra văn bản phức tạp với độ chính xác cao.
Gemini 1.0 Pro Vision
- Là phiên bản mở rộng của Gemini 1.0 Pro, được bổ sung khả năng hiểu và xử lý thông tin hình ảnh và video (đa phương thức - multimodal).
- Ngoài khả năng xử lý văn bản như 1.0 Pro, model này có thể phân tích hình ảnh, video để mô tả nội dung, trả lời các câu hỏi liên quan đến hình ảnh/video đó, trích xuất thông tin từ chúng.
Gemini 1.5 Pro
- Là thế hệ tiếp theo, đánh dấu một bước đột phá về khả năng xử lý.
- Điểm nổi bật nhất là cửa sổ ngữ cảnh (context window) cực lớn, lên đến 1 triệu token (tương đương hàng trăm nghìn từ hoặc nhiều giờ video/audio), cho phép xử lý và hiểu các tài liệu, đoạn mã, hoặc video rất dài một cách liền mạch.
- Cải thiện đáng kể về khả năng suy luận phức tạp, giải quyết vấn đề, lập trình và hiểu đa phương thức so với thế hệ 1.0.
- Hiệu quả hơn trong việc huấn luyện và phục vụ.
Gemini 1.5 Flash
Là một phiên bản nhẹ hơn và nhanh hơn của Gemini 1.5 Pro.
Được tối ưu hóa về tốc độ và hiệu quả chi phí, nhưng vẫn giữ được nhiều khả năng cốt lõi của 1.5 Pro, bao gồm cửa sổ ngữ cảnh lớn và khả năng suy luận đa phương thức mạnh mẽ.
Rất phù hợp cho các ứng dụng đòi hỏi độ trễ thấp và xử lý khối lượng lớn, ví dụ như tóm tắt nhanh, ứng dụng chatbot, chú thích hình ảnh/video, trích xuất dữ liệu từ tài liệu dài.
Nói tóm lại:
- 1.0 Pro: Model đa năng, cân bằng.
- 1.0 Pro Vision: Như 1.0 Pro nhưng thêm khả năng hiểu hình ảnh/video.
- 1.5 Pro: Mạnh mẽ nhất, cửa sổ ngữ cảnh siêu lớn, xử lý tác vụ phức tạp.
- 1.5 Flash: Nhanh và hiệu quả, giữ được nhiều ưu điểm của 1.5 Pro, phù hợp ứng dụng cần tốc độ.
Prompt
hập câu hỏi để Gemini trả lời.
Prompt kèm ảnh
Bức ảnh kèm theo câu hỏi
Gán cho biến
Có thể gán giá trị vào một biến.
- Tên Biến: Tên biến để gán giá trị. Trường này xuất hiện khi người dùng chọn gán cho biến
Chèn vào bảng
Có thể chèn giá trị vào cột trong bảng
- Chọn cột: Cột nơi giá trị được chèn. Trường này xuất hiện khi người dùng chọn chèn vào bảng
Thêm hàng bổ sung
Chèn thêm một hàng vào cột trong bảng.
Ví dụ thực tế
Ví dụ, để yêu cầu AI viết câu hỏi cho Professor
trong kèo testnet Kite AI
như sau
Để có thể lấy api người dùng truy cập vào đường dẫn này
Sau đó, nhấn nút Create API key
. Chọn một project trong tài khoản goole, nếu chưa có thì ấn tạo tài khoản, sau đó chọn 1 tài khoản rồi nhấn vào nút Create API key in existing project
. Vậy là người dùng có thể tạo ra được một api để sử dụng.
Sau khi tạo node Gemini AI người dùng điền API key vào mục API Key
Tiếp theo, ở phần Model
vì người dùng muốn tạo câu hỏi nên sẽ sử dụng model gemini-1.5-pro
phù hợp với tạo câu hỏi
Tiếp theo, với phần Prompt
, vì ở đây người dùng muốn tạo câu hỏi để hỏi con AI Professor
có chức năng giúp người dùng khám phá hệ sinh thái của Kite AI nên người dùng sẽ mô tả prompt như sau: Tạo một câu hỏi liên quan đến hệ sinh thái của kèo testnet Kite AI
, ngoài ra người dùng có thể thêm các yêu cầu như câu hỏi bằng tiếng anh, không được nhiều hơn 100 ký tự. Chỉ trả về câu hỏi không thêm bất kì kí tự nào
, khi đó người dùng sẽ điền như sau
Cuối cùng sau khi node này chạy, sẽ trả về một câu hỏi, để có thể nhận câu hỏi đó, chúng ra cần sử dụng biến/bảng. Để tiện sử dụng nhất trong quy trình, người dùng sẽ gán câu hỏi đó cho biến và đặt tên biến đó là questionAI
Cấu hình node cuối cùng sẽ như sau
Sau khi đã cấu hình xong, người dùng sẽ chạy node, khi đó con AI sẽ trả về kết quả trong biến questionAI
như sau
Sau khi có được câu hỏi, người dùng sẽ viết câu hỏi vào mục gửi bằng node Nhấn Phím
với nội dung bằng biểu thức lấy giá trị biến {{variables.questionAI}}
và gửi cho con AI
Khi đó con đoạn văn sẽ được hiển thị như sau
Vậy là người dùng đã sử dụng xong node Gemini AI trong một trường hợp tạo câu hỏi ở kèo testnet Kite AI