ChatGPT
Node này hỗ trợ tạo văn bản và hình ảnh theo yêu cầu bằng ChatGPT.
API Key
API được tạo từ tài khoản ChatGPT.
Kiểu
Văn bản: Tạo ra một văn bản theo yêu cầu mong muốn
Hình ảnh: Tạo ra một hình ảnh theo yêu cầu mong muốn
Model
Chọn model để thực hiện yêu cầu. Có thể thêm model mới nếu hỗ trợ qua API, người dùng có thể thêm model mới phát hành nếu có model đó có thể sử dụng qua api
GPT-3 (Generative Pre-trained Transformer 3)
- Phát hành: Khoảng năm 2020.
- Mô tả: Là một mô hình ngôn ngữ lớn (LLM) đột phá tại thời điểm ra mắt, với 175 tỷ tham số. GPT-3 nổi bật với khả năng tạo văn bản giống con người, dịch ngôn ngữ, viết nội dung sáng tạo và trả lời câu hỏi tổng quát. Nó đã đặt nền móng cho nhiều ứng dụng AI tạo sinh sau này.
- Hạn chế: (so với các phiên bản sau): Khả năng suy luận phức tạp, xử lý ngữ cảnh dài và độ tin cậy trong thông tin còn hạn chế hơn so với GPT-4.
GPT-4 (Generative Pre-trained Transformer 4)
- Phát hành: Tháng 3 năm 2023.
- Mô tả: Là bản nâng cấp đáng kể từ GPT-3. GPT-4 thể hiện khả năng suy luận logic và giải quyết vấn đề phức tạp tốt hơn nhiều. Nó sáng tạo hơn, có khả năng hợp tác tốt hơn trong các dự án viết lách hoặc coding, và có thể xử lý các chỉ dẫn tinh tế hơn. GPT-4 cũng có bộ nhớ ngữ cảnh dài hơn (có thể xử lý nhiều văn bản đầu vào hơn) và lần đầu tiên giới thiệu khả năng đa phương thức (multimodal), cho phép nhận cả đầu vào văn bản và hình ảnh (mặc dù đầu ra chủ yếu vẫn là văn bản).
- Cải tiến chính: Suy luận tốt hơn, sáng tạo hơn, an toàn hơn, xử lý ngữ cảnh dài hơn, chấp nhận đầu vào hình ảnh.
GPT-4o (Generative Pre-trained Transformer 4 Omni)
- Phát hành: Tháng 5 năm 2024.
- Mô tả: "o" là viết tắt của "omni", nghĩa là "toàn năng", ám chỉ khả năng xử lý đa dạng các loại đầu vào và đầu ra. Đây là mô hình tiên tiến nhất hiện tại của OpenAI. GPT-4o được thiết kế để xử lý và tạo ra sự kết hợp của văn bản, âm thanh và hình ảnh một cách tự nhiên và liền mạch. Nó có thể tương tác bằng giọng nói theo thời gian thực với độ trễ rất thấp và biểu cảm tự nhiên hơn.
- Điểm nổi bật:
- Đa phương thức thực sự: Xử lý đầu vào và tạo ra đầu ra gồm văn bản, âm thanh, hình ảnh trong cùng một mô hình.
- Tốc độ: Phản hồi nhanh như con người, đặc biệt trong tương tác giọng nói.
- Hiệu suất: Đạt hiệu suất cấp độ GPT-4 Turbo về văn bản, lý luận và coding, đồng thời cải thiện đáng kể về khả năng hiểu hình ảnh và âm thanh.
- Chi phí: Rẻ hơn 50% so với GPT-4 Turbo khi sử dụng qua API.
GPT-4o-mini
Được tối ưu hóa cho lý luận nhanh chóng, hiệu quả với hiệu suất đặc biệt hiệu quả trong các tác vụ mã hóa và trực quan.
DALL-E-3
Là một mô hình tạo ảnh từ văn bản do OpenAI phát triển, thuộc dòng DALL·E. Phiên bản DALL·E 3 là bản nâng cấp lớn so với DALL·E 2, với các đặc điểm nổi bật sau:
Hiểu văn bản tốt hơn: DALL·E 3 cải thiện mạnh khả năng hiểu các mô tả chi tiết và phức tạp trong văn bản. Nó tạo ra hình ảnh sát với prompt hơn so với các phiên bản trước, hạn chế hiện tượng "hiểu sai ý".
Tích hợp chặt chẽ với ChatGPT: Khi sử dụng ChatGPT (Plus hoặc Pro), người dùng có thể yêu cầu trợ giúp viết prompt và chỉnh sửa hình ảnh một cách hội thoại. Người dùng mô tả bằng từ ngữ tự nhiên và mô hình sẽ tạo prompt phù hợp cho hình ảnh.
Chỉnh sửa hình ảnh (inpainting/outpainting): DALL·E 3 có khả năng chỉnh sửa vùng cụ thể của ảnh theo yêu cầu người dùng – ví dụ: thay đổi phông nền, thêm đối tượng, sửa một phần ảnh mà không cần tạo lại toàn bộ.
Chất lượng hình ảnh vượt trội: Hình ảnh do DALL·E 3 tạo ra thường có độ phân giải cao hơn, chi tiết hơn và tuân theo logic thị giác tốt hơn – đặc biệt trong các nhiệm vụ khó như vẽ bàn tay, chữ viết, hoặc các cảnh vật phức tạp.
An toàn và đạo đức: OpenAI đã tích hợp các bộ lọc và giới hạn để ngăn mô hình tạo ra nội dung không phù hợp, ví dụ như ảnh người nổi tiếng, nội dung bạo lực, hoặc gợi dục.
Ứng dụng thực tế:
- Tạo ảnh minh họa cho sách/truyện thiếu nhi
- Thiết kế nhân vật game, hoạt hình
- Ý tưởng kiến trúc, sản phẩm
- Minh họa khoa học, kỹ thuật
Prompt
Trình bày yêu cầu khi tạo ra một đoạn văn bản hoặc một bức ảnh
Gán cho biến
Có thể gán giá trị vào một biến.
- Tên Biến: Tên biến để gán giá trị. Trường này xuất hiện khi người dùng chọn gán cho biến
Chèn vào bảng
Có thể chèn giá trị vào cột trong bảng
- Chọn cột: Cột nơi giá trị được chèn. Trường này xuất hiện khi người dùng chọn chèn vào bảng
Thêm hàng bổ sung
Chèn thêm một hàng vào cột trong bảng.
Ví dụ thực tế
Ví dụ, để yêu cầu AI viết câu hỏi cho Professor
trong kèo testnet Kite AI
như sau
Để làm được điều đó, người dùng sẽ cần cấu hình node ChatGPT AI như sau
Để tạo được api này người dùng truy cập vào trang API Key
Tạo một api key mới
Điền tên vào bấm tạo
Lưu địa chỉ api đó để sử dụng
Sau khi tạo node ChatGPT, nhập API key vào trường API Key.
Vì đang muốn tạo văn bản nên người dùng sẽ chọn kiểu Văn bản
Tiếp theo, ở phần Model
vì người dùng muốn tạo câu hỏi nên sẽ sử dụng model gpt-4o-mini
phù hợp với tạo câu hỏi
Tiếp theo, với phần Prompt
, vì ở đây người dùng muốn tạo câu hỏi để hỏi con AI Professor
có chức năng giúp người dùng khám phá hệ sinh thái của Kite AI nên người dùng sẽ mô tả prompt như sau: Tạo một câu hỏi liên quan đến hệ sinh thái của kèo testnet Kite AI
, ngoài ra người dùng có thể thêm các yêu cầu như câu hỏi bằng tiếng anh, không được nhiều hơn 100 ký tự. Chỉ trả về câu hỏi không thêm bất kì kí tự nào
, khi đó người dùng sẽ điền như sau
Cuối cùng sau khi node này chạy, sẽ trả về một câu hỏi, để có thể nhận câu hỏi đó, chúng ra cần sử dụng biến/bảng. Để tiện sử dụng nhất trong quy trình, người dùng sẽ gán câu hỏi đó cho biến và đặt tên biến đó là questionAI
Sau khi đã cấu hình xong, người dùng sẽ chạy node, khi đó con AI sẽ trả về kết quả trong biến questionAI
như sau
Sau khi có được câu hỏi, người dùng sẽ viết câu hỏi vào mục gửi bằng node Nhấn Phím
với nội dung bằng biểu thức lấy giá trị biến {{variables.questionAI}}
và gửi cho con AI
Khi đó con đoạn văn sẽ được hiển thị như sau
Như vậy, node ChatGPT đã được sử dụng để tạo câu hỏi trong kèo testnet Kite AI.