ChatGPT

Node này hỗ trợ tạo văn bản và hình ảnh theo yêu cầu bằng ChatGPT.

API Key

API được tạo từ tài khoản ChatGPT.

Kiểu

Văn bản: Tạo ra một văn bản theo yêu cầu mong muốn

Hình ảnh: Tạo ra một hình ảnh theo yêu cầu mong muốn

Model

Chọn model để thực hiện yêu cầu. Có thể thêm model mới nếu hỗ trợ qua API, người dùng có thể thay thế model có sẵn bằng cách xoá đi và thêm model mới phát hành nếu có model đó có thể sử dụng qua api ở đây

GPT-3 (Generative Pre-trained Transformer 3)

Phát hành: Khoảng năm 2020.
Mô tả: Là một mô hình ngôn ngữ lớn (LLM) đột phá tại thời điểm ra mắt, với 175 tỷ tham số. GPT-3 nổi bật với khả năng tạo văn bản giống con người, dịch ngôn ngữ, viết nội dung sáng tạo và trả lời câu hỏi tổng quát. Nó đã đặt nền móng cho nhiều ứng dụng AI tạo sinh sau này.
Hạn chế: (so với các phiên bản sau): Khả năng suy luận phức tạp, xử lý ngữ cảnh dài và độ tin cậy trong thông tin còn hạn chế hơn so với GPT-4.

GPT-4 (Generative Pre-trained Transformer 4)

Phát hành: Tháng 3 năm 2023.
Mô tả: Là bản nâng cấp đáng kể từ GPT-3. GPT-4 thể hiện khả năng suy luận logic và giải quyết vấn đề phức tạp tốt hơn nhiều. Nó sáng tạo hơn, có khả năng hợp tác tốt hơn trong các dự án viết lách hoặc coding, và có thể xử lý các chỉ dẫn tinh tế hơn. GPT-4 cũng có bộ nhớ ngữ cảnh dài hơn (có thể xử lý nhiều văn bản đầu vào hơn) và lần đầu tiên giới thiệu khả năng đa phương thức (multimodal), cho phép nhận cả đầu vào văn bản và hình ảnh (mặc dù đầu ra chủ yếu vẫn là văn bản).
Cải tiến chính: Suy luận tốt hơn, sáng tạo hơn, an toàn hơn, xử lý ngữ cảnh dài hơn, chấp nhận đầu vào hình ảnh.

GPT-4o (Generative Pre-trained Transformer 4 Omni)

Phát hành: Tháng 5 năm 2024.
Mô tả: "o" là viết tắt của "omni", nghĩa là "toàn năng", ám chỉ khả năng xử lý đa dạng các loại đầu vào và đầu ra. Đây là mô hình tiên tiến nhất hiện tại của OpenAI. GPT-4o được thiết kế để xử lý và tạo ra sự kết hợp của văn bản, âm thanh và hình ảnh một cách tự nhiên và liền mạch. Nó có thể tương tác bằng giọng nói theo thời gian thực với độ trễ rất thấp và biểu cảm tự nhiên hơn.
Điểm nổi bật:
- Đa phương thức thực sự: Xử lý đầu vào và tạo ra đầu ra gồm văn bản, âm thanh, hình ảnh trong cùng một mô hình.
- Tốc độ: Phản hồi nhanh như con người, đặc biệt trong tương tác giọng nói.
- Hiệu suất: Đạt hiệu suất cấp độ GPT-4 Turbo về văn bản, lý luận và coding, đồng thời cải thiện đáng kể về khả năng hiểu hình ảnh và âm thanh.
- Chi phí: Rẻ hơn 50% so với GPT-4 Turbo khi sử dụng qua API.

GPT-4o-mini

Được tối ưu hóa cho lý luận nhanh chóng, hiệu quả với hiệu suất đặc biệt hiệu quả trong các tác vụ mã hóa và trực quan.

DALL-E-3

Là một mô hình tạo ảnh từ văn bản do OpenAI phát triển, thuộc dòng DALL·E. Phiên bản DALL·E 3 là bản nâng cấp lớn so với DALL·E 2, với các đặc điểm nổi bật sau:

Hiểu văn bản tốt hơn: DALL·E 3 cải thiện mạnh khả năng hiểu các mô tả chi tiết và phức tạp trong văn bản. Nó tạo ra hình ảnh sát với prompt hơn so với các phiên bản trước, hạn chế hiện tượng "hiểu sai ý".
Tích hợp chặt chẽ với ChatGPT: Khi sử dụng ChatGPT (Plus hoặc Pro), người dùng có thể yêu cầu trợ giúp viết prompt và chỉnh sửa hình ảnh một cách hội thoại. Người dùng mô tả bằng từ ngữ tự nhiên và mô hình sẽ tạo prompt phù hợp cho hình ảnh.
Chỉnh sửa hình ảnh (inpainting/outpainting): DALL·E 3 có khả năng chỉnh sửa vùng cụ thể của ảnh theo yêu cầu người dùng – ví dụ: thay đổi phông nền, thêm đối tượng, sửa một phần ảnh mà không cần tạo lại toàn bộ.
Chất lượng hình ảnh vượt trội: Hình ảnh do DALL·E 3 tạo ra thường có độ phân giải cao hơn, chi tiết hơn và tuân theo logic thị giác tốt hơn – đặc biệt trong các nhiệm vụ khó như vẽ bàn tay, chữ viết, hoặc các cảnh vật phức tạp.
An toàn và đạo đức: OpenAI đã tích hợp các bộ lọc và giới hạn để ngăn mô hình tạo ra nội dung không phù hợp, ví dụ như ảnh người nổi tiếng, nội dung bạo lực, hoặc gợi dục.

Ứng dụng thực tế:
- Tạo ảnh minh họa cho sách/truyện thiếu nhi
- Thiết kế nhân vật game, hoạt hình
- Ý tưởng kiến trúc, sản phẩm
- Minh họa khoa học, kỹ thuật

Prompt

Trình bày yêu cầu khi tạo ra một đoạn văn bản hoặc một bức ảnh

Gán cho biến

Có thể gán giá trị vào một biến.

Tên Biến: Tên biến để gán giá trị. Trường này xuất hiện khi người dùng chọn gán cho biến

Chèn vào bảng

Có thể chèn giá trị vào cột trong bảng

Chọn cột: Cột nơi giá trị được chèn. Trường này xuất hiện khi người dùng chọn chèn vào bảng

Thêm hàng bổ sung

Chèn thêm một hàng vào cột trong bảng.

Ví dụ thực tế

Ví dụ, để yêu cầu AI viết câu hỏi cho Professor trong kèo testnet Kite AI như sau

Để làm được điều đó, người dùng sẽ cần cấu hình node ChatGPT AI như sau

Để tạo được api này người dùng truy cập vào trang API Key

Tạo một api key mới

api

Điền tên vào bấm tạo

api

Lưu địa chỉ api đó để sử dụng

api

Sau khi tạo node ChatGPT, nhập API key vào trường API Key.

Vì đang muốn tạo văn bản nên người dùng sẽ chọn kiểu Văn bản

Tiếp theo, ở phần Model vì người dùng muốn tạo câu hỏi nên sẽ sử dụng model gpt-4o-mini phù hợp với tạo câu hỏi

Tiếp theo, với phần Prompt, vì ở đây người dùng muốn tạo câu hỏi để hỏi con AI Professor có chức năng giúp người dùng khám phá hệ sinh thái của Kite AI nên người dùng sẽ mô tả prompt như sau: Tạo một câu hỏi liên quan đến hệ sinh thái của kèo testnet Kite AI, ngoài ra người dùng có thể thêm các yêu cầu như câu hỏi bằng tiếng anh, không được nhiều hơn 100 ký tự. Chỉ trả về câu hỏi không thêm bất kì kí tự nào, khi đó người dùng sẽ điền như sau

Cuối cùng sau khi node này chạy, sẽ trả về một câu hỏi, để có thể nhận câu hỏi đó, chúng ra cần sử dụng biến/bảng. Để tiện sử dụng nhất trong quy trình, người dùng sẽ gán câu hỏi đó cho biến và đặt tên biến đó là questionAI

Sau khi đã cấu hình xong, người dùng sẽ chạy node, khi đó con AI sẽ trả về kết quả trong biến questionAI như sau

Sau khi có được câu hỏi, người dùng sẽ viết câu hỏi vào mục gửi bằng node Nhấn Phím với nội dung bằng biểu thức lấy giá trị biến {{variables.questionAI}} và gửi cho con AI

Khi đó con đoạn văn sẽ được hiển thị như sau

Như vậy, node ChatGPT đã được sử dụng để tạo câu hỏi trong kèo testnet Kite AI.

General

Browser

Web Interaction

Control Flow

Online services

Data

Packages

ChatGPT

API Key

Kiểu

Model

GPT-3 (Generative Pre-trained Transformer 3)

GPT-4 (Generative Pre-trained Transformer 4)

GPT-4o (Generative Pre-trained Transformer 4 Omni)

GPT-4o-mini

DALL-E-3

Prompt

Gán cho biến

Chèn vào bảng

Thêm hàng bổ sung

Ví dụ thực tế

ChatGPT ​

API Key ​

Kiểu ​

Model ​

GPT-3 (Generative Pre-trained Transformer 3) ​

GPT-4 (Generative Pre-trained Transformer 4) ​

GPT-4o (Generative Pre-trained Transformer 4 Omni) ​

GPT-4o-mini ​

DALL-E-3 ​

Prompt ​

Gán cho biến ​

Chèn vào bảng ​

Thêm hàng bổ sung ​

Ví dụ thực tế ​

ChatGPT

API Key

Kiểu

Model

GPT-3 (Generative Pre-trained Transformer 3)

GPT-4 (Generative Pre-trained Transformer 4)

GPT-4o (Generative Pre-trained Transformer 4 Omni)

GPT-4o-mini

DALL-E-3

Prompt

Gán cho biến

Chèn vào bảng

Thêm hàng bổ sung

Ví dụ thực tế