1. Mở đầu

1.1 Mục tiêu của loạt bài này:

- Học để biết cách sử dụng các công cụ AI phù hợp, hỗ trợ chúng ta học, tư duy và làm việc

- Loạt bài này, ghi lại việc sử dụng AI ở nhiều cấp độ khác nhau

- Chúng ta sẽ học để sử dụng AI từ mức độ hỏi-đáp thông thường, đến việc tích hợp vào luồng công việc, vào quá trình tư duy hàng ngày

- Sử dụng AI có đạo đức

- Tích hợp AI vào dữ liệu bạn đang làm việc (ví dụ tích hợp AI vào Google Drive, Google Docs)

Có nhiều công cụ AI khác nhau, chúng ta sẽ bắt đầu với Gemini của Google.

1.2 Mở Gemini

Mở Gemini trên máy tính, hoặc trên điện thoại.

- Trên máy tính: mở trình duyệt web (ví dụ Chrome) > vào trang web https://gemini.google.com/app

- Trên điện thoại: có thể dùng bằng trình duyệt web, hoặc bằng app có tên là Google Gemini

- Dùng tạm bản miễn phí cho tiện

- Cách sử dụng dễ nhất: cần gì, hỏi đó; xem Gemini như một “chuyên gia đa lĩnh vực”, cái gì cũng biết (nhớ nghi ngờ các câu trả lời của bạn Gemini, lâu lâu bạn này có tính hay nói liều).

1.3 Gemini đã làm gì để trả lời bạn

Câu hỏi đầu tiên.

Tèo hỏi: Khi tôi hỏi gemini một câu hỏi, gemini sẽ lấy câu trả lời từ đâu?

Gemini trả lời:

Tuyệt vời! Đây là một câu hỏi rất hay về cách Gemini hoạt động.

Gemini lấy câu trả lời từ một mô hình ngôn ngữ lớn (LLM). Mô hình này đã được đào tạo trên một lượng dữ liệu khổng lồ bao gồm sách, bài viết, trang web và nhiều loại văn bản khác.

Nguồn gốc câu trả lời của Gemini

Nói tóm lại, có hai nguồn chính mà Gemini sử dụng để tạo ra câu trả lời cho bạn:

- [1] Kiến thức nội tại (Internal Knowledge):

+ Đây là kho kiến thức đã được học trong quá trình đào tạo mô hình.

+ Khi bạn hỏi những câu hỏi chung chung, về khái niệm, hoặc những thông tin đã được biết rộng rãi (ví dụ: "Thủ đô của Việt Nam là gì?", "Định luật Newton thứ nhất"), Gemini sẽ tạo ra câu trả lời dựa trên thông tin đã có sẵn trong bộ nhớ của nó.

- [2] Tìm kiếm trên Google (Google Search):

+ Đối với những câu hỏi yêu cầu thông tin mới nhất, cụ thể, hoặc cần xác minh (ví dụ: "Tỷ giá hối đoái hôm nay?", "Tin tức mới nhất về sự kiện X?", "Thời tiết ngày mai?"), Gemini có khả năng sử dụng công cụ Google Search (như bạn có thể thấy trong các phản hồi đôi khi tôi cần sử dụng công cụ này).

+ Điều này giúp Gemini cung cấp những câu trả lời cập nhật, chính xác và có liên quan đến các sự kiện và dữ liệu thời gian thực.

Quá trình tạo câu trả lời

Khi bạn đặt câu hỏi, Gemini thực hiện các bước sau:

[1] Phân tích: Nó hiểu ý nghĩa và ý định đằng sau câu hỏi của bạn

[2] Truy xuất: Nó truy cập vào kiến thức nội tại hoặc tiến hành tìm kiếm trên Google (nếu cần)

[3] Tổng hợp & Sáng tạo: Nó không chỉ sao chép thông tin mà còn tổng hợp các mẩu dữ liệu, sau đó tạo ra một câu trả lời hoàn chỉnh, mạch lạc và tự nhiên bằng ngôn ngữ của con người.

Nói cách khác, Gemini giống như một học giả đã đọc một lượng lớn sách và có khả năng tra cứu nhanh chóng để cung cấp cho bạn câu trả lời tốt nhất có thể!

1.4 Thông tin về Gemini

Tèo hỏi: Giới thiệu ngắn gọn về Gemini?
Tóm tắt trả lời của Gemini:
Gemini là hệ thống trí tuệ nhân tạo (AI) mạnh mẽ và tiên tiến nhất hiện nay của Google. Được phát triển bởi Google DeepMind, Gemini được thiết kế để trở thành một "trợ lý AI đa năng" có khả năng xử lý thông tin vượt xa các chatbot truyền thống.
Dưới đây là 4 điểm cốt lõi để hiểu về Gemini:
[1] Khả năng đa phương thức (Multimodal)
Khác với các AI trước đây chủ yếu xử lý văn bản, Gemini được huấn luyện đa phương thức ngay từ đầu. Điều này có nghĩa là nó có thể hiểu, vận hành và kết hợp đồng thời nhiều loại thông tin:
- Văn bản: Viết lách, dịch thuật, tóm tắt
- Hình ảnh: Nhận diện đồ vật, giải thích sơ đồ, tạo ảnh
- Âm thanh & Video: Nghe hiểu hội thoại, phân tích nội dung phim/clip dài
- Mã nguồn: Viết và sửa lỗi lập trình (Python, Java, C++, v.v.).
[2] Các phiên bản chính
Gemini có nhiều phiên bản cho các thiết bị và nhu cầu sử dụng khác nhau:
- Gemini Ultra: Phiên bản mạnh nhất, dành cho các tác vụ cực kỳ phức tạp và lập luận chuyên sâu
- Gemini Pro: Phiên bản linh hoạt, cân bằng giữa tốc độ và trí thông minh (hiện đang vận hành hầu hết các trải nghiệm chatbot)
- Gemini Flash: Tối ưu cho tốc độ và hiệu suất, phản hồi gần như tức thì
- Gemini Nano: Nhỏ gọn, chạy trực tiếp trên các thiết bị như điện thoại (Pixel 8/9, Galaxy S24) mà không cần internet
[3] Sự kế thừa và tiến hóa
- Gemini chính là bước tiến hóa của Google Bard (đã được đổi tên thành Gemini từ đầu năm 2024)
- Nó thay thế các mô hình cũ như LaMDA và PaLM 2 để cạnh tranh trực tiếp với GPT-4 của OpenAI
- Hiện nay, các phiên bản mới nhất như Gemini 2.5 hay Gemini 3 đã nâng cấp đáng kể khả năng "Deep Think" (suy nghĩ sâu) và xử lý dữ liệu khổng lồ (lên đến hàng triệu đơn vị thông tin cùng lúc)
[4] Tích hợp sâu rộng
Gemini không chỉ là một trang web để chat, nó có mặt ở khắp nơi trong hệ sinh thái Google:
- Gmail & Docs: Viết hộ email, soạn thảo văn bản
- Android: Trở thành trợ lý ảo thay thế Google Assistant
- Google Search: Tổng hợp câu trả lời thông minh (AI Overviews)
- Gemini Live: Cho phép bạn trò chuyện bằng giọng nói tự nhiên như với một người bạn
Tóm lại: Gemini là "bộ não" AI toàn diện của Google, giúp bạn làm việc năng suất hơn, sáng tạo hơn và tìm kiếm thông tin một cách thông minh hơn.

1.5 Bài tập và câu hỏi

Bài tập 1a. Bạn hãy hỏi Gemini 5 câu hỏi mà bạn đang quan tâm, đọc câu trả lời của Gemini, bạn có hài lòng với phần trả lời của Gemini không?

Bài tập 1b. Tìm ra trường hợp bạn đặt câu hỏi cho Gemini, mà câu trả lời của Gemini không chính xác, không đáng tin cậy? Chứng minh.

Câu hỏi 1.1 Quá trình tạo câu trả lời của Gemini? Phát biểu nào không đúng?

A. Phân tích: Gemini hiểu ý nghĩa và ý định đằng sau câu hỏi của bạn

B. Truy xuất: Gemini truy cập vào kiến thức nội tại hoặc tiến hành tìm kiếm trên Google (nếu cần)

C. Tổng hợp & Sáng tạo: Gemini chỉ sao chép thông tin từ nguồn đã tìm được

D. Tạo lập: Gemini tạo ra một câu trả lời hoàn chỉnh, mạch lạc và tự nhiên bằng ngôn ngữ của con người

Câu hỏi 1.2 Gemini lấy câu trả lời từ đâu? Phát biểu nào không đúng?

A. Kiến thức nội tại: Đây là kho kiến thức đã được học trong quá trình đào tạo mô hình

B. Tìm kiếm trên Google (Google Search): Được dùng để trả lời các câu hỏi về thông tin mới nhất và cần xác minh

C. Mô hình ngôn ngữ lớn (LLM): Mô hình này đã được đào tạo trên lượng dữ liệu khổng lồ bao gồm sách, bài viết và trang web

D. Dữ liệu thời gian thực: Được dùng để trả lời các câu hỏi chung chung về khái niệm và thông tin đã biết rộng rãi

Câu hỏi 1.3 Một số công cụ AI (chatbot) phổ biến? Phát biểu nào không đúng?

A. Gemini

B. Copilot

C. ChatGPT, Claude

D. Superman

-----

Bài sau: AI thực hành (2) - Cách đặt câu hỏi

Menu

Tìm kiếm trong Blog

AI thực hành (1) - Mở đầu

1. Mở đầu

1.1 Mục tiêu của loạt bài này:

1.2 Mở Gemini

1.3 Gemini đã làm gì để trả lời bạn

1.4 Thông tin về Gemini