--------------- <> -----------------
--- KHOA HỌC - CÔNG NGHỆ - GIÁO DỤC - VIỆC LÀM ---
--- Học để đi cùng bà con trên thế giới ---

Tìm kiếm trong Blog

Ebook2LateX (9) - Web services

Bài trước: Ebook2LateX (8) - Nhập dữ liệu tự động
-----

9. Web services

Tới phần này, chúng ta đã thực hiện được các việc sau:

- Thiết lập môi trường quản lý mã nguồn với Git

- Thiết lập hệ thống cơ sở dữ liệu

Trước khi bắt tay vào làm phần backend, chúng ta sẽ tìm hiểu về Dịch vụ web (web services).

9.1 Web services là gì?

Dịch vụ web (tiếng Anh là web services hay web service), để tiện trình bày sẽ dùng luôn từ gốc là web services.

Web services:

- Là một dịch vụ, do thiết bị điện tử này cung cấp cho một thiết bị điện tử khác, quá trình trao đổi được thực hiện trên môi trường web (world wide web, WWW, Internet, HTTP)

- Một máy server trên mạng sẽ luôn lắng nghe các yêu cầu từ một cổng cụ thể, để cung cấp các tài nguyên web như HTML, JSON, XML, images và tạo ra các dịch vụ cho các ứng dụng có sử dụng web services

Xem hình minh họa về web services,


So sánh trang web và web services

Ở một góc nhìn khác, kết quả trả về của một web services khá giống một trang web, tuy nhiên có một số khác biệt sau:

 

Trang web

Kết quả trả về của web services

Đối tượng sử dụng

Con người

Chương trình

Kiểu dữ liệu

Thông tin, dữ liệu

Thông tin, dữ liệu

Kiểu hiển thị

Thông tin con người có thể đọc được

Dữ liệu dạng XML, JSON

Một số định nghĩa khác về web service

- Web services là một hệ thống phần mềm, được thiết kế để hỗ trợ khả năng tương tác giữa các ứng dụng trên các máy tính khác nhau, thông qua mạng Internet, giao diện chung và sự gắn kết của nó được mô tả bằng XML

- Là tài nguyên phần mềm có thể xác định bằng địa chỉ URL

- Thực hiện các chức năng và đưa ra các thông tin người dùng yêu cầu

- Ứng dụng cơ bản của web services là tích hợp các hệ thống

- Các ứng dụng được tích hợp với cơ sở dữ liệu và các ứng dụng khác, người sử dụng sẽ giao tiếp với cơ sở dữ liệu để tiến hành phân tích và lấy dữ liệu

Xem hình minh họa,


- Web services là một tập hợp các giao thức và tiêu chuẩn mở được sử dụng để trao đổi dữ liệu giữa các ứng dụng hoặc giữa các hệ thống

- Các ứng dụng phần mềm được viết bằng các ngôn ngữ lập trình khác nhau hoặc chạy trên các nền tảng khác nhau, chúng có thể sử dụng các web services để trao đổi dữ liệu qua lại theo cách tương tự như liên lạc giữa các quá trình trên một máy tính

Xem hình minh họa,


9.2 Triển khai Web services trong Ebook2LateX

Để hiểu rõ hơn về Web services, chúng ta sẽ triển khai trong dự án Ebook2LateX.

Ứng dụng Ebook2LateX gồm 2 thành phần: Frontend và Backend.

Trong đó, thành phần Backend sẽ cung cấp các dịch vụ dưới dạng các Web services cho phần Frontend.

Thành phần Frontend và Backend sẽ giao tiếp với nhau thông qua Web services.

- Frontend sẽ sử dụng framework React

- Backend sẽ sử dụng framework FastAPI

Như vậy, React sẽ kết nối với FastAPI để trao đổi dữ liệu. Nghĩa là React sẽ sử dụng các dịch vụ web mà FastAPI cung cấp.

Cài đặt FastAPI

Như bạn đã biết, để làm ứng dụng web phía backend, bạn có thể lập trình từ đầu, có thể dùng CMS, hoặc có thể dùng framework.

Trong phần này chúng ta sẽ sử dụng framework FastAPI.

FastAPI là một web framework dựa trên Python, hỗ trợ lập trình bất đồng bộ mạnh mẽ.

FastAPI là framework mã nguồn mở, được Sebastián Ramírez người Colombia phát hành lần đầu 2018.

Để cài đặt và chạy được FastAPI, bạn cần có Python (phiên bản 3.8 trở lên) đã được cài đặt trên máy tính. Bạn có thể kiểm tra bằng lệnh: 

python -V

Ví dụ:

C:\Users\VIET HOANG - VTS>python -V

Python 3.14.0

Chúng ta đã có thư mục dự án là Ebook2LateX, đã có thư mục “môi trường ảo” là venv. Xem hình minh họa:


Chúng ta sẽ cài đặt FastAPI vào thư mục “môi trường ảo” (venv). Việc sử dụng môi trường ảo giúp cô lập các thư viện của dự án này, tránh xung đột với các dự án khác trên máy tính.

- Tại cửa sổ dòng lệnh (CMD), di chuyển dấu nhắc lệnh vào thư mục Ebook2LateX, kích hoạt môi trường ảo:

D:\DuAn\Ebook2LateX>venv\scripts\activate

(venv) D:\DuAn\Ebook2LateX>

- Gõ lệnh sau để cài đặt FastAPI: pip install "fastapi[all]"

(venv) D:\DuAn\Ebook2LateX>pip install "fastapi[all]"

Tham số “all” sẽ cài đặt luôn các thư viện bổ trợ cần thiết như uvicorn, pydantic, và các công cụ hỗ trợ xử lý dữ liệu form.

Uvicorn là gì?

Uvicorn là phần mềm web server, dùng để chạy các ứng dụng web viết bằng Python, hỗ trợ xử lý bất đồng bộ (ASGI - Asynchronous Server Gateway Interface).

Pydantic là gì?

Pydantic là một thư viện Python dùng để kiểm tra dữ liệu (validation) và xác thực dữ liệu (parsing) dựa trên các gợi ý kiểu (type hints).

Sau khi cài đặt xong, bạn nên chạy lệnh pip freeze > requirements.txt ở thư mục gốc để ghi lại danh sách các thư viện, giúp việc triển khai lên Docker sau này được đồng bộ. Như vậy trong dự án sẽ có 2 tập tin requirements.txt, một tập tin trong thư mục backend và một trong thư mục gốc. Bạn nên đọc thêm về mục đích của 2 tập tin requirements.txt này.

Viết đoạn mã nguồn đầu tiên (Hello World)

Trong thư mục backend, tạo tập tin có tên main.py và nhập vào đoạn mã sau (bạn nên tự tay gõ lại để nhớ và hiểu mã nguồn):

[main.py]

# Goi thu vien FastAPI

from fastapi import FastAPI

# Tao doi tuong app tu class FastAPI

app = FastAPI()

# Tao decorator cho app.get(“/”) 

@app.get("/")

# khi nguoi dung truy cap vao web root, goi ham sau

def read_root():

    return {"message": "Chao mung ban den voi Ebook2LateX!"}

Khởi chạy ứng dụng

Trở lại chương trình dòng lệnh (CMD), chạy lệnh sau để khởi động phần mềm web server:

uvicorn main:app --reload

Trong đó,

- main: là tên tập tin (main.py)

- app: là biến được khởi tạo trong code (app = FastAPI())

- --reload: Chế độ tự động tải lại server khi bạn thay đổi mã nguồn (rất hữu ích khi đang phát triển)

Nếu cửa sổ dòng lệnh xuất các thông tin sau là web server đã khởi chạy thành công:

←[32mINFO←[0m:     Started server process [←[36m62384←[0m]

←[32mINFO←[0m:     Waiting for application startup.

←[32mINFO←[0m:     Application startup complete.

(Đừng tắt cửa sổ dòng lệnh này, nếu tắt là tắt web server).

Kiểm tra kết quả

Sau khi khởi chạy ứng dụng thành công, bạn có thể mở trình duyệt web, truy cập vào địa chỉ sau:

http://127.0.0.1:8000

Bạn sẽ thấy câu chào mừng trên trình duyệt:

["Chao mung ban den voi Ebook2LateX!"]

Thực hiện commit trạng thái của dự án vào Git

D:\DuAn\Ebook2LateX>git status

        backend/main.py

        requirements.txt

D:\DuAn\Ebook2LateX>git add .

D:\DuAn\Ebook2LateX>git commit -m "feat: cai dat FastAPI"

9.3 Bài tập và câu hỏi

Bài tập

Bài tập 9a. Cài đặt các nội dung trong phần lý thuyết.

Bài tập 9b. Sử dụng File Explorer, tìm trong thư mục dự án (Ebook2LateX) và cho biết: sau khi cài đặt, mã nguồn của framework FastAPI được lưu ở đâu?

Câu hỏi

Câu 9.1 Web services là gì?

A. Là một loại phần cứng dùng để lưu trữ dữ liệu trên Internet

B. Là dịch vụ do thiết bị điện tử này cung cấp cho thiết bị điện tử khác thông qua môi trường mạng (WWW, HTTP)

C. Là một ngôn ngữ lập trình mới dùng để xây dựng giao diện người dùng

D. Là một hệ điều hành dành riêng cho các máy chủ lưu trữ tập tin PDF

Câu 9.2 Tại sao trong một dự án web, Backend và Frontend lại cần trao đổi dữ liệu thông qua định dạng JSON hoặc XML?

A. Vì đây là các định dạng giúp tăng dung lượng lưu trữ của ổ cứng

B. Vì đây là các ngôn ngữ lập trình có thể thực hiện các phép toán phức tạp

C. Vì đây là các định dạng dữ liệu chuẩn giúp các hệ thống khác nhau (như Python và React) có thể hiểu và làm việc với nhau

D. Vì các định dạng này giúp mã hóa dữ liệu để không ai có thể đọc được

Câu 9.3 Ai là người đã phát hành phiên bản đầu tiên của FastAPI vào năm 2018?

A. Guido van Rossum

B. Sebastián Ramírez

C. Mark Zuckerberg

D. Brendan Eich

Câu 9.4 Đặc điểm nào sau đây giúp FastAPI đạt được hiệu suất cao tương đương với Go hoặc Node.js?

A. Sử dụng giao thức SOAP để truyền tin

B. Dựa trên nền tảng Starlette, Pydantic và hỗ trợ lập trình bất đồng bộ (async)

C. Chỉ chạy được trên các máy chủ có cấu hình phần cứng cực mạnh

D. Không cần sử dụng bất kỳ thư viện hỗ trợ nào từ bên thứ ba

Câu 9.5 ASGI (Asynchronous Server Gateway Interface) là gì?

A. Là một thư viện dùng để vẽ biểu đồ toán học trong Python

B. Là chuẩn giao diện hỗ trợ lập trình bất đồng bộ cho các web server và ứng dụng Python

C. Là một hệ quản trị cơ sở dữ liệu thay thế cho PostgreSQL

D. Là một công cụ dùng để đóng gói ứng dụng vào Docker

Câu 9.6 Uvicorn đóng vai trò gì trong dự án web viết bằng Python?

A. Là một framework để viết mã nguồn Frontend

B. Là một hệ quản trị cơ sở dữ liệu quan hệ

C. Là một máy chủ Web (Web Server) chuẩn ASGI dùng để chạy ứng dụng FastAPI

D. Là trình soạn thảo mã nguồn chuyên dụng cho Python

Câu 9.7 Khi bạn thực hiện lệnh uvicorn main:app --reload trong terminal, tham số --reload có tác dụng gì đối với quá trình phát triển dự án?

A. Tự động cài đặt lại toàn bộ thư viện trong requirements.txt

B. Tự động sao lưu dữ liệu từ PostgreSQL sang một tập tin khác

C. Tự động phát hiện thay đổi trong mã nguồn và khởi động lại server để áp dụng thay đổi ngay lập tức

D. Xóa bỏ các tập tin rác trong thư mục venv/

Câu 9.8 Trong Python, "Decorator" thường được nhận diện bằng ký hiệu nào đặt ngay phía trên định nghĩa hàm?

A. Dấu #

B. Dấu $

C. Dấu &

D. Dấu @

-----
Bài sau:

Ebook2LateX (8) - Nhập dữ liệu tự động

Bài trước: Ebook2LateX (7) - Tạo các bảng
-----

8. Nhập dữ liệu tự động

8.1 Nhập dữ liệu tự động

Sau các bài học trước, chúng ta đã thực hiện:

- Tạo cơ dữ liệu cho dự án

- Tạo các bảng dữ liệu

- Thiết lập quan hệ giữa các bảng

- Lưu lại trạng thái dự án vào hệ thống Git

- Đẩy dự án lên Github

- Biết sử dụng ORM (SQLAlchemy)

- Biết sử dụng data migration (Alembic)

Tuy nhiên, trong các bảng chưa có dữ liệu. Việc nhập dữ liệu thủ công vào các bảng sẽ mất nhiều thời gian.

Trong phần này chúng ta sẽ viết script để tự động nhập dữ liệu mẫu vào các bảng. 

Quá trình tự động nhập dữ liệu vào các bảng được gọi là seeding. Seeding có nghĩa thông thường là “gieo hạt”. Trong cơ sở dữ liệu nó là quá trình “gieo dữ liệu” vào các bảng.

Tại sao cần nhập dữ liệu tự động?

- Để tối ưu hóa thời gian và nguồn lực: Thay vì tiêu tốn hàng giờ để nhập liệu thủ công từng bản ghi qua pgAdmin, một script tự động có thể tạo ra hàng nghìn dữ liệu chuẩn xác chỉ trong vài giây, giúp lập trình viên tập trung vào việc viết mã logic

- Kiểm thử giao diện và trải nghiệm người dùng (UI/UX): Dữ liệu mẫu giúp mô phỏng "hình hài" thực tế của ứng dụng. Ví dụ, cho phép kiểm tra xem các công thức toán học dài có làm vỡ khung giao diện không, hay các tính năng phân trang, tìm kiếm và cuộn trang có hoạt động mượt mà hay không

- Đảm bảo tính nhất quán trong làm việc nhóm: Cung cấp một bộ dữ liệu chuẩn duy nhất cho tất cả thành viên. Điều này giúp loại bỏ tình trạng sai lệch dữ liệu giữa các máy tính cá nhân, giúp việc tái hiện lỗi (debug) và phối hợp phát triển trở nên đồng bộ

- Xác thực cấu trúc và các ràng buộc hệ thống: Quá trình đổ dữ liệu tự động là cách nhanh nhất để kiểm tra tính đúng đắn của thiết kế cơ sở dữ liệu, đảm bảo các mối quan hệ khóa ngoại và các ràng buộc dữ liệu hoạt động đúng như mong đợi

Các bước để tạo dữ liệu

Để thực hiện tạo dữ liệu, chúng ta sẽ xây dựng các script Python sử dụng chính các Model (Users, Documents, FormulaEntries, Logs) đã định nghĩa bằng SQLAlchemy.

- Bước 1: Khởi tạo kết nối Database, chúng ta sử dụng đối tượng Session từ SQLAlchemy để giao tiếp với PostgreSQL thông qua chuỗi kết nối đã cấu hình trong tập tin .env.

Bạn cần đảm bảo: trong tập tin /Ebook2LateX/backend/.evn, đã có chuỗi kết nối, ví dụ: DATABASE_URL=postgresql://postgres:p%40ssword1@localhost:5432/ebook2latex_db

(Lưu ý: Khác với khi làm việc với Alembic, Python sẽ báo lỗi nếu chúng ta mã hóa “@” thành “%%40”, nên chúng ta sẽ mã hóa “@” thành “%40”).

Bạn cũng cần đảm bảo đã cài đặt thư viện python-dotenv để đọc thông tin từ .evn. (Xem lại phần 7.2 Cài đặt). Nếu chưa cài đặt, bạn chạy lệnh sau:

pip install python-dotenv

Viết mã khởi tạo trong database.py

Trong thư mục backend, tạo thư mục app. Trong app tạo tập tin database.py với nội dung sau:

[database.py]

import os

from dotenv import load_dotenv

from sqlalchemy import create_engine

from sqlalchemy.orm import sessionmaker, declarative_base


# Tải các biến môi trường từ tập tin .env

load_dotenv()


# 1. Lấy chuỗi kết nối từ biến môi trường

SQLALCHEMY_DATABASE_URL = os.getenv("DATABASE_URL")


# 2. Tạo Engine: Đây là "nguồn" kết nối chính tới Database

engine = create_engine(SQLALCHEMY_DATABASE_URL)


# 3. Tạo SessionLocal: Mỗi thực thể của lớp này sẽ là một phiên làm việc database

# autocommit=False: Đảm bảo dữ liệu chỉ được lưu khi ta ra lệnh commit()

SessionLocal = sessionmaker(autocommit=False, autoflush=False, bind=engine)


# 4. Tạo Base class: Các models (User, Document...) sẽ kế thừa từ đây

Base = declarative_base()

Giải thích thêm về đoạn mã trên

- load_dotenv(): Hàm này đọc tập tin .env và đưa các cấu hình vào hệ thống, để Python có thể đọc được qua os.getenv

- create_engine: Đóng vai trò là trung tâm điều khiển. Nó giữ các kết nối thực tế tới PostgreSQL. Bạn chỉ nên tạo một Engine duy nhất cho toàn bộ ứng dụng

- sessionmaker: Đây là thành phần tạo ra các đối tượng Session. Mỗi khi Backend nhận được một yêu cầu (request) từ người dùng, chúng ta sẽ mở một Session từ thành phần này để truy vấn dữ liệu

- bind=engine: Kết nối thành phần tạo session này với Engine đã tạo ở trên

Liên kết Models với cấu trúc thư mục mới

Vì bạn vừa đưa tập tin database.py vào thư mục app, bạn cần đảm bảo tập tin models.py (nơi định nghĩa các bảng Users, Documents...) cũng nằm trong thư mục app này để đồng bộ.

Di chuyển tập tin models.py vào thư mục /backend/app/.

Mở tập tin models.py, tìm dòng from database import Base và sửa thành (nếu chưa có thì thêm):

from .database import Base  # Dấu chấm đại diện cho việc import cùng thư mục

[models.py]

import uuid

from sqlalchemy import Column, String, Integer, ForeignKey, DateTime, Boolean, Text, Numeric

from sqlalchemy.dialects.postgresql import UUID, JSONB

from sqlalchemy.ext.declarative import declarative_base

from sqlalchemy.orm import relationship

from sqlalchemy.sql import func

from .database import Base


# Khởi tạo lớp Base để các Model kế thừa

Base = declarative_base()

...

Viết Script để tạo dữ liệu (seed.py)

Bây giờ chúng ta sẽ viết một tập tin Python để tự động tạo dữ liệu. Hãy tạo tập tin seed.py nằm trong thư mục /backend/ (cùng cấp với thư mục app).

Nội dung cho tập tin seed.py:

[seed.py]

import uuid

from app.database import SessionLocal

from app.models import User, Document, FormulaEntry


def seed_data():

    # 1. Khởi tạo phiên làm việc (Session)

    db = SessionLocal()

    

    try:

        print("Đang tạo dữ liệu...")


        # 2. Tạo dữ liệu cho bảng User

        # Lưu ý: Trong thực tế mật khẩu cần được băm (hash), ở đây ta nhập mật khẩu tượng trưng

        test_user = User(

            user_id=uuid.uuid4(),

            username_email="teo@dalat.edu.vn",

            password_hash="hashed_password_here",

            full_name="Lê Văn Tèo",

            role="Admin"

        )

        db.add(test_user)

        db.flush() # Đẩy dữ liệu tạm thời để lấy user_id cho bảng sau


        # 3. Tạo dữ liệu mẫu cho bảng Documents

        test_doc = Document(

            id=uuid.uuid4(),

            user_id=test_user.user_id,

            file_name="Giao_trinh_Toan_12.pdf",

            file_path_url="/uploads/toan12.pdf",

            status="Completed"

        )

        db.add(test_doc)

        db.flush()


        # 4. Tạo dữ liệu mẫu cho bảng FormulaEntries (Công thức LaTeX)

        formula = FormulaEntry(

            id=uuid.uuid4(),

            document_id=test_doc.id,

            latex_content=r"\frac{-b \pm \sqrt{b^2 - 4ac}}{2a}",

            order_index=1

        )

        db.add(formula)


        # 5. Xác nhận lưu toàn bộ thay đổi vào Database

        db.commit()

        print("Tạo dữ liệu thành công! Kiểm tra pgAdmin4 để xem kết quả.")


    except Exception as e:

        print(f"Có lỗi xảy ra: {e}")

        db.rollback() # Hoàn tác nếu có lỗi để tránh rác dữ liệu

    finally:

        db.close() # Luôn đóng kết nối sau khi xong


if __name__ == "__main__":

    seed_data()

Chạy lệnh Seeding

Sau khi viết xong tập tin seed.py, bạn mở Terminal tại thư mục /backend/ và chạy lệnh sau:

python seed.py

Sau bước này, bạn có thể mở pgAdmin 4, chuột phải vào các bảng và chọn View Data để xem kết quả là những dòng dữ liệu mẫu đầu tiên.

Cập nhật Git

Thực hiện commit vào Git để lưu lại trạng thái.

- Trong cửa sổ dòng lệnh (CMD), dấu nhắc lệnh đang ở thư mục gốc dự án (Ebook2LateX), nhập các lệnh sau:

(venv) D:\DuAn\Ebook2LateX>git status

HEAD detached at 4766c6a

Changes not staged for commit:

  (use "git add/rm <file>..." to update what will be committed)

  (use "git restore <file>..." to discard changes in working directory)

        deleted:    backend/models.py


Untracked files:

  (use "git add <file>..." to include in what will be committed)

        backend/app/

        backend/seed.py


no changes added to commit (use "git add" and/or "git commit -a")

(venv) D:\DuAn\Ebook2LateX>git add .

(venv) D:\DuAn\Ebook2LateX>git commit -m "feat: tao du lieu tu dong"

Cập nhật dự án lên Github

Kiểm tra kết nối giữa máy local với kho chứa ở xa?

Mở chương trình dòng lệnh, dấu nhắc tại thư mục dự án, gõ lệnh sau:

(venv) D:\DuAn\Ebook2LateX>git remote -v

origin  https://github.com/legiacong/Ebook2LateX.git (fetch)

origin  https://github.com/legiacong/Ebook2LateX.git (push)

Vậy là yên tâm để đẩy dự án lên Github:

(venv) D:\DuAn\Ebook2LateX>git push origin main

Ý nghĩa lệnh trên: Đẩy dự án lên repo có tên gọi tắt là origin, đẩy vào nhánh main.

8.2 Bài tập và câu hỏi

Bài tập

Bài tập 8a. Lập trình và cài đặt các nội dung trong phần lý thuyết.

Khi làm các bài tập, các bạn đừng sợ làm hỏng Database. Nếu làm sai, bạn có thể xóa database, tạo lại và chạy lệnh upgrade head cùng seed.py. Đó chính là sức mạnh của các công cụ bạn vừa học.

Bài tập 8b. Mở rộng cấu trúc (Schema Expansion)

Mục tiêu: Giúp người học hiểu cách thay đổi cấu trúc Database mà không làm mất dữ liệu hiện có.

Yêu cầu 1: Thêm tính năng "Yêu thích" (Likes/Stars):

- Yêu cầu: Thêm một bảng mới tên là UserFavorites để lưu việc người dùng đánh dấu các công thức (FormulaEntry) họ quan tâm

- Thao tác: Định nghĩa Model mới > Chạy alembic revision --autogenerate > alembic upgrade head

Yêu cầu 2: Quản lý phiên bản tài liệu:

- Yêu cầu: Thêm một cột version (kiểu Integer, mặc định là 1) vào bảng Documents

- Thao tác: Cập nhật models.py > Thực hiện migration để cập nhật database thực tế

Bài 8c: Truy vấn Nâng cao

Mục tiêu: Sử dụng Session và Relationship để lấy dữ liệu phức tạp.

Yêu cầu 1: Thống kê báo cáo (Reporting):

- Yêu cầu: Viết một script Python sử dụng SessionLocal để in ra danh sách tất cả các User, kèm theo số lượng tài liệu mà mỗi người đã tải lên

- Gợi ý: Sử dụng hàm func.count() trong SQLAlchemy

Yêu cầu 2: Tìm kiếm công thức:

- Yêu cầu: Viết một hàm nhận vào một từ khóa (ví dụ: "sqrt") và trả về tất cả các FormulaEntry có chứa từ khóa đó trong cột latex_content

Bài tập 8d. Seeding thực tế 

Mục tiêu: Làm quen với việc tạo dữ liệu mẫu số lượng lớn và ngẫu nhiên.

Yêu cầu 1: "Gieo dữ liệu" số lượng lớn với thư viện Faker:

- Thay vì nhập tay từng dòng như seed.py, hãy cài đặt thư viện Faker (pip install faker)

- Viết script tự động tạo ra 50 người dùng với tên và email ngẫu nhiên, mỗi người dùng có từ 2-5 tài liệu mẫu

Yêu cầu 2: Seeding từ tệp JSON:

- Tạo một tệp data.json chứa danh sách 10 công thức toán học

- Viết script seed_from_json.py đọc dữ liệu từ tập tin này và nạp vào bảng FormulaEntries

Câu hỏi

Câu 8.1 Trong dự án Python, thư viện python-dotenv được cài đặt và sử dụng nhằm mục đích chính là gì? 

A. Để tự động vẽ sơ đồ cơ sở dữ liệu cho dự án

B. Để nạp các biến môi trường (như chuỗi kết nối Database) từ tập tin .env vào hệ thống

C. Để mã hóa các tập tin hình ảnh thành định dạng LaTeX

D. Để gửi email thông báo cho người dùng khi có dữ liệu mới

Câu 8.2 Trong tập tin database.py, đối tượng engine được tạo ra bằng hàm create_engine đóng vai trò gì trong hệ thống?

A. Là nơi chứa các câu lệnh SQL dùng để tạo bảng

B. Là giao diện người dùng để nhập liệu thủ công vào PostgreSQL

C. Là "trung tâm điều khiển" giữ kết nối thực tế và quản lý việc giao tiếp giữa ứng dụng Python với PostgreSQL

D. Là một thư mục dùng để lưu trữ các tập tin PDF được tải lên

Câu 8.3 Tại sao chúng ta nên sử dụng SessionLocal (phiên làm việc) thay vì kết nối trực tiếp vào Database mỗi khi cần thao tác dữ liệu?

A. Để tăng tốc độ mạng Internet của máy tính

B. Để SQLAlchemy có thể quản lý các thay đổi một cách có hệ thống, cho phép xác nhận lưu (commit) hoặc hoàn tác (rollback) khi có lỗi xảy ra

C. Vì PostgreSQL không cho phép kết nối trực tiếp từ ngôn ngữ Python

D. Để tự động sao lưu dữ liệu lên hệ thống đám mây Github

Câu 8.4 Trong tập tin seed.py, nếu bạn muốn tạo một bản ghi cho bảng Document mà bảng này có khóa ngoại liên kết với bảng User, bạn cần phải thực hiện bước nào dưới đây để đảm bảo tính toàn vẹn dữ liệu? 

A. Phải tạo và lưu thông tin User trước, sau đó lấy user_id của người dùng đó để gán vào thuộc tính user_id của đối tượng Document

B. Chỉ cần nhập một tên người dùng bất kỳ vào bảng Document mà không cần quan tâm bảng User

C. Xóa bỏ ràng buộc khóa ngoại trong models.py trước khi chạy lệnh seeding

D. Phải chạy lệnh alembic upgrade head ngay bên trong tập tin seed.py

-----
Bài sau: Ebook2LateX (9) - Web services