Dia cung - 14 - NTFS - sparse - compressed attribute

(tiếp theo của Dia cung - 13)



Thêm một số khái niệm về attribute

Ở phần trên đã đề cập đến các khái niệm tổng quan về attribute. Phần tiếp theo sẽ trình bày thêm một số khái niệm liên quan đến attribute trong một số tình huống sử dụng cụ thể: ví dụ, hệ thống sẽ xử lý như thế nào khi tập tin có quá nhiều attribute, việc nén và mã hóa nội dung của attribute được thực hiện như thế nào.
Base MFT entry
Một tập tin có thể có tới 65 536 attribute (vì mã định danh attribute là một số 16 bit), giả sử, tất cả các MFT entry đều thuộc kiểu non-resident, tức là MFT entry chỉ cần lưu header của các attribute, thì kích thước cần dùng tới là 65 536 * 42 = 2 752 512 byte. Trong khi kích thước của một MFT entry chỉ có 1024 byte
Như vậy, trong nhiều trường hợp, một tập tin cần nhiều hơn một MFT entry để lưu trữ các attribute của nó.
Khi có hơn một MFT entry được cấp cho một tập tin, MFT entry đầu tiên của tập tin sẽ được chuyển thành base MFT entry. Các MFT entry còn lại thuộc về tập tin này được gọi là non-base MFT entry (gọi tắt là non-base entry). Khi đó, các non-base entry sẽ có một trường để lưu địa chỉ tham chiếu tới base entry của nó.
Base MFT entry sử dụng attribute $ATTRIBUTE_LIST để chứa: tất cả các attribute thuộc về một tập tin, địa chỉ của attribute trong MFT. Các non-base entry không có chứa hai attribute: $FILE_NAME và $STANDARD_INFORMATION.
Sparse Attribute (attribute “thưa”)
NTFS có thể giảm không gian đĩa thực tế cần thiết để lưu một tập tin bằng cách lưu attribute $DATA dạng non-resident theo kiểu sparse attribute.
Sparse attribute là attribute có chứa các cluster mang giá trị 0 (tại sao lại có các cluster chứa giá trị 0?), các cluster này sẽ không được ghi vào đĩa. Trong trường hợp có sparse attribute, một run (đường chạy) đặc biệt sẽ được tạo cho các cluster mang giá trị 0.
Một run thông thường sẽ có hai thông tin: cluster bắt đầu và kích thước của run (số cluster thuộc về run). Với sparse run, sẽ chỉ có một thông tin là kích thước của run mà không có thông tin về cluster bắt đầu. NTFS sử dụng “cờ” để báo một attribute là sparse hay không sparse.
Ví dụ, xét một tập tin cần sử dụng 12 cluster để lưu trữ, trong đó 5 cluster đầu có giá trị khác 0, 3 cluster tiếp theo chứa giá trị 0, và 4 cluster cuối cùng có giá trị khác 0. Để lưu tập tin này lên trên đĩa, nếu sử dụng attribute thông thường, sẽ cần một run có chiều dài là 12, nghĩa là cần ghi 12 cluster lên đĩa. Tuy nhiên, nếu sử dụng sparse attribute sẽ cần 3 run, nhưng tổng số cluster cần ghi lên đĩa là 9. Xem hình minh họa bên dưới.

Compressed attribute (tạm dịch “thuộc tính nén”)
NTFS cho phép ghi các attribute lên đĩa dưới dạng nén, tuy nhiên, thuật toán nén không được công bố. Chú ý, đây là nén tập tin ở mức hệ thống (system-level compression) chứ không phải nén tập tin bằng các ứng dụng (application-level compression) như zip, gzip.
Microsoft chỉ thực hiện nén các attribute kiểu $DATA dạng non-resident.
NTFS sử dụng cả sparse run và nén dữ liệu để giảm không gian lưu trữ trên đĩa. Trong header của attribute $DATA có “cờ báo” cho biết attribute có được nén hay không, các “cờ báo” trong attribute $STANDARD_INFORMATION và $FILE_NAME cũng cho biết tập tin có chứa attribute được nén hay không.
Trước khi thực hiện nén, dữ liệu được chia nhỏ thành các khối có kích thước bằng nhau, gọi là các đơn vị nén (compression unit). Kích thước của đơn vị nén được lưu trong header của attribute. Có ba trường hợp xảy ra với mỗi đơn vị nén:
  1. Nếu đơn vị nén chỉ chứa giá trị 0, một run kiểu sparse sẽ được tạo ra, và không cấp phát đĩa cho đơn vị nén này.
  2. Nếu kích thước của dữ liệu sau khi nén cũng bằng kích thước của dữ liệu gốc thì sẽ không thực hiện nén dữ liệu và run sẽ được tạo dựa trên dữ liệu gốc.
  3. Nếu kích thước của dữ liệu sau khi nén nhỏ hơn kích thước của dữ liệu gốc, một run sẽ được tạo ra để lưu dữ liệu đã được nén, đồng thời một sparse run cũng sẽ được tạo, để đảm bảo tổng số cluster của run và sparse run bằng với số cluster của đơn vị nén ban đầu.
Ví dụ, quan sát tình huống sau. Giả sử, đơn vị nén có kích thước 16 cluster, chúng ta có một attribute kiểu $DATA kích thước 64 cluster. Như vậy, sẽ chia dữ liệu ra thành 4 đơn vị nén.
    • Đơn vị nén đầu tiên và thứ tư không được nén, vì sau khi thực hiện nén, kích thước vẫn là 16 cluster. Tạo hai run tương ứng cho hai đơn vị nén.
    • Đơn vị nén thứ hai chỉ chứa giá trị 0, do vậy sẽ tạo một sparse run và không cấp phát không gian đĩa.
    • Đơn vị nén thứ ba, sau khi thực hiện nén xong, còn lại kích thước 10 cluster, vì vậy, sẽ thực hiện nén đơn vị này, tạo run có kích thước 10 cluster để lưu trữ, đồng thời tạo một sparse run kích thước 6 cluster.
Xem hình minh họa dưới đây.

Khi hệ điều hành đọc các attribute $DATA đã được nén, nó thấy “cờ báo” nén được thiết lập, đồng thời thấy kích thước của các run được thiết lập dựa trên kích thước của đơn vị nén. Run đầu tiên có kích thước bằng đơn vị nén, vì vậy, nó biết run này không bị nén. Run thứ hai, có kích thước bằng đơn vị nén, và nó là một sparse, vì vậy, đây sẽ là 16 cluster mang giá trị 0; Kết hợp run thứ ba và run thứ tư sẽ tạo thành một đơn vị nén, trong đó chỉ có 10 cluster cần giải nén; run cuối cùng có kích thước bằng đơn vị nén, nên hệ điều hành cũng biết run này không bị nén.
Với các attribute $DATA đã được nén, nhưng các run lại bị phân mảnh, dẫn tới kích thước của các run không bằng nhau, không dựa trên kích thước của đơn vị nén. Trong trường hợp này, việc giải nén sẽ phức tạp hơn. Để giải nén, hệ điều hành cần thực hiện các việc sau: trộn các run lại thành một khối, chia lại khối dữ liệu thành các khối nhỏ hơn có kích thước bằng kích thước của đơn vị nén, thực hiện giải nén. Quan sát ví dụ ở hình dưới đây.

Ở hình trên, sau khi trộn run sẽ tạo thành bốn run: bắt đầu là run dữ liệu bình thường, theo sau là một sparse run, tiếp theo là một run dữ liệu bình thường, cuối cùng là một sparse run.
Thực hiện chia lại bốn run thành các run mới, với kích thước của run mới là kích thước của đơn vị nén. Kích thước của các run ban đầu: 20 + 14 + 2 + 28 + 4 + 12 = 80. Kích thước của đơn vị nén là 16. Vậy số run mới là: 80/16 = 5 run.
Thực hiện giải nén: hai run đầu tiên không có sparse run, không cần giải nén. Run thứ ba và thứ năm có sparse run, thực hiện giải nén. Run thứ tư là sparse run, tất cả mang giá trị 0.
----------------------

Tham khảo
[1] Brian Carrie, File System Forensic Analysis, Addison Wesley Professional, 2005
----------------------
Cập nhật: 2013/9/30

Thuat ngu CNTT - 2 - Tiếng Việt - chữ Quốc ngữ



Tiếng Việt

Căn cứ vào những tài liệu mới được công bố gần đây, hiện nay có thể kết luận: Tiếng Việt là một ngôn ngữ thuộc nhóm Việt-Mường, tiểu chi Việt Chứt, nằm trong khối Việt Katu, thuộc khu vực phía đông của ngành Mon-Khmer, họ Nam Á.[8]
Hình minh họa:


Phân kỳ lịch sử của tiếng Việt tính từ thế kỉ VIII tới nay [9]:
A.
Giai đoạn proto Việt (tiền Việt)
- Có hai ngôn ngữ: tiếng Hán (khẩu ngữ của lãnh đạo) và tiếng Việt
- Có một văn tự: chữ Hán
Vào khoảng thế kỉ VIII, IX
B.
Giai đoạn tiếng Việt tiền cổ
- Có hai ngôn ngữ: tiếng Việt (khẩu ngữ của lãnh đạo) và Văn ngôn Hán
- Có một văn tự: chữ Hán
Vào khoảng thế kỉ X, XI, XII
C.
Giai đoạn tiếng Việt cổ
- Có hai ngôn ngữ: tiếng Việt và văn ngôn Hán
-  Có hai văn tự: chữ Hán và chữ Nôm
Vào khoảng thế kỉ XIII, XIV, XV, XVI
D.
Giai đoạn tiếng Việt trung đại
- Có hai ngôn ngữ: tiếng Việt và văn ngôn Hán
- Có ba  văn tự: chữ Hán, chữ Nôm và chữ Quốc ngữ
Vào khoảng thế kỉ XVII, XVIII và nửa đầu thế kỉ XIX
E.
Giai đoạn tiếng Việt cận đại
- Có ba ngôn ngữ: tiếng Pháp, tiếng Việt và văn ngôn Hán
-  Có bốn văn tự: Pháp, Hán, Nôm, Quốc ngữ
Vào thời gian Pháp thuộc
F.
Giai đoạn tiếng Việt hiện đại
- Có một  ngôn ngữ: tiếng Việt
- Có một văn tự: chữ Quốc ngữ
Từ năm 1945 trở đi
Đem bảng phân kì trên đây đặt trên bối cảnh lịch sử của Việt Nam:
-         Gắn liền với việc chuyển từ giai đoạn A sang B là sự chấm dứt chế độ cai trị của nhà Đường: họ Khúc dấy nghiệp tự chủ năm 906, Ngô Quyền đem lại nền độc lập cho nước nhà bằng chiến thắng năm 939.
-         Gắn liền với việc chuyển giai đoạn từ B sang C là phong trào làm văn thơ Nôm và sự trưởng thành của chữ Nôm ở thế kỉ XIII.
-         Gắn liền với việc chuyển giai đoạn từ C sang D là hai sự kiện xảy ra song song đồng thời: các chúa Nguyễn tách riêng thành một nhà nước rồi Nam tiến không ngừng; các giáo sĩ phương Tây đến truyền đạo rồi sáng tạo ra chữ Quốc ngữ; cả hai sự kiện đều bắt đầu từ thế kỉ XVII.
-         Gắn liền với việc chuyển giai đoạn từ D sang E là việc đế quốc Pháp đem quân xâm lược và đặt nền móng thống trị.
-         Và cuối cùng, gắn liền với việc chuyển giai đoạn từ E sang G là sự thành công của Cách mạng tháng Tám năm 1945.

Chữ Quốc ngữ

Chữ Quốc ngữ, còn được gọi tắt là Quốc ngữ, là hệ thống chữ viết chính thức hiện nay của tiếng Việt. Hệ thống này được xây dựng dựa trên chữ cái Latinh (cụ thể là trực tiếp từ chữ cái Bồ Đào Nha) thêm các chữ ghép và  chín dấu phụ - bốn dấu tạo ra các âm mới, và năm dấu còn lại dành cho thể hiện thanh điệu của từ. Hai loại dấu phụ có thể được viết cùng trên một chữ cái nguyên âm.[10]
Việc sáng tác ra chữ quốc ngữ là một công cuộc chung của nhiều người, trong đó có cả giáo sĩ Tây Ban Nha, Bồ Đào Nha và Pháp Lan Tây. Nhưng người có công nhất trong việc ấy là Alexandre de Rhodes vì chính ông là người đầu tiên đem in những sách bằng chữ quốc ngữ, thứ nhất là một cuốn tự điển khiến cho người sau có tài liệu mà học và nghiên cứu.
Đến giai đoạn thế kỷ 16, năm 1533. Khi các nhà truyền giáo phương Tây đến Việt nam để truyền dạy ĐạoThiên Chúa, các giáo sĩ đã nghiên cứu, và soạn ra bộ chữ từ chữ La tinh để viết cách phiên âm tiếng Việt, dùng cho việc giảng đạo bằng ngôn ngữ Việt . Từ bộ chữ này đã trở thành chữ Quốc ngữ. Đây cũng là giai đoạn khởi đầu quan trọng nhất, có tính chất quyết định đã giúp cho ngôn ngữ Việt, và nền văn hóa Việt Nam được phát  triển nhanh chóng. Các giáo sĩ, tu sĩ Jesuit (Dòng Tên) người Bồ Đào Nha như Francisco de Pina, Gaspar d’Amaral, Antonio Barbosa, v.v. Sử dụng chữ cái La tinh để ghi chép, phiên âm Tiếng Việt.  Năm 1618, linh mục Francisco De Pina cùng với linh mục Phêrô, đã dịch Kinh Lạy Cha và các Kinh căn bản khác sang tiếng Việt, có thể xem đây là khởi đầu cho việc soạn thảo chữ Quốc ngữ.  Các Linh mục tương đối hoàn tất hệ thống chuyển mẫu tự La-tinh thích hợp với cách giọng phát âm và thanh điệu tiếng Việt. Nhưng giai đoạn này chưa được đầy đủ.
Giáo sĩ Alexandre de Rhodes đã xuất bản các cuốn Từ điển Việt-Bồ-La, Ngữ pháp tiếng An Nam, và  “Bài giảng giáo lý Tám ngày” vào năm 1651.
Chữ Quốc ngữ tuy ra đời từ thế kỉ 17 (1651) ở Việt Nam nhờ công lao tâm trí của các Tu sĩ  truyền giáo, nhưng bị giới hạn chỉ dùng để giúp các Cha giảng, truyền đạo. Vì lúc ấy triều đình phong kiến Việt Nam, đàng Trong lẫn đàng Ngoài với chính sách cấm đạo, và giết hại Giáo sĩ nên chữ Quốc ngữ đã không thể phát triển, truyền bá rộng rãi.
Trường Trung học Adran (Collège d'Adran) là trường dạy Quốc Ngữ đầu tiên ở Việt Nam được các linh mục mở ở Sài gòn từ năm 1861 – 1887.
Gia Định Báo in chữ Quốc ngữ lần đầu tiên phát hành tại Sài Gòn, ngày 15/4/1865.
Khi nói đến chữ Quốc ngữ, và Báo Chí Việt Nam thì cũng không thể quên công lao của Ông Trương Vĩnh Ký, ông là người đầu tiên sáng lập, khai sinh nền Báo Chí Quốc ngữ của Việt Nam, ông là Tổng biên tập tờ Gia Định Báo in chữ Quốc ngữ đầu tiên.
Ông Pétrus - Trương Vĩnh Ký đã viết một bài khuyến khích việc học chữ Quốc ngữ.
Các nhà khoa bảng, trí thức, cách mạng như Phan Bội Châu, Phan Châu Trinh, Trần Quý Cáp, Huỳnh Thúc Kháng, kết hợp với nhiều nhà trí thức cấp tiến thời đó, khởi xướng ra các phong trào Duy Tân, Đông Du nhằm vận động cải cách văn hóa, chính trị trên toàn quốc, kêu gọi bãi bỏ Nho (Hán) học, kêu gọi việc học Quốc ngữ để nâng cao dân trí, với lý do đơn giản: Quốc ngữ dễ học, dễ viết, dễ phổ cập hơn chữ Nho (Hán). Các ông đã vận động mở trường dạy quốc ngữ khắp nước, rầm rộ nhất là ở Quảng Nam (1905), Bình Thuận (Trường Dục Thanh, 1907) và Hà Nội (Đông Kinh Nghĩa Thục,1907).
Mãi cho đến ngày 18 tháng 9 năm 1924 (Giai đoạn Pháp thuộc), toàn quyền Đông Dương Martial Merlin (1923-1925) đã ký quyết định chính thức cho dạy chữ Quốc Ngữ ở ba năm đầu cấp tiểu học, được phổ biến rộng rãi toàn quốc. Sự ra đời và truyền bá chữ Quốc ngữ mọi nơi, trong các trường học, đã giúp cho người Việt Nam, dễ dàng học hỏi, nghiên cứu khi tiếp xúc với văn hoá phương Tây qua sách báo, nâng cao nhận thức, dân trí phát triển cao hơn và nhanh hơn so với các nước trong vùng.[11]
Năm 1942, Hoàng Xuân Hãn biên soạn và cho xuất bản tại Hà Nội cuốn sách Danh từ khoa học, nội dung gồm 5765 thuật ngữ “dịch” ra tiếng Việt, thuộc các lĩnh vực toán học, vật lý, hóa học và cơ học.[14]
-----------------------------
Tham khảo:


[1] http://tusach.thuvienkhoahoc.com/wiki/Dự_án_Thuật_ngữ_Tin_Học
[2] Sử dụng thuật ngữ CNTT trong tiếng Việt: Tây, ta lộn xộn!, http://laodong.com.vn/
[3] Phan Văn Song, Mấy ý kiến về việc thống nhất thuật ngữ Thống kê, http://statistics.vn
[5] Nguyễn Thiện Giáp, Vấn đề chuẩn hóa từ vựng tiếng Việt, http://ngonngu.net
[6] Hà Minh, Vẫn “tắc” chuyện “xử lý tiếng Việt” trong môi trường CNTT, http://www.ictnews.vn
[8] Nguyễn Thiện Giáp, Khái quát về sự hình thành và phát triển của tiếng Việt, http://ngonngu.net/index.php?p=291
[9] Nguyễn Tài Cẩn, Thử phân kì lịch sử 12 thế kỉ của tiếng Việt, http://tainguyenso.vnu.edu.vn/jspui/bitstream/123456789/20716/1/020.pdf
[13] Hoàng Văn Hành, Về sự hình thành và phát triển thuật ngữ tiếng Việt, http://vietlex.com/ngon-ngu-hoc/95-Ve_su_hinh_thanh_va_phat_trien_thuat_ngu_tieng_Viet#_ftn1
[14] Phụng Nghi, 100 năm phát triển tiếng Việt, nhà xuất bản Văn nghệ, 1999
[15] Hà Quang Năng, Đặc điểm của thuật ngữ tiếng Việt, http://www.tgn.edu.vn/bai-viet/c45/i359/dac-diem-cua-thuat-ngu-tieng-viet-phan-1-.html
[16] Lê Đình Tư & Vũ Ngọc Cân, Nhập môn ngôn ngữ học, Hà Nội, 2009
----------------------
2013/9/24

Thuat ngu CNTT - 1 - Tinh trang thieu thong nhat



Việc chuyển các thuật ngữ chuyên ngành Công nghệ thông tin từ tiếng Anh sang tiếng Việt


Lê Gia Công

Tình trạng thiếu thống nhất

Ở bài viết này tác giả thực hiện khảo sát các phương tiện, các quan điểm trong việc chuyển các thuật ngữ chuyên ngành Công nghệ thông tin (từ đây gọi tắt là thuật ngữ) từ tiếng Anh sang tiếng Việt.

Khi cần tìm hiểu hoặc cần dịch một thuật ngữ từ tiếng Anh sang tiếng Việt, công cụ đầu tiên được nghĩ tới là tra cứu từ điển.

Từ điển[1]: loại sách tra cứu, chứa đựng một tập hợp các đơn vị ngôn ngữ (thường là đơn vị từ vựng), sắp xếp theo một thứ tự dễ tra, tìm (thường là theo thứ tự chữ cái) cung cấp một số kiến thức cần thiết đối với từng đơn vị (cách phát âm, từ nguyên, từ loại, nghĩa, hình thức đối chiếu sang một ngôn ngữ khác, vv.).

Từ điển được chia thành hai nhóm:

Từ điển ngôn ngữ
Từ điển khái niệm
Từ điển tường giải (hay Từ điển giải thích)
Từ điển đối dịch hai hoặc nhiều thứ tiếng
Từ điển đồng nghĩa
Từ điển trái nghĩa
…v.v
Bách khoa thư
Từ điển bách khoa
Từ điển thuật ngữ khoa học
Từ điển thuật ngữ đối chiếu hai hay nhiều thứ tiếng

Có thể sử dụng các loại từ điển kể trên để tìm hiểu và dịch một thuật ngữ.

Ví dụ một số từ điển tác giả đã sử dụng:

-         TỪ ĐIỂN KHOA HỌC CÔNG NGHỆ ANH – VIỆT, Cung Kim Tiến & Nguyễn Trung Thuần, Nhà xuất bản từ điển bách khoa, 2003(bản in)

-         Từ điển Tin học của công ty Lạc Việt (phần mềm)

-         Từ điển trực tuyến tại http://tratu.soha.vn

-         TỪ ĐIỂN TIN HỌC & CÔNG NGHỆ THÔNG TIN ANH – ANH – VIỆT, Nguyễn Ngọc Tuấn & Trương Văn Thiện, Nhà xuất bản thông tấn, 2002 (bản in)

-         Từ điển máy tính của Vdict.com (trực tuyến)

-         Từ điển tiếng Việt của Viện ngôn ngữ, nhà xuất bản từ điển bách khoa, 2007 (bản in)

Bên cạnh sử dụng các từ điển, có thể sử dụng các công cụ khác:

-         Công cụ dịch của Google tại địa chỉ: http://translate.google.com

-         Bách khoa toàn thư mở (tiếng Anh) tại http://en.wikipedia.org

-         Bách khoa toàn thư mở (tiếng Việt) tại http://vi.wikipedia.org.

-         Từ điển mở tại: http://vi.wiktionary.org

Giả sử cần dịch từ Header trong trình đơn View/Header and Footer của phần mềm Microsoft Word 2003 sang tiếng Việt. Thực hiện tra cứu một số từ điển:

-         Header: tiêu đề (TỪ ĐIỂN TIN HỌC & CÔNG NGHỆ THÔNG TIN ANH – ANH – VIỆT)

-         Header: ống góp (TỪ ĐIỂN KHOA HỌC CÔNG NGHỆ ANH – VIỆT)

-         Header: đầu trang - văn bản nhắc lại, như số trang hoặc dòng tóm tắt của một đầu đề tài liệu, xuất hiện ở đầu các trang trong một tài liệu (Từ điển Tin học Lạc Việt)

-         Header: đầu trang (http://tratu.soha.vn)

-         Header: người đóng đáy thùng, (thông tục) cái nhảy lao đầu xuống trước,  (điện học) côlectơ, cái góp điện, (kỹ thuật) vòi phun, ống phun, (kiến trúc) gạch lát ngang, đá lát ngang. (Từ điển Anh – Việt của Lạc Việt)

-         Header: tiêu đề (http://translate.google.com)

-         Header: Page header, in printing or typography the material separated from the main body that appears at the top of a page  (http://en.wikipedia.org)

Kết quả tra cứu cho 2 nghĩa đáng chú ý là tiêu đề và đầu trang.

Theo từ điển tiếng Việt của Viện ngôn ngữ, nhà xuất bản từ điển bách khoa, 2007, thì:

-         Tiêu đề (danh từ): danh mục, đầu đề nêu ra; danh hiệu, địa chỉ,…v.v của một công sở, một xí nghiệp in trên góc trái những giấy tờ dùng về việc văn phòng.

-         Đầu trang: không có mục từ này trong từ điển (tuy nhiên, từ “đầu” có nghĩa là “trên hết, trước hết, ở mút hết”; từ điển Tin học và trang web http://tratu.soha.vn giải thích: “Đầu trang: văn bản nhắc lại, như số trang hoặc dòng tóm tắt của một đầu đề tài liệu, xuất hiện ở đầu các trang trong một tài liệu”).

Vậy “header” là “tiêu đề” hay “đầu trang” hay “tiêu đề đầu trang”?

Tương tự khi tra cứu nghĩa của các từ: protocol, bit, byte, web/website …v.v đều có nhiều hơn một lựa chọn:

-         Protocol: giao thức? nghi thức? định ước? định chuẩn?

-         Bit: bit? bít? số nhị phân?

-         Byte: byte? bai?

-         Web/website: web? website? mạng? trang mạng?

Rất khó để lựa chọn một từ tiếng Việt cho phù hợp trong các trường hợp đã đưa ra.

Có nhiều nhận xét về những khó khăn trong việc chuyển các thuật ngữ từ tiếng Anh sang tiếng Việt. Sau đây là một số nhận xét:

“Công Nghệ Thông Tin hiện là một trong những lĩnh vực sử dụng nhiều từ ngữ vay mượn nhất ở Việt Nam. Đồng thời, việc sử dụng những thuật ngữ tiếng Việt tương đương cũng rất tuỳ tiện, thiếu nhất quán. Việc này gây nhiều khó khăn cho cộng đồng trong việc giao tiếp, truyền thông, nghiên cứu.”[2]

“Việc chuyển dịch các thuật ngữ chuyên ngành từ Anh sang Việt cũng mang nặng tính tự phát, thiếu thống nhất, thiếu tổ chức, nhiều lúc vô nguyên tắc và đặc biệt hơn là việc thiếu vắng sự hỗ trợ tối quan trọng của của các trường đại học, các tổ chức nghiên cứu chuyên môn cũng như sự giúp đỡ của các ban ngành có trách nhiệm như ngành giáo dục đào tạo và các tổ chức chính quyền cao hơn.”[3]

“…nhiều nhóm, nhiều người đã cố gắng sáng tạo ra các thuật ngữ để dịch các khái niệm thống kê từ tiếng nước ngoài, đặc biệt là từ tiếng Anh.  Điều này làm tình trạng thuật ngữ không thống nhất, kém hệ thống, thiếu chọn lọc... là không thể tránh khỏi.  Tình trạng này xảy ra giữa các nhóm tác giả và ngay cả chính ở mỗi tác giả.  Thật ra, đây cũng là tình trạng chung của thuật ngữ khoa học, kĩ thuật nói chung ở nước ta, đặc biệt là ở các ngành mới hay mới được quan tâm chẳng hạn như tin học mà báo chí trong nước cũng đã đề cập nhiều.”[4]

Như vậy vấn đề quan trọng ở đây chính là việc thống nhất phương pháp xây dựng và cách sử dụng các thuật ngữ. Trong đó cần xác định vai trò của: các trường đại học, tổ chức nghiên cứu, và cơ quan nhà nước.
-------------------
Tham khảo

[1] http://daitudien.net/ngon-ngu-hoc/ngon-ngu-hoc-ve-tu-dien.html
[2] Sử dụng thuật ngữ CNTT trong tiếng Việt: tây, ta lộn xộn!, http://laodong.com.vn/
[3] http://tusach.thuvienkhoahoc.com/wiki/Dự_án_Thuật_ngữ_Tin_Học
[4] Phan Văn Song, Mấy ý kiến về việc thống nhất thuật ngữ Thống kê, http://statistics.vn
  ----------------
2014/5/23

Đọc báo

Tự nhắc bản thân điều này để dạy con.

"• Có một loại đám mà không cần ai mời mọc nhưng vẫn có nhiều người cố đến tận nơi, đó là đám tang. Sinh, lão, bệnh, tử vốn là quy luật của đời người. Có điều những người sống đối xử với người chết như thế nào, nhất là tại các đám tang lại là điều không phải ai cũng biết.
Những người được giáo dục trong môi trường chú trọng giá trị đạo đức và tinh thần thì trước những đám tang, thường họ có những ứng xử rất văn hóa. Nhiều người được dạy rằng đi qua đám tang nên dừng lại ngả mũ cúi chào tiễn biệt người quá cố. Xe tang, theo quy định, là xe được ưu tiên trong lưu thông giao thông. Những người khi gặp đám tang thường đứng nép sang một bên để nhường cho đám tang đi qua.
Hiện nay rất nhiều những nét đẹp khi ứng xử với đám tang gần như đã mất. Những nhà có đám tang, dù đã để biển báo, có người vẫn rú ga vọt đi cho nhanh. Cứ cho rằng xã hội công nghiệp khác xưa nhiều lắm, thế nhưng không thể đem lý lẽ ấy ra để biện minh cho những hành vi thiếu văn hóa. Không cần dừng lại, không cần bỏ mũ cúi đầu ta vẫn chia sẻ được với người quá cố, với mất mát của gia đình họ: Hãy cho xe chạy chậm lại một chút, hãy cúi đầu thấp xuống một chút, hãy đừng rú ga, đừng bóp còi inh ỏi. Đừng tưởng nếu làm vậy thì không ai biết, trời biết, đất biết và ta biết - thế đã quá đủ rồi. Ứng xử với đám tang không chỉ là chuyện ứng xử với người chết mà còn nói lên gốc rễ văn hóa của một con người. - Vũ Trung Kiên"

Nguồn: Đám tang và sự cười cợt trên nỗi đau (plo.vn

Đọc sách

[91] Vàng xưa
Tác giả: Nguyễn Văn Thọ
NXB: Hội nhà văn - 262 trang - bản in 2010

"Trên đời này, ai dậy được ai? Người ta, chỉ có khi roi đời quất cho ngã gục mới tự nhận ra những bài sống và khi đó, sự giác ngộ về đời sống mới thực sự ngấm vào máu thịt, trở thành những bài học thực sự hữu ích cho bản thân. Sự dạy dỗ, dù chân thành hay giả dối, nhiều khi cũng chỉ như nước đổ đầu vịt. Hoặc là người ta sẽ vâng dạ đấy, nhưng thực ra là vâng dạ để lấy lòng, thậm chí khinh bỉ nhưng vì yếu thế mà vẫn 'vâng, dạ!'" (tr.184)

CN_2_2_Môi trường truyền dẫn



2.2 Media – Môi trường truyền dẫn

Môi trường truyền có chức năng truyền các tín hiệu có mang các bit thông tin.
Có ba loại môi trường truyền phổ biến:
  • Cáp đồng (wire)
  • Cáp quang (fiber optic)
  • Không dây (wireless)

Cáp đồng

Cáp đồng có nhiều loại, ở đây giới thiệu hai loại cáp đang được sử dụng nhiều là cáp xoắn đôi và cáp đồng trục.
Cáp xoắn đôi (twisted pair): được sử dụng rộng rãi trong mạng LAN và mạng điện thoại (telephone).
Mục đích của việc xoắn đôi từng cặp là để chống phát xạ nhiễu điện từ.
Cáp xoắn đôi được dùng nhiều là cáp UTP.

Cáp UTP (Unshielded Twisted Pair): cáp xoắn đôi không có vỏ bọc chống nhiễu. Cáp UTP là loại cáp có giá thành thấp, được sử dụng phổ biến trong các hệ thống Ethernet LAN. CAT là viết tắt của category, nghĩa là loại cáp. Cáp gồm 4 cặp dây.
Cáp đồng trục (coaxial cable): được sử dụng phổ biến trong lĩnh vực truyền hình.

Cáp quang

Sơ đồ sau minh họa hoạt động của cáp quang.

Cáp quang sử dụng sợi thủy tinh hoặc plastic đã được tinh chế để truyền các tín hiệu ánh sáng. Sợi quang được tráng một lớp lót nhằm phản chiếu tốt các tín hiệu.
Nguyên tắc hoạt động: khi chiếu ánh sáng từ Nguồn sáng  (có thể là laser, LED), tia sáng sẽ được phản xạ toàn phần liên tục tại phần tiếp xúc của hai môi trường, cho đến khi tới được đích. Tại đích tia sáng sẽ được tiếp nhận bởi Bộ cảm ứng quang.
Cáp quang có thể truyền dữ liệu ở tốc độ cao, đi xa, không bị nhiễu, không bị nghe trộm, tín hiệu trên đường truyền bị suy giảm rất ít.
Cáp quang có hai loại chính: đa mode (multi-mode) và đơn mode (single-mode).
  • Đa mode sử dụng cho truyền tải tín hiệu trong khoảng cách ngắn.
  • Đơn mode sử dụng cho truyền tải tín hiệu ở khoảng cách xa hàng trăm km, như trong mạng điện thoại, mạng truyền hình cáp.

Trong đó[3]:
  • Core: Trung tâm phản chiếu của sợi quang nơi ánh sáng đi.
  • Cladding: Vật chất quang bên ngoài bao bọc lõi mà phản xạ ánh sáng trở lại vào lõi.
  • Sheath: Lớp phủ  bảo vệ.
  • Jacket: lớp phủ bảo vệ.

Không dây

Khác với cáp đồng và cáp quang chỉ gửi tín hiệu theo dây dẫn, môi trường truyền không dây quảng bá tín hiệu truyền của mình ra toàn bộ không gian xung quanh thiết bị phát. Tất cả các thiết bị thu nằm trong vùng phủ sóng đều có thể nhận được tín hiệu.
Một điểm cần lưu ý đối với môi trường không dây là tần số của tín hiệu. Nếu hai tín hiệu cùng tần số hoặc tần số gần nhau sẽ gây ra hiện tượng nhiễu (interfere) tại thiết bị nhận.

Ví dụ ở hình trên, máy laptop nhận được tín hiệu từ hai thiết bị phát cùng một lúc, một tín hiệu mạnh của thiết bị ở gần và một tín hiệu yếu hơn của thiết bị ở xa. Hai tín hiệu này sẽ gây ra hiện tượng nhiễu tại máy laptop, làm cho máy laptop không thể trao đổi thông tin qua môi trường không dây. Vì vậy, trong trường hợp có nhiều thiết bị phát lân cận nhau, cần lựa chọn hợp lý kênh phát (tần số phát) của các thiết bị.
Mỗi quốc gia đều có các quy định để quản lý việc sử dụng các dải tần sóng điện từ. Ví dụ: dải tần nào dùng cho truyền hình, phát thanh, vệ tinh, hàng không, WiFi …v.v.
Ví dụ tại Mỹ, băng tần sử dụng cho truyền dữ liệu trong lĩnh vực truyền thông (WiFi, 3G) tập trung nhiều trong dải tần của microwave, sóng có tần số từ vài trăm MHz đến vài GHz. Mạng WiFi sử dụng băng tần ISM (industrial, scientific and medical), là băng tần miễn phí, cụ thể: 902MHz -> 928MHz, 2.4GHz -> 2.4835GHz, 5.25GHz -> 5.35GHz, 5.47GHz -> 5.725GHz, 5.725GHz -> 5.825GHz.

Tìm hiểu thêm

  1. Quy định pháp lý về việc sử dụng tần số sóng điện từ tại Việt Nam?

Tham khảo:

[1] Andrew S. Tanenbaum, David J. Wetherall, Computer Networks 5th edition, 2011
[2] David J. Wetherall, Introduction to Computer Networks, www.coursera.org, 2013
[3] http://vi.wikipedia.org
-----------------
2013/9/1