--------------- <> -----------------
--- KHOA HỌC - CÔNG NGHỆ - GIÁO DỤC - VIỆC LÀM ---
--- Học để đi cùng bà con trên thế giới ---

Tìm kiếm trong Blog

Hiển thị các bài đăng có nhãn Thuật ngữ. Hiển thị tất cả bài đăng
Hiển thị các bài đăng có nhãn Thuật ngữ. Hiển thị tất cả bài đăng

Tài liệu tham khảo liên quan đến thuật ngữ

Tham luận chữ quốc ngữ của tác giả Phạm Thị Kiều Ly (2019)
Phần 1:
Phần 2:
----

Computer - nên dịch là máy tính hay máy điện toán - tại sao?

Computer - nên dịch là máy tính hay máy điện toán - tại sao?
Thử đi tìm câu trả lời xem có tìm được không? :D
2014/11/28
--------------------------


Học là gì?[1]


Học là hành động thu nhận cái mới; thay đổi hoặc phát triển cái đã có, như: tri thức, kĩ năng, giá trị, hoạt động, sở thích; tiếp thu các loại thông tin.

[Learning is the act of acquiring new, or modifying and reinforcing, existing knowledge, behaviors, skills, values, or preferences and may involve synthesizing different types of information.]

 

Các đối tượng có thể học?

­ 
       Con người (humans)
­ 
       Động vật (animals)
­ 
       Máy móc (machines)

[The ability to learn is possessed by humans, animals and some machines. Progress over time tends to follow learning curves. Learning is not compulsory; it is contextual.]

 

Đặc điểm của quá trình học (quá trình nhận thức)


Quá trình nhận thức không diễn ra chỉ trong một lần, mà nó là một quá trình. Đối tượng học sẽ tiếp thu cái mới dựa trên nền các cái đã biết.

[It does not happen all at once, but builds upon and is shaped by what we already know. To that end, learning may be viewed as a process, rather than a collection of factual and procedural knowledge. Learning produces changes in the organism and the changes produced are relatively permanent.]

 

Định nghĩa máy học[2]


Máy học, hay học máy (machine learning) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể "học" cách phân loại thư điện tử xem có phải thư rác (spam) hay không và tự động xếp thư vào thư mục tương ứng. Học máy rất gần với suy diễn thống kê (statistical inference) tuy có khác nhau về thuật ngữ.

Học máy có liên quan lớn đến thống kê, vì cả hai lĩnh vực đều nghiên cứu việc phân tích dữ liệu, nhưng khác với thống kê, học máy tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính toán. Nhiều bài toán suy luận được xếp vào loại bài toán NP-khó, vì thế một phần của học máy là nghiên cứu sự phát triển các giải thuật suy luận xấp xỉ mà có thể xử lý được.

Học máy hiện nay được áp dụng rộng rãi, bao gồm máy truy tìm dữ liệu, chẩn đoán y khoa, phát hiện thẻ tín dụng giả, phân tích thị trường chứng khoán, phân loại các chuỗi DNA, nhận dạng tiếng nói và chữ viết, dịch tự động, chơi trò chơi và cử động rô-bốt (robot locomotion).

Dưới góc nhìn của trí tuệ nhân tạo, động lực chính của học máy là nhu cầu thu nhận tri thức (knowledge acquisition). Thật vậy, trong nhiều trường hợp ta cần kiến thức chuyên gia nhưng thực tế lại khan hiếm (không đủ chuyên gia ngồi phân loại thẻ tín dụng lừa đảo của tất cả giao dịch hàng ngày) hoặc chậm vì một số nhiệm vụ cần đưa ra quyết định nhanh chóng dựa trên xử lý dữ liệu khổng lồ (trong mua bán chứng khoán, phải quyết định trong vài khoảng khắc của giây chẳng hạn) và thiếu ổn định thì buộc phải cần đến máy tính. Ngoài ra, đại đa số dữ liệu sinh ra ngày nay chỉ phù hợp cho máy đọc (computer readable) tiềm tàng nguồn kiến thức quan trọng. Máy học nghiên cứu cách thức để mô hình hóa bài toán cho phép máy tính tự động hiểu, xử lý và học từ dữ liệu để thực thi nhiệm vụ được giao cũng như cách đánh giá giúp tăng tính hiệu quả.

Tom Mitchell, giáo sư nổi tiếng của Đại học Carnegie Mellon University - CMU định nghĩa cụ thể và chuẩn mực hơn như sau: "Một chương trình máy tính CT được xem là học cách thực thi một lớp nhiệm vụ NV thông qua trải nghiệm KN, đối với thang đo năng lực NL nếu như dùng NL ta đo thấy năng lực thực thi của chương trình có tiến bộ sau khi trải qua KN" (máy đã học).

 

Biểu diễn trong máy học


Biểu diễn (tiếng Anh: representation) là một trong những vấn đề quan trọng của học máy. Biểu diễn ở đây có thể hiểu làm sao ghi mã (encode) những thông tin của thế giới thật giúp hoàn thành nhiệm vụ một cách hiệu quả và đầy đủ nhất có thể. Thông tin ở đây bao hàm cả thông tin về dữ liệu đầu vào, đầu ra hay các trạng thái của hệ thống; cũng như cách đánh giá hiệu quả của chương trình.

Thông thường, trong học máy người ta hay xây dựng các mô hình sử dụng những biến ngẫu nhiên cho việc biểu diễn dữ liệu và nội trạng thái của hệ thống. Ví dụ: dùng biến ngẫu nhiên để biểu thị cho tính chất của email là spam (tương ứng giá trị 0) hay là bình thường (tương ứng 1). Mối tương quan giữa các biến ngẫu nhiên này có thể sử dụng ví dụ như mô hình xác suất dạng đồ thị để miêu tả. Mặt khác, để đo hiệu quả có thể dùng các hàm thiệt hại (hay hàm tiện ích, trong tiếng Anh là loss functionutility function tương ứng).

 

Tính phổ quát


Một trong những trọng tâm khác của học máy là đạt được tính phổ quát (tiếng Anh: generalization), nói cách khác là tính chất của chương trình có thể làm việc tốt với dữ liệu mà nó chưa gặp bao giờ (tiếng Anh: unseen data). Một chương trình chỉ hiệu quả với dữ liệu đã gặp, nhìn chung không có nhiều tính hữu dụng.

Lấy ví dụ về xếp thư điện tử tự động như trên, một hệ thống tự động, sau khi trải qua quá trình học từ dữ liệu ("training") có thể suy diễn một số nguyên tắc riêng (chẳng hạn như xem xét nội dung: nếu thư được viết bằng tiếng Anh mà chứa một số từ như "porn", "sell", "good product" hoặc người gửi đến từ Somalia trong khi người nhận ở Hà Nội không thân quen nhau) để quyết định xem có phải là thư rác hay không. Tuy nhiên, nếu như trong dữ liệu huấn luyện (training data) có ngôn ngữ khác trong thực tế (tiếng Việt thay vì tiếng Anh) hoặc thậm chí không phải dạng thuần văn bản (dạng ảnh khiến cho bóc tách nội dung khó hơn hoặc không thể) thì rất có thể máy sẽ dự báo không chính xác nữa.

Một số chương trình có thể tự động cập nhật trong thời gian thực (ví dụ như người sử dụng có chỉ ra rằng thư bị sắp xếp sai danh mục).

 

Tương tác với con người


Một số hệ thống học máy nỗ lực loại bỏ nhu cầu trực giác của con người trong việc phân tích dữ liệu, trong khi các hệ thống khác hướng đến việc tăng sự cộng tác giữa người và máy. Không thể loại bỏ hoàn toàn tác động của con người vì các nhà thiết kế hệ thống phải chỉ định cách biểu diễn của dữ liệu và những cơ chế nào sẽ được dùng để tìm kiếm các đặc tính của dữ liệu. Học máy có thể được xem là một nỗ lực để tự động hóa một số phần của phương pháp khoa học. Một số nhà nghiên cứu học máy tạo ra các phương pháp bên trong các khuôn khổ của thống kê Bayes.

 

Tương quan với Khai phá dữ liệu


Khai phá dữ liệu và học máy là hai khái niệm hay bị nhầm lẫn. Hai lĩnh vực này nhìn chung gần với nhau và đôi khi dùng chung nhiều phương pháp, công cụ nhưng khác biệt chính là ở mục tiêu:
­ 
       Khai phá dữ liệu: thường mục tiêu là tìm kiếm những thông tin, tri thức hoàn toàn mới tiềm năng có ích trong nguồn dữ liệu.
­ 
       Học máy: dự đoán một số thông tin của dữ liệu dựa trên những đặc tính đã biết.

 

Các loại giải thuật


Các thuật toán học máy được phân loại theo kết quả mong muốn của thuật toán. Các loại thuật toán thường dùng bao gồm:
­ 
       Học có giám sát: trong đó, thuật toán tạo ra một hàm ánh xạ dữ liệu vào tới kết quả mong muốn. Một phát biểu chuẩn về một việc học có giám sát là bài toán phân loại: chương trình cần học (cách xấp xỉ biểu hiện của) một hàm ánh xạ một vector tới một vài lớp bằng cách xem xét một số mẫu dữ liệu - kết quả của hàm đó.
­ 
       Học không giám sát: mô hình hóa một tập dữ liệu, không có sẵn các ví dụ đã được gắn nhãn.
­ 
       Học nửa giám sát: kết hợp các ví dụ có gắn nhãn và không gắn nhãn để sinh một hàm hoặc một bộ phân loại thích hợp.
­ 
       Học tăng cường: trong đó, thuật toán học một chính sách hành động tùy theo các quan sát về thế giới. Mỗi hành động đều có tác động tới môi trường, và môi trường cung cấp thông tin phản hồi để hướng dẫn cho thuật toán của quá trình học.
­ 
       Chuyển đổi: tương tự học có giám sát nhưng không xây dựng hàm một cách rõ ràng. Thay vì thế, cố gắng đoán kết quả mới dựa vào các dữ liệu huấn luyện, kết quả huấn luyện, và dữ liệu thử nghiệm có sẵn trong quá trình huấn luyện.
­ 
       Học cách học: trong đó thuật toán học thiên kiến quy nạp của chính mình, dựa theo các kinh nghiệm đã gặp.

Phân tích hiệu quả các thuật toán học máy là một nhánh của ngành thống kê, được biết với tên lý thuyết học điện toán.

 

Các chủ đề về học máy


Danh sách các chủ đề về học máy:
­ 
       Mô hình hóa các hàm mật độ xác suất điều kiện: hồi quy và phân loại

o       Mạng nơ-ron

o       Cây quyết định

o       Lập trình biểu thức gen

o       Lập trình di truyền

o       Hồi quy quá trình Gauss

o       Phân tích biệt thức tuyến tính

o       k láng giềng gần nhất

o       Độ dài thông điệp tối thiểu

o       Cảm tri nguyên

o       Hàm cơ sở xuyên tâm

o       Máy vector hỗ trợ (Support Vector Machine)
­ 
       Mô hình hóa các hàm mật độ xác suất qua các mô hình phát sinh:

o       Thuật toán cực đại kì vọng

o       Các mô hình đồ họa gồm mạng Bayes và mạng Markov

o       Ánh xạ topo phát sinh
­ 
       Các kỹ thuật suy luận xấp xỉ đúng:

o       Chuỗi Markov phương pháp Monte Carlo

o       Phương pháp biến thiên
­ 
       Tối ưu hóa: hầu hết các phương pháp trên đều sử dụng tối ưu hóa hoặc là các thể hiện của các thuật toán tối ưu hóa.

 

Học khái niệm[3]


Học khái niệm (concept learning) là một bài toán học quy nạp tiêu biểu: cho trước một số ví dụ của khái niệm, chúng ta phải suy ra một định nghĩa cho phép người dùng nhận biết một cách đúng đắn những thể hiện của khái niệm đó trong tương lai.

Ví dụ: thế nào là một thư rác? Định nghĩa? -> đó là khái niệm.

 

Tại sao các hệ chuyên gia vẫn còn nhiều hạn chế?


Một trong những nguyên nhân chủ yếu là do quá trình tích lũy tri thức phức tạp, chi phí phát triển các hệ chuyên gia rất cao, nhưng chúng không có khả năng học, khả năng tự thích nghi khi môi trường thay đổi. Các chiến lược giải quyết vấn đề của chúng cứng nhắc và khi có nhu cầu thay đổi, thì việc sửa đổi một lượng lớn mã chương trình là rất khó khăn.

 

Quy nạp là gì?[4]


Quy nạp là kết luận đi từ trường hợp riêng đi tới trường hợp tổng quát. Nghĩa là, kết luận tổng quát dựa trên việc nghiên cứu các tính chất của nhiều sự kiện, nhiều thí nghiệm hay nhiều quan sát riêng lẻ. Nếu kết luận chung dựa vào nghiên cứu tất cả các sự kiện riêng (các đối tượng, các hình, các số, vv…) thì quy nạp được gọi là đầy đủ hay hoàn chỉnh. Nếu kết luận chung dựa vào nghiên cứu một phần của tâp hợp tất cả các sự kiện (các đối tượng) thì quy nạp được gọi là không đầy đủ hay không hoàn chỉnh.


[1] http://en.wikipedia.org/wiki/Learning
[2] vi.wikipedia.org/wiki/H%E1%BB%8Dc_m%C3%A1y
[3] http://voer.edu.vn/m/gioi-thieu/203bcc4e
[4] https://voer.edu.vn/m/chung-minh-bang-quy-nap/a9301519

Thuat ngu CNTT - 0 - Tai lieu tham khao

[11] Thế mới cần phải có từ điển thuật ngữ

- Một đại biểu quốc hội phát biểu "...nhiều từ ngữ trong luật không có trong Từ điển tiếng Việt...".

- Phản hồi của Phạm Duy Nghĩa

"Luật học có ngôn ngữ chuyên ngành riêng, thường hàm súc, khái quát hóa đến cùng cực, các thẩm phán khi áp dụng sẽ diễn giải những thuật ngữ này. Bởi thế, ngoài Từ điển Tiếng Việt, muốn đọc và hiểu luật, phải có từ điển thuật ngữ luật học chuyên ngành. Tựa như Dược học, Y học... cũng có ngôn ngữ chuyên ngành riêng. Thành ra, ngôn ngữ trong một đạo luật, hiển nhiên cũng là tiếng Việt, song là một thứ tiếng Việt đã được mài giũa, khái quát hóa, muốn đọc và hiểu, cần tới những phương pháp phân tích luật của nhà chuyên môn./."

Nhiều từ ngữ trong luật không có trong Từ điển tiếng Việt/Lao Động
--------------------------

[10] Tiếng Việt - Từ điển - Xuất bản
"Từ, ngữ tiếng Việt hiện tại cũng chưa có một quy chuẩn thật rõ ràng và thống nhất, nhất quán từ dưới lên trên. Không nói đâu xa, trong làng báo, giữa báo Bắc và báo Nam đã có những phân biệt, định giới ngầm không văn bản như miền Nam thì dùng chữ hy sinh (y dài) còn báo Bắc là hi sinh (I ngắn). Những ví dụ như vậy có thể kể ra “thập loại”. Nên chăng, những sách khảo cứu vừa thông dụng - ứng dụng vừa bình dân - hàn lâm như Từ điển cần đó những Hội đồng giám định trước khi xuất bản ví như Viện Khoa học Xã hội, Viện Ngôn ngữ."
------------------------------------
[9] Sự hình thành và phát triển của thuật ngữ tiếng Việt - GS Hoàng Văn Hành


-         Thuật ngữ hóa từ ngữ thông thường
-         Mô phỏng thuật ngữ nước ngoài
-         Tiếp nhận thuật ngữ nước ngoài
Kết quả của ba quá trình thuật ngữ là ba lớp thuật ngữ:
-         Lớp thuật ngữ thuần Việt
-         Lớp thuật ngữ mô phỏng 
-    Lớp thuật ngữ quốc tế

Sự hình thành và phát triển của thuật ngữ tiếng Việt
-------------------------------------
[8] Lời dẫn của Danh từ khoa học - GS Hoàng Xuân Hãn
"...bàn về đặc điểm của danh từ khoa học và nêu lên tám yêu cầu khi đặt một danh từ khoa học mới, chưa có trong tiếng Việt

Đồng thời, tác giả còn nêu lên các phương pháp để đặt danh từ khoa học, có tham khảo đến cách làm của các nước lân cận như Trung Quốc, Nhật... và cách mà tác giả đã sử dụng để tạo ra các danh từ khoa học trong chính cuốn sách này..."
Lời dẫn
------------------------------------
[7] Ngôn ngữ vùng đất mới - Hồ Anh Thái
Ngôn ngữ vùng đất mới
------------------------------------
[6] 130 năm thăng trầm chữ Việt
Kì 1. Hai thế kỉ và một quyết định
Kì 2. Ai học chữ Việt đầu tiên
Kì 3. Cưỡng bách và phản kháng
Kì 4. Bước ra khỏi giáo hội
Kì 5. Báo chí tiên phong
Kì 6. Ngọn lửa Đông Kinh nghĩa thục
Kì cuối. Quốc ngữ của một nước độc lập
--------------------------------------
[5] Tại sao lại nói là "vào Nam ra Bắc" mà không nói là "vào Bắc ra Nam"?
Triết lý tiếng Việt trong "vào Nam ra Bắc" - Nguyễn Đức Dân
---------------------------------------
[4] [Từ "đến từ" bị dùng sai]
Một con sâu lớn đang tàn phá "Vườn tiếng Việt"
---------------------------------------
[3] [Trang chuyên về Việt hóa thuật ngữ
Nơi đề nghị, góp ý, thảo luận, học hỏi lẫn nhau và phổ biến các thuật ngữ mới trong Tiếng Việt]
Việt Hóa Thuật Ngữ
----------------------------------------
[2] [Nói đúng, viết đúng tiếng Việt]
Thế Nào Là Tiếng Việt Trong Sáng? - Đào Văn Bình
Thế Nào Là Tiếng Việt Trong Sáng? (II)
----------------------------------------
[1][Cấu trúc vĩ mô của từ điển thuật ngữ CNTT - Viện Từ điển học & Bách khoa thư Việt Nam
Tác giả nhầm IT = Informations Technology]
Một số vấn đề về cấu trúc vĩ mô của Từ điển thuật ngữ Công nghệ thông tin ở Việt Nam

Thuat ngu CNTT - 2 - Tiếng Việt - chữ Quốc ngữ



Tiếng Việt

Căn cứ vào những tài liệu mới được công bố gần đây, hiện nay có thể kết luận: Tiếng Việt là một ngôn ngữ thuộc nhóm Việt-Mường, tiểu chi Việt Chứt, nằm trong khối Việt Katu, thuộc khu vực phía đông của ngành Mon-Khmer, họ Nam Á.[8]
Hình minh họa:


Phân kỳ lịch sử của tiếng Việt tính từ thế kỉ VIII tới nay [9]:
A.
Giai đoạn proto Việt (tiền Việt)
- Có hai ngôn ngữ: tiếng Hán (khẩu ngữ của lãnh đạo) và tiếng Việt
- Có một văn tự: chữ Hán
Vào khoảng thế kỉ VIII, IX
B.
Giai đoạn tiếng Việt tiền cổ
- Có hai ngôn ngữ: tiếng Việt (khẩu ngữ của lãnh đạo) và Văn ngôn Hán
- Có một văn tự: chữ Hán
Vào khoảng thế kỉ X, XI, XII
C.
Giai đoạn tiếng Việt cổ
- Có hai ngôn ngữ: tiếng Việt và văn ngôn Hán
-  Có hai văn tự: chữ Hán và chữ Nôm
Vào khoảng thế kỉ XIII, XIV, XV, XVI
D.
Giai đoạn tiếng Việt trung đại
- Có hai ngôn ngữ: tiếng Việt và văn ngôn Hán
- Có ba  văn tự: chữ Hán, chữ Nôm và chữ Quốc ngữ
Vào khoảng thế kỉ XVII, XVIII và nửa đầu thế kỉ XIX
E.
Giai đoạn tiếng Việt cận đại
- Có ba ngôn ngữ: tiếng Pháp, tiếng Việt và văn ngôn Hán
-  Có bốn văn tự: Pháp, Hán, Nôm, Quốc ngữ
Vào thời gian Pháp thuộc
F.
Giai đoạn tiếng Việt hiện đại
- Có một  ngôn ngữ: tiếng Việt
- Có một văn tự: chữ Quốc ngữ
Từ năm 1945 trở đi
Đem bảng phân kì trên đây đặt trên bối cảnh lịch sử của Việt Nam:
-         Gắn liền với việc chuyển từ giai đoạn A sang B là sự chấm dứt chế độ cai trị của nhà Đường: họ Khúc dấy nghiệp tự chủ năm 906, Ngô Quyền đem lại nền độc lập cho nước nhà bằng chiến thắng năm 939.
-         Gắn liền với việc chuyển giai đoạn từ B sang C là phong trào làm văn thơ Nôm và sự trưởng thành của chữ Nôm ở thế kỉ XIII.
-         Gắn liền với việc chuyển giai đoạn từ C sang D là hai sự kiện xảy ra song song đồng thời: các chúa Nguyễn tách riêng thành một nhà nước rồi Nam tiến không ngừng; các giáo sĩ phương Tây đến truyền đạo rồi sáng tạo ra chữ Quốc ngữ; cả hai sự kiện đều bắt đầu từ thế kỉ XVII.
-         Gắn liền với việc chuyển giai đoạn từ D sang E là việc đế quốc Pháp đem quân xâm lược và đặt nền móng thống trị.
-         Và cuối cùng, gắn liền với việc chuyển giai đoạn từ E sang G là sự thành công của Cách mạng tháng Tám năm 1945.

Chữ Quốc ngữ

Chữ Quốc ngữ, còn được gọi tắt là Quốc ngữ, là hệ thống chữ viết chính thức hiện nay của tiếng Việt. Hệ thống này được xây dựng dựa trên chữ cái Latinh (cụ thể là trực tiếp từ chữ cái Bồ Đào Nha) thêm các chữ ghép và  chín dấu phụ - bốn dấu tạo ra các âm mới, và năm dấu còn lại dành cho thể hiện thanh điệu của từ. Hai loại dấu phụ có thể được viết cùng trên một chữ cái nguyên âm.[10]
Việc sáng tác ra chữ quốc ngữ là một công cuộc chung của nhiều người, trong đó có cả giáo sĩ Tây Ban Nha, Bồ Đào Nha và Pháp Lan Tây. Nhưng người có công nhất trong việc ấy là Alexandre de Rhodes vì chính ông là người đầu tiên đem in những sách bằng chữ quốc ngữ, thứ nhất là một cuốn tự điển khiến cho người sau có tài liệu mà học và nghiên cứu.
Đến giai đoạn thế kỷ 16, năm 1533. Khi các nhà truyền giáo phương Tây đến Việt nam để truyền dạy ĐạoThiên Chúa, các giáo sĩ đã nghiên cứu, và soạn ra bộ chữ từ chữ La tinh để viết cách phiên âm tiếng Việt, dùng cho việc giảng đạo bằng ngôn ngữ Việt . Từ bộ chữ này đã trở thành chữ Quốc ngữ. Đây cũng là giai đoạn khởi đầu quan trọng nhất, có tính chất quyết định đã giúp cho ngôn ngữ Việt, và nền văn hóa Việt Nam được phát  triển nhanh chóng. Các giáo sĩ, tu sĩ Jesuit (Dòng Tên) người Bồ Đào Nha như Francisco de Pina, Gaspar d’Amaral, Antonio Barbosa, v.v. Sử dụng chữ cái La tinh để ghi chép, phiên âm Tiếng Việt.  Năm 1618, linh mục Francisco De Pina cùng với linh mục Phêrô, đã dịch Kinh Lạy Cha và các Kinh căn bản khác sang tiếng Việt, có thể xem đây là khởi đầu cho việc soạn thảo chữ Quốc ngữ.  Các Linh mục tương đối hoàn tất hệ thống chuyển mẫu tự La-tinh thích hợp với cách giọng phát âm và thanh điệu tiếng Việt. Nhưng giai đoạn này chưa được đầy đủ.
Giáo sĩ Alexandre de Rhodes đã xuất bản các cuốn Từ điển Việt-Bồ-La, Ngữ pháp tiếng An Nam, và  “Bài giảng giáo lý Tám ngày” vào năm 1651.
Chữ Quốc ngữ tuy ra đời từ thế kỉ 17 (1651) ở Việt Nam nhờ công lao tâm trí của các Tu sĩ  truyền giáo, nhưng bị giới hạn chỉ dùng để giúp các Cha giảng, truyền đạo. Vì lúc ấy triều đình phong kiến Việt Nam, đàng Trong lẫn đàng Ngoài với chính sách cấm đạo, và giết hại Giáo sĩ nên chữ Quốc ngữ đã không thể phát triển, truyền bá rộng rãi.
Trường Trung học Adran (Collège d'Adran) là trường dạy Quốc Ngữ đầu tiên ở Việt Nam được các linh mục mở ở Sài gòn từ năm 1861 – 1887.
Gia Định Báo in chữ Quốc ngữ lần đầu tiên phát hành tại Sài Gòn, ngày 15/4/1865.
Khi nói đến chữ Quốc ngữ, và Báo Chí Việt Nam thì cũng không thể quên công lao của Ông Trương Vĩnh Ký, ông là người đầu tiên sáng lập, khai sinh nền Báo Chí Quốc ngữ của Việt Nam, ông là Tổng biên tập tờ Gia Định Báo in chữ Quốc ngữ đầu tiên.
Ông Pétrus - Trương Vĩnh Ký đã viết một bài khuyến khích việc học chữ Quốc ngữ.
Các nhà khoa bảng, trí thức, cách mạng như Phan Bội Châu, Phan Châu Trinh, Trần Quý Cáp, Huỳnh Thúc Kháng, kết hợp với nhiều nhà trí thức cấp tiến thời đó, khởi xướng ra các phong trào Duy Tân, Đông Du nhằm vận động cải cách văn hóa, chính trị trên toàn quốc, kêu gọi bãi bỏ Nho (Hán) học, kêu gọi việc học Quốc ngữ để nâng cao dân trí, với lý do đơn giản: Quốc ngữ dễ học, dễ viết, dễ phổ cập hơn chữ Nho (Hán). Các ông đã vận động mở trường dạy quốc ngữ khắp nước, rầm rộ nhất là ở Quảng Nam (1905), Bình Thuận (Trường Dục Thanh, 1907) và Hà Nội (Đông Kinh Nghĩa Thục,1907).
Mãi cho đến ngày 18 tháng 9 năm 1924 (Giai đoạn Pháp thuộc), toàn quyền Đông Dương Martial Merlin (1923-1925) đã ký quyết định chính thức cho dạy chữ Quốc Ngữ ở ba năm đầu cấp tiểu học, được phổ biến rộng rãi toàn quốc. Sự ra đời và truyền bá chữ Quốc ngữ mọi nơi, trong các trường học, đã giúp cho người Việt Nam, dễ dàng học hỏi, nghiên cứu khi tiếp xúc với văn hoá phương Tây qua sách báo, nâng cao nhận thức, dân trí phát triển cao hơn và nhanh hơn so với các nước trong vùng.[11]
Năm 1942, Hoàng Xuân Hãn biên soạn và cho xuất bản tại Hà Nội cuốn sách Danh từ khoa học, nội dung gồm 5765 thuật ngữ “dịch” ra tiếng Việt, thuộc các lĩnh vực toán học, vật lý, hóa học và cơ học.[14]
-----------------------------
Tham khảo:


[1] http://tusach.thuvienkhoahoc.com/wiki/Dự_án_Thuật_ngữ_Tin_Học
[2] Sử dụng thuật ngữ CNTT trong tiếng Việt: Tây, ta lộn xộn!, http://laodong.com.vn/
[3] Phan Văn Song, Mấy ý kiến về việc thống nhất thuật ngữ Thống kê, http://statistics.vn
[5] Nguyễn Thiện Giáp, Vấn đề chuẩn hóa từ vựng tiếng Việt, http://ngonngu.net
[6] Hà Minh, Vẫn “tắc” chuyện “xử lý tiếng Việt” trong môi trường CNTT, http://www.ictnews.vn
[8] Nguyễn Thiện Giáp, Khái quát về sự hình thành và phát triển của tiếng Việt, http://ngonngu.net/index.php?p=291
[9] Nguyễn Tài Cẩn, Thử phân kì lịch sử 12 thế kỉ của tiếng Việt, http://tainguyenso.vnu.edu.vn/jspui/bitstream/123456789/20716/1/020.pdf
[13] Hoàng Văn Hành, Về sự hình thành và phát triển thuật ngữ tiếng Việt, http://vietlex.com/ngon-ngu-hoc/95-Ve_su_hinh_thanh_va_phat_trien_thuat_ngu_tieng_Viet#_ftn1
[14] Phụng Nghi, 100 năm phát triển tiếng Việt, nhà xuất bản Văn nghệ, 1999
[15] Hà Quang Năng, Đặc điểm của thuật ngữ tiếng Việt, http://www.tgn.edu.vn/bai-viet/c45/i359/dac-diem-cua-thuat-ngu-tieng-viet-phan-1-.html
[16] Lê Đình Tư & Vũ Ngọc Cân, Nhập môn ngôn ngữ học, Hà Nội, 2009
----------------------
2013/9/24

Thuat ngu CNTT - 1 - Tinh trang thieu thong nhat



Việc chuyển các thuật ngữ chuyên ngành Công nghệ thông tin từ tiếng Anh sang tiếng Việt


Lê Gia Công

Tình trạng thiếu thống nhất

Ở bài viết này tác giả thực hiện khảo sát các phương tiện, các quan điểm trong việc chuyển các thuật ngữ chuyên ngành Công nghệ thông tin (từ đây gọi tắt là thuật ngữ) từ tiếng Anh sang tiếng Việt.

Khi cần tìm hiểu hoặc cần dịch một thuật ngữ từ tiếng Anh sang tiếng Việt, công cụ đầu tiên được nghĩ tới là tra cứu từ điển.

Từ điển[1]: loại sách tra cứu, chứa đựng một tập hợp các đơn vị ngôn ngữ (thường là đơn vị từ vựng), sắp xếp theo một thứ tự dễ tra, tìm (thường là theo thứ tự chữ cái) cung cấp một số kiến thức cần thiết đối với từng đơn vị (cách phát âm, từ nguyên, từ loại, nghĩa, hình thức đối chiếu sang một ngôn ngữ khác, vv.).

Từ điển được chia thành hai nhóm:

Từ điển ngôn ngữ
Từ điển khái niệm
Từ điển tường giải (hay Từ điển giải thích)
Từ điển đối dịch hai hoặc nhiều thứ tiếng
Từ điển đồng nghĩa
Từ điển trái nghĩa
…v.v
Bách khoa thư
Từ điển bách khoa
Từ điển thuật ngữ khoa học
Từ điển thuật ngữ đối chiếu hai hay nhiều thứ tiếng

Có thể sử dụng các loại từ điển kể trên để tìm hiểu và dịch một thuật ngữ.

Ví dụ một số từ điển tác giả đã sử dụng:

-         TỪ ĐIỂN KHOA HỌC CÔNG NGHỆ ANH – VIỆT, Cung Kim Tiến & Nguyễn Trung Thuần, Nhà xuất bản từ điển bách khoa, 2003(bản in)

-         Từ điển Tin học của công ty Lạc Việt (phần mềm)

-         Từ điển trực tuyến tại http://tratu.soha.vn

-         TỪ ĐIỂN TIN HỌC & CÔNG NGHỆ THÔNG TIN ANH – ANH – VIỆT, Nguyễn Ngọc Tuấn & Trương Văn Thiện, Nhà xuất bản thông tấn, 2002 (bản in)

-         Từ điển máy tính của Vdict.com (trực tuyến)

-         Từ điển tiếng Việt của Viện ngôn ngữ, nhà xuất bản từ điển bách khoa, 2007 (bản in)

Bên cạnh sử dụng các từ điển, có thể sử dụng các công cụ khác:

-         Công cụ dịch của Google tại địa chỉ: http://translate.google.com

-         Bách khoa toàn thư mở (tiếng Anh) tại http://en.wikipedia.org

-         Bách khoa toàn thư mở (tiếng Việt) tại http://vi.wikipedia.org.

-         Từ điển mở tại: http://vi.wiktionary.org

Giả sử cần dịch từ Header trong trình đơn View/Header and Footer của phần mềm Microsoft Word 2003 sang tiếng Việt. Thực hiện tra cứu một số từ điển:

-         Header: tiêu đề (TỪ ĐIỂN TIN HỌC & CÔNG NGHỆ THÔNG TIN ANH – ANH – VIỆT)

-         Header: ống góp (TỪ ĐIỂN KHOA HỌC CÔNG NGHỆ ANH – VIỆT)

-         Header: đầu trang - văn bản nhắc lại, như số trang hoặc dòng tóm tắt của một đầu đề tài liệu, xuất hiện ở đầu các trang trong một tài liệu (Từ điển Tin học Lạc Việt)

-         Header: đầu trang (http://tratu.soha.vn)

-         Header: người đóng đáy thùng, (thông tục) cái nhảy lao đầu xuống trước,  (điện học) côlectơ, cái góp điện, (kỹ thuật) vòi phun, ống phun, (kiến trúc) gạch lát ngang, đá lát ngang. (Từ điển Anh – Việt của Lạc Việt)

-         Header: tiêu đề (http://translate.google.com)

-         Header: Page header, in printing or typography the material separated from the main body that appears at the top of a page  (http://en.wikipedia.org)

Kết quả tra cứu cho 2 nghĩa đáng chú ý là tiêu đề và đầu trang.

Theo từ điển tiếng Việt của Viện ngôn ngữ, nhà xuất bản từ điển bách khoa, 2007, thì:

-         Tiêu đề (danh từ): danh mục, đầu đề nêu ra; danh hiệu, địa chỉ,…v.v của một công sở, một xí nghiệp in trên góc trái những giấy tờ dùng về việc văn phòng.

-         Đầu trang: không có mục từ này trong từ điển (tuy nhiên, từ “đầu” có nghĩa là “trên hết, trước hết, ở mút hết”; từ điển Tin học và trang web http://tratu.soha.vn giải thích: “Đầu trang: văn bản nhắc lại, như số trang hoặc dòng tóm tắt của một đầu đề tài liệu, xuất hiện ở đầu các trang trong một tài liệu”).

Vậy “header” là “tiêu đề” hay “đầu trang” hay “tiêu đề đầu trang”?

Tương tự khi tra cứu nghĩa của các từ: protocol, bit, byte, web/website …v.v đều có nhiều hơn một lựa chọn:

-         Protocol: giao thức? nghi thức? định ước? định chuẩn?

-         Bit: bit? bít? số nhị phân?

-         Byte: byte? bai?

-         Web/website: web? website? mạng? trang mạng?

Rất khó để lựa chọn một từ tiếng Việt cho phù hợp trong các trường hợp đã đưa ra.

Có nhiều nhận xét về những khó khăn trong việc chuyển các thuật ngữ từ tiếng Anh sang tiếng Việt. Sau đây là một số nhận xét:

“Công Nghệ Thông Tin hiện là một trong những lĩnh vực sử dụng nhiều từ ngữ vay mượn nhất ở Việt Nam. Đồng thời, việc sử dụng những thuật ngữ tiếng Việt tương đương cũng rất tuỳ tiện, thiếu nhất quán. Việc này gây nhiều khó khăn cho cộng đồng trong việc giao tiếp, truyền thông, nghiên cứu.”[2]

“Việc chuyển dịch các thuật ngữ chuyên ngành từ Anh sang Việt cũng mang nặng tính tự phát, thiếu thống nhất, thiếu tổ chức, nhiều lúc vô nguyên tắc và đặc biệt hơn là việc thiếu vắng sự hỗ trợ tối quan trọng của của các trường đại học, các tổ chức nghiên cứu chuyên môn cũng như sự giúp đỡ của các ban ngành có trách nhiệm như ngành giáo dục đào tạo và các tổ chức chính quyền cao hơn.”[3]

“…nhiều nhóm, nhiều người đã cố gắng sáng tạo ra các thuật ngữ để dịch các khái niệm thống kê từ tiếng nước ngoài, đặc biệt là từ tiếng Anh.  Điều này làm tình trạng thuật ngữ không thống nhất, kém hệ thống, thiếu chọn lọc... là không thể tránh khỏi.  Tình trạng này xảy ra giữa các nhóm tác giả và ngay cả chính ở mỗi tác giả.  Thật ra, đây cũng là tình trạng chung của thuật ngữ khoa học, kĩ thuật nói chung ở nước ta, đặc biệt là ở các ngành mới hay mới được quan tâm chẳng hạn như tin học mà báo chí trong nước cũng đã đề cập nhiều.”[4]

Như vậy vấn đề quan trọng ở đây chính là việc thống nhất phương pháp xây dựng và cách sử dụng các thuật ngữ. Trong đó cần xác định vai trò của: các trường đại học, tổ chức nghiên cứu, và cơ quan nhà nước.
-------------------
Tham khảo

[1] http://daitudien.net/ngon-ngu-hoc/ngon-ngu-hoc-ve-tu-dien.html
[2] Sử dụng thuật ngữ CNTT trong tiếng Việt: tây, ta lộn xộn!, http://laodong.com.vn/
[3] http://tusach.thuvienkhoahoc.com/wiki/Dự_án_Thuật_ngữ_Tin_Học
[4] Phan Văn Song, Mấy ý kiến về việc thống nhất thuật ngữ Thống kê, http://statistics.vn
  ----------------
2014/5/23