marque

*** Chào mừng bạn đang ghé thăm trang web An Phong An Bình***

Thứ Sáu, 14 tháng 4, 2017

Thôi! Bỏ đi Tám

“Thôi! Bỏ đi Tám” hay “Thôi bỏ đi, Tám!” là những câu thông dụng, nghe đã nhiều lần, tạm hiểu, nhưng ít ai biết xuất xứ của nó như thế nào. Trong thời chiến tranh cận đại ở Việt Nam, để cho người Mỹ hiểu, người mình đã từng dịch những lời đó thành những lời trào phúng “Forget Eight” . Vô tình hay cố ý, người ta đã bỏ quên chữ “Thôi”. Không biết người Mỹ có hiểu hay không, nhưng lối dịch này thật ngây ngô và buồn cười. Vào thời điểm bây giờ (2009), Internet “dịch”  mấy lời đó như sau:

    “Thôi! Bỏ đi Tám”  ð “Blow! Discarded Eight” (bản dịch của Google) hoặc “Stop! To cast Eight” (bản dịch của EVTran – English Vietnamese Translator);

    “Thôi bỏ đi, Tám!” ð “Only leaves, Eight!” hoặc “Cease desertion, Eight!”.

Dịch như vậy chỉ có “Trời mới hiểu”! Nếu ai biết dịch những câu này ra tiếng Anh như thế nào cho đúng, xin làm ơn quảng bá trên Internet.

Kể từ ngày thế giới được toàn cầu hoá, nhân loại đã xích lại gần nhau hơn, trên nhiều lĩnh vực như thương mại, văn hoá, kỹ thuật, v.v. Nhu cầu chuyển ngữ cũng được phát triển rầm rộ khắp năm châu. Riêng đối với cộng đồng Việt Nam, hiện giờ đang có rất nhiều công ty và nhiều cá nhân, trong nước lẫn ngoài nước rải rác khắp năm châu, đãm trách việc chuyển ngữ song phương từ tiếng Việt sang tiếng Anh, Pháp, Nhật, Hàn, Thái, Ấn độ … Người chuyển ngữ không nhất thiết phải là người Việt, thí dụ như anh Shane Wall gốc người Úc (lấy tên Việt là Võ văn Sanh) hiện đang sống tại Tây Ninh. Người chuyển ngữ thường thường nêu rõ lĩnh vực chuyên môn của họ, thí dụ như kỹ thuật, y khoa, hành chánh, văn chương, v v. kèm thêm chi tiết riêng tư như quá trình đào tạo, thành viên của hội dịch thuật, tiền công dịch tính theo  mỗi chữ, và một vài bài dịch tiêu biểu, để khách hàng tuỳ tiện phán xét. Những công ty dịch thuật có nhiều khách hàng có thể phân tải (outsourcing) cho các công ty nhỏ hơn, hoặc các công ty khác cùng lĩnh vực chuyên môn, và dùng nhu liệu (thí dụ như CATCountComputer Assisted Tranlation acCounting) để đếm chữ và tự động in hoá đơn cho khách hàng. Như vậy một phần trong thương vụ chuyển ngữ đã được tự động hoá (automation).

Mặt khác, kể từ ngày Internet được phổ thông trong đại chúng thì việc tìm tòi, trao đổi, chia sẻ những gì có thể viết được bằng chữ, ghi lại được bằng âm thanh, hay bằng hình ảnh đã trở thành quá dễ dàng. Ngày nay khi tìm một vài mục bằng tiếng Việt trên YouTube hay Google, nhiều khi người ta lại vô tình được thêm một vài kết quả liên quan nhưng được viết bằng một ngoại ngữ như Anh, Pháp, Trung Hoa, Hàn, Nhật! Người có óc tò mò không thể không ước ao “phải chi bài này được viết bằng tiếng của người mình” và những điều ao ước đó chắc cũng là những điều ao ước của những người thuộc các sắc tộc khác. Ngày nay, theo ước lượng của Ông Lương vĩnh Tước,  Phó Tổng Giám đốc Tập đoàn Yahoo, thì số người Việt sử dụng Internet tại Việt Nam đã lên đến trên dưới 20 triệu. Vì vậy nhu cầu chuyển ngữ trực tuyến từ tiếng ngoại quốc sang tiếng Việt, và ngược lại, đã lôi cuốn một số người tham gia vào việc phát triển nhu liệu chuyển ngữ tự động (auto translation, hay machine translation).

Dù chuyển ngữ bằng người (human translation) hay bằng nhu liệu trong máy tính (machine  translation) thì việc chuyển ngữ  cũng đều có thể được tóm gọn bằng sơ đồ sau đây:

Dịch” có thể là đầu óc của con người, hoặc là một nhu liệu trong máy tính. “Nhập” (Input) là những gì cần phải dịch trong ngôn ngữ nguyên thuỷ (source language). “Xuất” (Output) là những gì đã được dịch trong một ngôn ngữ khác (target language). Đơn giản như vậy, nhưng Dịch phải đạt được ba điều căn bản: chính xác, nhanh và bóng bẩy, dù Dịch là người, hay là máy. Đơn giản như vậy nhưng khó vô cùng! Trước hết muốn chính xác, phải thông hiểu Nhập và việc làm đầu tiên là suy diễn (interpretation). Không phải Nhập nào cũng rõ nghĩa; có người than “chỉ có người viết mới hiểu nổi họ muốn nói gì”. Đôi khi, câu văn rất giản dị, con người thì hiểu rất mau, nhưng máy thì ... phải cần rất nhiều thời gian để huấn luyện; thí dụ như “nhiêu, nhiều”, hoặc “mới, mới làm; cũ, chê”. Đây là một thử thách lớn lao cho những ai muốn dạy máy vi tính hiểu tiếng Việt. Dầu thế nào đi nữa, Dịch vẫn phải làm nhiệm vụ được giao phó cho mình: tạo ra Xuất, dù hay, hay dở!

Nhanh thì có lẽ không ai nhanh hơn máy, vì máy có thể vừa dịch, vừa viết, bắt đầu từ lúc máy thấy Nhập. Trên thực tế, người ta không cần Xuất ngay lập tức, ngoại trừ khi phải dịch ở các phiên toà, hay các cuộc đàm phán mang màu sắc chính trị như trong quốc hội (ở Canada), trong các buổi họp của các nguyên thủ quốc gia. Tuy vậy, nhưng người ta cũng không thể “chờ cho đến Tết Congo” mới có câu trả lời (Xuất).

Người ta đánh giá phẩm chất của Dịch bằng cách phân tích Xuất. Ai bóng bảy, trôi chảy thì người đó hơn. Đôi khi lỡ vào thế kẹt, người dịch có thể vào  diễn đàn dịch thuật cầu cứu với bạn đồng nghiệp nhờ chỉnh giùm bản dịch (Xuất) của mình. Nếu dùng máy để dịch thì có thể thử dùng một nhu liệu khác và người sử dụng máy phải phán quyết xem Xuất nào hay hơn. Vào thời điểm hiện tại thì nhiều người đồng ý rằng Người dịch hay hơn Máy. Trước khi trình làng sản phẩm của mình, người chịu trách nhiệm (Dịch) phải duyệt và sửa chữa Xuất, bất kể là Nhập đã được dịch bằng Người hay bằng Máy. Nói tóm gọn thì Máy chưa thể hoàn toàn thay thế Người, trong lĩnh vực dịch thuật. Rất có thể là Máy sẽ không bao giờ hoàn toàn thay thế người được và người làm thương vụ chuyển ngữ không phải lo “bể nồi cơm”. Tuy không thể hoàn toàn giao hết trách nhiệm dịch thuật cho máy, người dịch thuật chuyên môn đã và đang nhờ máy trợ giúp dưới dạng CAT. Người dịch thông thường phải tự dịch trước, rồi dùng các nhu liệu CAT như Trados 2007, Wordfast để xúc tiến việc dịch thuật cho chóng thành và để điều chỉnh sản phẩm của mình.

Chuyển sang vấn đề dịch hoàn toàn bằng máy (Machine Translation), thì các nhu liệu chuyển ngữ tiếng Việt hiện giờ vẫn còn trong tình trạng phát triển. Trong khi lịch sử “dịch bằng máy” bắt đầu từ thập kỷ 1950, mãi đến năm 1969 chương trình dịch bằng máy Anh – Việt đầu tiên (LOGOS I) mới chính thức bắt đầu. Đến năm 1972, LOGOS I được dùng để dịch cẩm nang dành cho phi công Việt nam từ tiếng Anh sang tiếng Việt và khi so sánh với văn bản do người dịch (human translation) thì kết quả như sau: bản do người dịch dễ hiểu nhất, đứng nhì là bản dịch của LOGOS I có hiệu đính (revised version), đứng chót là bản dịch không hiệu đính (unedited version). Nhưng đáng chú ý nhất là bản dịch có hiệu đính được coi là rõ  ràng nhất (có phải đây là điểm bắt nguồn cho CAT sau này?). Sau này để cho có hiệu quả hơn, người ta quyết định huấn luyện trau dồi khả năng Anh ngữ cho phi công Việt Nam để họ dùng trực tiếp cẩm nang bằng Anh ngữ mà không dùng bản dịch của LOGOS I nữa!

Trong hai thập kỷ gần đây, người Việt ở quốc nộihải ngoại đã đóng góp nhiều vào việc phân tích các phương thức chuyển ngữ. Trong các buổi thuyết trình của người ngoại quốc về phương cách chuyển ngữ, người ta cũng đã dùng thí dụ chuyển ngữ Anh – Việt. Từ phương cách dựa theo luật lệ rắc rối của mỗi ngôn ngữ (rule-based translation) người ta đã dần dần chuyển sang phương thức thống kê (statistical approach) mà người ta gọi là “dịch mà không cần hiểu”! Một trong những nhu liệu đang được phát triển bằng phương cách này là Google Translate trên Internet, hoàn toàn miễn phí và có thể in ra lời dịch ngay lập tức khi mình đưa những lời cần dịch vào máy. Những lời cần dịch không nhất thiết phải là những chữ mà mình đánh máy (keyboarding) vào khung cửa sổ Enter mà còn có thể là một  bài đã được viết sẵn và chuyển lên Internet (uploaded document), hoặc một định danh dưới dạng URL. Google Translate có thể dịch song phương 42 ngôn ngữ (trong đó có tiếng Việt) và hiện đang cần sự giúp đỡ của người sử dụng để nới rộng phần dữ liệu (database) và giúp cải tạo độ chính xác của bản dịch. 

Mặc dù việc dịch bằng máy hiện giờ chưa được hoàn chỉnh, người ta vẫn có thể áp dụng các nhu liệu chuyển ngữ để tạo ra những sản phẩm phụ (by-products) thí dụ như “thông dịch có phiên âm” như trong sơ đồ sau đây:

Âm là tiếng của người nói cho máy nghe. Âm có thể là lời nói từng chữ một, hay trọn nguyên câu. Chuyển Âm ð Văn là nhu liệu chuyển âm thanh (voice recognition) sang lời viết (Văn_1), cùng chung ngôn ngữ với Âm . Hiện tại có rất nhiều nhu liệu này dành cho Anh ngữ, thí dụ như Dragon, Wave to Text. Riêng cho tiếng Việt, CSLU toolkit đã được dùng trong cuộc thử nghiệm gồm 2345 chữ với độ chính xác cao nhất là 97%.

Dịch giữ nhiệm vụ dịch Văn_1 sang Văn_2 trong một ngôn ngữ thứ hai, như đã bàn đến ở phía trên.  Chuyển Văn ð Âm là nhu liệu biến chuyển câu văn (text) sang tiếng nói  trong cùng ngôn ngữ với Văn_2. SmartRead, TextAloud là hai thí dụ cho  Chuyển Văn ð Âm bằng Anh Ngữ. Chuyển sang nhu liệu bằng tiếng Việt thì vào tháng 11 2009, trường Đại Học Quốc Gia Sài gòn vừa mới trình làng Tiếng nói Phương Nam, một nhu liệu có thể chuyển văn bản viết bằng tiếng Việt sang tiếng nói qua giọng cô phát thanh viên Kim Phượng!


Để chứng minh rằng việc thực hiện những sản phẩm như vậy không phải chỉ là viễn tưởng, xin hãy mời xem iTravel®, một loại máy thông dịch bỏ túi có phát âm hiện đang được khách du lịch thế giới chiếu cố. Hiện giờ các máy thông dịch như vậy cần phải có một máy vi âm (microphone) thật tốt để giúp máy khỏi lầm lẫn khi  nghe tiếng nói của người. Hiện giờ các máy như vậy chỉ có tầm dùng giới hạn (thí dụ như du lịch). Rồi sẽ có một ngày các nhu liệu được đề cập ở phía trên được cải thiện hoàn chỉnh để có thể áp dụng chính xác trong nhiều lĩnh vực khác nhau. Có lẽ ngày đó con người không còn cần phải mất nhiều công sức trao  dồi khả năng viết và nói (nhiều) ngoại ngữ nữa.

Xin hãy đừng thấy chuyện này có vẻ quá xa vời mà vội phán “Thôi! Bỏ đi Tám”.