5 ưu điểm dịch thuật GPT cần biết nhất
O.Translator
Oct 09, 2023

Điều gì cho phép GPT có thể đẩy dịch máy vào lĩnh vực tiếp theo?
Ưu điểm chính của GPT (Generative Pre-trained Transformer) so với dịch máy truyền thống nằm ở việc sử dụng các thuật toán học sâu và dữ liệu tiền huấn luyện quy mô lớn, điều này giúp GPT thể hiện xuất sắc hơn trong việc hiểu ngữ cảnh, nắm bắt các sắc thái ngôn ngữ và tạo ra bản dịch mượt mà, tự nhiên hơn.
1. Hiểu ngữ cảnh của tài liệu tốt hơn
Hiểu ngữ cảnh là gì? Lấy ví dụ về dịch giữa tiếng Trung và tiếng Anh: “I didn’t see her face because of the mask.”
Nếu thiếu sự hiểu biết đầy đủ về ngữ cảnh, dịch máy có thể bỏ qua các chi tiết ngữ cảnh như “the mask” là loại mặt nạ gì, tại sao lại đeo mặt nạ, chỉ đơn thuần dịch nghĩa bề mặt.
Trong khi đó, các mô hình như GPT có thể dựa vào ngữ cảnh xã hội hiện tại (chẳng hạn như sự phổ biến của khẩu trang trong thời kỳ dịch bệnh) và các manh mối trong câu để đưa ra phán đoán hợp lý hơn rằng từ “mask” ở đây chỉ loại khẩu trang dùng để che mặt, ngăn ngừa sự lây lan của virus, chứ không phải mặt nạ trong kịch nghệ hay hóa trang, từ đó tạo ra một bản dịch chính xác và phù hợp với ngữ cảnh thực tế hơn.
Khả năng hiểu ngữ cảnh tốt hơn của GPT thể hiện ở việc nó có thể nắm bắt chính xác hơn các sắc thái trong ngôn ngữ, bao gồm giọng điệu, phép ẩn dụ, chơi chữ, phép ví von và các hiện tượng ngôn ngữ khác, từ đó đưa ra giải thích và dịch thuật đúng về mặt ngữ nghĩa. Đặc biệt, đối với việc dịch các tài liệu có liên quan chặt chẽ về ngữ cảnh, việc hiểu mối quan hệ giữa các phần trong tài liệu, bao gồm cả các mối quan hệ phụ thuộc dài hạn, có thể cung cấp bản dịch chính xác hơn.
2. Khả năng nhận diện và tạo ngôn ngữ tự nhiên tốt hơn
GPT khi tạo văn bản có thể phù hợp hơn với thói quen ngôn ngữ của con người, bản dịch được tạo ra trôi chảy và tự nhiên hơn, không cứng nhắc hoặc không phù hợp với thói quen biểu đạt của ngôn ngữ đích như một số phương pháp dịch máy truyền thống.
Ví dụ như dịch câu này: “Although he was tired after working long hours, he still decided to go to the gym, which his doctor had advised him to do for improving his health.”
Google Dịch: “Mặc dù sau khi làm việc lâu anh ấy rất mệt, nhưng anh ấy vẫn quyết định đi đến phòng tập gym, đây là lời khuyên của bác sĩ để cải thiện sức khỏe của anh ấy.”
GPT dịch là: “Mặc dù đã làm việc trong một thời gian dài và cảm thấy mệt mỏi, nhưng anh ấy vẫn quyết định đến phòng tập thể dục, đây là lời khuyên của bác sĩ để cải thiện tình trạng sức khỏe của anh ấy.”.
Có thể thấy, nếu là cả một tài liệu, việc câu dịch có tự nhiên hay không là một chỉ số quan trọng để đánh giá hiệu quả dịch thuật, và GPT tốt hơn nhiều so với dịch máy ở điểm này.
3. Giảm thiên vị trong dịch thuật
Do dữ liệu đào tạo của GPT đa dạng và phong phú hơn, nó có thể giảm thiểu những thiên kiến có thể tồn tại trong một số hệ thống dịch máy truyền thống khi dịch thuật.
Ví dụ, khi dịch các tên nghề nghiệp trung lập về giới tính, một số hệ thống dịch máy có thể mặc định sử dụng từ ngữ của một giới tính nào đó, trong khi GPT có thể xử lý vấn đề này một cách khách quan hơn.
4. Khả năng thích ứng với các biểu đạt phi tiêu chuẩn
GPT có khả năng hiểu và dịch tốt hơn các biểu đạt phi tiêu chuẩn, thành ngữ, thậm chí là ngôn ngữ mạng, vì nó đã tiếp xúc với các biểu đạt ngôn ngữ đa dạng hơn trong quá trình tiền huấn luyện.
Ví dụ: khi dịch các câu chứa ngôn ngữ mạng phổ biến, GPT có thể nắm bắt chính xác hơn ý nghĩa của chúng và đưa ra bản dịch phù hợp.
5、Khả năng học tập của GPT
Điều đáng chú ý nhất là GPT đang không ngừng học hỏi và phát triển. Ngay cả với khả năng hiện tại, GPT cũng có lợi thế hơn so với dịch máy.