Hủy
Công Nghệ

Microsoft AI đạt chất lượng dịch thuật Trung – Anh như con người

Trang Lê Thứ Sáu | 23/03/2018 13:33

CNET

Chuyên gia nghiên cứu của Microsoft đã tạo ra được hệ thống dịch tự động dịch báo từ tiếng Trung sang tiếng Anh với chất lượng và độ chính xác cực cao.
 

Một đội ngũ chuyên gia nghiên cứu của Microsoft đã tạo ra được hệ thống dịch tự động đầu tiên có thể dịch báo từ tiếng Trung sang tiếng Anh với chất lượng và độ chính xác như chuyên gia ngôn ngữ thật sự.

Họ đã đạt được sự tương đồng với con người khi thực hiện chương trình kiểm tra các bài báo có tên newstest2017, được phát triển bởi một nhóm đối tác công nghệ và giáo dục. Để đảm bảo kết quả chính xác và tương đương với những gì con người làm được, nhóm đã nhờ hai chuyên viên đánh giá song ngữ nhằm so sánh kết quả của Microsoft với phần dịch thuật của hai người dịch độc lập.

Microsoft AI dat chat luong dich thuat Trung – Anh nhu con nguoi
Xuedong Huang, nghiên cứu kỹ thuật phụ trách mảng lời nói, ngôn ngữ tự nhiên và dịch tự động của Microsoft. (Ảnh: Scott Eklund/Red Box Pictures)

Xuedong Huang, nhà nghiên cứu kỹ thuật phụ trách mảng lời nói, ngôn ngữ tự nhiên và dịch thuật tự động của Microsoft cho biết: “Đạt được sự tương đồng với con người trong việc dịch tự động là ước mơ của tất cả chúng tôi”.

Microsoft AI dat chat luong dich thuat Trung – Anh nhu con nguoi

Arul Menezes, Giám đốc quản lý đối tác nghiên cứu của nhóm dịch tự động của Microsoft. (Ảnh: Dan DeLong.)

Dịch tự động là một vấn đề mà các nhà chuyên gia đã dày công nghiên cứu nhưng nhiều người tin rằng việc đó không bao giờ đạt được. Tuy nhiên, đạt được cột mốc này không có nghĩa là những thách thức của việc dịch tự động đã được giải quyết vì vẫn còn nhiều khó khăn phía trước, chẳng hạn thử nghiệm hệ thống trên các tin tức thời gian thực.

Không có câu trả lời “đúng”

Bộ tài liệu kiểm tra mà nhóm đã dùng để đạt được mốc tương đương với con người này gồm khoảng 2,000 câu đến từ các báo mạng đã được dịch chuyên nghiệp. Microsoft đã thực hiện nhiều vòng đánh giá trên bộ kiểm tra này, ngẫu nhiên chọn hàng trăm đoạn dịch để đánh giá mỗi lần. Mặc dù đã vượt các yêu cầu của bộ kiểm tra, để xác minh chất lượng thực sự của bộ máy dịch thuật tự động, Microsoft còn thuê một nhóm các chuyên gia ngôn ngữ từ bên ngoài để so sánh kết quả của Microsoft với nội dung dịch thủ công bởi con người.

Microsoft AI dat chat luong dich thuat Trung – Anh nhu con nguoi
Tie-Yan Liu, trưởng phòng nghiên cứu chính của nhóm Nghiên cứu Châu Á Microsoft ở Bắc Kinh. (Ảnh: Microsoft).

Phương pháp xác nhận kết quả phần nào cho thấy sự phức tạp của việc dạy cho hệ thống dịch thuật chính xác. Với các nhiệm vụ như nhận diện giọng nói, khá dễ dàng để có thể đánh giá hệ thống có làm tốt như người không, bởi vì kết quả lý tưởng sẽ là sự giống nhau giữa người và máy. Các nhà nghiên cứu gọi đây là việc nhận diện khuôn mẫu (pattern recognition task).

Dịch thuật có phần khác hơn. Thậm chí hai người dịch trôi chảy có thể dịch một câu theo cách khác nhau, và không câu nào sai. Đó là bởi vì có nhiều hơn một cách đúng để nói về cùng một thứ.

“Dịch tự động phức tạp hơn nhiều so với nhận diện một khuôn mẫu đơn thuần,” Zhou nói. “Con người có thể dùng nhiều từ khác nhau để diễn tả cùng một ý, nhưng không phải lúc nào bạn cũng có thể chỉ ra cái nào tốt hơn”.

Những nhà nghiên cứu cho rằng sự phức tạp này làm cho dịch tự động là một vấn đề đầy thách thức, nhưng cũng rất đáng tự hào nếu có thể vượt qua được vấn đề đó.

Liu nói không ai biết được hệ thống dịch tự động sẽ có thể làm tốt việc dịch bất cứ từ ngữ của bất kỳ ngôn ngữ nào chính xác và cường điệu được như con người dịch hay không. Nhưng những phát minh gần đây cho thấy các nhóm có thể tiếp tục thực hiện các bước tiến xa hơn để đạt được mục tiêu đó và các thành tựu AI khác, như đạt được sự tương đồng với con người trong dịch đuổi.

“Một điều duy nhất chúng tôi có thể khẳng định đó chính là việc chúng tôi sẽ ngày càng làm tốt hơn,” Liu chia sẻ.


Cập nhật tin Đầu Tư, Bất Động Sản, tin nhanh kinh tế chứng khoán, kiến thức Doanh Nghiệp tại Fanpage.

Tin cùng chuyên mục

Tin nổi bật trong ngày

Tin mới