Văn phòng

Cách Skype Translator hoạt động

Mục lục:

Anonim

Khoa học viễn tưởng chứa đầy các tài liệu tham khảo về các thiết bị công nghệ tiên tiến mà hoạt động của chúng, diễn giải cách diễn đạt thần thoại, không thể phân biệt được với ma thuật. Xuất phát từ trí óc sáng tạo của các tác giả, thật khó để tưởng tượng khi nào những phát minh như vậy có thể nằm trong tay chúng ta và cuối cùng chúng ta chấp nhận rằng sự tồn tại của chúng sẽ không trở thành một phần trong vòng đời của chúng ta. Nhưng thỉnh thoảng, một trong số chúng lẻn vào cuộc sống của chúng ta quá sớm. Đó là trường hợp của bản dịch thời gian thực mà Microsoft và Skype sắp thực hiện

"Nhiệm vụ rất đơn giản.Nó liên quan đến khả năng hội nghị truyền hình của Skype, mạng máy chủ đám mây rộng lớn của Microsoft Azure, những đổi mới công nghệ của Microsoft Research và những tiến bộ gần đây trong nhiều lĩnh vực như thống kê và máy học. Tất cả điều này phục vụ bạn để ngay khi bạn phát âm một câu bằng ngôn ngữ của mình, hệ thống sẽ nhận ra những gì bạn nói, dịch nó và truyền nó đến liên hệ của bạn bằng một ngôn ngữ khác. Làm thế nào là nó có thể?"

Công nghệ biến điều đó thành hiện thực

Skype Translator, tên mà chức năng mới được biết đến, không phải là chớp nhoáng, thậm chí không phải trong một năm . Skype Translator là kết quả của nhiều thập kỷ nghiên cứu về nhận dạng giọng nói, dịch máy và kỹ thuật máy học. Trong tất cả các lĩnh vực này, hoạt động của một hệ thống sẽ không thể thực hiện được nếu không có những tiến bộ mới nhất trong đó.

Skype Translator là kết quả của nhiều thập kỷ nghiên cứu về nhận dạng giọng nói, dịch máy và kỹ thuật máy học.

Bắt đầu với Nhận dạng giọng nói, một công nghệ đã được nghiên cứu một thời gian nhưng việc áp dụng công nghệ này luôn bị ảnh hưởng bởi số lượng lớn lỗi và độ nhạy quá mức của các hệ thống hiện có. Một giây nghi ngờ, những thay đổi nhỏ trong giọng nói hoặc một tiếng ồn nhỏ nhất cũng đủ khiến máy tính nhầm lẫn và khiến nó hiểu nó muốn gì. Đó là cách nó diễn ra cho đến khi sự phát triển của các kỹ thuật 'học sâu' và việc tạo ra các mạng lưới thần kinh nhân tạo bùng nổ, điều mà Microsoft Research biết được điều gì đó. Nhờ họ, có thể giảm đáng kể tỷ lệ lỗi và cải thiện độ tin cậy cũng như hiệu quả của tính năng nhận dạng giọng nói, bước đầu tiên cần thiết để Skype Translator hoạt động.

machine translation là trụ cột rõ ràng khác mà Skype Translator dựa vào. Tại đây, Microsoft một lần nữa sử dụng công nghệ nội bộ và sử dụng công cụ dịch Bing để dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.Hệ thống của ông sử dụng kết hợp các kỹ thuật nhận dạng cú pháp và mô hình thống kê để tinh chỉnh kết quả. Ngoài ra, trong dịp này, động cơ đã được huấn luyện đặc biệt để nhận dạng loại ngôn ngữ xuất hiện trong các cuộc hội thoại nói, khác xa với tính chính xác và gọn gàng thường được giả định trong văn bản. Do đó, hệ thống Skype Translator kết hợp cơ sở kiến ​​thức ngôn ngữ rộng lớn của Bing Translator cùng với lớp từ và cụm từ mở rộng thường được sử dụng trong ngôn ngữ thông tục.

Nhưng lời nói và ngôn ngữ là địa hình phức tạp. Chúng liên tục thay đổi, chúng có nhiều hương vị và chủng loại, mỗi người có một phong cách riêng, v.v. Skype Translator phải theo kịp tất cả những điều này, yêu cầu đào tạo liên tục và tối ưu hóa cả nhận dạng giọng nói và dịch máy. Để làm được điều này hệ thống đã được xây dựng trên nền tảng 'máy học' mạnh mẽ, một nhánh của trí tuệ nhân tạo nhằm mục đích phát triển các kỹ thuật cho phép máy móc và thuật toán học hỏi bằng cách huấn luyện với dữ liệu mẫu.Việc sử dụng các kỹ thuật này, phổ biến trong lĩnh vực thống kê, cho phép dịch vụ cải thiện khi sử dụng, tận dụng dữ liệu được tạo khi sử dụng để tinh chỉnh thêm tính năng nhận dạng giọng nói và dịch tự động.

Một số dữ liệu thử nghiệm này được tạo tự động từ nhiều nguồn khác nhau, bao gồm các mạng xã hội như Facebook, các trang web đã dịch, video có phụ đề hoặc thậm chí các cuộc hội thoại được tạo cho mục đích này và được phiên âm và dịch thủ công . Nhưng một phần khác của dữ liệu đến từ các cuộc trò chuyện thực tế được tổ chức thông qua dịch vụ. Điều này rất quan trọng vì Microsoft sẽ thông báo cho bạn sau mỗi cuộc gọi, bạn nên biết rằng Skype Translator có thể ghi lại các cuộc hội thoại, ẩn danh chúng để có thể phân tích chúng sau này bằng các thuật toán của nó và được giới thiệu trong quá trình đào tạo các mô hình thống kê của mình.

Skype Translator chỉ có thể hoạt động bình thường nếu nó có thể học thông qua một quá trình dựa trên việc sử dụng nó trong các cuộc hội thoại thực của con người

"

Hệ thống không thể hoạt động nếu không có quá trình tìm hiểu này. Khi con người nói, chúng ta tạm dừng và lặp lại mọi thứ, mắc lỗi và thay đổi suy nghĩ khi tiếp tục, giới thiệu ahs, ehms, uhms>chỉ tìm hiểu về công dụng thực tế của nó mới có thể làm cho nó tốt hơn "

Từ ngôn ngữ nói này sang ngôn ngữ nói khác trong vài giây

Được hỗ trợ bởi tất cả những tiến bộ này, điều quan trọng là Skype Translator có thể thực hiện toàn bộ quá trình nhận dạng và dịch thuật một cách nhanh chóng và minh bạch cho người dùng Mỗi khi chúng ta nói, hệ thống phải nhận ra những gì chúng ta đang nói, dịch nó sang ngôn ngữ của người nhận và truyền đạt cho họ theo cách vẫn trung thành với những gì chúng ta cố gắng truyền đạt ban đầu.Chúng ta càng ít chú ý đến các bước trung gian càng tốt.

Ngay sau khi hệ thống phát hiện ra rằng chúng ta đang nói, hệ thống sẽ bắt đầu ghi lại những gì chúng ta nói và bắt đầu quá trình nhận dạng giọng nói Đây không phải là về việc không chỉ nhận ra từng từ mà chúng ta đang phát âm mà còn loại bỏ mọi thứ thừa, xóa các biểu thức và tiếng ồn vô nghĩa, phát hiện sự phân chia văn bản thành các câu, bao gồm các dấu chấm câu và chữ in hoa, đồng thời cung cấp ngữ cảnh cho văn bản đó điều đó giúp giải thích của bạn. Khi bạn nghĩ về nó một chút, bạn sẽ nhận ra rằng thật khó để xác định tất cả những điều này từ ngôn ngữ nói.

Skype Translator cần tính năng nhận dạng giọng nói càng chính xác càng tốt, vì những gì tiếp theo là chuẩn bị thông tin đã thu thập để so sánh với các mô hình thống kê đang được cải thiện thông qua hệ thống 'máy học' của mình.Ở đây, quá trình này bao gồm việc tìm ra những điểm tương đồng giữa những gì hệ thống đã hiểu mà chúng ta đang nói với các từ và ngữ cảnh có trong các mô hình, sau đó áp dụng các phép biến đổi đã học trước đó để chuyển đổi âm thanh thành văn bản và dịch nó sang ngôn ngữ nước ngoài.

Ở bước cuối cùng, Skype đã chuẩn bị sẵn một cặp bot có giọng nam và nữ đóng vai trò phiên dịch trong cuộc gọi Sau khi người dùng chọn một người, anh ta sẽ chịu trách nhiệm truyền thông điệp đã dịch của chúng tôi tới người nhận, để không chỉ các bản phiên âm và bản dịch bằng văn bản xuất hiện trên màn hình mà anh ta còn có thể nghe thấy chúng thành tiếng như thể một người thứ ba đang ở đó. trung gian giữa chúng tôi. . Các bot này có thể nhanh chóng truyền đạt thông điệp để bất kỳ ai đang nghe ở phía bên kia màn hình sẽ nhận được thông báo sau vài giây sau khi chúng tôi phát âm.

Chương trình thử nghiệm là điểm bắt đầu

Chính xác là sự hiện diện của bot với tư cách là diễn giả bên thứ ba trong cuộc trò chuyện là một trong những chi tiết vẫn cần được hoàn thiện. Microsoft nhận ra rằng việc thích ứng với chúng thật dễ dàng đối với những người quen nói qua thông dịch viên, nhưng đối với những người khác, việc này cần một thời gian học hỏi. Và Microsoft và Skype có thể quyết tâm tạo ra trải nghiệm dịch thuật theo thời gian thực tốt nhất hiện có, nhưng để làm được như vậy họ cần chúng ta học hỏi cả bản thân và máy mócBản xem trước Skype Translator chỉ là một bước nữa trong quá trình đó.

Chương trình thử nghiệm đã ra mắt vào giữa tháng 12, giới thiệu bản dịch nói giữa hai ngôn ngữ: tiếng Anh và tiếng Tây Ban Nha, và bản dịch viết trong hơn 40 Để truy cập nó, cần có lời mời, chúng tôi có thể yêu cầu bằng cách đăng ký trên trang web của chương trình. Nếu chúng tôi hài lòng với nó, chúng tôi có thể dùng thử Skype Translator từ các ứng dụng Skype dành cho Windows 8.1 hoặc Windows 10 Bản xem trước kỹ thuật. Nếu không, chúng tôi sẽ phải đợi dịch vụ được mở rộng và công khai chính thức.

"

Dù sao đi nữa, Skype Translator đã khởi động ngay khi chúng ta sắp nói lời tạm biệt với năm 2014. Trước khi kết thúc, hãy dừng lại ở đây một giây và nghĩ về năm bạn vừa đọc: hai nghìn mười bốn>"

Via | Skype Blog I, II

Văn phòng

Lựa chọn của người biên tập

Back to top button