Bing

Microsoft thông báo rằng công nghệ nhận dạng giọng nói của họ giúp giảm tỷ lệ mắc lỗi và hoạt động hiệu quả như con người

Anonim
"

Đó là một trong những trụ cột mà nhiều người khẳng định rằng các nền tảng khác nhau sẽ phát triển trong tương lai gần. Không có gì để tương tác với các lệnh hoặc cử chỉ bằng văn bản. Tương lai nằm ở việc nói chuyện với máy móc nhưng không nói chuyện với các mệnh lệnh rô-bốt và các mệnh lệnh không tự nhiên. Chúng tôi sẽ làm điều đó bằng ngôn ngữ tự nhiên, điều mà chúng tôi đánh giá ngày càng rõ ràng hơn ở các trợ lý cá nhân."

Và một trong những công ty có sự nghiệp đáng chú ý nhất theo nghĩa này là Microsoft, một công ty có lộ trình phát triển nhằm liên tục cải thiện khả năng nhận dạng giọng nói của nhân viên sau đó trên nền tảng của họ.Một công nghệ mà chúng tôi hiện có tin tức từ nhóm phát triển, tin tức nói về một cải tiến tuyệt vời đặt nó ở cùng mức độ chính xác như mức độ được sử dụng giữa con người

Theo nghĩa này, họ đã thông báo rằng hệ thống nhận dạng giọng nói của họ đã đạt 5,1% trong WER, tức là tỷ lệ lỗi của từ được sử dụng. Đối với nhiều người, điều này có thể không nói lên được điều gì, nhưng thật ngạc nhiên nếu chúng ta thấy một mặt tỷ lệ này giống với tỷ lệ chúng ta thấy trong giao tiếp giữa mọi người

Để làm được điều này, từ Redmond họ đã chọn sử dụng các mô hình cải tiến của ngôn ngữ lời nói và âm thanh dựa trên việc sử dụng mạng thần kinhĐây là Chúng được kết hợp với bộ nhớ hai chiều dài hạn để cải thiện mô hình âm thanh, do đó cải thiện khả năng nhận dạng nhờ dự đoán các từ có thể được sử dụng dựa trên lịch sử giao tiếp.Những cải tiến này cũng có sự hỗ trợ của đám mây nhờ nỗ lực mà công ty đã thực hiện để cải thiện cơ sở hạ tầng điện toán đám mây, đặc biệt là với Azure.

Ngoài ra, điều này có nghĩa là tỷ lệ lỗi này đã được hạ xuống về biên độ lỗi, kể từ trước đó 5,9%, do đó giảm từ 12%, là con số mà hệ thống có được cách đây chưa đầy một năm. Do đó, Microsoft đã đạt được một hệ thống nhận dạng giọng nói hiệu quả như của con người và nhìn thấy sự tiến bộ mà họ đang đạt được, không có gì ngạc nhiên khi họ thậm chí sẽ cải thiện nó trong những tháng hoặc năm tới.

Biết đâu trong vài năm nữa, việc nói chuyện với PC chạy Windows, tương tác với Cortana hoặc các ứng dụng như Office của chúng ta sẽ trở thành điều gì đó tự nhiên như những gì chúng đã khiến chúng ta mơ ước (hoặc gặp ác mộng, biết đâu) trong rạp chiếu phim.

In Xataka | Chúng không phải là giọng nói từ bên ngoài ngôi mộ, chúng là những mệnh lệnh ẩn mà trợ lý giọng nói nhận ra còn con người thì không

Bing

Lựa chọn của người biên tập

Back to top button