Microsoft Research tạo hệ thống có khả năng tự động tạo phụ đề "thông minh"
Mục lục:
Chắc chắn bạn đã từng gặp một chú thích khó hiểu, không chính xác hoặc nói rất ít về hình ảnh mà nó đề cập; và thậm chí có khả năng là, nếu bạn cống hiến hết mình để xuất bản các bài báo của riêng mình, bạn sẽ thấy tedious điền vào phần này là điều cần thiết nhất. Chà, những người từ Redmond đã tạo ra một công cụ nhằm giúp bạn thực hiện mọi việc dễ dàng hơn.
Một tác phẩm do Microsoft Research xuất bản tự mô tả là “hệ thống tạo phụ đề” có khả năng bắt chước các đặc điểm tường thuật của ngôn ngữ con người, nghĩa là một công nghệ có thể mô tả ảnh chụp màn hình như thể về một người trong chúng ta, với ngữ cảnh tương ứng của nó.Điều mà các công ty như Facebook, Microsoft và Google đã nghiên cứu được một thời gian, nhưng lần này nó vượt quá mong đợi.
Nó bao gồm những gì
Anh ấy đã có một khoảng thời gian tuyệt vời
Bằng cách này, system có khả năng thậm chí kể một câu chuyện hoàn chỉnh từ nhiều hình ảnh, mô tả và kể nó như thể đó là một cuốn sách. Theo các chuyên gia, một tiện ích có thể trở thành một tính năng mang lại cảm giác giống người hơn cho một số ứng dụng nhất định, ứng dụng nhận dạng giọng nói, tự động tạo mô tả ở các khu vực khác, v.v.
Và thực tế là tool không giới hạn ở việc nói ngắn gọn những gì nó “thấy”, mà còn cung cấp một phạm vi rộng hơn. Frank Ferraro, một trong những tác giả của tác phẩm này, giải thích: bối cảnh của tình huống được phản ánh trong hình ảnh, đạt được "bối cảnh tường thuật và phong cách tường thuật độc đáo".Để đặt chúng ta vào một tình huống, anh ấy đưa ra cho chúng ta một cách rõ ràng example
Mẹ anh tự hào về anhVì vậy, chúng tôi đề xuất trường hợp sau: “Hãy tưởng tượng chúng ta có một album ảnh của một số người bạn đã tổ chức sinh nhật trong một Quán rượu. Một số hình ảnh đầu tiên cho thấy mọi người gọi bia và uống nó, trong khi những hình ảnh cuối cùng cho thấy ai đó đang ngủ trên ghế sofa”, anh nhận xét.
Một hệ thống thông thường “có thể chỉ đơn giản là chỉ ra điều gì đó giống như có một người đang nằm trên ghế sofa, trong khi hệ thống của chúng tôi có thể bao gồm rằng họ có thể ở trong tình huống đó vì họ say sau khi uống một vài ly”. Một bổ sung cung cấp sự hiểu biết và một cảm xúc nhất định cũng được phản ánh qua các hình ảnh và chú thích ảnh có trong bài viết này.
Via | Đánh giá Công nghệ MIT
Trong Xataka Windows | Microsoft ra mắt ứng dụng xác định giống chó của bạn