"Yolov8 hoạt động bằng cách chia hình ảnh video thành dạng lưới và dự đoán các ô trong giới hạn, xác suất và phân đoạn cho mỗi ô lưới, từ đó xác định những vật thể không mong muốn lọt vào, phân loại và xóa chúng", Serhii Postupaiev, thành viên nhóm nghiên cứu của Đại học Công nghệ Kaunas (Litva), cho biết.
Yolov8 là viết tắt của "You Only Look Once", hình thành từ ý tưởng cảnh quay có lọt người quay phim hoặc vật thể không phù hợp với bối cảnh. Nó được đánh giá sẽ hữu ích trong các sự kiện phát sóng trực tiếp.
Postupaiev cho biết tệp dữ liệu dùng để đào tạo AI khá đa dạng, gồm hàng nghìn gigabyte nội dung quay được với kích thước, hình dạng và loại thiết bị khác nhau trong trong nhiều điều kiện. Nhóm sử dụng Video Inpainting, công cụ học sâu (deep learning) hoạt động khá giống Spot Healing Brush để xóa các điểm không ưng ý trên ảnh của phần mềm Photoshop.
"Với AI, các chương trình phát sóng trực tiếp sẽ trở nên sạch và chuyên nghiệp hơn, không bị gián đoạn do kỹ thuật viên sẽ loại bỏ những thứ ở nơi không nên xuất hiện trong cảnh quay", Postupaiev cho hay. "Với video đã quay, việc biên tập cũng dễ dàng hơn nhiều".
Theo Postupaiev, Yolov8 ban đầu sẽ được ứng dụng tập trung vào lĩnh vực bóng đá, chủ yếu để loại bỏ chi tiết gây mất tập trung khi tường thuật trực tiếp. Thời gian tới, công nghệ này sẽ có mặt trong các lĩnh vực khác. Dù vậy, nhóm chưa công bố lộ trình thương mại hóa sản phẩm.
Năm ngoái, phần mềm tương tự cũng được viện Max Planck nghiên cứu và công bố. Tuy nhiên, theo Petapixel, Yolov8 được xem là mô hình AI hoàn thiện đầu tiên có khả năng xử lý ngay khi đang quay trực tiếp.
Ý kiến ()