BrushNet: Công cụ Image Inpainting mới từ nhà Tencent

CongDC
3 min readApr 22, 2024

--

Tóm tắt: BrushNet là mô hình cải tiến mới cho bài toán Image Inpainting. So sánh với các mô hình tốt nhất hiện tại như Stable Diffusion Inpainting hay PowerPaint thì chất lương bức ảnh tạo ra từ BrushNet được cải thiện từ 6-7 % (trong nghiên cứu của tác giả).

1.Giới thiệu

Vào ngày 11/03/1014, BrushNet một cải tiến mới từ nhà Tencent cho tác vụ Image Inpainting chính thức được công bố papermã nguồn mở đi kèm <3. So với các mô hình trước đây thì chất lượng của BrushNet được cho là tốt hơn từ 6 -7% (chủ yếu đến từ độ phân giải được cải thiện đáng kể) dựa theo đánh giá từ chính nghiên cứu của họ. Dưới đây là một số kết quả demo từ nhà sản xuất:

Một kết quả tạo ra từ BrushNet với ảnh đầu vào (bên trái) cùng với ảnh mask đầu vào (ở giữa) và kết quả đầu ra (bên phải)

Kết quả cho thấy độ chân thực khá cao, ảnh đầu ra vẫn giữa được khuôn mặt của Mark gần giống với ảnh ban đâu (môi vẫn bị bóng hơn so với ảnh gốc). Oke vậy với thử nghiệm trong thực tế thì sao :v

Kết qủa tạo ra từ BrushNet với ảnh từ một căn phòng trống (bên trái) và ảnh mask (giữa) tạo ra bức ảnh với đầy đủ nội thất (bên phải)

2. Kiến trúc mô hình

(Đang cập nhập … )

3. So sánh với các mô hình khác

Theo nhận định cá nhân, mô hình BrushNet có tốt hơn các mô hình khác ở độ phân giải, vùng inpainting hài hòa với vùng outpainting và vùng chuyển tiếp mượt mà hơn. Điều đó cũng được thể hiện trong paper của tác giả.

So sánh kết quả của BrushNet so với các mô hình thế hệ trước đây như (b) Blended Latent Diffusion (BLD) , Stable Diffusion Inpainting (SDI), (d) HD-Painter (HDP), (e) PowerPaint (PP), (f) ControlNet-Inpainting (CNI)

Trong bảng đánh giá chi tiết giữa các mô hình, nổi bật nhất là điểm PSNR của BrushNet tăng tới 30% so với SDI và đạt 31.94 điểm, gần đạt tới ngưỡng mắt người không phân biệt được (PSNR = 40).

Với những kết quả trên cũng có thể thấy mô hình BrushNet hiện tại đang là một trong số các mô hình tốt nhất bên cạnh SDI.

4. Kết luận

Sự cải tiến của BrushNet vẫn đảm bảo cho nó tương thích với các mô hình Stable Diffusion khác (như DreamShaper, MajixMix,…) do vậy BrushNet tuy chưa có nhiều cải tiến nhưng với những gì nó mang lại thì đây là lựa chọn hàng đầu ở thời điểm hiện tại cho bài toán Image Inpainting.

--

--