Hệ thống gợi ý Recommender System là một hệ thống lọc thông tin để dự đoán về sở thích của người dùng đối với mặt hàng mặt họ quan tâm, sau đó đưa ra các đề xuất hợp lí có hiệu quả. Hình thức này được sử dụng để cung cấp các kiến nghị, gợi ý trên nhiều lĩnh vực như: YouTube giới thiệu video, Shopee & Tiki giới thiệu sản phẩm liên quan cần mua, Netflix đề xuất phim theo sở thích và Facebook để giới thiệu bạn bè quen biết cũng như các sản phẩm quảng cáo khác,v.v.
Nhờ hiệu quả tuyệt vời, các loại của hệ thống gợi ý Recommender System được hầu hết các chuyên gia sử dụng để nâng cao hoạt động kinh doanh và tăng tỉ lệ chuyển đổi.
Những yếu tố góp phần hình thành nên hệ thống Recommender System bao gồm: Người dùng (User); Mặt hàng (Items); Phản hồi (Feedback). Sau khi đã thu thập được các thông tin số liệu, việc biểu diễn nó trên ma trận User-Items là phương pháp hiểu quả để xem xét sở thích của người dùng lên từng items cụ thể.
Trong ma trận USER-ITEM ở trên:
• Mỗi hàng đại diện cho một người dùng.
• Mỗi cột đại điện cho một mặt hàng.
• Mỗi ô thể hiện xếp hạng của từng người dùng đưa ra cho từng mặt hàng.
• Ma trận có tổng số 'n' người và 'm' mặt hàng
• Aij là xếp hạng của người dùng Ui với mặt hàng Ij (Aij có thể nằm trong khoảng từ 1 đến 5)
Có thể nhận thấy, trong ma trận này khá thưa thớt với nhiều ô còn trống vì có nhiều mặt hàng nhưng mỗi khách hàng không thể tiếp cận và đưa ra đánh giá cho tất cả được. Vì vậy, hệ gợi ý vào thời điểm này đóng vai trò dựa trên các thông tin đã biết về người dùng để gợi ý cho họ các mặt hàng chưa biết đến và các mặt hàng gợi ý này sẽ được sắp xếp theo độ yêu thích giảm dần.
Các loại của hệ thống gợi ý Recommender System
1. Lọc cộng tác
Lọc cộng tác Recommender System hoạt động với sự cộng tác của người dùng. Nếu có nhiều người dùng thích mặt hàng nào đó thì mặt hàng đó có thể được giới thiệu cho người dùng chưa xem mặt hàng đó.
Giả sử có bốn người dùng và bốn mục như được mô tả trong hình trên.
• Tất cả bốn người dùng đã mua Item-1 và Item-2.
• USER-1, USER -2 và USER -3 cũng đã mua Item-3 nhưng USER-4 chưa thấy Item-3.
• Vì vậy, Item-3 có thể được đề xuất cho USER-4.
• Hiện chỉ có USER-3 đã mua Item-4, vì vậy không thể đề xuất Item-4 cho USER-4 vì không có nhiều người mua và quan tâm đến mặt hàng này.
-> Đây là cách làm việc của lọc cộng tác.
2. Lọc dựa trên nội dung
Phương pháp lọc dựa trên nội dung tương tự như cách tiếp cận với các kỹ thuật máy học cổ điển. Ở đây cần thu thập thông tin về một mục Ij và một Ui người dùng, sau đó cần tạo các tính năng của cả Ui; Ij và kết hợp các tính năng đó và đưa chúng vào mô hình máy học để đào tạo. Ở đây, "Số liệu" sẽ là Aij, là xếp hạng tương ứng do người dùng Ui đưa ra trên mặt hàng Ij.
3. Dựa trên sự tương đồng
Có hai loại phương pháp tiếp cận dựa trên sự tương đồng là
• Người dùng - Người dùng tương tự (User-User)
• Mặt hàng - Mặt hàng tương tự (Item - Item)
4. Dữ liệu hóa ma trận
Dữ liệu hóa ma trận là một loại thuật toán lọc cộng tác được sử dụng trong hệ thống Recommender system. Các thuật toán thừa số hóa ma trận hoạt động bằng cách phân rã ma trận tương tác giữa người dùng và các mặt hàng. Kết quả gợi ý có thể được cải thiện bằng cách gán các trọng số khác nhau cho các yếu tố tiềm ẩn dựa trên mức độ phổ biến của mặt hàng và tính tích cực của người dùng.
Những bước cần làm để xây dựng hệ thống Recommender system:
• Thu thập dữ liệu phù hợp tùy vào các bài toán cụ thể
• Chạy mô hình và lọc ra top Item phù hợp để gợi ý cho người dùng
• Đánh giá hiệu quả mô hình và cập nhật lại mô hình hệ thống thông qua các dữ liệu mới được sinh ra hàng ngày