QnA Maker là dịch vụ lưu trữ ngôn ngữ tự nhiên trên nền tảng đám mây (do microsoft cung cấp ).
Ở QnA chúng ta có thể tạo đoạn hội thoại (gồm câu hỏi và câu trả lời ) cho 1 nội dung được xác định. Từ đó nó sẽ tìm ra câu trả lời tương ứng và phù hợp nhất cho câu hỏi từ người dùng nhập vào.
Không chỉ đơn thuần là lưu trữ, QnA Maker còn có thể thu thập nội dung, cách thức câu hỏi từng người dùng để phân tích và đưa ra gợi ý hay chọn câu trả lời phù hợp khi có nhiều câu trả lời trên cùng 1 nội dung.
QnA Maker thường được ứng dụng trong việc xây dựng ứng dụng giao tiếp với khách hàng (chatbot).
Các ngôn ngữ QnA Maker hỗ trợ.
- Hỗ trợ 1 ngôn ngữ trên 1 QnA Maker resource.
- Không hỗ trợ nhiều ngôn ngữ trên 1 QnA Maker resource (khi tạo 1 resource thì ngôn ngữ được chọn về sau sẽ không thể thay đổi ).
- Có thể hỗ trợ nhiều ngôn ngữ trên 1 knowledge base. (có thể sử dụng thông qua translate, hay theo kiểu quản lý câu hỏi và câu trả lời riêng biệt cho từng ngôn ngữ ).
- Hỗ trợ 53 ngôn ngữ trên thế giới.
- Hỗ trợ 14 ngôn ngữ trong việc truy vấn kết quả và mức độ liên quan (giữa question và answer ).
Tìm hiểu về knowledge base trong QnA Maker
- Knowledge base là nơi để QnA Maker nhập nội dung của người dùng vào bao gồm toàn bộ câu hỏi, câu trả lời tương ứng.
- Là nơi có thể nhập vào cũng như lấy ra thông tin về mối quan hệ, đề xuất mối quan hệ giữa các cập câu hỏi và câu trả lời.
- Tại đây chúng ta có thể chỉnh sửa, có thể thêm mới hoặc xóa đi các cập câu hỏi.
- Để QnA Maker cập nhật đúng, sau khi chỉnh sửa xong thì cần phải Publish Knowledge base.
Những giới hạn trong QnA Maker knowledge
- Số lượng knowledge base tối đa.
- Cách đặt tên file export thông tin không được chứa ký tự đặc biệt
- Kích thước tối đa dành cho file là
- Độ dài và các ký tự có thể sử dụng cho tên và nội dung dữ liệu trong knowledge base.
- Độ dài các nội dung trong Knowledge:
- Độ dài của câu trả lời ( answer ): 25,000
- Độ dài của câu hỏi ( question ): 1,000
- Độ dài của Metadata key: 100
- Độ dài của Metadata value: 500
- Những ký tự được sử dụng trong metadata name: Alphabets, số và _
- Những ký tự được sử dụng trong metadata value: Sử dụng tất cả trừ 2 ký tự " : " và " | "
- Độ dài tên file : 200
- Số lượng câu hỏi tối đa nhận được câu hỏi thay thế: 300
- URL, HTML trong 1 trang là 1000000 ký tự.
Hỗ trợ SDK trên các ngôn ngữ
- C#
- Go
- JavaScript
- Python
- Ruby
Sử dụng active learning để cải thiện knowledge base
- Active learning hoạt động trên cơ sở cho phép nâng cao chất lượng knowledge base bằng cách để xuất các câu hỏi thay thế. Từ đó chúng ta có thể linh hoạt sử dụng nguồn dữ liệu đề xuất nếu hợp lí và cần thiết.
Knowledge base không tự động thay đổi, câu hỏi thay thế chỉ hiển thị dưới dạng đề xuất. Để sử dụng chúng ta phải thao tác chấp nhận, và những đề xuất này không làm thay đổi hay mất đi những dữ liệu đã có. - Active learning được hỗ trợ từ phiên bản 4.4.0 trở lên. Nếu ở phiên bản cũ hơn, cần nâng cấp để có thể sử dụng.
- Phải bật tính năng active learning trên knowledge base khi sử dụng (ở phiên bản "stable release" thì active learning sẽ không được bật sẵn).
Trên này là những thông tin kiến thức cơ bản tìm hiểu về QnA Maker để bắt đầu làm việc với nó.
Nội dung và ứng dụng chi tiết hơn mình sẽ hướng dẫn ở bài tiếp theo.
Xin chân thành cám ơn.
Tài liệu tham khảo: https://docs.microsoft.com/vi-vn/azure/cognitive-services/qnamaker/