Chi phí liên quan đến n-gram tokenizer ở ElasticSearch và opensearch thường không đề cập chi tiết trong các tài liệu, do đó, có khi nó sẽ gây ra các hậu quả khá nghiêm trọng về chi phí và hiệu năng. Dẫn đến trường hợp là chúng ta phải "lấy thịt đè người" bằng cách tăng chi phí phần cứng một cách lãng phí. Trong bài viết này, chúng ta sẽ đề cập đến vài use-case sử dụng n-gram tokenizer, một số phương pháp cải tiến, hoặc một vài phương pháp thay thế nó bằng cách khách hiệu quả hơn.
Dạo gần đây, khi các ứng dụng AI đang hô mưa gọi gió trên toàn cõi, điển hình là hot keywork chatGPT, thì trong cộng đồng nghiên cứu cũng nổ ra cuộc chiến giữa hai phe Symbolic AI và Connectionist AI. Có vẻ như ở nơi nào có chia nhóm, thì sẽ có một nhóm người chọn phe này, và một nhóm khác chọn phe còn lại, một nhóm khác nữa đứng ở cả hai, nhóm khác nữa không chọn nhóm nào cả. Hai nhóm là nhóm đứng cả hai và nhóm không chọn nhóm nào cả thường ít hoặc không làm gì cả, còn nhóm chọn phe này và nhóm chọn phe kia sẽ đối đầu nhau rất gay gắt.
RFM là model được sử dụng trong phân tích marketing, dùng để phân nhóm khách hàng của công ty dựa trên các pattern mua hàng hoặc thói quen của họ. Chúng ta cùng tìm hiểu chi tiết về RFM, ứng dụng của nó, và thử sử dụng nó để phân tích data xem sao nhé
Nhân dịp đầu tháng, mình khai bút với chủ đề Real Time Recommendation. Paper này mình đọc cũng khá lâu rồi, giờ mới có dịp note lại chia sẻ. Các kỹ sư của ByteDance vừa mới cung cấp một paper nêu ra một vài hướng nghiên cứu của họ về Real Time Recommendation mà họ đã áp dụng thành công trong sản phẩm tiktok. Chủ đề này liên quan nhiều đến MLOpts - xây dựng kiến trúc hệ thống.
Netflix là một trong những nền tảng stream video phổ biến nhất thế giới. Nền tảng này có hơn 10 ngàn bộ phim và các chương trình truyền hình. Trong bài viết này, mình sẽ phân tích dataset về các thông tin mà netflix cung cấp trong file netflix.csv
Ở bài viết này, mình sẽ giới thiệu các bạn một vài cách để có thể đọc file trong python. Thông thường, mình sẽ search google rồi copy paste các đoạn mã lệnh của người dùng đóng góp trên stackoverflow về và chạy. Nay mình ngồi túm nó lại thành 1 bài viết để sau này mình dễ dàng tra cứu
Ở bài viết này, mình sẽ giới thiệu các bạn một vài cách có thể giúp các bạn có thêm thu nhập dựa vào việc cào dữ liệu. Tất nhiên là các công việc đều không dễ dàng gì, chúng ta cần đổ thêm chút sức trâu bò và nuôi dưỡng thì mới có ngày hái quả ngọt được
Hướng dẫn xây dựng chương trình AI đơn giản cho game cờ tướng sử dụng minimax và cắt tỉa alpha, beta. Sử dụng html với javascript và package http-server của nodejs
Hướng dẫn xây dựng mô hình máy học sử dụng thư viện PyCaret
Hiểu một cách đơn giản, chúng ta sẽ phân chia quyền cho một cá nhân được truy xuất một số tài nguyên, hoặc thực thi một số quyền.