Phạm Duy Tùng Machine Learning Blog Page 3

Data Analytics - Nghề Mới Thời Thượng

Jul 29, 2023 43 min read Data Analytics

Data Analytics đang là ngành hot ở thời điểm hiện tại, tuy nhiên, mức độ cạnh trang của ngành này khá cao, chúng ta thường không thấy tuyển intern cho vị trí này.

Phân Cụm Cửa Hàng Để Đưa Ra Quyết Định Thông Minh Hơn - Lý Thuyết

Jul 29, 2023 7 min read Retail

Phân cụm theo cửa hàng, phân cụm theo danh mục, phân cụm theo nhóm danh mục, là một trong các yếu tố | công cụ tốt giúp cho khối sale, khối marketing đưa ra các quyết định sáng suốt. Thông thường thì chúng ta sẽ phân loại các siêu thị thành các cụm, tuy nhiên, có vẻ như việc phân loại theo nhóm danh mục hoặc danh mục sẽ phù hợp hơn với mục tiêu kinh doanh | mục tiêu marketing. Ví dụ, việc phân loại theo danh mục sẽ cho phép chúng ta tiếp cận đến khoảng mục tiêu (target range) tốt hơn, và đưa ra các chương trình khuyến mãi phù hợp nhất với những nhu cầu của nhóm đó mang tới.

Tư Duy Làm Sản Phẩm - The Product Mindset

Jul 23, 2023 14 min read mindset

Bằng cách đưa cách tiếp cận phát triển sản phẩm vào việc lập kế hoạch và thực hiện phân tích, các tổ chức có thể mở rộng các thành công riêng biệt thành loại ra quyết định dựa trên dữ liệu bền vững, toàn tổ chức, đóng vai trò là nền tảng của chuyển đổi kỹ thuật số thực sự.

N-Gram Trong Elastic Search Và Opensearch - Khi Nào Không Nên Sử Dụng

Mar 25, 2023 6 min read RFM Recommendation Marketing

Chi phí liên quan đến n-gram tokenizer ở ElasticSearch và opensearch thường không đề cập chi tiết trong các tài liệu, do đó, có khi nó sẽ gây ra các hậu quả khá nghiêm trọng về chi phí và hiệu năng. Dẫn đến trường hợp là chúng ta phải "lấy thịt đè người" bằng cách tăng chi phí phần cứng một cách lãng phí. Trong bài viết này, chúng ta sẽ đề cập đến vài use-case sử dụng n-gram tokenizer, một số phương pháp cải tiến, hoặc một vài phương pháp thay thế nó bằng cách khách hiệu quả hơn.

Symbolic AI Và Connectionist AI

Feb 18, 2023 11 min read RFM Recommendation Marketing

Dạo gần đây, khi các ứng dụng AI đang hô mưa gọi gió trên toàn cõi, điển hình là hot keywork chatGPT, thì trong cộng đồng nghiên cứu cũng nổ ra cuộc chiến giữa hai phe Symbolic AI và Connectionist AI. Có vẻ như ở nơi nào có chia nhóm, thì sẽ có một nhóm người chọn phe này, và một nhóm khác chọn phe còn lại, một nhóm khác nữa đứng ở cả hai, nhóm khác nữa không chọn nhóm nào cả. Hai nhóm là nhóm đứng cả hai và nhóm không chọn nhóm nào cả thường ít hoặc không làm gì cả, còn nhóm chọn phe này và nhóm chọn phe kia sẽ đối đầu nhau rất gay gắt.

Marketing Thực Chiến - Phân Loại Khách Hàng Sử Dụng RFM Analysis

Dec 4, 2022 17 min read RFM Recommendation Marketing

RFM là model được sử dụng trong phân tích marketing, dùng để phân nhóm khách hàng của công ty dựa trên các pattern mua hàng hoặc thói quen của họ. Chúng ta cùng tìm hiểu chi tiết về RFM, ứng dụng của nó, và thử sử dụng nó để phân tích data xem sao nhé

Tiktok Real Time Recommendation

Dec 1, 2022 25 min read Machine learning Tikok Deep Learning ByteDance Recommendation

Nhân dịp đầu tháng, mình khai bút với chủ đề Real Time Recommendation. Paper này mình đọc cũng khá lâu rồi, giờ mới có dịp note lại chia sẻ. Các kỹ sư của ByteDance vừa mới cung cấp một paper nêu ra một vài hướng nghiên cứu của họ về Real Time Recommendation mà họ đã áp dụng thành công trong sản phẩm tiktok. Chủ đề này liên quan nhiều đến MLOpts - xây dựng kiến trúc hệ thống.

Data Visualization - Phần 1 - Phân Tích Dữ Liệu Netflix

Aug 2, 2022 4 min read Machine learning Normalization Deep Learning

Netflix là một trong những nền tảng stream video phổ biến nhất thế giới. Nền tảng này có hơn 10 ngàn bộ phim và các chương trình truyền hình. Trong bài viết này, mình sẽ phân tích dataset về các thông tin mà netflix cung cấp trong file netflix.csv

5 Cách Mở File Trong Python

Jul 31, 2022 4 min read Machine learning Normalization Deep Learning

Ở bài viết này, mình sẽ giới thiệu các bạn một vài cách để có thể đọc file trong python. Thông thường, mình sẽ search google rồi copy paste các đoạn mã lệnh của người dùng đóng góp trên stackoverflow về và chạy. Nay mình ngồi túm nó lại thành 1 bài viết để sau này mình dễ dàng tra cứu