1. Đề bài

Công ty Procter & Gamble (P&G), một công ty hàng tiêu dùng đóng gói toàn cầu. Công ty có khoảng 7,000 chuyên gia R&D trên toàn thế giới, hoạt động của công ty bao gồm phát triển sản phẩm từ đầu đến cuối (R&D to product), có quy trình R&D có cấu trúc tốt và lực lượng lao động có kỹ năng cao

Đề tài công ty đặt ra: “Đánh giá tác động của Trí tuệ nhân tạo thế hệ mới (GenAI) đến hiệu quả hợp tác nhóm trong môi trường làm việc tri thức, tập trung vào ba khía cạnh chính: hiệu suất làm việc, chia sẻ chuyên môn và tương tác cộng đồng .” hay nói cách khác, Thí nghiệm này được thiết kế để kiểm tra tác động của AI đến ba khía cạnh chính của teamwork: hiệu suất, chia sẻ chuyên môn và tương tác cộng đồng trong bối cảnh làm việc thực tế

Cụ thể, nghiên cứu này nhằm trả lời các câu hỏi chính sau:

Liệu GenAI có thể cung cấp những lợi ích về hiệu suất so với cách làm truyền thống của teamwork hay không?
GenAI có giúp mở rộng phạm vi chuyên môn của nhân viên ngay cả khi họ thiếu một số kiến thức và kỹ năng chuyên môn nhất định không?
GenAI có thể cung cấp loại hình tương tác cộng đồng nào mà chúng ta thường liên tưởng đến sự hợp tác giữa con người không?

Quy mô công ty thực hiện thí nghiệm được mô tả như sau:

Số lượng người tham gia: 811 nhân viên P&G
Người tham gia là các chuyên gia từ hai lĩnh vực: R&D và Commercial
Được phân ngẫu nhiên vào các điều kiện thí nghiệm
Phân bổ:
- 776 người được phân ngẫu nhiên vào 4 điều kiện thí nghiệm
- 35 người không được phân ngẫu nhiên do vào muộn hoặc cấp bậc cao hơn band 3
Các nhóm làm việc từ xa qua Microsoft Teams
Chia làm 4 nhóm:
- Cá nhân không sử dụng AI
- Nhóm 2 người không sử dụng AI
- Cá nhân sử dụng AI
- Nhóm 2 người sử dụng AI

Điều kiện thí nghiệm

Công cụ AI được sử dụng:

Dựa trên GPT-4 và truy cập thông qua Microsoft Azure
Người tham gia ở điều kiện có AI được đào tạo 1 giờ về cách tương tác với công cụ GenAI

Phạm vi tổ chức:

Được thực hiện ở 4 đơn vị kinh doanh: Chăm sóc trẻ em, Chăm sóc phụ nữ, Chăm sóc cá nhân và Chăm sóc răng miệng
Tại 2 khu vực địa lý: Châu Âu và Châu Mỹ Việc chọn P&G với quy mô lớn và phạm vi toàn cầu như vậy giúp tăng tính đại diện và độ tin cậy của kết quả nghiên cứu.

Thời gian:

Thí nghiệm được thực hiện trong khoảng thời gian từ tháng 5 đến tháng 7 năm 2024
Dưới hình thức hội thảo phát triển sản phẩm ảo kéo dài một ngày

Cách thức thu thập dữ liệu:

Thu thập trước thí nghiệm: thông tin cá nhân người tham gia
Trong quá trình: ghi lại tất cả các lệnh và phản hồi của GenAI, bản ghi tương tác nhóm
Sau thí nghiệm: khảo sát và phỏng vấn một số người tham gia

Biến số đo lường:

Hiệu suất: Chất lượng giải pháp (thang điểm 1-10)
Chuyên môn: Tính kỹ thuật của giải pháp (thang điểm 1-7)
Tính cộng đồng : Cảm xúc tích cực và tiêu cực (thang điểm 1-7)

2. Kết quả

Một vài kết quả mình rút ra khi đọc bài viết

2.1. Về hiệu suất

Nhóm không AI cải thiện 0.24 độ lệch chuẩn so với cá nhân không AI (p < 0.05)
Cá nhân có AI cải thiện 0.37 độ lệch chuẩn so với cá nhân không AI (p < 0.01)
Nhóm có AI cải thiện 0.39 độ lệch chuẩn so với cá nhân không AI (p < 0.01)
Cá nhân có AI và nhóm có AI có chất lượng giải pháp tương đương
Cá nhân có AI giảm 16.4% thời gian hoàn thành nhiệm vụ
Nhóm có AI giảm 12.7% thời gian hoàn thành nhiệm vụ
Nhóm có AI tạo ra giải pháp dài hơn đáng kể

2.2. Về chuyên môn

Nhân viên làm việc một mình với AI đạt hiệu suất tương đương nhóm có ít nhất một nhân viên core-job ( 1 kỹ thuật + 1 chuyên môn)
AI giúp xóa nhòa ranh giới giữa ý tưởng kỹ thuật và thương mại
Sự khác biệt về tính kỹ thuật/thương mại giữa nhân viên R&D và Commercial biến mất khi sử dụng AI
Không có sự khác biệt về điểm chất lượng dựa trên định hướng kỹ thuật của giải pháp

2.3. Về tính cộng đồng

Cá nhân sử dụng AI tăng 0.457 độ lệch chuẩn cảm xúc tích cực (p < 0.01)
Nhóm sử dụng AI tăng 0.635 độ lệch chuẩn cảm xúc tích cực (p < 0.01)
Cá nhân sử dụng AI giảm 0.233 độ lệch chuẩn cảm xúc tiêu cực (p < 0.05)
Nhóm sử dụng AI giảm 0.235 độ lệch chuẩn cảm xúc tiêu cực (p < 0.05)

2.4. Kết quả nổi bật khác:

Nhóm có AI có khả năng tạo ra giải pháp trong top 10% cao hơn 9.2 điểm phần trăm so với nhóm kiểm soát
Phân phối ý tưởng của nhóm có AI cân bằng hơn, giảm ảnh hưởng thống trị
Nhiều người tham gia giữ lại hơn 75% nội dung do AI tạo ra trong giải pháp cuối cùng

Một vài thông số trong bài báo

Summary Statistics