(CLO) Mô hình AI DeepSeek R1 bị chỉ trích vì dễ bị thao túng để tạo nội dung nguy hiểm như hướng dẫn chế tạo vũ khí sinh học và kích động hành vi tự làm hại bản thân.
Theo báo cáo mới đây từ The Wall Street Journal, mô hình AI R1 của DeepSeek – công ty trí tuệ nhân tạo đến từ Trung Quốc – đang gây lo ngại khi dễ dàng bị thao túng để tạo ra nội dung nguy hiểm, bao gồm hướng dẫn chế tạo vũ khí sinh học và chiến dịch kích động hành vi tự làm hại bản thân ở thanh thiếu niên.
Mô hình AI R1 của DeepSeek bị chỉ trích.
DeepSeek dễ bị lợi dụng để tạo nội dung nguy hiểm
Sam Rubin, Phó Chủ tịch cấp cao của bộ phận ứng phó sự cố và tình báo mối đe dọa Unit 42 thuộc Palo Alto Networks, nhận định với The Wall Street Journal rằng DeepSeek dễ bị "bẻ khóa" hơn so với các mô hình AI khác. Điều này có nghĩa là chatbot có thể bị thao túng để tạo ra nội dung bất hợp pháp hoặc gây hại.
Trong một thử nghiệm, The Wall Street Journal đã kiểm tra mức độ bảo vệ của DeepSeek R1. Dù mô hình có vẻ được tích hợp các biện pháp an toàn cơ bản, nhưng các nhà nghiên cứu của tạp chí này vẫn có thể thuyết phục nó thiết kế một chiến dịch truyền thông xã hội nguy hiểm. Theo lời của chính chatbot, chiến dịch này sẽ "lợi dụng mong muốn được thuộc về của thanh thiếu niên, biến sự yếu đuối về mặt cảm xúc thành vũ khí thông qua việc khuếch đại thuật toán".
Không dừng lại ở đó, DeepSeek R1 còn bị thuyết phục để:
- Cung cấp hướng dẫn cho một cuộc tấn công bằng vũ khí sinh học.
- Viết một bản tuyên ngôn ủng hộ Hitler.
- Soạn thảo một email lừa đảo chứa mã độc hại.
Trong khi đó, khi thử nghiệm cùng một yêu cầu với ChatGPT, chatbot của OpenAI đã từ chối tuân thủ.
Vấn đề kiểm duyệt nội dung của DeepSeek
DeepSeek trước đây đã bị chỉ trích vì kiểm duyệt nội dung theo chính sách của Trung Quốc. Các báo cáo trước đó cho thấy ứng dụng này tránh các chủ đề nhạy cảm như sự kiện Quảng trường Thiên An Môn hay quyền tự chủ của Đài Loan.
Ngoài ra, Dario Amodei, CEO của Anthropic – một công ty AI khác, gần đây cũng tuyên bố rằng DeepSeek "tệ nhất" trong các bài kiểm tra an toàn liên quan đến vũ khí sinh học.
Những phát hiện này làm dấy lên mối lo ngại về khả năng kiểm soát nội dung của DeepSeek, đồng thời đặt ra câu hỏi về trách nhiệm của các công ty AI trong việc đảm bảo an toàn cho người dùng.
(CLO) Sau thành công của Chị Dâu, đạo diễn Khương Ngọc tiếp tục gây chú ý khi công bố dự án điện ảnh mới mang tên “Cục vàng của ngoại”, dự kiến ra mắt vào năm 2025. Bộ phim tiếp tục khai thác đề tài về phụ nữ, nhưng lần này tập trung vào tình cảm bà cháu - một chủ đề giàu cảm xúc và gần gũi với khán giả Việt.
(CLO) Dù phải đối mặt với thách thức từ lạm phát và giá nguyên liệu đầu vào tăng cao, ngành kinh doanh ẩm thực (F&B) Việt Nam năm 2024 vẫn cho thấy sức bật đáng kể với doanh thu toàn ngành tăng trưởng mạnh 16,6%, đạt gần 689 nghìn tỷ đồng.
(CLO) Sau khi không còn tổ chức công an cấp huyện, đến nay công việc tiếp nhận đăng ký, cấp biển số ô tô cho người dân tại Hà Nội đã chuyển giao cho công an cấp xã thực hiện. Giúp người dân tiết kiệm được thời gian di chuyển, hạn chế việc xếp hàng dài chờ đợi tại điểm cấp biển số xe.
(CLO) Trước đề xuất của một số Sở Giáo dục và Đào tạo về thay đổi lịch thi tốt nghiệp THPT 2025, Bộ Giáo dục và Đào tạo quyết định vẫn giữ nguyên lịch thi.
(CLO) Đoàn đại biểu Hội Nhà báo Việt Nam do Phó Chủ tịch thường trực Nguyễn Đức Lợi dẫn đầu, đã có những đóng góp quan trọng tại Hội thảo quốc tế "Patria" lần thứ IV về thông tin và truyền thông, diễn ra từ ngày 17-22/3 tại La Habana, Cuba.
(CLO) Chính phủ Pháp đang lên kế hoạch phát hành "cẩm nang sinh tồn" đến tất cả các hộ gia đình để giúp người dân chuẩn bị đối phó với các mối đe dọa cấp bách, bao gồm xung đột vũ trang trên lãnh thổ Pháp.
(CLO) Những ngày này, con đường rực rỡ sắc vàng của hoa Phong Linh tại Khu đô thị ParkCity (quận Hà Đông, TP Hà Nội) đã thu hút đông đảo người dân ở đủ mọi độ tuổi đến check-in.
(CLO) Mức định giá của mạng xã hội X đã tăng vọt trở lại 44 tỷ USD, cho thấy sự thay đổi mạnh mẽ sau khi ông chủ Elon Musk của mạng xã hội này trở thành cố vấn của Tổng thống Mỹ Donald Trump.
(CLO) Bộ GD&ĐT quyết định giữ nguyên lịch thi tốt nghiệp THPT 2025 như đã công bố trước đó. Nội dung trên được Bộ GD&ĐT nhấn mạnh trong công văn trả lời các Sở GD&ĐT Hà Nội, TP HCM, Ninh Bình, Nghệ An, Quảng Trị về đề xuất điều chỉnh thời gian thi tốt nghiệp THPT năm nay.
(CLO) Sáng 20/3, Lễ công bố Hệ thống các chỉ số đo lường khán giả VTV - VTVratings đã diễn ra tại Quy Nhơn, Bình Định trong khuôn khổ Liên hoan Truyền hình toàn quốc lần thứ 42.
(CLO) Hàng trăm nhân viên của Đài phát thanh Châu Á Tự do (RFA) tại Mỹ sẽ bị nghỉ phép không lương từ cuối tuần này, sau khi chính quyền Tổng thống Donald Trump quyết định chấm dứt tài trợ cho đài.
(CLO) Công viên Nghĩa Đô (quận Cầu Giấy, Hà Nội) nằm trên đường Nguyễn Văn Huyên và Tô Hiệu là một trong những công viên lớn nhất Thủ đô đang trong quá trình cải tạo, nâng cấp sau một thời gian xuống cấp trầm trọng.
(CLO) Hàng chục nghìn người đã biểu tình ở Israel để phản đối Thủ tướng Benjamin Netanyahu sau khi ông khởi động lại chiến sự đẫm máu ở Dải Gaza trong tuần này.
(NB&CL) Thời gian gần đây, người dân thị xã Kỳ Anh, tỉnh Hà Tĩnh không khỏi bức xúc trước tình trạng một cá nhân ngang nhiên xây dựng nhà ở và lăng mộ quy mô lớn trên đất rừng, bất chấp quy định pháp luật. Dư luận đặt câu hỏi về trách nhiệm quản lý của chính quyền địa phương khi để xảy ra tình trạng này giữa “thanh thiên bạch nhật”.
(CLO) Mức định giá của mạng xã hội X đã tăng vọt trở lại 44 tỷ USD, cho thấy sự thay đổi mạnh mẽ sau khi ông chủ Elon Musk của mạng xã hội này trở thành cố vấn của Tổng thống Mỹ Donald Trump.
(CLO) Hàng trăm nhân viên của Đài phát thanh Châu Á Tự do (RFA) tại Mỹ sẽ bị nghỉ phép không lương từ cuối tuần này, sau khi chính quyền Tổng thống Donald Trump quyết định chấm dứt tài trợ cho đài.
(CLO) Google tiếp tục mở rộng khả năng của chatbot AI Gemini bằng việc bổ sung hai tính năng mới: Canvas - một không gian làm việc tương tác dành cho viết lách và lập trình, cùng với Audio Overview - công cụ tóm tắt nội dung bằng giọng nói.
(CLO) Google vừa công bố thỏa thuận mua lại công ty an ninh mạng Wiz với giá 32 tỷ USD vào ngày 18/3, đánh dấu thương vụ mua lại lớn nhất từ trước đến nay của gã khổng lồ công nghệ này.
(CLO) Sau hơn 6 tháng bị kẹt ở Pháp vì các cáo buộc pháp lý, nhà sáng lập kiêm CEO Pavel Durov của Telegram đã trở lại Dubai (UAE) - ít nhất là trong vài tuần.
(CLO) Kết nối internet mạnh mẽ là điều cần thiết, cho dù bạn đang chơi game online, tham gia cuộc họp Zoom hay xem chương trình yêu thích trên các dịch vụ phát trực tuyến.
(CLO) Baidu vừa công bố hai mô hình AI mới, Ernie 4.5 và Ernie X1, nhằm cạnh tranh trực tiếp với các đối thủ mạnh như DeepSeek và OpenAI trong cuộc đua trí tuệ nhân tạo ngày càng khốc liệt.
(CLO) Hàng trăm nhân viên tại Đài Tiếng nói Mỹ (VOA), Đài Châu Á Tự do (RFA), Đài Châu Âu Tự do (RFE) và các cơ quan truyền thông khác đã nhận được email vào cuối tuần thông báo rằng họ sẽ bị cấm vào văn phòng, phải nộp lại thẻ báo chí và thiết bị làm việc, theo các phương tiện truyền thông địa phương đưa tin hôm thứ Bảy.