AI đang học cách theo dõi phản
ứng cảm xúc của con người trong thời gian thực, bằng cách quan sát khuôn mặt và
lắng nghe giọng nói của chúng ta (Ảnh: Hume AI)
Chúng ta không có xu hướng nghĩ mình là người đặc biệt dễ bị
thao túng nhưng lịch sử dường như đã cho thấy rằng có rất ít thứ mạnh mẽ hơn khả
năng thuyết phục mọi người tuân theo quan điểm của bạn về mọi việc. Như Yuval
Noah Harari đã chỉ ra trong Sapiens, lịch sử nhân loại của ông, “những ý niệm
chung” như tiền bạc, tôn giáo, quốc gia, luật pháp và chuẩn mực xã hội tạo
thành xương sống cơ bản của xã hội loài người. Khả năng tập hợp các ý tưởng và
hợp tác theo nhóm lớn hơn nhiều so với các bộ lạc địa phương của chúng ta là một
trong những lợi thế mạnh mẽ nhất của chúng ta so với thế giới động vật.
Nhưng tư tưởng thường hay ủy mị. Chúng ta không sinh ra đã
có chúng, chúng xâm nhập vào đầu chúng ta từ đâu đó và thường có thể thay đổi
được. Những thứ có thể thay đổi suy nghĩ của mọi người trên quy mô lớn có thể đạt
được những điều đáng kinh ngạc hoặc thậm chí định hình lại xã hội của chúng ta
– theo chiều hướng tốt hơn cũng như tồi tệ hơn nhiều.
GPT-4 đã có sức thuyết phục hơn con người
Có vẻ như các mô hình Ngôn ngữ AI đã cực kỳ hiệu quả trong
việc thay đổi suy nghĩ của mọi người. Trong một nghiên cứu trước khi in gần đây
của các nhà nghiên cứu tại EPFL Lausanne ở Thụy Sĩ, 820 người đã được khảo sát
về quan điểm của họ về nhiều chủ đề khác nhau, từ các chủ đề tương đối ít cảm
xúc như “tiền xu có nên tiếp tục lưu hành hay không", cho đến chủ đề nóng
hổi, các vấn đề bị chính trị hóa nặng nề như phá thai, sử dụng phòng tắm dành
cho người chuyển giới và "các trường đại học có nên coi chủng tộc là một yếu
tố trong tuyển sinh để đảm bảo sự đa dạng không?"
Sau khi ghi lại quan điểm ban đầu của họ, những người tham
gia sau đó sẽ tham gia vào một loạt cuộc tranh luận dựa trên văn bản kéo dài 5
phút chống lại những người khác và chống lại GPT-4 – và sau đó, họ được phỏng vấn
lại để xem liệu quan điểm của họ có thay đổi do cuộc trò chuyện hay không.
Trong các tình huống giữa con người với con người, các cuộc
tranh luận này có xu hướng phản tác dụng và củng cố vị thế của con người, đồng
thời khiến họ ít có khả năng thay đổi quan điểm. GPT đạt được nhiều thành công
hơn, tốt hơn một chút nhưng không đáng kể về mặt thống kê 21%.
Sau đó, các nhà nghiên cứu bắt đầu cung cấp cho cả con người
và đối tượng AI một ít thông tin nhân khẩu học về đối thủ của họ – giới tính,
tuổi tác, chủng tộc, trình độ học vấn, tình trạng việc làm và khuynh hướng
chính trị – đồng thời hướng dẫn rõ ràng cách sử dụng thông tin này để đưa ra
các lập luận cụ thể cho con người họ sẽ tranh luận cùng.
Đáng chú ý, điều này thực sự khiến những người tranh luận
trở nên tồi tệ hơn so với khi họ không có thông tin. Nhưng AI đã có thể sử dụng
dữ liệu bổ sung này để đạt được hiệu quả tuyệt vời - những tranh luận viên GPT-4
“được cá nhân hóa” đạt hiệu quả đáng kể hơn 81,7% so với con người.
Theo dõi biểu hiện khuôn mặt
dường như đang ở giai đoạn khá thô sơ nhưng nó sẽ trở thành một công cụ thuyết
phục cực kỳ mạnh mẽ
Có chút nghi ngờ rằng AI sẽ sớm trở thành kẻ thao túng quan
điểm vĩ đại nhất mà thế giới từng chứng kiến. Nó có thể hoạt động ở quy mô lớn,
điều chỉnh lập luận cho phù hợp với từng cá nhân trong một nhóm hàng triệu người,
đồng thời liên tục cải tiến các kỹ thuật và chiến lược của mình. Nó sẽ có trong
mọi chủ đề và phần bình luận trên Twitter/X, định hình và phổ biến các câu chuyện
trên toàn xã hội theo lệnh của chủ nhân nó. Và nó sẽ không bao giờ thao túng
chúng ta tệ hơn bây giờ.
Ngoài ra, AI đang bắt đầu có quyền truy cập vào các công cụ
mới mạnh mẽ sẽ biến sinh học của chúng ta thành vũ khí chống lại chúng ta. Nếu
GPT-4 đã rất giỏi trong việc điều chỉnh cách tiếp cận với bạn chỉ bằng cách biết
thông tin nhân khẩu học xã hội của bạn, hãy tưởng tượng nó sẽ được cấp quyền
truy cập vào trạng thái cảm xúc theo thời gian thực của bạn tốt hơn đến mức
nào.
Đây không phải là khoa học viễn tưởng – mới đây, Hume AI đã
công bố Giao diện giọng nói đồng cảm (AVI). Đó là một mô hình ngôn ngữ được thiết
kế để trò chuyện bằng giọng nói với bạn trong khi theo dõi trạng thái cảm xúc của
bạn thông qua giọng nói, đọc biểu cảm trong câu nói để thu thập thêm nhiều ngữ
cảnh.
AVI không chỉ cố gắng xác định cảm xúc của bạn mà còn chọn
giọng điệu riêng để phù hợp với cảm xúc của bạn, làm dịu các cuộc tranh cãi,
xây dựng năng lượng và trở thành một đối tác trò chuyện nhiệt tình.
Và Hume còn có nhiều tiềm năng hơn nữa. Các mô hình khác
đang sử dụng quyền truy cập vào máy ảnh để xem nét mặt, kiểu di chuyển và phản ứng
động của bạn với những gì đang xảy ra để thu thập nhiều thông tin thời gian thực
hơn về cách thông điệp được tiếp nhận. Chỉ riêng đôi mắt đã được chứng minh là
có thể cung cấp một lượng thông tin đáng kinh ngạc khi được phân tích bằng AI.
Theo một nghĩa nào đó, đây đơn giản là bản chất của cuộc
trò chuyện giữa con người với nhau. Chắc chắn có rất nhiều cách tích cực mà
công nghệ đáp ứng cảm xúc có thể được sử dụng để nâng cao mức độ hạnh phúc tổng
thể của chúng ta, xác định những người đang cần sự giúp đỡ nghiêm túc và xoa dịu
tình huống xấu trước khi chúng phát sinh. Đó không phải là lỗi của AI nếu nó có
khả năng tập trung và nhạy bén hơn chúng ta.
Nhưng trên thực tế, không phải tất cả chúng đều đặt lợi ích
tốt nhất cho bạn lên hàng đầu. Bạn hẳn phải trố mắt kinh ngạc trước làn sóng sắp
tới của những hình ảnh quảng cáo được cá nhân hóa mang tính phản hồi cảm xúc và
siêu thuyết phục.
Hãy ngoại suy xem công nghệ này có thể làm gì trong tay các
cơ quan thực thi pháp luật, bộ phận nhân sự, các chính phủ áp bức, các nhà cách
mạng, các đảng phái chính trị, các phong trào xã hội hoặc những người nhằm mục
đích gieo rắc sự bất hòa và mất lòng tin – và những khả năng đen tối là vô tận.
Đây không phải là nỗ lực xấu nhắm vào Hume AI; nó chỉ đơn giản là sự thừa nhận
về mức độ thuyết phục và lôi kéo mà công nghệ có thể dễ dàng trở thành.
Cơ thể chúng ta sẽ bộc lộ cảm xúc và ý định của chúng ta,
và AI sẽ sử dụng chúng để điều khiển chúng ta.
Thật vậy, OpenAI đã thông báo nhưng quyết định không phát
hành mô hình Voice Engine, công cụ có thể tái tạo giọng nói của con người sau
khi nghe chỉ 15 giây để cho thế giới thời gian “tăng cường khả năng phục hồi xã
hội trước những thách thức do các mô hình sáng tạo thuyết phục hơn bao giờ hết
mang lại”.
Chứng kiến cách cha mẹ và ông bà chúng ta vật lộn để phản ứng
với sự thay đổi công nghệ, chúng ta chỉ có thể hy vọng rằng các thế hệ sắp tới
có đủ trí thông minh thực tế để thích nghi và nhận ra rằng bất cứ khi nào họ
nói chuyện với một cỗ máy mà có lẽ nó đang cố gắng hiểu bạn để đạt được mục
tiêu nào đó.
LH (New Atlas)