BNEWS Trong vài năm qua, trí tuệ nhân tạo (AI) đã bước ra khỏi phòng thí nghiệm để đi vào đời sống, từ lớp học, văn phòng cho đến phòng khám.
Những mô hình ngôn ngữ lớn (LLM) được ca ngợi như những “bộ não biết nói”, có thể tư vấn, phân tích, thậm chí hỗ trợ con người ra quyết định.
Nhưng đằng sau vẻ trơn tru ấy, có một khoảng trống âm thầm: AI không "giỏi" mọi ngôn ngữ và tiếng Anh luôn chiếm ưu thế. Đôi khi, sự thiếu công bằng đó không chỉ là vấn đề kỹ thuật mà là vấn đề sinh tử. Hãy hình dung một câu hỏi tưởng chừng đơn giản: một phụ nữ mang thai bị phù chân vào cuối thai kỳ nên làm gì? Với người hỏi bằng tiếng Anh, câu trả lời của AI có thể rất chuẩn xác: cần cảnh giác với tiền sản giật, một biến chứng nguy hiểm. Nhưng với người hỏi bằng một ngôn ngữ khác, tiếng Swahili (ngôn ngữ phổ biến ở khu vực Đông Phi) chẳng hạn, câu trả lời lại có thể là: “Bạn không cần lo lắng”.
Phóng viên TTXVN tại London dẫn kết quả của một nghiên cứu mới đây cho thấy độ chính xác của mô hình ở những ngôn ngữ ngoài tiếng Anh có thể thấp hơn tới gần 30 điểm phần trăm. Trong trường hợp tệ nhất, một mô hình có thể trả lời đúng khoảng 75% câu hỏi bằng tiếng Anh lại chỉ đạt 22,6% ở ngôn ngữ khác. Một sự chênh lệch như vậy, nếu xảy ra trong lĩnh vực y tế hay pháp lý, không còn là lỗi công nghệ, mà là rủi ro xã hội.
Điều đáng nói là thế giới không vận hành bằng một ngôn ngữ duy nhất. Khi các tổ chức quốc tế bắt đầu triển khai AI ở những khu vực đang phát triển – từ châu Phi đến Đông Nam Á – những cộng đồng không nói tiếng Anh lại là những đối tượng được kỳ vọng sẽ hưởng lợi nhiều nhất. Trớ trêu thay, đây lại là nhóm ít có khả năng tận dụng các công cụ này, bởi các mô hình AI hiện tại vẫn xử lý các ngôn ngữ ít dữ liệu (không phải tiếng Anh) một cách kém hiệu quả.
Vấn đề không chỉ nằm ở dữ liệu, mà còn nằm ở cách AI “nghĩ”. Phần lớn các mô hình hiện nay được huấn luyện trên kho dữ liệu khổng lồ bằng tiếng Anh. Khi gặp một ngôn ngữ khác, các mô hình thường “dịch ngược” về tiếng Anh để xử lý, rồi mới trả lời lại. Quy trình hai bước ấy nghe có vẻ hợp lý, nhưng thực chất lại mở ra thêm nhiều tầng sai lệch.
Ngay cả ở cấp độ kỹ thuật sâu hơn, sự thiên lệch cũng đã được “lập trình” từ đầu. Các mô hình xử lý văn bản bằng cách chia nhỏ thành “token” — những đơn vị ngôn ngữ cơ bản. Vì được huấn luyện chủ yếu bằng tiếng Anh, chúng phân mảnh các ngôn ngữ khác kém hiệu quả hơn. Cùng một câu có thể cần nhiều token hơn gấp nhiều lần ở ngôn ngữ khác… khiến chi phí tăng lên đáng kể. Điều đó có nghĩa là không chỉ kém chính xác hơn, người dùng ở các ngôn ngữ khác còn phải trả giá đắt hơn - theo cả nghĩa đen lẫn nghĩa bóng.
Một phản ứng tự nhiên là “trộn” thêm tiếng Anh vào câu hỏi, hy vọng AI sẽ hiểu rõ hơn, song điều này lại phản tác dụng. Theo nghiên cứu, việc trộn nhiều ngôn ngữ trong cùng một câu hỏi… thường làm hiệu suất giảm thêm. Thay vì giúp mô hình bám vào điểm tựa, hệ thống rơi vào trạng thái nhiễu loạn giữa các ngôn ngữ.
Điều đáng suy ngẫm không chỉ là AI chưa hoàn hảo, mà là con người đang quá nhanh chóng tin vào sự hoàn hảo ấy. Khi một công nghệ được triển khai ở quy mô toàn cầu, mọi sai lệch nhỏ đều có thể nhân lên thành hệ quả lớn. Một câu trả lời sai trong tiếng Anh có thể được kiểm chứng lại, nhưng một câu trả lời sai trong một ngôn ngữ ít phổ biến có thể không bao giờ bị phát hiện.
Mặc dù vậy, vẫn có những tín hiệu tích cực. Chỉ cần bổ sung một lượng nhỏ dữ liệu chất lượng cao bằng ngôn ngữ địa phương, hiệu suất của mô hình đã có thể cải thiện đáng kể. Nhưng đó mới chỉ là bước đầu. Điều cần thiết hơn là một cách tiếp cận công bằng ngay từ gốc: xây dựng AI không chỉ “biết nhiều”, mà còn “hiểu đều các ngôn ngữ”. Nếu không, trí tuệ nhân tạo thay vì thu hẹp khoảng cách tri thức, lại có nguy cơ đào sâu thêm những bất bình đẳng vốn đã tồn tại. Khi đó, câu hỏi không còn là AI thông minh đến đâu, mà là: AI đang phục vụ ai.
- Từ khóa:
- chuyển đổi số
- công nghệ số
- AI
- trí tuệ nhân tạo
Tin liên quan
Nâng cao năng lực chuyển đổi số cho lãnh đạo, quản lý và công chức
Nếu không lấy người dân làm trung tâm, các nền tảng, giải pháp số rất dễ trở nên hình thức, kém hiệu quả, thậm chí làm gia tăng khoảng cách số giữa người dân và chính quyền.
Tin cùng chuyên mục
-
Công nghệCông nghệ làm mát đô thị để ứng phó nắng nóng cực đoan
Công nghệ này cho phép đẩy một phần năng lượng Mặt Trời trở lại khí quyển thay vì hấp thụ vào công trình, từ đó giảm nhu cầu sử dụng điều hòa và góp phần cắt giảm phát thải khí nhà kính.
-
Công nghệKhoác “áo số” cho di sản nghìn năm Tháp Bà Pô Nagar
Việc áp dụng công nghệ vào di tích không thuần túy là xu hướng kỹ thuật mà là phương thức diễn giải di sản mới, sinh động và bền vững hơn.
-
Công nghệThái Lan: “Tiếp sức số” cho nông dân
Theo kế hoạch, chương trình sẽ đào tạo miễn phí theo hình thức trực tiếp và trực tuyến cho ít nhất 2.000 nông dân và doanh nghiệp SMEs trong lĩnh vực nông nghiệp.
-
Công nghệĐấu giá tên miền .vn: Ok.vn đạt mức trả giá cao nhất 109 triệu đồng
Đợt 2 đấu giá cấp quyền sử dụng tên miền quốc gia Việt Nam “.vn” có độ dài 2 ký tự tiếp tục ghi nhận sự quan tâm tích cực của cộng đồng trong hai ngày 24 và 25/6.
-
Công nghệOpenAI cân nhắc hoãn IPO đến năm 2027
Theo báo cáo vừa công bố từ New York Times, OpenAI đang xem xét hoãn kế hoạch phát hành cổ phiếu lần đầu ra công chúng (IPO) cho đến năm 2027.
-
Công nghệHướng đi mới cho pin nhiên liệu hydro
Theo các nhà khoa học, công nghệ này có tiềm năng ứng dụng trong ô tô chạy bằng hydro, tàu hỏa, máy bay không người lái, tàu thủy, hệ thống điện phân tán.
-
Công nghệTrung tâm cấp quốc gia đầu tiên hỗ trợ sản xuất thử chip bán dẫn
Ngày 26/6, tại Hà Nội, Bộ Khoa học và Công nghệ tổ chức Lễ ra mắt Trung tâm quốc gia hỗ trợ sản xuất thử chip bán dẫn (Vietnam National Multi-Project Wafer Coordination Center - VNMPW/CC).
-
Công nghệỨng dụng AI giúp đảm bảo tại các giao lộ đường sắt ở Nhật Bản
Ngày càng nhiều nhà điều hành đường sắt của Nhật Bản áp dụng các hệ thống đảm bảo an toàn sử dụng trí tuệ nhân tạo (AI) để giúp ngăn ngừa tai nạn liên quan đến tàu hỏa tại các giao lộ đường sắt.
-
Công nghệLHQ thông qua bộ quy tắc toàn cầu đầu tiên cho xe tự hành
Một cơ quan thuộc Liên hợp quốc (LHQ) cho biết đã chính thức thông qua bộ quy tắc toàn cầu đầu tiên dành cho xe tự hành hoàn toàn vào ngày 24/6.













