BNEWS Công ty OpenAI - nhà phát triển công cụ trò chuyện (chatbot) ChatGPT - đã bổ sung tính năng thoại và nhận diện hình ảnh cho nền tảng trí tuệ nhân tạo tạo sinh (generative AI).
Thông báo của OpenAI nêu rõ những tính năng trên sẽ được bổ sung vào các phiên bản trả phí của dịch vụ ChatGPT, theo đó cho phép người dùng nói chuyện với AI và thậm chí chỉ cho AI xem những gì họ đang nói đến.
OpenAI cho biết: “Giọng nói và hình ảnh mở ra cho bạn nhiều hướng ứng dụng ChatGPT trong cuộc sống".
OpenAI gợi ý rằng người dùng có thể chụp ảnh một địa danh khi đi du lịch và trò chuyện trực tiếp cùng ChatGPT về điều thú vị ở địa điểm đó; có thể chụp ảnh những thứ có bên trong chiếc tủ lạnh để ChatGPT gợi ý về công thức bữa ăn hoặc chụp ảnh bài tập Toán của con để nhận được lời giải.
Theo Open AI, người dùng ChatGPT Plus và Enterprise sẽ được trải nghiệm tính năng này trong vài tuần tới. Dự án này cũng được phát triển hướng tới hệ điều hành điện thoại thông minh của Apple và Google.
Nhà sáng tạo ChatGPT cho biết: “Giờ đây, bạn có thể sử dụng giọng nói để trò chuyện qua lại với trợ lý của mình. Nói chuyện với công cụ này khi đang di chuyển, yêu cầu kể một câu chuyện trước khi đi ngủ cho các con của bạn, hoặc nhờ công cụ này giải quyết một cuộc tranh luận trên bàn ăn".
OpenAI cũng đã hợp tác với các diễn viên lồng tiếng để khiến các tương tác bằng giọng nói qua ChatGPT trở nên thực tế hơn.
Các chương trình AI tạo sinh của OpenAI đã trở thành tâm điểm chú ý vào cuối năm ngoái, khi ChatGPT thể hiện khả năng tạo ra các bài tiểu luận, bài thơ và cuộc trò chuyện từ những gợi ý ngắn gọn bằng văn bản.
Ngoài công ty khởi nghiệp OpenAI, nhiều "gã khổng lồ" công nghệ như Google, Meta và Microsoft... cũng đang chạy đua phát triển AI, trong khi nỗ lực tránh những nguy cơ tiềm tàng của công nghệ này tạo ra những thông tin sai lệch và tiếp tay cho tội phạm mạng.
Trong một thông báo ngày 25/9, nền tảng phát nhạc trực tuyến Spotify có trụ sở tại Thụy Điển cho biết họ đang tận dụng công nghệ của OpenAI để cho phép dịch podcast sang nhiều ngôn ngữ, trong khi vẫn duy trì ngôn ngữ của người nói ban đầu.
Ông Ziad Sultan, Phó Chủ tịch phụ trách cá nhân hóa của Spotify, cho biết: “Bằng cách kết hợp giọng nói của chính người sáng tạo, Voice Translation mang đến cho người nghe trên toàn thế giới khả năng khám phá và lấy cảm hứng từ các podcast mới theo cách chân thực hơn bao giờ hết”.
Theo Spotify, trong những tuần tới, công ty này sẽ tung ra những podcast tiếng Anh được dịch sang tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức./.
Tin liên quan
Anthropic – Đối thủ cạnh tranh tiềm năng với OpenAI?
Anthropic được kỳ vọng sẽ ghi dấu ấn mạnh mẽ và khác biêt bên cạnh những gã khổng lồ AI như OpenAI hay Google.
Tin cùng chuyên mục
-
Công nghệLHQ thông qua bộ quy tắc toàn cầu đầu tiên cho xe tự hành
Một cơ quan thuộc Liên hợp quốc (LHQ) cho biết đã chính thức thông qua bộ quy tắc toàn cầu đầu tiên dành cho xe tự hành hoàn toàn vào ngày 24/6.
-
Công nghệClaude Tag - Bước đi mới của Anthropic
Công ty công nghệ Anthropic vừa cho ra mắt một công cụ trí tuệ nhân tạo (AI) liên quan đến ứng dụng nhắn tin công việc Slack của tập đoàn phần mềm Salesforce.
-
Công nghệSony sẽ xuất xưởng cảm biến hình ảnh mới tăng độ phân giải lên 20%
Cảm biến này có thể đọc dữ liệu nhanh gấp đôi so với các mẫu trước đó và cho phép quay phim ở tốc độ 120 khung hình/giây với độ phân giải 4K.
-
Công nghệMeta ra mắt kính AI giá 299 USD, duy trì vị thế dẫn đầu thị trường
Meta vừa trình làng dòng kính thông minh mới với mức giá khởi điểm 299 USD, thấp hơn đáng kể so với 379 USD của dòng Ray-Ban hiện có.
-
Công nghệBỉ phát minh công nghệ tiêu diệt "chất ô nhiễm vĩnh cửu" PFAS trong đất
Công ty Haemers Technologies do kỹ sư Jan Haemers sáng lập, vừa phát triển thành công một phương pháp có thể tiêu diệt hoàn toàn "hóa chất vĩnh cửu" (PFAS) trong đất bằng nhiệt độ cao.
-
Công nghệChuyển đổi số mở đường cho hệ thống y tế thông minh
Các chuyên gia cho rằng, để xây dựng thành công hệ thống y tế thông minh, cần tiếp tục hoàn thiện hạ tầng số, chuẩn hóa dữ liệu, phát triển nguồn nhân lực và hoàn thiện cơ chế, chính sách phù hợp.
-
Công nghệWorld Cup 2026: Khi AI vào sân
AI có thể tự động tính toán các khoảng trống chiến thuật thông qua việc đo lường các vùng không gian mở ra khi một đội bóng dịch chuyển đội hình, từ đó chỉ ra những vị trí mà đối phương đang sơ hở.
-
Công nghệTổng thống Mỹ ký sắc lệnh thúc đẩy phát triển công nghệ máy tính lượng tử
Động thái của Nhà Trắng đã nhận được sự ủng hộ từ giới lãnh đạo công nghệ.
-
Công nghệCông nghệ khung ảnh kỹ thuật số ấn tượng của Aura
Công ty công nghệ Aura mới đây trình làng khung ảnh kỹ thuật số Aura Ink sử dụng công nghệ e-ink để tạo ra màn hình trông không hề giống kỹ thuật số.












