BAOTAYNINH.VN trên Google News

Loa thông minh có thực sự là 'kẻ nghe lén' 

Cập nhật ngày: 16/08/2019 - 19:44

Tư Lan có thiện cảm với loa thông minh bởi nó đọc truyện cho con gái cô mỗi tối, cho tới ngày đoạn hội thoại xuất hiện trong điện thoại...

Tư Lan là một nhân viên văn phòng ở Quảng Châu, Trung Quốc. Nhân ngày sinh nhật con gái cô, một người bạn đã tặng cho bé một chiếc loa thông minh của một thương hiệu phổ biến tại Trung Quốc. Đó là chiếc hộp vuông nhỏ, giá tiền cũng không cao. Tư Lan cũng không quan tâm lắm đến những thứ mới lạ nên chỉ để nó trong phòng khách, nhưng cô con gái 6 tuổi thì rất thích chiếc loa nhỏ, lúc nào cũng ôm lấy nó kể chuyện.

Dần dần, Tư Lan cũng bắt đầu có thiện cảm hơn với chiếc loa này. "Đúng là đồ để dỗ trẻ con!" - cô nghĩ và bắt đầu lên Taobao tìm kiếm những sản phẩm liên quan, dự định mua một chiếc loa mới có thiết kế và chất lượng âm thanh tốt hơn.

Cho đến một ngày tháng trước, Tư Lan vô tình mở một ứng dụng trên điện thoại có kết nối với loa và phát hiện rằng, một đoạn văn bản được ghi trong đó là cuộc trò chuyện của cô với chồng và đã được chuyển từ giọng nói thành văn bản. Điều khiến cô bất ngờ là đoạn hội thoại này xảy ra khi con gái cô đã nghe kể chuyện từ loa xong. Về lý thuyết, lúc này chiếc loa phải trạng thái không hoạt động, không được thu âm, càng không thể truyền nội dung sang điện thoại rồi chuyển thành văn bản.

Những hoài nghi liên tục xuất hiện trong đầu Tư Lan: "Nó vẫn luôn nghe trộm các cuộc trò chuyện của gia đình mình sao?". Mọi người trong gia đình cũng bắt đầu cảm thấy hoài nghi về chiếc loa, dự định mua loa mới cũng vì thế mà đổ bể. Còn về chiếc loa sẵn có, Tư Lan chỉ còn cách tắt nguồn, "con gái tôi thích nghe kể chuyện, vậy nên khi bé nghe tôi sẽ bật máy, nghe xong thì tắt luôn". Bốn, năm tháng gần đây gia đình cô đều làm như vậy.

Amazon Echo Dot là loa thông minh tích hợp trợ lý ảo Alexa bán chạy nhất từ trước tới nay trong dòng sản phẩm Echo của Amazon.

"Sự cố" nghe lén được ghi nhận đầu tiên của loa thông minh xảy ra ở Oregon, Mỹ, năm 2018.

Danielle sống ở Portland, bang Oregon, trong nhà sử dụng bốn chiếc loa thông minh của Amazon dòng Echo. Tháng 5/2018, chồng của Danielle nhận được một cuộc gọi từ cấp dưới: "Tắt ngay chiếc loa Echo đi, anh bị hacker tấn công rồi!". Trước hôm đó, cấp dưới của chồng cô nhận được một file ghi âm, mở ra thì nghe thấy cuộc trò chuyện riêng tư ở nhà của vợ chồng Danielle, trong đó hai người đang bàn luận xem nên dùng loại sàn gỗ cứng nào.

Trước cú sốc này, Danielle đã tắt hết tất cả loa thông minh Echo, nhanh chóng gọi điện thoại cho tổng đài chăm sóc khách hàng của Amazon để tìm lời giải thích, đồng thời chia sẻ sự việc với Hệ thống Phát thanh Columbia.

Với sự cố này, Amazon giải thích là "thao tác sai", nghĩa là trong lúc vận hành, chiếc loa Echo đã hiểu sai nội dung của một cuộc hội thoại thành hiệu lệnh, cho rằng người dùng muốn gửi nội dung giọng nói trước đó cho ai đó trong danh bạ, nên ngay lập tức đã thực hiện.

Echo là dòng loa thông minh của Amazon, được trang bị trợ lý ảo Alexa. Kể từ giữa năm 2018, khoảng 35 triệu chiếc loa Echo đã được xuất xưởng tại Mỹ, theo dự báo của hãng phân tích CIRP. Thị phần của nó đạt tới 70%, vượt xa các thương hiệu khác.

Không lâu sau đó, Echo lại xảy ra "sự cố" thứ hai. Một người dùng Đức đã chia sẻ thông tin với tạp chí địa phương có tên C’t. Khi yêu cầu Amazon gửi dữ liệu giọng nói cho các hoạt động cá nhân của mình, anh ta nhận được một tệp nén 100MB, nội dung tệp là lời giải thích về lệnh thoại của Alexa và 1.700 bản ghi âm cuộc trò chuyện của người lạ.

Tạp chí C’t đã nghe một vài bản ghi âm và thấy rằng nội dung của các cuộc trò chuyện có thể là những chi tiết trong cuộc sống hàng ngày, bao gồm thời gian ở nhà và ra ngoài, các thiết bị thông minh từ các thương hiệu khác trong gia đình, giới tính các thành viên trong gia đình, thậm chí cả âm thanh khi tắm của người dùng.

Mặc dù Amazon đã xin lỗi về hai sự cố trên, nhưng không thể che giấu một suy đoán đang dần hình thành trong dư luận: Việc "nghe lén" của loa thông minh có lẽ không chỉ là mối nguy hiểm tiềm ẩn, mà nó thật sự tồn tại. "Khi nghe thấy tiếng đánh thức từ chúng ta là nó có thể bắt đầu hoạt động, vậy có phải là những chiếc loa thông minh đang nghe chúng ta nói chuyện mọi lúc mọi nơi không?" Tư Lan nghi ngờ.

Không chỉ có vậy, cũng trong tháng 7, trợ lý ảo Google Assistant bị nghi ngờ cung cấp các file âm thanh đã được ghi lại tự động cho nhân viên của Google. Thậm chí cả các nhà thầu bên thứ ba trên khắp thế giới của hãng này cũng có thể nghe nội dung các cuộc hội thoại.Những tháng gần đây, ngày càng nhiều những sự cố liên quan đến thiết bị thông minh "nghe lén" đang được phơi bày. Tháng 7 vừa qua, một nhà thầu của Apple cho biết, để tăng cường khả năng của Siri, Apple sẽ thuê một nhà thầu bên ngoài nghe các bản ghi âm, bao gồm các các cuộc trò chuyện riêng tư mà Siri vô tình thu được khi kích hoạt, như thông tin y tế hay một số thông tin khác.

Lo ngại về loa thông minh và trợ lý giọng nói được tích hợp trong các thiết bị đang lan rộng. Không chỉ "nghe lén", hiện tượng loa thông minh thỉnh thoảng tự khởi động cũng khiến người dùng lo lắng. Kể từ năm ngoái, một số người cho biết, khi chưa được khởi động còn nghe thấy tiếng cười "he he" phát ra từ chiếc loa Echo, khiến người ta sởn tóc gáy.

Tình trạng tương tự cũng xảy ra trên một số loa thông minh tại Trung Quốc. Một người dùng tiết lộ, loa thông minh trong nhà có lần đột nhiên nói "thiết bị đang trong quá trình nâng cấp hệ thống, đã cập nhật ** ứng dụng". "Dù đó cũng chỉ là những nội dung hết sức bình thường, nhưng trong nhà không có ai, chiếc loa đột nhiên phát ra âm thanh, mỗi lần như vậy đều khiến tôi giật mình", người này cho hay. Thậm chí có một lần, khi mời bạn đến nhà chơi, trong lúc hai người đang nói chuyện, chiếc loa thông minh đột nhiên khởi động và bật bài hát "Kẻ giết người" của Lâm Tuấn Kiệt.

Các loa thông minh đều điểu khiển qua điện thoại.

Anh Trương Tư Thành, ở Quảng Châu, Trung Quốc, cho biết, "vài năm gần đây, trước khi mua loa thông minh, bạn bè xung quanh đều đến hỏi tôi về vấn đề nghe lén". Anh từng làm trong bộ phận loa thông minh của nhiều công ty, vì vậy được bạn bè coi như chuyên gia trong ngành. "Điều thú vị là, sau khi hỏi, hầu hết mọi người đều vẫn mua".

Theo anh Trương và nhiều người quen thuộc với loa thông minh, việc nhận dạng loa thông minh chia thành hai trạng thái: "đứng yên" và "di chuyển". Khi loa thông minh chưa được kích hoạt thì ở trạng thái "đứng yên", nghĩa là có thể ghi âm thanh từ bên ngoài, nhưng sẽ không lưu trữ và tiến hành nhận biết ý nghĩa lời nói. Từ Gia Minh, một quản lý kinh doanh sản phẩm loa thông minh ở một siêu thị điện máy Quảng Châu, cho biết: "Trạng thái trước khi được đánh thức tương đương với thao tác nhận dạng sóng âm, loa sẽ so sánh âm thanh chúng thu được và âm thanh đánh thức. Khi sóng âm thanh khớp, nó sẽ tự động khởi động". 

Anh Trương phủ nhận những tin đồn về việc "lén lút nghe trộm" của loa thông minh. Theo anh, các sản phẩm trên thị trường không hề tồn tại bất kỳ tình trạng cố ý nghe lén nào. "Đây là một việc rất tốn kém", anh Trương nhận định. Anh đã thử tính toán: Giả sử một công ty bán ra 1 triệu chiếc loa và có 200.000 ngày làm việc trực tiếp. Nếu như công ty muốn những chiếc loa này nghe lén 24 giờ, chỉ tính mỗi giây tạo ra 100.000 dữ liệu, nhân với 200.000, ra chi phí băng thông, lưu trữ và tính toán cũng đủ khiến người ta giật mình.

Quan trọng hơn, với khả năng xử lý công nghệ hiện nay, các công ty không thể biến những bản ghi âm khổng lồ mà rời rạc này thành thông tin có ích với giá trị thương mại. Theo quan điểm của anh Trương, cho dù không xem xét đến vấn đề đạo đức, chỉ xem xét lợi ích thương mại thì các công ty cũng không có động lực để đi thu thập thông tin như vậy.

Anh Trương nhớ lại, trong một cuộc kiểm tra loa thông minh do Bộ công nghiệp và công nghệ thông tin Trung Quốc chủ trì năm ngoái, khi ở trạng thái chưa được đánh thức, lượng dữ liệu được truyền bởi những chiếc loa thông minh chỉ ở mức KB, đối với dữ liệu thoại, lượng dữ liệu này hầu như không đáng kể.

Trương Tư Thành và Từ Gia Minh đều thừa nhận rằng, sau khi được "đánh thức", loa sẽ tiến vào trạng thái làm việc đám mây và truyền âm thanh thu được đến máy chủ đám mây để hoàn thành công việc nhận dạng và phản hồi ý nghĩa lời nói. "Đây là điều không thể tránh khỏi", anh Trương nói, hiện nay khả năng tính toán được tích hợp trong loa thông minh không thể hỗ trợ thao tác tính toán ý nghĩa lời nói của AI và càng không thể cải thiện khả năng nhận dạng lời nói.

Loa thông minh có 2 trạng thái: "Thức" và "Ngủ". Ở trạng thái Ngủ, nếu có âm thanh tương tự lời đánh thức, loa sẽ hiểu nó phải tiếp tục hoạt động, dẫn tới trạng thái ghi âm "nhầm".

Theo chiến lược sản phẩm, khi người dùng kết thúc mệnh lệnh, nếu như không có âm thanh mới xuất hiện trong vài giây, loa sẽ hồi phục về trạng thái "ngủ". "Mỗi loại loa có cài đặt không giống nhau, một số trong vòng 3 giây, số khác trong vòng 5 giây", anh Từ tiết lộ. Tuy nhiên trên thực tế, do sự hoàn thiện có hạn của loa, "đánh thức" và "ngủ" có thể xảy ra lỗi. "Ví dụ, có một âm thanh tương tự lời đánh thức hoặc có âm thanh khác sau khi kết thúc mệnh lệnh khiến cho loa tưởng rằng nó cần tiếp tục hoạt động, nó sẽ tiếp tục ghi âm mà người dùng không biết." Theo suy đoán của anh Từ, cái gọi là "sự cố nghe lén"của nhiều khách hàng, bao gồm cả Tư Lan, đều bắt nguồn từ những nguyên nhân trên.

Theo một số chuyên gia, hiện nay trong ngành công nghiệp loa thông minh "tỷ lệ đánh thức sai" lý tưởng là khoảng 2 lần trong mỗi 48 giờ, tệ hơn có thể tới 2-3 lần trong mỗi 24 giờ, điều này có nghĩa là tỷ lệ "nghe lén" tương đối cao. "Đối với các nhà sản xuất loa, điều quan trọng nhất bây giờ là cải thiện khả năng của AI, giảm sai sót. Kho dữ liệu thu thập được chính là tài liệu đào tạo tốt nhất", Từ Gia Minh nói.

Tháng 4 vừa qua, khảo sát của Bloomberg cho thấy Amazon có hàng nghìn nhân viên trên khắp thế giới phụ trách việc nghe và kiểm tra các cuộc trò chuyện của người dùng và Alexa, đồng thời tiến hành đánh dấu, kiểm tra và phản hồi các bản ghi âm để giảm sai sót, giúp Alexa đáp ứng mệnh lệnh tốt hơn. Hai nhân viên của Amazon ở Rumani cho biết, mỗi ngày họ phải làm việc 9 giờ và phân tích hơn 1.000 bản ghi âm.

"Thực ra đây không phải bí mật trong ngành", anh Trương nói. Không chỉ các thương hiệu nước ngoài, mà một số thương hiệu loa thông minh trong nước cũng sẽ có công đoạn "nghe thử" này. Để bảo vệ sự riêng tư của người dùng, trước khi bị nhân viên nghe, các bản ghi âm sẽ được bỏ đi những chi tiết nhạy cảm, dù nhân viên có nghe được cuộc trò chuyện, thậm chí đề cập đến vấn đề riêng tư, nhưng vẫn không thể nhận ra được danh tính cụ thể của người dùng. "Trong quy trình 'đám mây', bản thân tệp âm thanh cũng không ứng với thông tin tài khoản và thông tin thiết bị của người dùng, chủ yếu là để tối ưu hoá các mệnh lệnh" - đại diện một nhà sản xuất loa thông minh Trung Quốc nói.

"1% tổng số lượng dữ liệu được nhân viên nghe chủ yếu tập trung vào việc xác định những nội dung khó, ví dụ khi loa trả lời 'tôi không hiểu bạn đang nói gì', nội dung trước đó của câu này sẽ được ưu tiên để nhân viên nghe và đánh giá thủ công", anh Trương giải thích. Ở công ty anh làm trước đây, mỗi khi có tính năng mới được tung ra, để cải thiện độ chính xác, tỷ lệ "nghe thử" của một vài dữ liệu nhất định sẽ tăng lên khoảng 10%. Tuy nhiên, thời gian của công việc này rất ngắn, "sau vài ngày nghiên cứu sẽ trở lại tỷ lệ bình thường". Từ Gia Minh cũng cho rằng, cùng với khả năng nhận diện ngày càng cải thiện của mô hình AI, tỷ lệ các công ty sử dụng nhân viên nghe các bản ghi âm sẽ càng ngày càng giảm.

Dữ liệu âm thanh mà loa thông minh thu được sẽ không được lưu trữ vĩnh viễn, nhà sản xuất loa ở trên cho biết, sau khi nhận dạng xong tệp âm thanh sẽ bị xoá. "Thời gian lưu trữ dữ liệu của mỗi nhà sản xuất không giống nhau, ở công ty chúng tôi là khoảng vài tháng", anh Từ cho biết.

Loa thông minh có màn hình là nghi ngại hàng đầu với các chuyên gia công nghệ vì lo sợ rò rỉ hình ảnh các nhân khi bị hack.

Loa thông minh, cũng như một số sản phẩm sử dụng trợ lý giọng nói khác, vẫn chưa được hoàn thiện

Điều này đã gây ra nhiều lỗ hổng cho sản phẩm. Ví dụ, nhận dạng sai lời đánh thức hay bị "hacker tấn công". Tháng 8 năm ngoái, tại Hội nghị tin tặc Defcon được tổ chức ở Las Vegas, Mỹ, nhóm bảo mật Tencent chỉ mất 26 giây đã bẻ khoá thành công loa Echo của Amazon, khống chế thiết bị từ xa, khiến thiết bị này tự động ghi âm khi đang ở trạng thái chưa được đánh thức, đồng thời gửi tệp ghi âm đến máy chủ từ xa qua mạng.

Không lâu sau khi bẻ khoá, chuyên gia an toàn mạng của Tencent, Ngũ Huệ Vũ, cho rằng, "trong số 2.300 chiếc loa, có một chiếc bị tấn công vật lý, những chiếc còn lại đều có thể bị tin tặc tấn công gián tiếp qua mạng LAN và trở thành thiết bị nghe lén từ xa của tin tặc". Đương nhiên, sau khi Tencent gửi những lỗ hổng này đi, Amazon đã hoàn thành việc cập nhật và sửa lỗi.

Mặt khác, do thời gian phát triển ngắn, mức độ hoàn thiện thấp, cho đến nay, loa thông minh vẫn chưa hình thành bất kỳ chuỗi "công nghiệp đen" nào. Dữ liệu giọng nói được cung cấp mức độ bảo mật khá nghiêm ngặt, anh Trương Tư Thành tiết lộ. Ở công ty nơi anh làm việc, tất cả công việc liên quan đến ghi âm được thực hiện trong công ty, do nhân sự có hạn nên sẽ thuê thêm nhân viên ở ngoài thực hiện những công việc nhận dạng có tính bảo mật thấp, nhưng cũng sẽ yêu cầu họ đến công ty để hoàn thành công việc.

"Ở thị trường Trung Quốc, tôi chưa từng nghe nói tới việc có công ty nào bán dữ liệu thông tin ra ngoài, chưa từng nghe nói đến các trường hợp nghe lén thành công, đồng thời theo những gì tôi được biết, loa thông minh sẽ không sử dụng dữ liệu âm thanh mà nó ghi được để tạo một bức chân dung toàn cảnh cho người dùng." Anh Trương khẳng định: "Suy cho cùng, loa thông minh bây giờ vẫn 'ngu' lắm, hơn nữa chi phí trích xuất thông tin quá cao. Tôi nghĩ trong tương lai 3-5 năm nữa, cũng không cần lo lắng các vấn đề riêng tư mà loa mang tới". Giống các chuyên gia khác, anh cũng không phủ nhận rằng những tình huống "chưa xảy ra" ở trên sẽ có khả năng "xảy ra" trong tương lai khi công nghệ ngày càng hoàn thiện hơn.

Là một chuyên gia của ngành công nghiệp mới nổi này, anh Trương chấp nhận rằng công nghệ và quyền riêng tư rất khó để cân bằng, "Ở thời đại Internet và trí tuệ nhân tạo phát triển như hiện nay, có một sự thật là chúng ta không hề có quyền riêng tư", anh nói. Cho dù không có loa thông minh, qua điện thoại và máy tính, những thông tin như thông tin cá nhân, sở thích, thói quen của mỗi người cũng đã bị các công ty nắm giữ. 

Đối mặt với những lo lắng này, một số người lựa chọn không dùng loa thông minh. Một kỹ thuật viên nói rằng anh ta đã tắt hết loa thông minh trong nhà, cũng không có ý định mua thêm bất cứ đồ gia dụng thông minh nào nữa. Anh Trương cũng thừa nhận, nhà anh đã mua 3, 4 chiếc loa thông minh nhưng để dùng cho thử nghiệm công việc.

Trước sự phát triển của công nghệ về quyền riêng tư, điểm mấu chốt, theo anh Trương, là "không gây hại". Anh đặt loa thông minh ở phòng khách và phòng sinh hoạt chung, do đó, ngay cả khi một số dữ liệu giọng nói bị rò rỉ thực chất cũng không gây hại cho anh và gia đình. "Phạm vi thu âm của loa thông minh là khoảng 3-5 mét, rất khó thu âm qua vách ngăn nên sẽ không thu được âm thanh trong phòng ngủ. Nếu có vấn đề riêng tư cần nói có thể tắt loa rồi hẵng nói chuyện", anh gợi ý.

Điều không thể chấp nhận với anh Trương là vấn đề rò rỉ hình ảnh, "tôi tuyệt đối không bao giờ mua loa có tích hợp camera hoặc bất kỳ sản phẩm nào có trang bị camera cho phòng ngủ". Một khi hình ảnh bị rò rỉ thì mối nguy hiểm còn lớn hơn và không thể khắc phục.

"Bạn không thể che giấu bản thân, vì vậy chỉ có thể dùng những cách cơ bản nhất để tự bảo vệ mình", anh Trương nói.

Tuy nhiên, một số người có thái độ lạc quan hơn. "Loa thông minh đang trong giai đoạn mới phát triển, muốn mở rộng phát triển ra thành ngôi nhà thông minh đều phải trải qua những giai đoạn ban đầu. Lúc này, việc bảo vệ quyền riêng tư chỉ có thể dựa vào sự 'tự giác' của nhà sản xuất", Từ Gia Minh nói. "Sau khi những sản phẩm này trở nên phổ biến, chắc chắn sẽ xuất hiện những cấp độ bảo vệ quyền riêng tư cao hơn được thống nhất toàn ngành, hạn chế quyền hạn đồng thời thực thi như một tiêu chuẩn bắt buộc".

Nguồn VNE (theo iFeng)