Rò rỉ hơn 16 tỷ mật khẩu: Tài khoản Facebook, Google, Apple đều có nguy cơ bị truy cập trái phép
Một vụ vi phạm dữ liệu quy mô chưa từng có vừa khiến hơn 16 tỷ mật khẩu bị rò rỉ trên Internet, làm dấy lên lo ngại nghiêm trọng về an ninh mạng toàn cầu. Các tài khoản Facebook, Google, Apple và nhiều dịch vụ phổ biến khác đang đứng trước nguy cơ bị truy cập trái phép.
Việc thu thập và lưu trữ thông tin nhạy cảm một cách bất cẩn có thể nguy hiểm không kém hành vi đánh cắp dữ liệu có chủ đích. Đó là cảnh báo từ nhóm nghiên cứu bảo mật của tờ Cybernews, sau khi họ phát hiện một loạt các tập dữ liệu khổng lồ bị rò rỉ, chứa tới hàng tỷ thông tin đăng nhập từ đủ loại nền tảng, từ mạng xã hội, dịch vụ VPN đến các cổng thông tin nội bộ dành cho nhà phát triển.
Theo dõi sát sao hoạt động trên web từ đầu năm 2025, nhóm đã phát hiện 30 tập dữ liệu bị lộ, mỗi tập chứa từ vài chục triệu đến hơn 3,5 tỷ bản ghi, với tổng cộng hơn 16 tỷ thông tin đăng nhập bị phơi bày, một con số gần như vượt quá sức tưởng tượng.

Đáng chú ý, hầu hết các tập dữ liệu này đều chưa từng được báo cáo trước đây. Ngoại lệ duy nhất là một kho dữ liệu “bí ẩn” gồm 184 triệu bản ghi được Tạp chí Wired đưa tin hồi tháng 5 và đó mới chỉ xếp hạng thứ 20 trong danh sách những gì Cybernews đã phát hiện.
Tình trạng này phản ánh sự lan rộng đáng báo động của các phần mềm độc hại chuyên đánh cắp thông tin đăng nhập. Các chuyên gia cảnh báo: “Đây không chỉ là một vụ rò rỉ mà là bản thiết kế cho hoạt động khai thác thông tin hàng loạt”.
Điểm tích cực hiếm hoi là hầu hết các dữ liệu này chỉ tồn tại trên mạng trong thời gian rất ngắn, đủ để các nhà nghiên cứu phát hiện, nhưng chưa kịp truy vết kẻ đứng sau. Nhiều tập dữ liệu bị rò rỉ qua các kho lưu trữ mở, cho thấy một lỗ hổng nghiêm trọng trong quản lý dữ liệu hiện nay.
Hàng tỷ bản ghi bị lộ chứa đựng những gì?
Theo nhóm nghiên cứu, phần lớn dữ liệu trong các tập tin bị rò rỉ là sự pha trộn phức tạp giữa thông tin đánh cắp từ phần mềm độc hại, tập hợp thông tin đăng nhập được “nhồi nhét” từ nhiều nguồn và các dữ liệu bị rò rỉ trước đây được đóng gói lại theo định dạng mới.
Mặc dù không thể xác định chính xác số lượng người dùng bị ảnh hưởng do nhiều bản ghi có thể trùng lặp nhưng mức độ chồng chéo không làm giảm đi độ nguy hiểm của khối dữ liệu khổng lồ này.
Điểm đáng lưu ý là hầu hết các bản ghi đều tuân theo một định dạng nhất quán, đó là địa chỉ web URL, sau đó là tên người dùng và mật khẩu. Đây chính là cấu trúc phổ biến mà các phần mềm độc hại hiện đại sử dụng để thu thập dữ liệu đăng nhập một cách có hệ thống và dễ khai thác.
Với hơn 16 tỷ bản ghi, các tập dữ liệu này mở ra cánh cửa tiếp cận đến gần như mọi dịch vụ kỹ thuật số phổ biến hiện nay, từ Google, Facebook, Apple, đến GitHub, Telegram, thậm chí cả các hệ thống chính phủ.
Các nhà nghiên cứu cảnh báo đây chính là mảnh đất màu mỡ cho tội phạm mạng triển khai những chiến dịch lừa đảo tinh vi, tấn công bằng mã độc tống tiền, chiếm đoạt tài khoản hoặc thâm nhập hệ thống doanh nghiệp qua email.
Đặc biệt, việc các dữ liệu bị lộ còn bao gồm cookie, mã xác thực và siêu dữ liệu khiến mối đe dọa càng nghiêm trọng hơn đối với những tổ chức chưa triển khai xác thực đa yếu tố hoặc không thường xuyên thay đổi thông tin đăng nhập.
Bộ dữ liệu nào đã tiết lộ hàng tỷ thông tin đăng nhập?
Các tập dữ liệu bị rò rỉ mà nhóm nghiên cứu phát hiện có quy mô và nguồn gốc rất đa dạng. Tập nhỏ nhất, được đặt tên theo một loại phần mềm độc hại, chứa hơn 16 triệu bản ghi.
Trong khi đó, tập lớn nhất có thể liên quan đến nhóm người dùng nói tiếng Bồ Đào Nha, lên tới hơn 3,5 tỷ bản ghi. Trung bình, mỗi tập chứa khoảng 550 triệu thông tin đăng nhập, đủ để gây hậu quả nghiêm trọng nếu rơi vào tay kẻ xấu.
Một số tập dữ liệu được đặt tên mơ hồ như “login”, “credentials” (thông tin đăng nhập), khiến các nhà nghiên cứu không thể xác định chính xác nội dung bên trong. Tuy nhiên, những tập khác lại gợi ý rõ ràng về nguồn gốc hoặc mục tiêu.
Ví dụ, có tập dữ liệu 455 triệu bản ghi mang tên cho thấy liên quan đến Nga, hay một tập khác liên quan đến Telegram với hơn 60 triệu bản ghi. Một số còn ám chỉ các dịch vụ đám mây, nền tảng dành cho doanh nghiệp hoặc các tệp bị khóa bằng phần mềm độc hại.
Theo nhóm nghiên cứu, điều khiến những dữ liệu này đặc biệt nguy hiểm là chúng bao gồm cả nhật ký cũ và mới từ các phần mềm đánh cắp thông tin, thường đi kèm cookie, mã thông báo xác thực và siêu dữ liệu. Điều này đe dọa nghiêm trọng đến các tổ chức không sử dụng xác thực đa yếu tố hoặc không có quy trình bảo vệ thông tin đăng nhập.
Điều đáng lo ngại là không thể xác định ai đứng sau việc thu thập các tập dữ liệu này. Một số có thể do nhà nghiên cứu bảo mật thu thập, nhưng phần lớn khả năng thuộc về các nhóm tội phạm mạng, vốn ưa chuộng những kho dữ liệu khổng lồ để mở rộng quy mô các cuộc tấn công như đánh cắp danh tính, lừa đảo tài chính và chiếm đoạt tài khoản. Chỉ cần một tỷ lệ thành công nhỏ, chúng cũng có thể tiếp cận hàng triệu nạn nhân tiềm năng.
Trong bối cảnh người dùng không thể biết chắc dữ liệu của mình có bị rò rỉ hay không, các biện pháp cơ bản như sử dụng trình quản lý mật khẩu, thiết lập mật khẩu mạnh và kích hoạt xác thực hai yếu tố (2FA) là tuyến phòng thủ thiết yếu. Việc quét hệ thống định kỳ để phát hiện phần mềm độc hại cũng đóng vai trò quan trọng trong việc bảo vệ dữ liệu cá nhân khỏi rơi vào tay kẻ xấu.
Facebook, Google, Apple có bị rò rỉ dữ liệu không?
Trên lý thuyết, không có bằng chứng nào cho thấy Facebook, Google hay Apple đã bị vi phạm bảo mật một cách trực tiếp. Tuy nhiên, với hơn 16 tỷ thông tin đăng nhập bị rò rỉ, tương đương trung bình 2 tài khoản cho mỗi người trên hành tinh thì nguy cơ vẫn hiện hữu.
Sự thật là các tập dữ liệu bị lộ đến từ nhiều nguồn, với mức độ trùng lặp chưa thể xác định. Điều này khiến một số báo cáo truyền thông vội vàng khẳng định các tài khoản từ các “ông lớn” công nghệ đã bị lộ thông tin, điều mà giới nghiên cứu cho là thiếu chính xác.

Bob Diachenko, nhà nghiên cứu bảo mật nổi tiếng và cộng tác viên của Cybernews, người đầu tiên phát hiện vụ rò rỉ khổng lồ này, đã làm rõ: “Không có dấu hiệu nào cho thấy Facebook, Google hay Apple bị vi phạm trực tiếp”. Tuy nhiên, ông cũng cảnh báo rằng, nhiều thông tin đăng nhập xuất hiện trong các tập dữ liệu bị đánh cắp có chứa địa chỉ URL trỏ đến các trang đăng nhập của chính các nền tảng này.
Nói cách khác, mặc dù hệ thống lõi của các công ty này chưa bị xâm nhập, nhưng người dùng vẫn có thể bị đánh cắp thông tin qua phần mềm độc hại hoặc tấn công lừa đảo và đó là mối nguy không thể xem nhẹ.
Vụ rò rỉ hơn 16 tỷ dữ liệu báo hiệu bước ngoặt trong thế giới ngầm tội phạm mạng
Theo Aras Nazarovas, nhà nghiên cứu tại Cybernews, vụ rò rỉ hơn 16 tỷ bản ghi lần này không chỉ đơn thuần là một sự cố an ninh mà nó phản ánh một xu hướng thay đổi rõ rệt trong hoạt động của tội phạm mạng.
Ông Nazarovas khuyến cáo người dùng nên thực hiện thay mật khẩu ngay lập tức, bật 2FA nếu chưa có, giám sát tài khoản thường xuyên và liên hệ với bộ phận hỗ trợ khi có bất thường.
Vụ việc lần này chỉ là một phần trong chuỗi các rò rỉ dữ liệu khổng lồ đã và đang làm rung chuyển thế giới công nghệ. Từ vụ rò rỉ dữ liệu kỷ lục với 26 tỷ bản ghi hồi đầu năm 2024, đến RockYou2024 gần 10 tỷ mật khẩu bị rò rỉ, và vụ lộ dữ liệu quy mô quốc gia ở Trung Quốc gần đây, xu hướng cho thấy các vụ vi phạm dữ liệu không chỉ gia tăng về quy mô mà còn thay đổi cả về cách thức tổ chức và phát tán. Đây là lời cảnh báo rõ ràng rằng, bảo mật dữ liệu cá nhân giờ đây không chỉ là lựa chọn, mà là yêu cầu bắt buộc.