Tại sao google hỏi co phai nguoi máy

Tuy khiến người dùng mất thời gian nhưng bù lại, phương thức này sẽ giúp tăng tính bảo mật cho website, tránh tình trạng spam và sự tấn công của tin tặc.

Người dùng Internet chắc hẳn từng bị quấy rầy bởi những hộp xác thực CAPTCHA với câu "I'm not a robot" (Tôi không phải người máy) hoặc yêu cầu phải tìm ra vạch kẻ đường, biển hiệu hay đèn tín hiệu giao thông...

 

Trước khi giải đáp cho câu hỏi tại sao Google thường bắt người dùng xác nhận "Tôi không phải người máy", chúng ta hãy tìm hiểu ngọn nguồn vấn đề - CAPTCHA.


CAPTCHA là viết tắt của "Completely Automated Public Turing test to tell Computers and Humans Apart" (tạm dịch: Bài kiểm tra Turing công khai hoàn toàn tự động nhằm phân biệt máy tính và người), được phát triển bởi các nhà khoa học, gồm: Luis von Ahn, Manuel Blum, Nicholas J. Hopper (thuộc Đại học Carnegie Mellon), và John Langford (khi đó thuộc IBM) vào năm 2000.

 

Tại sao google hỏi co phai nguoi máy


Bạn có thể hiểu nôm na, CAPTCHA giống như là một bài kiểm tra về mức độ phản hồi, được sử dụng để xác minh trong máy tính, nhằm xác định xem liệu người dùng có phải là một con người thật sự không.


Máy chủ sẽ yêu cầu người dùng hoàn tất một quá trình kiểm tra đơn giản mà máy tính dễ dàng tạo ra được, nhưng bản thân nó lại không thể giải được. Vậy nên, chỉ có người dùng – con người đích thực mới có thể hoàn thành CAPTCHA.

 

Khi CAPTCHA ngày càng được dùng phổ biến trong bảo mật trên Internet, Luis von Ahn cảm thấy con người đã tiêu tốn quá nhiều thời gian để giải những câu đố hình ảnh này. Trong TED Talk 2011, Von Ahn đã ước tính rằng toàn bộ nhân loại đã lãng phí 500.000 giờ mỗi ngày để gõ CAPTCHA.


Để CAPTCHA được sử dụng mạnh mẽ và có ý nghĩa hơn, ông đã phát triển reCAPTCHA, sau đó được bán cho Google vào năm 2009, giúp điện tử hóa sách giấy. Ví dụ mỗi lần bạn gõ CAPTCHA trên Facebook, Twitter, Google,... bạn đang giúp số hoá sách.

 

Tại sao google hỏi co phai nguoi máy

 

Được biết, reCAPTCHA đã giúp số hóa hàng triệu cuốn sách mỗi năm và cũng đã mở rộng để hỗ trợ các nỗ lực khác như số hóa tên đường và số trên Google Maps hoặc nhận ra các đối tượng phổ biến trong ảnh cho Google Images.


Tuy nhiên, CAPTCHA cũng như reCAPTCHA không phải là không thể phá vỡ. Năm 2014, phân tích của Google cho thấy trí tuệ nhân tạo (AI) có thể giải được những hình ảnh CAPTCHA và reCAPTCHA phức tạp nhất với độ chính xác lên tới 99.8%.

 

Do đó, Google đã tạo ra hệ thống mới "No CAPTCHA reCAPTCHA: I'm not a robot", không dựa vào khả năng giải mã văn bản của người dùng mà là hành vi trên mạng của họ trước khi vượt qua điểm kiểm tra an ninh.


Google sẽ phân tích hành vi của bạn trước, trong và sau khi nhấp vào hộp kiểm để xác định xem bạn có những đặc điểm xuất hiện ở người không. Phân tích này có thể bao gồm mọi thứ từ lịch sử duyệt web của bạn, cho đến cách bạn di chuyển chuột trên trang.

 

Nếu Google vẫn không chắc chắn rằng bạn có phải là người thật hay không thì sau khi nhấp vào hộp kiểm, bạn sẽ được hiển thị reCAPTCHA như một biện pháp bảo mật bổ sung.

Đã không ít lần bạn phải đánh dấu vào ô “Tôi không phải robot” (I’m not a robot) sau khi nhập thông tin vào một website nào đó. Tiếp theo, bạn có thể phải vượt qua một bài test tìm hình ảnh nữa. Bạn tự hỏi vì sao phải làm những bước đó? Lời giải thích có ngay bên dưới!

Một trong những hệ quả của việc ứng dụng máy tính vào vận hành xã hội loài người là nhiều hệ thống dễ dàng bị thao túng để tự động thực hiện những ý đồ của kẻ đứng sau. Những chương trình tự động đó được gọi là “bot”, viết tắt của “robot”.

 

Bot có thể gây ra đủ loại rắc rối trên mạng internet. Nhằm ngăn ngừa điều đó, vào thập niên 1990, các nhà nghiên cứu máy tính đã phát minh ra một kỹ thuật gọi là CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) nhằm sàng lọc những con bot tìm cách nhập thông tin vào các website.

Sẽ có nhiều trường hợp, người chủ website muốn đảm bảo rằng một con người “bằng xương bằng thịt” đang nhập thông tin vào website của họ. Ví dụ, khi bạn tạo hoặc đăng nhập vào tài khoản (để ngăn lừa đảo hoặc hack), khi đăng bình luận (để ngăn spam), và khi mua hàng hay vé (để ngăn đầu cơ)...

Và đó là lý do tại sao bạn phải chứng minh mình không phải là một con robot.

CAPTCHA ban đầu là hình ảnh đi kèm ký tự, số, hoặc từ viết bằng các loại font uốn lượn, thường bị che khuất bởi những đường kẻ ngang hay hiệu ứng nhiễu hạt để vô hiệu hóa các thuật toán thị giác máy tính. Từ năm 2007, một dự án gọi là reCAPTCHA được khởi động nhằm tận dụng bài test CAPTCHA cho những mục đích có ý nghĩa khác, ví dụ như số hóa sách và huấn luyện các thuật toán học máy - reCAPTCHA cũng yêu cầu bạn phải đánh dấu vào ô “I’m not a robot”.

 

Năm 2009, Google mua lại reCAPTCHA và bắt đầu sử dụng nền tảng này để giải mã các địa chỉ trong Google Street View, bằng cách... mượn vài giây công sức của mỗi người thực hiện bài test này (có người đã tìm cách kiện Google vì hành vi ăn cướp trắng trợn sức lao động vào năm 2015, nhưng vụ kiện sau đó đã bị hủy bỏ).

Ngày nay, khi bạn thực hiện một bài test reCAPTCHA, bạn đang giúp Google huấn luyện các mô hình học máy AI bằng cách chỉ ra các vật thể trong những bức ảnh mà thông thường máy tính thường có thể gặp vấn đề nhận biết. Do đó, thật mỉa mai khi bạn cứ nghĩ mình đang giúp ngăn chặn lũ bot, nhưng trên thực tế lại đang giúp chúng trở nên ưu việt hơn trong những tác vụ nhận diện hình ảnh, vốn cực kỳ cần thiết để... đánh bại CAPTCHA trong tương lai.

Và bằng cách chỉ ra những vạch ngựa vằn, đèn giao thông, cầu, xe cộ..., bạn cũng đang giúp huấn luyện thế hệ xe ô tô tự hành của tương lai - dù rằng vào năm 2019, Google từng khẳng định dữ liệu reCAPTCHA sẽ không được sử dụng cho mục đích đó.