Đăng ký ngay

Đăng nhập

Mất mật khẩu

Quên mật khẩu? Hãy điền địa chỉ email của bạn. Bạn sẽ nhận được một liên kết và sẽ tạo một mật khẩu mới qua email.

Thêm câu hỏi

You must login to ask question.

Đăng nhập

Đăng ký ngay

Chào mừng bạn gia nhập trang hỏi đáp cộng đồng Hiệp Sĩ Top.

Cách thức hoạt động của Google tìm kiếm

Đối với một truy vấn thông thường, có hàng nghìn, thậm chí là hàng triệu trang web có thể cung cấp thông tin liên quan.

Giao diện của Google tìm kiếm.

Vậy thì Google xác định các trang được hiển thị trong kết quả tìm kiếm của bạn như thế nào? Thực ra, quá trình này bắt đầu trước cả khi bạn nhập truy vấn tìm kiếm…

Thu thập dữ liệu và lập chỉ mục

Ngay tại lúc này, Google đang sử dụng các trình thu thập dữ liệu web để sắp xếp thông tin từ các trang web và nội dung công khai khác trong chỉ mục Tìm kiếm.

» Cách Tìm kiếm sắp xếp thông tin

Trước khi bạn tìm kiếm, các trình thu thập dữ liệu web thu thập thông tin từ hàng trăm tỷ trang web và sắp xếp thông tin trong chỉ mục Tìm kiếm.

» Những khái niệm cơ bản về Tìm kiếm

Quy trình thu thập dữ liệu bắt đầu với danh sách các địa chỉ web từ các lần thu thập dữ liệu trước và các sơ đồ trang web do chủ sở hữu trang web cung cấp. Khi truy cập các trang web này, trình thu thập dữ liệu web của chúng tôi sử dụng các liên kết trên trang để khám phá các trang khác. Những phần mềm này đặc biệt chú ý đến các trang web mới, thay đổi đối với trang hiện có và các liên kết hỏng. Các chương trình máy tính xác định dữ liệu trang web nào cần thu thập, tần suất thu thập dữ liệu và số trang cần tìm nạp từ mỗi trang web.

Chúng tôi cung cấp công cụ quản trị trang web để mang đến cho chủ sở hữu trang web các lựa chọn chi tiết hơn về cách Google thu thập dữ liệu trang web của họ: họ có thể cung cấp hướng dẫn chi tiết về cách xử lý các trang trên trang web của mình, có thể yêu cầu thu thập lại dữ liệu hoặc có thể chọn không thu thập dữ liệu bằng cách sử dụng tệp có tên gọi “robots.txt”. Google không bao giờ nhận thanh toán để thu thập dữ liệu một trang web thường xuyên hơn — chúng tôi cung cấp các công cụ giống nhau cho tất cả các trang web để đảm bảo mang lại kết quả tốt nhất có thể cho người dùng.

» Tìm kiếm thông tin bằng cách thu thập dữ liệu

Web giống như một thư viện không ngừng phát triển với hàng tỷ cuốn sách và không có hệ thống sắp xếp trung tâm. Chúng tôi sử dụng phần mềm là những trình thu thập dữ liệu web để khám phá các trang web công khai. Trình thu thập dữ liệu web xem xét các trang web và theo dõi liên kết trên các trang đó, cũng như điều bạn sẽ thực hiện khi duyệt nội dung trên web. Trình thu thập dữ liệu đi từ liên kết này sang liên kết khác và gửi dữ liệu liên quan đến các trang web đó về máy chủ của Google.

» Sắp xếp thông tin bằng cách lập chỉ mục

Khi trình thu thập dữ liệu web tìm thấy một trang web, hệ thống của chúng tôi hiển thị nội dung của trang, tương tự như một trình duyệt. Chúng tôi lưu ý các tín hiệu chính — từ từ khóa cho đến độ cập nhật của trang web — và theo dõi những điều này trong chỉ mục Tìm kiếm.

Chỉ mục Google Tìm kiếm chứa hàng trăm tỷ trang web và có kích thước lớn hơn 100.000.000 gigabyte. Chỉ mục này cũng giống như mục lục ở cuối một cuốn sách — với một mục cho mỗi từ chúng tôi bắt gặp trên mọi trang web được lập chỉ mục. Khi lập chỉ mục một trang web, chúng tôi thêm trang vào các mục cho tất cả các từ có trên trang đó.

Với Sơ đồ tri thức, chúng tôi tiếp tục vượt ra ngoài khả năng đối sánh từ khóa để hiểu rõ hơn những người, địa điểm và sự vật mà bạn quan tâm. Để làm điều này, chúng tôi không chỉ sắp xếp thông tin về các trang web mà còn cả các loại thông tin khác. Hiện nay, Google Tìm kiếm có thể giúp bạn tìm kiếm văn bản từ hàng triệu cuốn sách trong các thư viện lớn, tìm giờ khởi hành, giờ đến của các hãng vận chuyển công cộng trong vùng của bạn, hoặc giúp bạn tìm dữ liệu từ các nguồn công cộng như Ngân hàng thế giới.

Các thuật toán Tìm kiếm

Hệ thống xếp hạng của Google tìm trong hàng trăm tỷ trang web trong chỉ mục Tìm kiếm để cung cấp cho bạn kết quả hữu ích và phù hợp chỉ trong một phần nhỏ của giây.

» Cách hoạt động của thuật toán Tìm kiếm

Bạn muốn câu trả lời, chứ không phải hàng tỷ trang web, và vì thế, hệ thống xếp hạng của Google tìm qua hàng trăm tỷ trang web trong chỉ mục Tìm kiếm để cung cấp cho bạn kết quả hữu ích và phù hợp chỉ trong một phần nhỏ của giây.

Các hệ thống xếp hạng này được tạo thành từ một loạt các thuật toán phân tích nội dung bạn đang tìm kiếm và thông tin gì cần trả về cho bạn. Trong quá trình phát triển Tìm kiếm, để làm cho tính năng này hữu ích hơn, chúng tôi đã tinh chỉnh các thuật toán của mình để đánh giá tìm kiếm và kết quả của bạn một cách chi tiết hơn nhằm làm cho dịch vụ của chúng tôi hoạt động tốt hơn cho bạn.

» Sau đây là một số cách Google sử dụng các thuật toán Tìm kiếm để trả về thông tin hữu ích trên web:

  • Phân tích các từ của bạn

Việc hiểu được nghĩa của tìm kiếm của bạn là điều quan trọng để trả về câu trả lời thích hợp. Vì thế để tìm các trang có thông tin liên quan, bước đầu tiên của chúng tôi là phân tích các từ trong truy vấn của bạn có nghĩa gì. Chúng tôi xây dựng các mô hình ngôn ngữ để cố giải mã những chuỗi từ chúng tôi nên tra trong chỉ mục.

Điều này bao gồm các bước trông có vẻ đơn giản như phân tích các lỗi chính tả, và mở rộng đến cả việc cố gắng hiểu loại truy vấn bạn đã nhập bằng cách áp dụng một số nghiên cứu mới nhất về hiểu ngôn ngữ tự nhiên. Ví dụ: hệ thống từ đồng nghĩa của chúng tôi giúp Tìm kiếm biết được bạn có ý gì, ngay cả khi một từ có nhiều định nghĩa. Hệ thống này mất 5 năm để phát triển và đã cải thiện đáng kể kết quả trong hơn 30% lượt tìm kiếm bằng các ngôn ngữ khác nhau.

Chúng tôi cũng cố hiểu bạn đang tìm kiếm loại thông tin nào. Đó là một tìm kiếm rất cụ thể hay một truy vấn rộng? Có những từ như “đánh giá”, “ảnh” hay “giờ mở cửa” cho biết bạn cần thông tin cụ thể từ tìm kiếm hay không? Bạn có đang tìm kiếm các từ khóa thịnh hành cho thấy rằng bạn muốn nội dung được xuất bản vào ngày đó hay không? Hay bạn đang tìm kiếm một doanh nghiệp lân cận và muốn thông tin về địa phương?

  • Đối sánh tìm kiếm của bạn

Tiếp theo, chúng tôi tìm các trang web có thông tin khớp với truy vấn của bạn. Khi bạn tìm kiếm, ở mức độ cơ bản nhất, các thuật toán của chúng tôi sẽ tra cụm từ tìm kiếm của bạn trong chỉ mục để tìm các trang thích hợp. Các thuật toán này phân tích tần suất và vị trí các từ khóa đó xuất hiện trên một trang, liệu chúng xuất hiện trong tựa đề, tiêu đề hay nội dung.

Cũng như việc đối sánh từ khóa, các thuật toán tìm các gợi ý để đo mức độ phù hợp giữa kết quả tìm kiếm tiềm năng và nội dung người dùng đang tìm kiếm. Khi bạn tìm “chó”, có thể bạn không muốn một trang có từ “chó” xuất hiện hàng trăm lần. Chúng tôi cố tìm hiểu xem liệu trang có cung cấp câu trả lời cho truy vấn của bạn không và không chỉ lặp lại truy vấn hay không. Vì thế các thuật toán Tìm kiếm phân tích liệu trang có nội dung thích hợp hay không — chẳng hạn như ảnh, video về chó hay thậm chí danh sách các giống chó. Cuối cùng, chúng tôi kiểm tra xem trang có được viết bằng ngôn ngữ giống như câu hỏi của bạn hay không để ưu tiên các trang bằng ngôn ngữ tùy chọn của bạn.

  • Xếp hạng các trang hữu ích

Đối với một truy vấn thông thường, có hàng nghìn, thậm chí là hàng triệu trang web có thể cung cấp thông tin liên quan. Vì thế, để giúp xếp hạng các trang tốt nhất đầu tiên, chúng tôi cũng viết các thuật toán để đánh giá mức độ hữu ích của các trang web này.

Các thuật toán này phân tích hàng trăm yếu tố khác nhau để cố hiển thị thông tin tốt nhất có sẵn trên web, từ độ mới mẻ của nội dung cho đến số lần xuất hiện của cụm từ tìm kiếm của bạn và liệu trang có cung cấp trải nghiệm người dùng tốt hay không. Để đánh giá độ đáng tin cậy và nguồn có căn cứ về chủ đề, chúng tôi tìm các trang web có vẻ được nhiều người dùng đánh giá cao đối với cùng truy vấn. Nếu các trang web nổi bật khác về chủ đề này có liên kết đến trang, đó là một dấu hiệu tốt cho thấy thông tin có chất lượng cao.

Có nhiều trang web spam trên web cố tìm cách vươn lên đầu kết quả tìm kiếm bằng các kỹ thuật như lặp lại từ khóa hay mua các liên kết vượt qua được PageRank. Các trang web này cung cấp trải nghiệm người dùng rất kém và thậm chí có thể gây hại hay nhầm lẫn cho người dùng của Google. Vì thế, chúng tôi viết các thuật toán để xác định spam và xóa các trang web vi phạm nguyên tắc quản trị trang web của Google khỏi kết quả của chúng tôi.

  • Xem xét bối cảnh

Các thông tin chẳng hạn như vị trí của bạn, lịch sử tìm kiếm và cài đặt Tìm kiếm đều giúp chúng tôi tùy chỉnh kết quả cho phù hợp và hữu ích với bạn nhất trong khoảnh khắc đó.

Chúng tôi sử dụng quốc gia và vị trí của bạn để cung cấp nội dung thích hợp với khu vực của bạn. Ví dụ: nếu bạn ở Chicago và tìm “bóng đá”, Google có thể sẽ hiển thị cho bạn kết quả về môn bóng đá Mỹ và câu lạc bộ Chicago Bears trước tiên. Ngược lại, nếu bạn tìm “bóng đá” ở Luân Đôn, Google sẽ xếp hạng các kết quả về bóng đá và giải Premier League cao hơn. Cài đặt Tìm kiếm cũng là một chỉ báo quan trọng về việc bạn có khả năng thấy kết quả nào hữu ích, chẳng hạn như liệu bạn có thiết lập một ngôn ngữ ưu tiên hay chọn tham gia Tìm kiếm an toàn (một công cụ giúp lọc các kết quả không phù hợp) hay không.

Trong một số trường hợp, chúng tôi cũng có thể cá nhân hóa kết quả cho bạn dựa trên thông tin về hoạt động Tìm kiếm gần đây của bạn. Ví dụ: nếu bạn tìm “Barcelona” và gần đây đã tìm “Barcelona đấu với Arsenal”, đó có thể là một gợi ý quan trọng cho biết bạn muốn thông tin về câu lạc bộ bóng đá chứ không phải thành phố. Bạn có thể kiểm soát hoạt động tìm kiếm nào được sử dụng để cải thiện trải nghiệm Tìm kiếm, bao gồm điều chỉnh việc dữ liệu nào được lưu vào tài khoản Google của mình, tại myaccount.google.com.

  • Trả về kết quả tốt nhất

Trước khi cung cấp cho bạn kết quả, chúng tôi đánh giá xem tất cả các thông tin liên quan đến nhau như thế nào: liệu chỉ có một chủ đề duy nhất trong kết quả tìm kiếm hay có nhiều chủ đề? Có phải có quá nhiều trang tập trung vào một cách diễn giải hời hợt? Chúng tôi cố gắng cung cấp thông tin đa dạng bằng các định dạng hữu ích nhất cho loại tìm kiếm của bạn. Và khi web phát triển, chúng tôi cũng phát triển hệ thống xếp hạng của mình để cung cấp kết quả tốt hơn cho nhiều truy vấn hơn.

Câu trả lời hữu ích

Với nhiều nội dung hơn và dưới nhiều hình thức hơn bao giờ hết trên Internet, Google đảm bảo cung cấp cho bạn kết quả tìm kiếm bằng nhiều định dạng chi tiết để giúp bạn nhanh chóng tìm được thông tin đang tìm.

» Câu trả lời hữu ích có nhiều hình thức

Larry Page từng mô tả công cụ tìm kiếm hoàn hảo là một công cụ hiểu chính xác ý định của bạn và cung cấp cho bạn đúng điều bạn muốn. Theo thời gian, quy trình thử nghiệm của chúng tôi đã luôn cho thấy rằng người dùng muốn có câu trả lời nhanh cho truy vấn của họ. Chúng tôi đã cải thiện rất nhiều trong việc cung cấp cho bạn câu trả lời phù hợp nhất, nhanh nhất và bằng các định dạng hữu ích nhất cho loại thông tin bạn đang tìm kiếm.

Nếu đang tìm thông tin thời tiết, chắc bạn sẽ muốn dự báo thời tiết trên trang kết quả chứ không chỉ liên kết đến các trang thời tiết. Hoặc chỉ đường: nếu truy vấn của bạn là “Chỉ đường đến sân bay San Francisco”, bạn sẽ muốn bản đồ kèm theo chỉ đường chứ không chỉ liên kết đến các trang web khác. Điều này đặc biệt quan trọng trên các thiết bị di động có băng thông giới hạn và thao tác nhấp để chuyển trang rất chậm.

Hàng nghìn kỹ sư và nhà khoa học đang nỗ lực để tinh chỉnh các thuật toán của chúng tôi và phát triển các cách tìm kiếm hữu ích mới. Bạn có thể xem một số cải tiến với Tìm kiếm của chúng tôi ở bên dưới. Trong số khoảng 1600 cải tiến với Google Tìm kiếm chỉ trong năm 2016, đây chỉ là một số cách mà chúng tôi cải thiện Tìm kiếm theo thời gian.

  • Câu trả lời từ Sơ đồ tri thức

Ví dụ: Tháp Eiffel cao bao nhiêu?

Trong năm 2012, chúng tôi triển khai Sơ đồ tri thức, một cơ sở dữ liệu gồm hơn một tỷ nhân vật, địa điểm và sự vật trong thế giới thực với hơn 50 tỷ dữ kiện và mối quan hệ giữa các dữ kiện này. Thế giới được tạo thành từ những sự vật có thật chứ không chỉ những chuỗi văn bản. Vì thế, chúng tôi đã xây dựng Sơ đồ tri thức để hiển thị cách mọi thứ liên kết với nhau. Bạn có thể tìm được câu trả lời nhanh cho các câu hỏi như “Tháp Eiffel là gì?”, “Tháp cao bao nhiêu?”, “Tháp được mở cửa lần đầu khi nào?” sau đó nhấp để khám phá trên web.

  • Hướng và lưu lượng

Ví dụ: Chỉ đường đến sân bay O’Hare

Một điều luôn rõ ràng là khi mọi người tìm kiếm một địa chỉ trên Google — ví dụ như “đường Bushwood” — họ không muốn liên kết đến các trang web đề cập đến con đường này. Chắc chắc họ sẽ muốn biết con đường đó ở đâu và cách để đến đó. Vì thế, chúng tôi đã xây dựng một bản đồ có thể nhấp, kéo và rất dễ khám phá.

  • Câu trả lời trực tiếp

Ví dụ: Thời gian tổ chức Sundance

Đôi khi bạn muốn có câu trả lời trực tiếp cho một số truy vấn nhất định, vì thế, chúng tôi đã hợp tác với các doanh nghiệp có thể cung cấp thông tin và dịch vụ bạn đang tìm kiếm và cấp phép nội dung của họ để cung cấp câu trả lời hữu ích ngay trên trang kết quả Tìm kiếm. Ví dụ: nếu bạn đang tìm lịch chiếu phim tại rạp chiếu phim trong vùng của mình, chúng tôi hợp tác với các nhà cung cấp dữ liệu có thông tin cập nhật và đáng tin cậy về lịch chiếu phim trong khu vực của bạn và với các nhà cung cấp dịch vụ đặt vé để giúp bạn mua vé. Đây cũng là cách chúng tôi cung cấp cho bạn thông tin dự báo thời tiết và kết quả thể thao trực tiếp trên trang Tìm kiếm.

  • Đoạn trích nổi bật

Ví dụ: Tu chính án thứ 21 được thông qua vào lúc nào?

Khi bạn đặt câu hỏi cho Google, mục tiêu của chúng tôi là giúp bạn tìm được câu trả lời nhanh chóng và dễ dàng. Đoạn trích nổi bật giúp cung cấp câu trả lời nhanh cho các câu hỏi bằng cách thu hút sự chú ý đến các đoạn trích được tạo bằng chương trình từ các trang web mà thuật toán của chúng tôi cho là liên quan đến câu hỏi cụ thể được đặt ra. Tất cả Đoạn trích nổi bật đều bao gồm đoạn trích thông tin được trích dẫn trực tiếp từ một trang web bên thứ ba, kèm theo liên kết đến trang, tiêu đề và URL của trang.

  • Danh sách chi tiết

Ví dụ: Các nhà thiên văn học nữ nổi tiếng

Câu trả lời tốt nhất cho câu hỏi của bạn không phải lúc nào cũng là một đối tượng duy nhất, mà là một danh sách gồm những nhân vật, địa điểm hoặc sự vật có liên quan đến nhau. Vì thế, khi bạn tìm kiếm [đèn hải đăng ở California] hay [nhà thiên văn nữ nổi tiếng], chúng tôi sẽ hiển thị cho bạn một danh sách về những đối tượng này ở đầu trang. Bằng cách kết hợp Sơ đồ tri thức của chúng tôi với trí tuệ thập thể trên web, chúng tôi thậm chí có thể cung cấp các danh sách như [các bộ phim hành động hay nhất năm 2016] hay [những điều nên làm ở Rome]. Nếu nhấp vào một mục, bạn có thể xem xét kết quả chi tiết hơn trên web.

  • Cung cấp câu trả lời trước khi bạn hỏi

Mọi người muốn dễ dàng tiếp cận thông tin. Đó là lý do vì sao ứng dụng Google trên điện thoại thông minh tích hợp lối tắt và nguồn cấp thông tin hữu ích ở ngay trên màn hình chính. Điều này giúp bạn có được thông tin chi tiết về thể thao, ăn uống, giải trí và thời tiết mà không phải nhập truy vấn.

» Phát triển để đáp ứng môi trường web luôn thay đổi

Web liên tục phát triển, với hàng trăm trang web mới xuất bản mỗi giây. Điều đó được phản ánh trong kết quả mà bạn thấy trong Google Tìm kiếm: chúng tôi liên tục thu thập lại dữ liệu web để lập chỉ mục nội dung mới. Tùy thuộc vào truy vấn của bạn, một số trang kết quả sẽ thay đổi nhanh chóng, trong khi các trang khác ổn định hơn. Ví dụ: khi bạn đang tìm kiếm tỷ số mới nhất của một trận đấu thể thao, chúng tôi phải thực hiện cập nhật theo từng giây, trong khi đó kết quả về một nhân vật lịch sử có thể giữ nguyên trong vài năm liên tục.

Hiện nay, Google xử lý hàng nghìn tỷ tìm kiếm mỗi năm. Mỗi ngày, 15% truy vấn chúng tôi xử lý là những truy vấn chúng tôi chưa từng gặp trước đây. Việc xây dựng các thuật toán Tìm kiếm mà có thể mang lại kết quả hữu ích nhất cho tất cả các truy vấn này là một thử thách phức tạp, đòi hỏi đầu tư và kiểm tra chất lượng liên tục.

Sứ mệnh của Google

Sứ mệnh của chúng tôi: Sắp xếp thông tin của thế giới và giúp thông tin trở nên hữu ích và có thể truy cập được trên toàn cầu.

Tìm kiếm đã phát triển rất nhiều kể từ khi Google ra mắt vào năm 1998, nhưng sứ mệnh của chúng tôi vẫn không thay đổi.

Phương pháp tiếp cận của Google đối với Tìm kiếm:

  • Tập trung vào người dùng: Chúng tôi cố gắng để mang lại kết quả hữu ích và phù hợp.
  • Hỗ trợ chủ sở hữu trang web: Chúng tôi giúp các nhà xuất bản và doanh nghiệp được khám phá trực tuyến.
  • Cung cấp quyền truy cập tối đa vào thông tin: Chúng tôi cam kết cung cấp nền tảng web mở và miễn phí.

Theo Google

Về Hiệp Sĩ TopĐã xác minh

Cuộc sống tươi đẹp!

Theo tôi

Bình luận ( 2 )

  1. Content is king, link is queen quả là không sai. Luôn tập trung vào người dùng đó là cách Google phát triển trường tồn.

  2. Bình luận này được chỉnh sửa.

    Mọi người có thể tìm hiểu thêm về Cẩm nang Tối ưu hóa cho công cụ tìm kiếm (SEO) do chính Google biên soạn hướng dẫn. Rất hữu ích dành cho những người mới bắt đầu tìm hiểu về SEO.

Để lại câu trả lời