Google có thể tồn tại niềm tin mù quáng vào thuật toán không?

Công cụ tìm kiếm của Google là một chiến thắng của công nghệ. Không thể phủ nhận điều đó.

Đó là viên đá đã hoàn thành cấu trúc ban đầu của Internet. Tuy nhiên, Internet hiện đang ở giữa một bản sửa đổi đầy kịch tính và không rõ liệu tìm kiếm của Google có được làm mới mà nó cần để khiến nó trở nên hấp dẫn hơn bao giờ hết hay đó sẽ là một trong những điều được tô vẽ.

Ảnh tín dụng: iStockPhoto / craetive

Google bước vào năm 2011 với hai vấn đề lớn đe dọa sự liên quan ngay lập tức của công ty và đó là tương lai lâu dài:

1.) Kết quả tìm kiếm trên Google.com ngày càng kém hiệu quả vì chúng bị vấy bẩn bởi "spam web" và các bài viết từ "trang trại nội dung" (các trang web tạo nội dung giả để chuyển càng nhiều quảng cáo càng tốt).

2.) Phương tiện truyền thông xã hội đã thay thế tìm kiếm web truyền thống cho nhiều loại thu thập thông tin khác nhau và Google không có một trò chơi hợp pháp trong xã hội.

Công ty đã đi một chặng đường dài để giải quyết vấn đề thứ hai vào tháng 7 với việc ra mắt Google+. Sau một vài lần bùng nổ xã hội cao cấp - chẳng hạn như Google Wave và Google Buzz - họ đã đóng đinh nó khá nhiều với Google+.

Để rõ ràng, chúng ta vẫn không biết liệu Google+ có thể chiến thắng số đông hay không, nhưng nó đã trở nên cực kỳ phổ biến trong giới chuyên gia công nghệ và truyền thông và nó đã khiến Facebook phản ứng và thay đổi để tự đệm mình trước những người từ bỏ nó cho Google+. Để tìm hiểu sâu hơn về chủ đề này, hãy đọc bài viết của tôi Tại sao Google+ sắp thay đổi web như chúng ta biết.

Cũng lớn như truyền thông xã hội, thách thức lớn hơn nữa đối với Google là tiềm năng giảm dần của công cụ tìm kiếm. Trong những năm gần đây, các tìm kiếm của Google đã trở nên ít hữu ích hơn và khó chịu hơn rất nhiều. Việc tìm kiếm những thứ mà bạn biết ở ngoài kia trở nên khó khăn hơn - ngay cả những thứ bạn đã tìm kiếm (và tìm thấy) trước đây. Một ví dụ khác là các trang đã được đăng lên web gần đây. Họ bị áp đảo trong thuật toán Google bởi các trang cũ hơn đã có thời gian tích lũy thêm các liên kết đến.

Vấn đề lớn là SEO - tối ưu hóa công cụ tìm kiếm. Toàn bộ ngành công nghiệp đã phát sinh xung quanh việc giúp các trang web tối ưu hóa các trang của họ để được xếp hạng cao nhất có thể trong Google. Do đó, các trang web nằm ở đầu kết quả tìm kiếm của Google đã trở nên nhiều hơn về các trang web được tối ưu hóa tốt nhất thay vì các trang web có nội dung phù hợp nhất và tốt nhất.

Tệ hơn nữa, toàn bộ các công ty đã nổi lên với toàn bộ mục đích của họ là tạo ra nội dung chất lượng thấp được tối ưu hóa cao cho Google và tải lên các quảng cáo để nhanh chóng đạt được mục đích. Những "trang trại nội dung" đã trở thành việc lớn. Một trong số đó, Request Media - vốn ghét được gọi là trang trại nội dung và trốn tránh nhãn hiệu - hiện là một công ty đại chúng và khoe khoang về việc có quan hệ đối tác chặt chẽ với Google.

Tôi sẽ để bạn tự đánh giá xem liệu Need Media có phải là trang trại nội dung hay không. Dưới đây là bốn bài viết từ trang web hàng đầu của nó, eHow. Là những hữu ích hay hữu ích? Một trang web nhằm mục đích phục vụ độc giả và không chỉ phục vụ quảng cáo xuất bản những thứ này?

  • Cách tính tuổi từ ngày sinh
  • Cách đăng nhập vào AOL
  • Cách thêm AOL vào iPad của bạn
  • Làm thế nào để Belch

(Chúng ta sẽ nói nhiều hơn trong một khoảnh khắc về việc Google có xem xét trang trại nội dung hay không.)

Nhận thấy những rủi ro ngày càng tăng mà công cụ này gây ra cho mối quan hệ của Google với người dùng và cuối cùng là mô hình kinh doanh của mình, công ty đã chuyển mạnh vào năm 2011 để khắc phục tình trạng này. Nó đã bắt đầu với một bài đăng trên blog mâu thuẫn vào tháng 1, trong đó Google bảo vệ chất lượng của công cụ tìm kiếm của mình là "tốt hơn bao giờ hết về mức độ liên quan" trong khi cũng hạ gục các trang web spam (các trang web "lừa đảo theo cách cao hơn vị trí trong kết quả tìm kiếm ") và trang trại nội dung (" trang web có nội dung chất lượng thấp hoặc chất lượng thấp ").

Sau đó, nó thả những quả bom thực sự - một loạt các bản cập nhật lớn cho thuật toán tìm kiếm của nó. Chúng được mệnh danh là bản cập nhật "Panda" hoặc "Farmer" hoặc "Panda Farmer" (đừng cười). Lần đầu tiên (Panda 1.0) xuất hiện vào tháng 2 và nó đã xóa sạch lưu lượng tìm kiếm vào một loạt các trang web, nhưng thật kỳ lạ, eHow (trang web nổi tiếng nhất với nhãn "trang trại nội dung" đã thoát ra ngoài vô tình.

Google cuối cùng đã tung ra Panda 2.0 vào tháng 4, Panda 2.1 vào tháng 5, Panda 2.2 vào tháng 6 và Panda 2.5 vào tháng 9. Theo nhà phân tích SEO Sistrix, những bản cập nhật Panda này cuối cùng đã nghiền nát eHow, vốn dựa vào tìm kiếm của Google để thu hút phần lớn lưu lượng truy cập của nó. Mặc dù các báo cáo về lưu lượng truy cập của eHow giảm vào đầu năm nay, Request Media đã phủ nhận rằng nó đã bị tổn thương bởi các bản cập nhật Panda. Sau đó, vào đầu tháng này, công ty đã thừa nhận vấn đề giao thông của eHow, mặc dù họ đã cố gắng loại bỏ nó là "một vấn đề kỹ thuật nội bộ". Công chúng đã không bị lừa, vì cổ phiếu của Need's Media đã giảm một cách nhanh chóng.

Vì vậy, Google rõ ràng đã bỏ túi trò chơi lớn của mình trong cuộc săn Panda. Vấn đề là phải mất nhiều tháng để làm điều đó và rất nhiều lỗi thử nghiệm thuật toán và có rất nhiều thiệt hại tài sản thế chấp được thực hiện trong quá trình này. Như thể Google nhìn vào sân sau của nó, phát hiện ra một loạt bồ công anh, và thay vì cầm tông đơ cầm tay và đi ra ngoài và cắt chúng, Google quyết định xây dựng một chiếc cưa máy rất tiên tiến để đối phó với nó. Chiếc cưa cuối cùng đã thoát khỏi bồ công anh nhưng nó cũng đánh bật một số khối ra khỏi hàng rào, đặt một số vết thương xuống đất và lấy ra một phần của hàng rào phía sau.

Về thiệt hại tài sản thế chấp, TechRepublic đã không tránh khỏi những ảnh hưởng của nó. Trang web này đã lấy một số viên đạn trong cuộc chiến chéo giữa Google và eHow. TechRepublic có một lịch sử lâu dài về xuất bản các mẹo, hướng dẫn chuyên sâu và các thực tiễn tốt nhất có thời hạn sử dụng lâu dài và Google luôn yêu thích vì họ nhận được rất nhiều liên kết từ khắp nơi trên web. Nội dung của TechRepublic trái ngược hoàn toàn với cả spam web (chúng tôi chưa bao giờ tuyệt vời trong tối ưu hóa SEO) và trang trại nội dung (chúng tôi tập trung vào ít bài viết hơn và nội dung chất lượng cao hơn), nhưng các bản cập nhật Panda đã giảm một nửa số lượng người dùng mà Google gửi tới TechRepublic.

Tôi chỉ ra điều này không phải là nho chua hay than vãn về việc Google chọn chúng tôi. TechRepublic sẽ ổn thôi. Chúng tôi có một lượng lớn người dùng trung thành thường xuyên truy cập trang web của chúng tôi - đặc biệt là những người đăng ký nhận bản tin email phổ biến của chúng tôi - và cuối cùng Google có thể tìm ra cách phân biệt sự khác biệt giữa mẹo trang trại nội dung như trên eHow và in- hướng dẫn chuyên sâu mà bạn có được trên TechRepublic.

Tuy nhiên, tất cả những gì xảy ra là niềm tin của Google vào thuật toán. Google nói rằng họ không chọn ra các trang web để đưa hoặc từ chối vào kết quả tìm kiếm của Google. Nó chỉ đơn giản là xây dựng một thuật toán tìm kiếm một cách có hệ thống những thứ có liên quan nhất và bỏ qua (hoặc loại bỏ) những thứ ít liên quan nhất. Google lập luận rằng điều này tạo ra một hệ thống công bằng và khách quan hơn, và việc đưa bộ lọc của con người vào hệ thống sẽ khiến nó bị sai lệch và chủ quan. Trong khi điều đó có thể đúng, câu hỏi lớn là liệu sự can thiệp của con người có làm cho việc tìm kiếm của Google hiệu quả hơn và cuối cùng chính xác hơn.

Vấn đề với thuật toán (và trí tuệ nhân tạo nói chung) là nó không có ý thức hay trí tuệ chung - ít nhất là chưa. Trong khi đó, các hệ thống mà Google tìm kiếm đang ngày càng cạnh tranh để khám phá thông tin - tìm kiếm xã hội và ứng dụng di động - sử dụng trí tuệ tập thể của cộng đồng hoặc các chuyên gia nhắm mục tiêu để cung cấp thông tin tốt hơn nhanh hơn tìm kiếm của Google, trong nhiều trường hợp.

Mặc dù thành công ban đầu của thử nghiệm xã hội Google+, các bản cập nhật Panda trong năm 2011 cho thấy Google vẫn tin vào thuật toán trên tất cả mọi thứ. Công ty nghĩ rằng ném thêm toán học, tiến sĩ và máy chủ vào bất kỳ vấn đề nào là câu trả lời đúng. Như chúng ta đã thấy, cách tiếp cận đó đã bắt đầu thất bại với Google vào năm 2011. Nó đã gặp khó khăn khi nhắm mục tiêu vào các trang trại nội dung và cuối cùng nó đã vô tình xóa một loạt nội dung hữu ích trong quá trình này. Câu hỏi lớn bây giờ là liệu Google có thể học hỏi từ trải nghiệm và thay đổi này hay không, liệu cuối cùng nó sẽ biến thành một cơ chế dự phòng mà mọi người sử dụng khi họ không thể tìm thấy thông tin họ cần từ tìm kiếm xã hội (hỏi bạn bè trên Twitter hoặc Facebook của họ) hoặc một ứng dụng di động.

Cũng đọc

  • Ứng dụng iPhone là mối đe dọa lớn nhất của Google trong tìm kiếm di động
  • Tại sao Google Plus sắp thay đổi Web như chúng ta biết
  • Nội dung đã trở thành quảng cáo cho quảng cáo? (CNET)

© Copyright 2020 | mobilegn.com